Generalidades del big data para el desarrollo sostenible en Colombia - Junio, 2019 - Cepei
←
→
Transcripción del contenido de la página
Si su navegador no muestra la página correctamente, lea el contenido de la página a continuación
Generalidades del big data
para el desarrollo sostenible
en Colombia
Autores:
Margarita Vaca
Juan Camilo Vega
Junio, 2019Generalidades del big data para el desarrollo sostenible en Colombia Dirección general: Philipp Schönrock Autores: Margarita Vaca y Juan Camilo Vega Edición y revisión técnica: Fredy Rodríguez Edición de apoyo: Alexandra Roldán y Carolina Vegas Diseño y diagramación: Alba Pabón Bogotá D.C., Colombia Junio de 2019
Contenido Introducción............................................................................................................... 4 Contexto del desarrollo sostenible.................................................................. 5 ¿Qué es el BIG DATA?.............................................................................................. 8 Contexto del big data en Colombia.................................................................. 9 Fuentes de datos.................................................................................................. 13 La importancia de las fuentes de datos .................................................... 16 Conclusiones......................................................................................................... 21 Bibliografía............................................................................................................. 22 Acerca de Cepei .................................................................................................. 25
Introducción
La necesidad de aprovechar los datos información, que ayude a determinar las
que son producidos día a día es cada vez causas de este problema. Algunos métodos
más evidente. En especial, cuando son un tradicionales para la recolección y análisis
insumo principal para la toma de decisiones de datos han sido, por ejemplo, sobrevolar
a nivel regional, nacional y subnacional. Sin diferentes zonas del país e identificar las
embargo, uno de los principales problemas áreas donde se presenta el fenómeno para
que enfrentan los países es la alta inversión calcular la superficie afectada. En el caso
de recursos que representa la recolección, de la deforestación, el big data provee el
el procesamiento, el análisis y la difusión de uso de imágenes satelitales para identificar
esta información. patrones de cambio en los bosques del
territorio colombiano. Lo cual permite la
Es por eso, que el uso de nuevas herramientas implementación de políticas orientadas a
de tecnología y la implementación de controlar esta situación.
fuentes no oficiales de información, como el
big data, ofrecen alternativas económicas, El presente documento expone el contexto
eficientes e innovadoras. Estas permiten del desarrollo sostenible y habla sobre los
cerrar brechas de información, así como Objetivos de Desarrollo del Milenio (ODM) y
generar evidencia para la toma de decisiones los Objetivos de Desarrollo Sostenible (ODS).
y la construcción de nuevas estrategias para Luego aborda el tema de la presencia de los
el desarrollo sostenible. tipos de fuentes de información dentro del
contexto colombiano, y cómo el big data
En el caso colombiano, por ejemplo, la puede contribuir a la implementación de los
deforestación es un problema grave. Solo ODS, así como la importancia de usar todas
para el 2015, habían sido deforestadas las fuentes de información disponibles en la
56.962 hectáreas (IDEAM, 2018). Esta área consecución de la Agenda 2030. También se
equivale en tamaño a ciudades capitales presentan iniciativas en el uso de fuentes no
como Popayán, Cali, o, apróximadamente, oficiales de información, las cuales pueden
5 veces Mocoa. Con el fin de encontrar guiar futuros esfuerzos para el uso de este
soluciones a estas y otras problemáticas, tipo de datos, con el fin de motivar a distintos
surge la necesidad de obtener datos que actores a tenerlas en cuenta como nuevas
permitan identificar las zonas críticas, y otra herramientas de medición.Contexto
Introducción
del desarrollo sostenible
El contundente desarrollo de las tecnologías Es por ello que en el presente documento
de la
Los información
Objetivos y comunicación
de Desarrollo en la
del Milenio se
del hará una revisión
desarrollo general
sostenible, quedelplantea
contexto
la
última se
(ODM) década ha generado
consolidaron comohoy
un en día las
concepto nacional en materia
importancia de unadel uso de big data
articulación para
sólida de
transferencia de
revolucionario grandes
que volúmenessinergias
logró establecer de datos medir los indicadores
las diferentes delalos
esferas de ODS, primero
sociedad: medio
(big data
entre de ahora
distintos en adelante).
países y actores,Ejemplo de
al definir haciendo
ambiente,uninclusión
reconocimiento
social contextual del
y desarrollo
ellodiscurso
un es la información que circulaacada
común enfocado minuto
mejorar el ecosistema
económico. nacional de datos
Su objetivo es yeliminar
el uso de
la
en redes general
bienestar sociales,de
páginas web y Para
la población. teléfonos
este fuentes no tradicionales
desigualdad demedio
y proteger el datos ambiente
usadas ena
inteligentes,
fin, se fijaron cuya gestión
metas para ylauso representa de
erradicación un Costa
travésRica.
de la construcción de alianzas entre
nuevo
la reto para
pobreza, la Administración
la promoción Pública. de
de la igualdad diferentes sectores y actores, resaltando
género, el mejoramiento de la salud materna Igualmente, se busca
la responsabilidad acercar que
compartida al deben
lector
yElla
análisis de grandes
sostenibilidad deldatos
medio(big data) puede
ambiente. a una todos
asumir conceptualización del término
los países y personas. Esta hojay
mejorar la toma de decisiones en áreas críticas características del big data,como
de ruta fue denominada con lala finalidad
Agenda
del desarrollo,
Aunque como la salud,de
la implementación el empleo, la
esta hoja de dary a
2030 conocer
está la importancia
compuesta de este
por los Objetivos
productividad,
de la seguridad
ruta presentó avances yen
la gestión
cada unode tema en la Agenda
de Desarrollo 2030, (ODS),
Sostenible y cuál ha
los sido el
cuales
desastres
de naturales,
sus objetivos por nombrar
y alcanzó algunas.
una reducción avance desde
incorporan lasla lecciones
visión de algunos actores
aprendidas de
Pero para ello,
significativa de la se debenextrema
pobreza generar1
al nuevas
14% en nacionales relevantes,
los ODM y portan quienes
el lema de “Nogeneran
dejar a
alianzas
2015; entre todos
un aumento dellos actoresde
número involucrados
estudiantes e capacitación,
nadie atrás”. investigación
Para lograr ele implementación
propósito de la
impulsar verdaderas
matriculados revoluciones
en instituciones educativas
de educación de herramientas
Agenda 2030, 189depaíses
big data.
acordaron 17 ODS,
y culturales.
primaria en 8 puntos porcentuales; una compuestos por 169 metas y 241 indicadores,
reducción en la mortalidad infantil2 que pasó Alineado a fortalecer
que buscan lo anterior,los se hará un
procesos de
El abordaje
de de estas
90 a 43 niños novedosas
muertos por cadatendencias
1000; el reconocimiento de losderetos
medición y monitoreo con los de
los avances que
la
en la gestión
alcance de losnacional defue
objetivos información
desigual ypara
no cuenta
misma.el país y los distintos sectores sociales,
monitorear
permitió el progreso
la inclusión de loslos
de todos países en el
países. para la producción, utilización y colaboración
cumplimiento de los Objetivos de Desarrollo que
Una permitan el aprovechamiento
de las principales del big
características de
Sostenible
Luego, en (ODS),
2015,requiere tambiénuna
se identificó del debate
nueva data en la medición
los ODS es que y están
evaluación de la agenda
interconectados,
y reflexión
hoja sobre
de ruta conlasunnuevas herramientas,
enfoque holístico desarrollo sostenible
es decir que en Costa
los logros en Rica.
cualquiera de
capacidades y mecanismos de gestión
necesarios
1
para su implementación.
El índice de pobreza extrema es calculado como el porcentaje de la población que vive con menos de 1,90 dólares al día,
corregido por Paridad de Poder adquisitivo (PPP en inglés).
2 La mortalidad infantil es presentada como el número de menores de un año muertos por cada 1.000.
Network
www.bd4d.net 3
5Introducción
ellos impacta en menor o mayor medida
el cumplimiento de los demás. Asimismo,
Es así, que la información que se produce
en el día a día, y que usualmente no es
conciben un enfoque articulado que tiene considerada por las oficinas de estadística
en cuenta componentes innovadores como: u oficinas gubernamentales, ha tomado
Ciudades y Comunidades Sostenibles, un rol significativo para determinar nuevas
Producción y Consumo Responsables, y soluciones a problemáticas sociales y
Paz e Instituciones
El contundente Sólidas,de
desarrollo presentes en los
las tecnologías estadísticas.
Es Poren el
por ello que ejemplo,
presente la pobreza
documento
ODS
de la11,información
12 y 16, respectivamente.
y comunicaciónAdemás
en la generalmente
se se mide general
hará una revisión a través del
de encuestas
contexto
brinda un mayor
última década detalle de
ha generado hoyatención al
en día las presenciales
nacional en un del
en materia número
uso designificativo de
big data para
medio ambiente
transferencia a travésvolúmenes
de grandes de la Acción
de por el
datos hogares
medir losdel territorio ade
indicadores través de preguntas
los ODS, primero
Clima, Vida
(big data deSubmarina, y Vida y Ecosistemas
ahora en adelante). Ejemplo de que buscan
haciendo unreflejar el estado socioeconómico
reconocimiento contextual del
Terrestres,
ello es la información que circula cada 13,
considerados en los ODS 14 y
minuto ecosistema nacional de datoseny la
de las personas que habitan el vivienda.
uso de
15,
en respectivamente.
redes sociales, páginas web y teléfonos Hacer este
fuentes tipo de mediciones
no tradicionales de datosrequiere de
usadas en
inteligentes, cuya gestión y uso representa un una alta
Costa inversión, lo cual limita la continuidad
Rica.
Los ODS
nuevo han
reto representado
para un desafío
la Administración para
Pública. y cobertura de la misma.
todos los países. No sólo por la escasez de Igualmente, se busca acercar al lector
recursos
El análisisendetérminos
grandesde dinero,
datos (bigcapital físico
data) puede A causa
a de esta necesidad,
una conceptualización del eltérmino
big data,
y
ymejorar
humano, sinodetambién
la toma porenlaáreas
decisiones necesidad
críticas como fuente de
características datos
del no tradicional,
big data, ofrece
con la finalidad
de
delinformación que permita
desarrollo, como la salud,enfocar estos
el empleo, la medidas
de dar a con menores
conocer costos gracias
la importancia de aeste
las
recursos de forma
productividad, eficienteyyladegestión
la seguridad medir de
la que se
tema enpueden
la Agendallevar a cabo
2030, y cuáleste
ha tipo
sido de
el
efectividad de los esfuerzos
desastres naturales, hechos.algunas.
por nombrar ejercicios, sin tener que recurrir a los
avance desde la visión de algunos actoresmedios
Pero para ello, se deben generar nuevas tradicionales.relevantes,
nacionales En un estudio realizado
quienes por
generan
Aalianzas
partir entre
de esto,
todoslos
lospaíses
actoreshan trabajado
involucrados e David Newhouse
capacitación, et al. e(2017)
investigación se busca
implementación
aimpulsar
través verdaderas
de sus Oficinas de Estadística,
revoluciones educativas medir
de el porcentaje
herramientas dedata.
de big personas que están
Ministerios,
y culturales. Comisiones ODS, entre otros bajo la línea de pobreza en México, usando
actores en fortalecer las estadísticas imágenes asatelitales
Alineado de alta
lo anterior, se resolución
hará un
nacionales
El abordaje ydesubnacionales. Empero,
estas novedosas esta
tendencias entre 2014 y 2015.de
reconocimiento Estas
los imágenes
retos conidentifican
los que
nueva Agenda nacional
en la gestión ha evidenciado la necesidad
de información para los materiales
cuenta el país y con los que sectores
los distintos están hechas las
sociales,
de incorporar
monitorear elnuevas fuentes
progreso depaíses
de los información
en el casas,
para la los techos,utilización
producción, las paredes, el número
y colaboración
que faciliten la
cumplimiento de identificación deDesarrollo
los Objetivos de datos a de pisos
que de laselcasas,
permitan si tienen un del
aprovechamiento auto,
bigy
mayores niveles
Sostenible (ODS),de desagregación.
requiere también del debate a partir
data en lade eso se yestima
medición el porcentaje
evaluación de
de la agenda
y reflexión sobre las nuevas herramientas, población sostenible
desarrollo que se encuentra en estado de
en Costa Rica.
capacidades y mecanismos de gestión pobreza, por municipio.
necesarios para su implementación.
Network
www.bd4d.net 3
6Introducción
Figura 1. Estimaciones de pobreza: municipalidades urbanas México
Legend
Municipality Urban Poverty Estimates
26% - 37%
37% - 48%
48% - 59%
59% - 70%
70% - 81%
El contundente desarrollo de las tecnologías Es por ello que en el Nopresente
Data documento
de la información y comunicación en la se hará una revisión general del contexto
última década ha generado hoy en día las nacional en materia del uso de big data para
transferencia de grandes volúmenes de datos medir los indicadores de los ODS, primero
(big data de ahora en adelante). Ejemplo de haciendo un reconocimiento contextual del
ello es la información que circula cada minuto ecosistema nacional de datos y el uso de
en redes sociales, páginas web y teléfonos fuentes no tradicionales de datos usadas en
inteligentes, cuya gestión y uso representa un Costa Rica.
nuevo reto para la Administración Pública.
Igualmente, se busca acercar al lector
El análisis de grandes datos (big data) puede a una conceptualización del término y
mejorar la toma de decisiones en áreas críticas características del big data, con la finalidad
Fuente: David Newhouse et al. (2017)
del desarrollo, como la salud, el empleo, la de dar a conocer la importancia de este
productividad, la seguridad y la gestión de tema en la Agenda 2030, y cuál ha sido el
Un ejemplonaturales,
desastres adicionalpor
del nombrar
uso de big data
algunas. dinámica
avance migratoria
desde de de
la visión la algunos
población hacia
actores
es la alianza
Pero entre
para ello, se Cepei
debeny Telefónica, para
generar nuevas y fuera de Mocoa
nacionales antes, durante
relevantes, quienes y generan
después
medir elentre
alianzas impacto
todosmigratorio
los actoresde la avenida
involucrados e de la tragedia.
capacitación, Este es uno
investigación de los varios
e implementación
torrencial ocurrida en
impulsar verdaderas Mocoa en
revoluciones el 2017.
educativas casos
de de acciónde
herramientas que
bigofrecen
data. las fuentes no
Ay culturales.
través de la posición georeferenciada de oficiales de información, que ayudan a cerrar
los teléfonos móviles, es posible explicar la las brechasa deloinformación.
Alineado anterior, se hará un
El abordaje de estas novedosas tendencias reconocimiento de los retos con los que
en la gestión nacional de información para cuenta el país y los distintos sectores sociales,
monitorear el progreso de los países en el para la producción, utilización y colaboración
cumplimiento de los Objetivos de Desarrollo que permitan el aprovechamiento del big
Sostenible (ODS), requiere también del debate data en la medición y evaluación de la agenda
y reflexión sobre las nuevas herramientas, desarrollo sostenible en Costa Rica.
capacidades y mecanismos de gestión
necesarios para su implementación.
Network
www.bd4d.net 3
7Introducción
¿Qué es el
BIG DATA?
El contundente desarrollo de las tecnologías Es por ello que en el presente documento
Especialistas
de la información en analítica
y comunicación en la de
se datos argumentan
hará una que:
revisión general del contexto
última década ha generado hoy en día las nacional en materia del uso de big data para
“El término Big Data se aplica a la información que no
transferencia de grandes volúmenes de datos medir los indicadores de los ODS, primero
se puede procesar o analizar mediante los procesos
(big data de ahora en adelante). Ejemplo de haciendo un reconocimiento contextual del
o herramientas
ello es la información tradicionales”
que circula cada minuto ecosistema nacional de datos y el uso de
en redes sociales, páginas web y teléfonos fuentes no tradicionales de datos usadas en
(Zikopoulos
inteligentes, cuya gestión y usoet al, 2011).
representa un Costa Rica.
nuevo reto para la Administración Pública.
Igualmente, se busca acercar al lector
El análisis de grandes datos (big data) puede a una conceptualización del término y
mejorar la toma de decisiones en áreas críticas características del big data, con la finalidad
del desarrollo, como la salud, el empleo, la de dar a conocer la importancia de este
productividad,
Partiendo la seguridad
de esta y ladata
noción, big gestión de
puede tema
Este enconcepto
la Agenda 2030, y cuállas
engloba ha sido el
cinco
desastrescomo
definirse naturales, por nombrar
un concepto algunas.
evolutivo que avance desde laque
características visióncomprenden
de algunos actores
al big
Pero para laello,
describe se deben generar
transformación nuevas
de grandes nacionales relevantes,
data: variedad, volumen,quienes generan
velocidad, valor,
alianzas entrede
conjuntos todos los actores(estructurados,
datos involucrados e capacitación,
y veracidad. investigación e implementación
Para una mayor comprensión,
impulsar verdaderasy revoluciones
semiestructurados educativas
no estructurados) o la de
en herramientas
el siguientedecaso
big data.
se ejemplifican las
y culturales.
combinación de estos, que se generan de características del big data:
acuerdo con la dinámica de las sociedades Alineado a lo anterior, se hará un
yElse
abordaje de en
traducen estas novedosas tendencias
diagnósticos, directrices reconocimiento
El mundial dede los de
fútbol retos con2018
Rusia los atrajo
que
oen parámetros,
la gestión nacional
para de
la información para
correcta toma cuenta el país
a miles dey personas
los distintos sectores ciudades
a distintas sociales,
monitorear
de el progreso
decisiones en un de los países
tiempo en el
y espacio paradel
la producción, utilización
país organizador. Esto ysecolaboración
convirtió en
cumplimiento de
determinado. Dellos Objetivos
mismo de Desarrollo
modo, big data queuna
permitan el aprovechamiento
gran oportunidad del big
para las cadenas
Sostenible (ODS), requiere también del debate
es un insumo potencial para la extracción datahoteleras,
en la medición y evaluaciónde
al apoderarse de la
laagenda
mayor
y reflexión
de sobre entre
correlaciones las nuevas herramientas,
variables clave que desarrollo sostenible en Costa Rica.
porción de demanda por habitaciones
capacidades
permiten y mecanismos
explicar las causas dede gestión
un evento, en las ciudades donde se celebraron los
necesarios
anticipar para su implementación.
tendencias o resultados, e inferir partidos. Para cumplir con su objetivo,
posibles soluciones a nivel global, nacional era necesario analizar la información
y subnacional. recolectada de sus clientes durante los
Network
www.bd4d.net 3
8Introducción
días del evento, para así poder ofrecer
los paquetes de estadía adecuados a los
a fechas determinadas, el análisis de la
información debía hacerse lo más rápido
clientes potenciales. posible para tomar ventaja de esto y prever
eventualidades desfavorables.
La información recolectada puede
comprender la edad, nacionalidad, sexo, Por último, analizar esta información
preferencias desarrollo
El contundente por servicios (paquetes
de las de
tecnologías representó
Es por ello queuna
enoportunidad
el presente para la toma
documento
de transporte o de ysitios
la información turísticos), en
comunicación entre
la se de
hará decisiones
una revisiónbasada
general en
del evidencia.
contexto
otros.
última Con esta
década havariedad
generadoy gran
hoyvolumen de
en día las El big
nacional en data representó
materia del uso deun biggran valor
data para
información,
transferencia delos hoteles
grandes crearon perfiles
volúmenes de datosde para
medir loslasindicadores
empresas de a laloshora deprimero
ODS, unificar
(bigclientes
data depotenciales en los cuales
ahora en adelante). podrían
Ejemplo de recursos
haciendo un areconocimiento
través de la identificación de
contextual del
enfocar sus esfuerzos. Asimismo, cientos
ello es la información que circula cada minuto oportunidades
ecosistema en de
nacional el uso de ylos
datos el insumos.
uso de
en de clientes
redes llegaban
sociales, a losweb
páginas hoteles en esta
y teléfonos Por otra
fuentes parte, la veracidad
no tradicionales de los
de datos datosen
usadas es
época, por
inteligentes, estagestión
cuya razón, ylauso
información
representaque
un un Rica.
Costa factor crítico, dado que no se tiene un
se reto
nuevo generaba
para ladiariamente aumentaba
Administración Pública. a control de la calidad de los mismos, ni un
una velocidad impresionante. Debido a proceso estandarizado
Igualmente, en la recolección
se busca acercar al lector
que la de
El análisis duración
grandesdel evento
datos (big era
data)limitado
puede de la conceptualización
a una información. del término y
mejorar la toma de decisiones en áreas críticas características del big data, con la finalidad
del desarrollo, como la salud, el empleo, la de dar a conocer la importancia de este
productividad, la seguridad y la gestión de tema en la Agenda 2030, y cuál ha sido el
desastres naturales, Contexto
por nombrar algunas.del big
avance data
desde la visión de algunos actores
en
Pero para ello, se deben generar nuevas
Colombia
alianzas entre todos los actores involucrados e
nacionales relevantes, quienes generan
capacitación, investigación e implementación
impulsar verdaderas revoluciones educativas de herramientas de big data.
y culturales.
Alineado a lo anterior, se hará un
El abordajehade sido
Colombia estasuno
novedosas
de lostendencias
primeros reconocimiento de los retos
con el fin de investigar con los que
o visualizar esta
en la gestión nacional de información
países en promover políticas públicas para cuenta el país y los distintos sectores
información y promover la publicación desociales,
monitorear
para el progreso
el desarrollo de los países
sostenible. en ve
Esto se el para la producción,
nuevos utilización
conjuntos de y colaboración
datos. En esta política
cumplimiento
reflejado en la de los Objetivos
creación de Desarrollo
de la Comisión ODS, que permitaninformación
se comparte el aprovechamiento del big
bajo la protección
Sostenible (ODS),
estructurada requiere
por las también
entidades del debate
responsables data en la medición
del Habeas Data, ycon
evaluación de la agenda
la finalidad de no
y reflexión
de sobre lasque
impulsar acciones nuevas
vayanherramientas,
en línea con desarrollo sostenible en Costa Rica.
vulnerar los derechos de los ciudadanos
capacidades
el y de
cumplimiento mecanismos
las metas dedela Agenda
gestión durante el proceso.
necesarios
2030. para su implementación.
Adicionalmente, existe una ley y
una política de datos abiertos que apoya Para ilustrar al lector acerca de la realidad
la publicación de datos de interés general, colombiana en materia de planeación, el
Network
www.bd4d.net 3
9y Social (CONPES) -que
Introducción
Consejo Nacional de Política Económica
es el principal
de esfuerzos dentro de sus políticas públicas.
Por ejemplo, el gobierno nacional junto con
organismo en materia de desarrollo el Departamento Nacional de Planeación
económico y social- se encarga de brindar (DNP) presentó una de las herramientas
asesoría al gobierno nacional en estos temas para la puesta en marcha de la Agenda 2030
y visibiliza su labor a través de documentos en Colombia: el Documento Conpes 3918, el
denominados Conpes. cual comprende a las entidades encargadas
El contundente desarrollo de las tecnologías Es por ello que en el presente documento
de cada una de las 147 metas3 de los ODS,
de la información y comunicación en la se hará una revisión general del contexto
En el contexto de América Latina, Colombia la definición de indicadores nacionales y las
última década ha generado hoy en día las nacional en materia del uso de big data para
ha sido uno de los países más comprometidos metas del país para el año 2030, incluyendo
transferencia de grandes volúmenes de datos medir los indicadores de los ODS, primero
en promover espacios donde se generan la regionalización de las rutas de acción
(big data de ahora en adelante). Ejemplo de haciendo un reconocimiento contextual del
y comparten datos para el desarrollo y la definición del esquema de reporte de
ello es la información que circula cada minuto ecosistema nacional de datos y el uso de
sostenible. Esto se evidencia en la inclusión información para los indicadores.
en redes sociales, páginas web y teléfonos fuentes no tradicionales de datos usadas en
inteligentes, cuya gestión y uso representa un Costa Rica.
nuevo reto para la Administración Pública.
Organizaciones a cargo deIgualmente,
los ODSseenbusca
Colombia
acercar al lector
El análisis de grandes datos (big data) puede a una conceptualización del término y
mejorar
En la toma de existen
Colombia decisiones30 en áreas críticas
entidades características
aquellas que del big data,
tienen con la finalidad
una responsabilidad
del desarrollo,
encargadas como la
de liderar el salud, el empleo,
cumplimiento la
de la de dar a conocer
directa, mientrasla importancia
las de este
instituciones
productividad,
Agenda laprincipal
2030. La seguridad y la gestión
entidad de
es el DNP, tema en la Agenda
acompañantes son 2030, y cuál
aquellas quehatienen
sido el
la
desastres
que además naturales, por nombrar
de encargarse algunas.
de la medición avance de
misión desde la visión
brindar apoyodea algunos actores
las instituciones
Pero
de los para ello, seODS,
indicadores deben generar
formula nuevas
las políticas nacionales
líderes, puesrelevantes, quienesde generan
pueden incidir manera
alianzas entre
públicas paratodos
cadalosperíodo
actores involucrados
presidencial.e capacitación,
directa sobreinvestigación e implementación
esa meta. Por ejemplo, para
impulsar
Estas verdaderas
luego revoluciones
constituyen educativas
el Plan Nacional de de meta
la herramientas de big la
1.1 (erradicar data.
pobreza extrema),
y culturales.
Desarrollo. la institución líder es el Departamento
Alineado
de a lo Social
Prosperidad anterior, se entidades
y como hará un
El abordaje
En de estas Conpes
el documento novedosas tendencias
3918, están reconocimiento de
acompañantes los los
están retosministerios
con los que de
en la gestión nacional de información para
definidas las instituciones a cargo de cada
4 cuenta el país y los distintos sectores sociales,
Agricultura, Minas y Energía, y Educación.
monitorear
meta. el progreso
Se definen de los paíseslíderes
como instituciones en el para la producción, utilización y colaboración
cumplimiento de los Objetivos de Desarrollo que permitan el aprovechamiento del big
Sostenible (ODS), requiere también del debate data en la medición y evaluación de la agenda
y reflexión sobre las nuevas herramientas, desarrollo sostenible en Costa Rica.
capacidades y mecanismos de gestión
necesarios para su implementación.
3 Dado que las 22 metas restantes requieren de esfuerzos conjuntos entre actores gubernamentales e internacionales.
4 Consultar Anexo E del documento Conpes 3918.
Network
www.bd4d.net 3
10Comisión de Alto Nivel ODS en Colombia:
Miembros
- Miembrosyy estructura
Figura 2. Comisión ODS en Colombia
Introducción
estructura
El contundente desarrollo de las tecnologías Es por ello que en el presente documento
de la información y comunicación en la se hará una revisión general del contexto
última década ha generado hoy en día las nacional en materia del uso de big data para
transferencia de grandes volúmenes de datos medir los indicadores de los ODS, primero
(big data de ahora en adelante). Ejemplo de haciendo un reconocimiento contextual del
ello es la información que circula cada minuto ecosistema nacional de datos y el uso de
en redes sociales, páginas web y teléfonos fuentes no tradicionales de datos usadas en
inteligentes, cuya gestión y uso representa un Costa Rica.
nuevo reto para la Administración Pública.
Igualmente, se busca acercar al lector
Presidente y Secretaría Técnica:
El análisis de grandes datos (bigDepartamento
data) puede a Planeación-DNP
Nacional de una conceptualización del término y
mejorar la toma de decisiones en áreas críticas características del big data, con la finalidad
Comité técnico*:
Representantes de todas las instituciones miembro
del desarrollo, como la salud, el empleo, la de dar a conocer la importancia de este
Representantes de instituciones invitadas
Representantes
productividad, la seguridad y la gestión de de la tema
unidad consultiva
en la Agenda 2030, y cuál ha sido el
GRUPOS DE TRABAJO
desastres naturales, por nombrar algunas. avance desde la visión de algunos actores
Pero para ello, se deben generar nuevas nacionales relevantes, quienes generan
alianzas entre todos los actores involucrados e capacitación, investigación e implementación
impulsar verdaderas revoluciones educativas de herramientas de big data.
y culturales.
Indicadores Movilización Implementación Alineado Comunicaciones
a lo anterior, Incidenciaseinternacional
hará un
(Liderado de recursos Subnacional (Liderado por el DNP) (Liderado por la
El abordaje
por DANE)de estas novedosas
(Liderado por tendencias
(Liderado por elreconocimiento de los Cancillería)
DNP) Crear una estrategia retos con los que
Define los indicadores el Ministerio Apoyar a las unidades para aumentar Mantener la incidencia
en la gestión nacional de información para cuenta el país y los distintos sectores sociales,
nacionales de Hacienda) territoriales para alinear el conocimiento del país en los foros
monitorear el progresoRecomendar
de los medidas
países en el locales
los planes para la deproducción,
la Agenda 2030 utilización y colaboración
internacionales
y fuentes de desarrollo en la ciudadanía, otras
cumplimiento de los Objetivos de Desarrollo
de financiamiento a los Objetivos que permitan
instituciones el aprovechamiento del big
y actores
innovadoras
Sostenible (ODS), requiere también del debate Globales interesados
data en la medición y evaluación de la agenda
y reflexión sobre las nuevas herramientas, desarrollo sostenible en Costa Rica.
* De acuerdo al decreto 280 of 2015
capacidades y mecanismos de gestión
** Miembro no permanente
necesarios para su implementación.
Fuente y diseño: CEPEI.
Network
www.bd4d.net 3
11diferentes regiones del país como la Caribe, Centro Oriente, Eje Cafetero y Antioquia, Pacífico y
Centro Sur (con excepción de la región de los Llanos).
Además de incorporar los ODS como referentes de sus procesos de planeación, los departamentos
en mención hicieron una asociación explícita y detallada de los ODS con los componentes
Introducción
estratégicos
Con el fin de desusidentificar
planes de desarrollo
fortalezasy/oycon losseguimiento
indicadores definidos en los mismos.de
al cumplimiento De tal
la
forma, es posible identificar 2 categorías
debilidades del país en la implementación en estos planes, a saber: 1) PDD con incorporación
Agenda 2030. Para garantizar que las rutas alta
de los ODS, con énfasis en la
de la Agenda 2030, el Departamentoasociación con los componentes
de acción estratégicos (p. ej., asociación
sean implementadas con
a nivel
dimensiones, ejes, líneas, objetivos, programas o proyectos, como lo evidencian los PDD de Boyacá,
Administrativo Nacional de Estadística regional, la información de seguimiento
Córdoba, Cundinamarca y Santander); y, 2) PDD con incorporación alta de los ODS, con énfasis en
(DANE)- oficina nacional de estadística-, debe tener un nivel de desagregación que
la asociación con componentes de medición (p. ej., en cuanto a indicadores, como en los casos de
tiene la misión
Caquetá, Quindíode medir los
y Nariño). indicadores
En las permita
siguientes páginas identificar
se presentan brechas características
las principales sociales que
ODS, así correspondientes
decontundente
los PDD como generar a cada y compartir orienten la toma decisiones de los actores
una de las categorías
El desarrollo de las tecnologías Es porseñaladas.
ello que en el presente documento
información para realizar el adecuado departamentales y municipales.
de la información y comunicación en la se hará una revisión general del contexto
última década ha generado hoy en día las Figura 4.5
nacional en materia del uso de big data para
Figura 3. Buenas prácticas en la incorporación de los ODS en los PDD
Buenas
transferencia de grandes prácticasdeendatos
volúmenes la incorporación de los
medir losODS en los PDD de los ODS, primero
indicadores
(big data de ahora en adelante).San Andrés
Ejemploy Providencia de haciendo un reconocimiento contextual del
ello es la información que circula cada minuto La Guajira
Santandernacional de datos y el uso de
ecosistema
Atlántico
Población: 2.071.016 Hab.
30.537 Km²
Magdalena
en redes sociales, páginas web y teléfonos
Sucre Cesar
fuentesExtensión:
no tradicionales de datos usadas en
inteligentes, cuya gestión y uso representa un
Córdoba Bolívar
Costa Rica.
Norte de Santander
Córdoba
Población: 1.736.170 Hab. Boyacá
nuevo reto para la Administración Pública.
Extensión: 25.020 Km² Población: 1.278.107 Hab.
Km²
Antioquia Santander
Extensión: 23.189acercar
Arauca
Igualmente, se busca al lector
Chocó Boyacá
Caldas Casanare
El análisis de grandes datos
Quindío
(big data)Quindío
puede Bogotá
Risaralda Cundinamarca a una
Vichada
conceptualización del término y
mejorar la tomaPoblación: 568.506 Hab. en áreas
de decisiones críticas
Valle del Cauca Tolima
características delCundinamarca
big data, con la finalidad
Extensión: 1.845 Km² Población: 2.721.368 Hab.
Meta
Extensión:
la 24.210 Km²
Guainía
del desarrollo, como la salud, el empleo,
Cauca
Huila la Guaviare
de dar a conocer importancia de este
Nariño
productividad, la seguridad
Nariño
y la gestión
Putumayo
de
Caquetá
tema
Vaupés
en la Agenda 2030, y cuál ha sido el
desastres Población: 1.765.906
naturales, por Hab.
nombrar algunas. avance desde la visión de algunos actores
Extensión: 33.268 Km²
Pero para ello, se deben generar nuevas Amazonas nacionales relevantes, quienes generan
Caqueta
alianzas entre todos los actoresPoblación:
involucrados
483.846 Hab.
e capacitación, investigación e implementación
Extensión:
impulsar verdaderas revoluciones educativas 88.965 Km ² de herramientas de big data.
yFuente:
culturales.
DNP, DSEPP.
Fuente: DNP, DSEPP5 (2017)
Alineado a lo anterior, se hará un
El
14 abordaje
De acuerdo condeinformación
estas novedosas tendencias
del DANE (Departamento Administrativoreconocimiento deenlos
Nacional de Estadística), retosestos
su conjunto, con los que
departamentos
concentran
En la el 22
figura% de la
3 población
son total del país
presentados (10,6 millones
los frente a un total nacional
Departamental de 48,7 millones
(PDD). de
Tanto habitantes,
en la con base en
alineación
en la gestión nacional de información para cuenta el país y los distintos sectores sociales,
las proyecciones para el año 2016). Así mismo, a partir de información del IGAC (Instituto Geográfico Agustín Codazzi), estos 7 departa-
departamentos
mentos representan
monitorear de
un 19 % delSantander,
el progreso territorio Boyacá,
de loscontinental
países de
enColombia
el con componentes
(217.976
para km2 estratégicos
frente a una extensión
la producción,
6
, como
total dey1.141.748
utilización km2).con
colaboración
Cundinamarca,
cumplimiento deCórdoba, los Objetivos Quindío, Nariño
de Desarrollo componentes
que permitan el medición 7 (inclusión
de aprovechamiento del bigde
ySostenible
Caquetá, querequiere
(ODS), son también
reconocidos por
del debate los Objetivos
data de Desarrollo
en la medición Sostenible
y evaluación en
de la agenda
promover 48
los planes de desarrollo territoriales, 2016-
y reflexiónbuenas prácticas
sobre las nuevas en incluir los
herramientas, desarrollo sostenible en Costa Rica.
ODS dentro dey sus
capacidades Planes de de
mecanismos Desarrollo
gestión 2019).
necesarios para su implementación.
5 Dirección de Seguimiento y Evaluación de Políticas Públicas
6 Los componentes estratégicos son los que tienen asociación con dimensiones, ejes, líneas, objetivos, programas o
proyectos como lo evidencian los PDD de Boyacá, Córdoba, Cundinamarca y Santander.
7 Los componentes de medición están enfocados a indicadores como en los casos de Caquetá, Quindío y Nariño.
Network
www.bd4d.net 3
12Fuentes de datos
Introducción
Las fuentes de datos pueden ser clasificadas entre oficiales o tradicionales, y no oficiales
El contundente
en dos grandes desarrollo
categorías.de
Delas tecnologías
acuerdo a su Es por
o no ello que en el presente documento
tradicionales.
de la yinformación
origen y con
articulación comunicación en la
las estadísticas se
En hará una revisión
la segunda general
categoría, lasdel contexto
fuentes de
última década
oficiales, y segúnhalagenerado
estructurahoy
de en
losdía las
datos. nacional en materia del uso de big data
datos se caracterizan como estructuradas,para
transferencia
En el primerdecaso,
grandes
las volúmenes
fuentes dede datos
datos medir los indicadores
semiestructuradas y node los ODS, primero
estructuradas, lo
(big data
estarán de ahorapor
definidas eneladelante).
nivel de Ejemplo de
rigurosidad haciendo un reconocimiento contextual del
cual indicará el nivel, el tipo de formato de la
ello es la información
metodológica que circula
de medición cada minuto
dado por la ecosistema
información,nacional deprocesamiento
y su nivel datos y el usopara
de
en redes
Oficina sociales,
Nacional de páginas webyyseteléfonos
Estadística, dividen fuentes
obtener no tradicionales de datos usadas en
resultados.
inteligentes, cuya gestión y uso representa un Costa Rica.
nuevo reto para la Administración Pública.
Igualmente, se busca acercar al lector
El análisis de grandesFuentes depuede
datos (big data) datos según su origen
a una conceptualización del término y
mejorar la toma de decisiones en áreas críticas características del big data, con la finalidad
del desarrollo,
Las como lade
fuentes oficiales salud, el empleo,son
información la de darfigura
En la a conocer la importancia
4 se presentan de este
el número de
productividad,
aquellas la seguridad
producidas y la gestión por
o supervisadas de tema en la
entidades 8 Agenda 2030, y cuál ha sido el
que constituyen el SEN, las cuales
desastres
las oficinas naturales, por nombrar
de estadística algunas.
nacional de cada avance
incluyendesde
tantolaentidades
visión de algunos
estatalesactores
como
Pero para ello, se deben generar nuevas
país. En el contexto colombiano, el Sistema nacionales relevantes, quienes generan
personas de los sectores público, privado
alianzas entre
Estadístico todos los(SEN)
Nacional actores
esinvolucrados
el conjuntoe capacitación, investigación
y mixto. Asimismo, e implementación
el SEN garantiza que
impulsar verdaderas
articulado revoluciones
de componentes educativas
encargados de de herramientas de big data.
cada proceso estadístico tenga un código
y culturales.
producir y difundir las estadísticas oficiales de ética, que asegura la rigurosidad con la
nacionales y territoriales. El DANE es ente Alineado a lo y difunde
que se recopila anterior, la se hará uny
información,
El abordaje
rector de estas
del sistema novedosas
(DANE, s.f.). tendencias reconocimiento de los retos
protege la confidencialidad quecon los que
proveen los
en la gestión nacional de información para cuenta
dueñoseldepaís
losydatos
los distintos sectores
(Naciones sociales,
Unidas, 2013).
monitorear el progreso de los países en el para la producción, utilización y colaboración
cumplimiento de los Objetivos de Desarrollo que permitan el aprovechamiento del big
Sostenible (ODS), requiere también del debate data en la medición y evaluación de la agenda
y reflexión sobre las nuevas herramientas, desarrollo sostenible en Costa Rica.
capacidades y mecanismos de gestión
necesarios para su implementación.
8 Para mayor información, el lector puede consultar el siguiente link, donde puede encontrar el listado de las entidades
que conforman el SEN.
Network
www.bd4d.net 3
13Figura 4. Integrantes del SEN
Introducción
El contundente desarrollo de las tecnologías Es por ello que en el presente documento
de la información y comunicación en la se hará una revisión general del contexto
última década ha generado hoy en día las nacional en materia del uso de big data para
transferencia de grandes volúmenes de datos medir los indicadores de los ODS, primero
(big data de ahora en adelante). Ejemplo de haciendo un reconocimiento contextual del
Fuente: SEN y DANE
ello es la información que circula cada minuto ecosistema nacional de datos y el uso de
en redes sociales, páginas web y teléfonos fuentes no tradicionales de datos usadas en
inteligentes, cuya gestión y uso representa un Costa Rica.
Las fuentes de datos no oficiales se entienden Si se considera que las fuentes no oficiales
nuevo reto para la Administración Pública.
como aquellas que no cuentan con el aval de información tienen un alto potencial
de la oficina nacional de estadística y, por Igualmente, senivel
de uso, por el busca acercary al
de detalle lector
temáticas
El análisis de grandes datos (big data) puede a una conceptualización del refleja
términounay
lo tanto, no son consideradas o incluidas específicas de trabajo, esto
mejorar la toma de decisiones en áreas críticas características
en las estadísticas oficiales. Un ejemplo son oportunidad dedel big data,
trabajar con la
nuevos finalidad
campos de
del desarrollo, como la salud, el empleo, la de dar a conocer la importancia de este
las investigaciones, reportes o estudios que medición o complementar las estadísticas
productividad, la seguridad y la gestión de tema en la Agenda 2030, y cuál ha sido el
realizan algunas instituciones del sector oficiales.
desastres naturales, por nombrar algunas. avance desde la visión de algunos actores
privado o la sociedad civil.
Pero para ello, se deben generar nuevas nacionales relevantes, quienes generan
alianzas entre todos los actores involucrados e capacitación, investigación e implementación
Fuentes
impulsar verdaderas deeducativas
revoluciones datos según su estructura
de herramientas de big data.
y culturales.
El gran conjunto de fuentes de información Alineado a unloanálisis,
hace posible anterior,
sin lase hará un
necesidad de
El abordaje
que de estaspara
está disponible novedosas tendencias
el análisis de datos reconocimiento de los retos con los
procesamiento previo. Estas son las fuentesque
enclasifica
se la gestión nacional
en tres tipos:de información semi
estructurados, para cuenta
de datosel país
quey usualmente
los distintos sectores
genera sociales,
el DANE
monitorear el yprogreso
estructurados de los países en el
no estructurados. para la producción, utilización
para calcular los indicadores ODS.y colaboración
cumplimiento de los Objetivos de Desarrollo que permitan el aprovechamiento del big
Sostenible
Las (ODS),
fuentes de requiere también del debate
datos estructuradas son data en la existen
También medición y evaluación
las fuentes dededatos
la agenda
semi
y reflexión sobre las nuevas herramientas,
aquellas que se presentan en un formato desarrollo sostenible en Costa Rica.
estructurados. Estas generalmente tienen
capacidades
predefinido (poryejemplo
mecanismos
las hojasde gestión
de cálculo) un formato definido, pero son de difícil
ynecesarios para su
se caracterizan porimplementación.
tener un orden claro que comprensión para el usuario y requieren
Network
www.bd4d.net 3
14un procesamiento
Introducción
para
facilitar su
interpretación. Un ejemplo de estas fuentes
significativa al cálculo de indicadores ODS.
En especial si se consideran las falencias de
de datos sería el texto de etiquetas en información que se presentan actualmente
lenguajes XML y XTML. en el país, pues según la información del
portal ODS de Colombia9, 61 de las 169
Finalmente, existen las fuentes de datos no metas carecen de información que permita
estructuradas.
El contundenteEstas carecen
desarrollo de tecnologías
de las un formato realizar
Es un adecuado
por ello seguimiento.
que en el presente El DNP
documento
de
de lapresentación
información claro, pues consisten
y comunicación en la en hará
se su informe Avances
una revisión y Desafíos
general para
del contexto
de información
última década ha proveniente
generado hoydeen correos
día las el Seguimiento
nacional de los
en materia ODSdeenbigColombia
del uso data paray
electrónicos, fotografías,
transferencia de mensajes de
grandes volúmenes texto
de datos el documento
medir Conpes
los indicadores 3918,
de los ODS,elaborado
primero
o(big
archivos deahora
data de audioen
y vídeo.
adelante). Ejemplo de por el un
haciendo DNP, para el 2017,
reconocimiento sólo del
contextual el
ello es la información que circula cada minuto 54% de nacional
ecosistema la información
de datos y para los
el uso de
Es
en pertinente resaltar
redes sociales, que web
páginas las fuentes de
y teléfonos indicadores
fuentes ODS estaba
no tradicionales disponible.
de datos De
usadas en
datos semiestructurados
inteligentes, cuya gestión yy no
usoestructurados,
representa un esta manera,
Costa Rica. 30% era información parcial o
que
nuevoactualmente no son consideradas
reto para la Administración Pública. requería mejoras, y no se contaban con datos
como parte de las estadísticas oficiales, o metodologías
Igualmente, se para el 16%
busca restante.
acercar al lector
pueden
El análisis llegar a contribuir
de grandes de puede
datos (big data) forma a una conceptualización del término y
mejorar la toma de decisiones en áreas críticas características del big data, con la finalidad
del desarrollo, como la salud, el empleo, la de dar a conocer la importancia de este
productividad, la seguridad y la gestión de tema en la Agenda 2030, y cuál ha sido el
desastres naturales, por nombrar algunas. avance desde la visión de algunos actores
Pero para ello, se deben generar nuevas nacionales relevantes, quienes generan
alianzas entre todos los actores involucrados e capacitación, investigación e implementación
impulsar verdaderas revoluciones educativas de herramientas de big data.
y culturales.
Alineado a lo anterior, se hará un
El abordaje de estas novedosas tendencias reconocimiento de los retos con los que
en la gestión nacional de información para cuenta el país y los distintos sectores sociales,
monitorear el progreso de los países en el para la producción, utilización y colaboración
cumplimiento de los Objetivos de Desarrollo que permitan el aprovechamiento del big
Sostenible (ODS), requiere también del debate data en la medición y evaluación de la agenda
y reflexión sobre las nuevas herramientas, desarrollo sostenible en Costa Rica.
capacidades y mecanismos de gestión
necesarios para su implementación.
9 Consultar https://www.ods.gov.co/tools/data-availability
Network
www.bd4d.net 3
15La importancia
Introducción
de las fuentes de datos
El contundente desarrollo de las tecnologías Es por ello que en el presente documento
de la información
Colombia y comunicación
ha mostrado en los
gran interés en la se
la hará una revisión
protección de losgeneral del contexto
derechos de los
última no
datos década ha generado
estructurados. hoyesta
Por en día las
razón, nacional en materia
ciudadanos del uso de
en el contexto debig
la data para
creciente
transferencia
se de grandes
desarrolló volúmenes de
el Documento datos
Conpes medir los indicadores
transformación de la de
vidalosdiaria
ODS,en
primero
datos
(big data
3920, de cual
en el ahoraseenpropone:
adelante).
“laEjemplo de
definición haciendo
digitales un reconocimientoy contextual
cuantificables del
procesables“
elloun
de es la información
marco queecircula
jurídico cada minuto
institucional que ecosistema nacional
(Conpes 3920). deforma,
De esta datossey promueven
el uso de
en redes sociales,
maximice páginas
la obtención de web y teléfonos
beneficios del fuentes no en
esfuerzos tradicionales de datos
la generación usadas en
y divulgación
inteligentes, cuya gestión
aprovechamiento y uso representa
de datos, permita unla Costa Rica. de datos no oficiales para el
de fuentes
nuevo reto para
cooperación la Administración
entre los sectores Pública.
público desarrollo sostenible.
y privado y, al mismo tiempo, refuerce Igualmente, se busca acercar al lector
El análisis de grandes datos (big data) puede a una conceptualización del término y
mejorar la toma de decisiones en áreas críticas
características del big data, con la finalidad
Datos abiertos en Colombia
del desarrollo, como la salud, el empleo, la de dar a conocer la importancia de este
productividad, la seguridad y la gestión de tema en la Agenda 2030, y cuál ha sido el
Otro de los grandes avances en el país es en este módulo los usuarios pueden
desastres naturales, por nombrar algunas. avance desde la visión de algunos actores
su política de datos abiertos. Entre estos compartir información con el portal. Conoce
Pero para ello, se deben generar nuevas nacionales relevantes, quienes generan
adelantos se puede citar el portal de datos está a disposición de los usuarios que
alianzas entre todos los actores involucrados e capacitación, investigación e implementación
abiertos datos.gov.co, creado por Ministerio quieran enterarse sobre investigaciones y
impulsar verdaderas revoluciones educativas de herramientas de big data.
de las Tecnologías de la Información y visualizaciones hechas con datos abiertos.
y culturales.
las Comunicaciones (MINTIC), en el cual
Alineado a lo anterior, se hará un
se publican bases de datos que incluyen Otro ejemplo fue la aprobación de la ley
El abordaje de estas novedosas tendencias reconocimiento de los retos con los que
big data e investigaciones de diferentes 1712, “por medio de la cual se crea la Ley de
en la gestión nacional de información para cuenta el país y los distintos sectores sociales,
organizaciones gubernamentales para Transparencia y del Derecho de Acceso a
monitorear el progreso de los países en el para la producción, utilización y colaboración
libre consulta. Esta información es revisada la Información Pública Nacional y se dictan
cumplimiento de los Objetivos de Desarrollo que permitan el aprovechamiento del big
previamente por el MINTIC. El portal está otras disposiciones.” (Ley 1712, 2014). Esta ley
Sostenible (ODS), requiere también del debate data en la medición y evaluación de la agenda
compuesto por tres módulos: Descubre, obliga a todas las entidades a publicar sus
y reflexión sobre las nuevas herramientas, desarrollo sostenible en Costa Rica.
Publica y Conoce. Descubre sirve para datos, siempre y cuando no se encuentren
capacidades y mecanismos de gestión
consultar bases de datos publicadas dentro de dos categorías: información
necesarios para su implementación.
para investigación, crear visualizaciones pública clasificada e información pública
o desarrollar historias. Publica funciona reservada. (Ver figura 5)
desde la perspectiva de la oferta, ya que
Network
www.bd4d.net 3
16También puede leer