Generalidades del big data para el desarrollo sostenible en Colombia - Junio, 2019 - Cepei
←
→
Transcripción del contenido de la página
Si su navegador no muestra la página correctamente, lea el contenido de la página a continuación
Generalidades del big data para el desarrollo sostenible en Colombia Autores: Margarita Vaca Juan Camilo Vega Junio, 2019
Generalidades del big data para el desarrollo sostenible en Colombia Dirección general: Philipp Schönrock Autores: Margarita Vaca y Juan Camilo Vega Edición y revisión técnica: Fredy Rodríguez Edición de apoyo: Alexandra Roldán y Carolina Vegas Diseño y diagramación: Alba Pabón Bogotá D.C., Colombia Junio de 2019
Contenido Introducción............................................................................................................... 4 Contexto del desarrollo sostenible.................................................................. 5 ¿Qué es el BIG DATA?.............................................................................................. 8 Contexto del big data en Colombia.................................................................. 9 Fuentes de datos.................................................................................................. 13 La importancia de las fuentes de datos .................................................... 16 Conclusiones......................................................................................................... 21 Bibliografía............................................................................................................. 22 Acerca de Cepei .................................................................................................. 25
Introducción La necesidad de aprovechar los datos información, que ayude a determinar las que son producidos día a día es cada vez causas de este problema. Algunos métodos más evidente. En especial, cuando son un tradicionales para la recolección y análisis insumo principal para la toma de decisiones de datos han sido, por ejemplo, sobrevolar a nivel regional, nacional y subnacional. Sin diferentes zonas del país e identificar las embargo, uno de los principales problemas áreas donde se presenta el fenómeno para que enfrentan los países es la alta inversión calcular la superficie afectada. En el caso de recursos que representa la recolección, de la deforestación, el big data provee el el procesamiento, el análisis y la difusión de uso de imágenes satelitales para identificar esta información. patrones de cambio en los bosques del territorio colombiano. Lo cual permite la Es por eso, que el uso de nuevas herramientas implementación de políticas orientadas a de tecnología y la implementación de controlar esta situación. fuentes no oficiales de información, como el big data, ofrecen alternativas económicas, El presente documento expone el contexto eficientes e innovadoras. Estas permiten del desarrollo sostenible y habla sobre los cerrar brechas de información, así como Objetivos de Desarrollo del Milenio (ODM) y generar evidencia para la toma de decisiones los Objetivos de Desarrollo Sostenible (ODS). y la construcción de nuevas estrategias para Luego aborda el tema de la presencia de los el desarrollo sostenible. tipos de fuentes de información dentro del contexto colombiano, y cómo el big data En el caso colombiano, por ejemplo, la puede contribuir a la implementación de los deforestación es un problema grave. Solo ODS, así como la importancia de usar todas para el 2015, habían sido deforestadas las fuentes de información disponibles en la 56.962 hectáreas (IDEAM, 2018). Esta área consecución de la Agenda 2030. También se equivale en tamaño a ciudades capitales presentan iniciativas en el uso de fuentes no como Popayán, Cali, o, apróximadamente, oficiales de información, las cuales pueden 5 veces Mocoa. Con el fin de encontrar guiar futuros esfuerzos para el uso de este soluciones a estas y otras problemáticas, tipo de datos, con el fin de motivar a distintos surge la necesidad de obtener datos que actores a tenerlas en cuenta como nuevas permitan identificar las zonas críticas, y otra herramientas de medición.
Contexto Introducción del desarrollo sostenible El contundente desarrollo de las tecnologías Es por ello que en el presente documento de la Los información Objetivos y comunicación de Desarrollo en la del Milenio se del hará una revisión desarrollo general sostenible, quedelplantea contexto la última se (ODM) década ha generado consolidaron comohoy un en día las concepto nacional en materia importancia de unadel uso de big data articulación para sólida de transferencia de revolucionario grandes que volúmenessinergias logró establecer de datos medir los indicadores las diferentes delalos esferas de ODS, primero sociedad: medio (big data entre de ahora distintos en adelante). países y actores,Ejemplo de al definir haciendo ambiente,uninclusión reconocimiento social contextual del y desarrollo ellodiscurso un es la información que circulaacada común enfocado minuto mejorar el ecosistema económico. nacional de datos Su objetivo es yeliminar el uso de la en redes general bienestar sociales,de páginas web y Para la población. teléfonos este fuentes no tradicionales desigualdad demedio y proteger el datos ambiente usadas ena inteligentes, fin, se fijaron cuya gestión metas para ylauso representa de erradicación un Costa travésRica. de la construcción de alianzas entre nuevo la reto para pobreza, la Administración la promoción Pública. de de la igualdad diferentes sectores y actores, resaltando género, el mejoramiento de la salud materna Igualmente, se busca la responsabilidad acercar que compartida al deben lector yElla análisis de grandes sostenibilidad deldatos medio(big data) puede ambiente. a una todos asumir conceptualización del término los países y personas. Esta hojay mejorar la toma de decisiones en áreas críticas características del big data,como de ruta fue denominada con lala finalidad Agenda del desarrollo, Aunque como la salud,de la implementación el empleo, la esta hoja de dary a 2030 conocer está la importancia compuesta de este por los Objetivos productividad, de la seguridad ruta presentó avances yen la gestión cada unode tema en la Agenda de Desarrollo 2030, (ODS), Sostenible y cuál ha los sido el cuales desastres de naturales, sus objetivos por nombrar y alcanzó algunas. una reducción avance desde incorporan lasla lecciones visión de algunos actores aprendidas de Pero para ello, significativa de la se debenextrema pobreza generar1 al nuevas 14% en nacionales relevantes, los ODM y portan quienes el lema de “Nogeneran dejar a alianzas 2015; entre todos un aumento dellos actoresde número involucrados estudiantes e capacitación, nadie atrás”. investigación Para lograr ele implementación propósito de la impulsar verdaderas matriculados revoluciones en instituciones educativas de educación de herramientas Agenda 2030, 189depaíses big data. acordaron 17 ODS, y culturales. primaria en 8 puntos porcentuales; una compuestos por 169 metas y 241 indicadores, reducción en la mortalidad infantil2 que pasó Alineado a fortalecer que buscan lo anterior,los se hará un procesos de El abordaje de de estas 90 a 43 niños novedosas muertos por cadatendencias 1000; el reconocimiento de losderetos medición y monitoreo con los de los avances que la en la gestión alcance de losnacional defue objetivos información desigual ypara no cuenta misma.el país y los distintos sectores sociales, monitorear permitió el progreso la inclusión de loslos de todos países en el países. para la producción, utilización y colaboración cumplimiento de los Objetivos de Desarrollo que Una permitan el aprovechamiento de las principales del big características de Sostenible Luego, en (ODS), 2015,requiere tambiénuna se identificó del debate nueva data en la medición los ODS es que y están evaluación de la agenda interconectados, y reflexión hoja sobre de ruta conlasunnuevas herramientas, enfoque holístico desarrollo sostenible es decir que en Costa los logros en Rica. cualquiera de capacidades y mecanismos de gestión necesarios 1 para su implementación. El índice de pobreza extrema es calculado como el porcentaje de la población que vive con menos de 1,90 dólares al día, corregido por Paridad de Poder adquisitivo (PPP en inglés). 2 La mortalidad infantil es presentada como el número de menores de un año muertos por cada 1.000. Network www.bd4d.net 3 5
Introducción ellos impacta en menor o mayor medida el cumplimiento de los demás. Asimismo, Es así, que la información que se produce en el día a día, y que usualmente no es conciben un enfoque articulado que tiene considerada por las oficinas de estadística en cuenta componentes innovadores como: u oficinas gubernamentales, ha tomado Ciudades y Comunidades Sostenibles, un rol significativo para determinar nuevas Producción y Consumo Responsables, y soluciones a problemáticas sociales y Paz e Instituciones El contundente Sólidas,de desarrollo presentes en los las tecnologías estadísticas. Es Poren el por ello que ejemplo, presente la pobreza documento ODS de la11,información 12 y 16, respectivamente. y comunicaciónAdemás en la generalmente se se mide general hará una revisión a través del de encuestas contexto brinda un mayor última década detalle de ha generado hoyatención al en día las presenciales nacional en un del en materia número uso designificativo de big data para medio ambiente transferencia a travésvolúmenes de grandes de la Acción de por el datos hogares medir losdel territorio ade indicadores través de preguntas los ODS, primero Clima, Vida (big data deSubmarina, y Vida y Ecosistemas ahora en adelante). Ejemplo de que buscan haciendo unreflejar el estado socioeconómico reconocimiento contextual del Terrestres, ello es la información que circula cada 13, considerados en los ODS 14 y minuto ecosistema nacional de datoseny la de las personas que habitan el vivienda. uso de 15, en respectivamente. redes sociales, páginas web y teléfonos Hacer este fuentes tipo de mediciones no tradicionales de datosrequiere de usadas en inteligentes, cuya gestión y uso representa un una alta Costa inversión, lo cual limita la continuidad Rica. Los ODS nuevo han reto representado para un desafío la Administración para Pública. y cobertura de la misma. todos los países. No sólo por la escasez de Igualmente, se busca acercar al lector recursos El análisisendetérminos grandesde dinero, datos (bigcapital físico data) puede A causa a de esta necesidad, una conceptualización del eltérmino big data, y ymejorar humano, sinodetambién la toma porenlaáreas decisiones necesidad críticas como fuente de características datos del no tradicional, big data, ofrece con la finalidad de delinformación que permita desarrollo, como la salud,enfocar estos el empleo, la medidas de dar a con menores conocer costos gracias la importancia de aeste las recursos de forma productividad, eficienteyyladegestión la seguridad medir de la que se tema enpueden la Agendallevar a cabo 2030, y cuáleste ha tipo sido de el efectividad de los esfuerzos desastres naturales, hechos.algunas. por nombrar ejercicios, sin tener que recurrir a los avance desde la visión de algunos actoresmedios Pero para ello, se deben generar nuevas tradicionales.relevantes, nacionales En un estudio realizado quienes por generan Aalianzas partir entre de esto, todoslos lospaíses actoreshan trabajado involucrados e David Newhouse capacitación, et al. e(2017) investigación se busca implementación aimpulsar través verdaderas de sus Oficinas de Estadística, revoluciones educativas medir de el porcentaje herramientas dedata. de big personas que están Ministerios, y culturales. Comisiones ODS, entre otros bajo la línea de pobreza en México, usando actores en fortalecer las estadísticas imágenes asatelitales Alineado de alta lo anterior, se resolución hará un nacionales El abordaje ydesubnacionales. Empero, estas novedosas esta tendencias entre 2014 y 2015.de reconocimiento Estas los imágenes retos conidentifican los que nueva Agenda nacional en la gestión ha evidenciado la necesidad de información para los materiales cuenta el país y con los que sectores los distintos están hechas las sociales, de incorporar monitorear elnuevas fuentes progreso depaíses de los información en el casas, para la los techos,utilización producción, las paredes, el número y colaboración que faciliten la cumplimiento de identificación deDesarrollo los Objetivos de datos a de pisos que de laselcasas, permitan si tienen un del aprovechamiento auto, bigy mayores niveles Sostenible (ODS),de desagregación. requiere también del debate a partir data en lade eso se yestima medición el porcentaje evaluación de de la agenda y reflexión sobre las nuevas herramientas, población sostenible desarrollo que se encuentra en estado de en Costa Rica. capacidades y mecanismos de gestión pobreza, por municipio. necesarios para su implementación. Network www.bd4d.net 3 6
Introducción Figura 1. Estimaciones de pobreza: municipalidades urbanas México Legend Municipality Urban Poverty Estimates 26% - 37% 37% - 48% 48% - 59% 59% - 70% 70% - 81% El contundente desarrollo de las tecnologías Es por ello que en el Nopresente Data documento de la información y comunicación en la se hará una revisión general del contexto última década ha generado hoy en día las nacional en materia del uso de big data para transferencia de grandes volúmenes de datos medir los indicadores de los ODS, primero (big data de ahora en adelante). Ejemplo de haciendo un reconocimiento contextual del ello es la información que circula cada minuto ecosistema nacional de datos y el uso de en redes sociales, páginas web y teléfonos fuentes no tradicionales de datos usadas en inteligentes, cuya gestión y uso representa un Costa Rica. nuevo reto para la Administración Pública. Igualmente, se busca acercar al lector El análisis de grandes datos (big data) puede a una conceptualización del término y mejorar la toma de decisiones en áreas críticas características del big data, con la finalidad Fuente: David Newhouse et al. (2017) del desarrollo, como la salud, el empleo, la de dar a conocer la importancia de este productividad, la seguridad y la gestión de tema en la Agenda 2030, y cuál ha sido el Un ejemplonaturales, desastres adicionalpor del nombrar uso de big data algunas. dinámica avance migratoria desde de de la visión la algunos población hacia actores es la alianza Pero entre para ello, se Cepei debeny Telefónica, para generar nuevas y fuera de Mocoa nacionales antes, durante relevantes, quienes y generan después medir elentre alianzas impacto todosmigratorio los actoresde la avenida involucrados e de la tragedia. capacitación, Este es uno investigación de los varios e implementación torrencial ocurrida en impulsar verdaderas Mocoa en revoluciones el 2017. educativas casos de de acciónde herramientas que bigofrecen data. las fuentes no Ay culturales. través de la posición georeferenciada de oficiales de información, que ayudan a cerrar los teléfonos móviles, es posible explicar la las brechasa deloinformación. Alineado anterior, se hará un El abordaje de estas novedosas tendencias reconocimiento de los retos con los que en la gestión nacional de información para cuenta el país y los distintos sectores sociales, monitorear el progreso de los países en el para la producción, utilización y colaboración cumplimiento de los Objetivos de Desarrollo que permitan el aprovechamiento del big Sostenible (ODS), requiere también del debate data en la medición y evaluación de la agenda y reflexión sobre las nuevas herramientas, desarrollo sostenible en Costa Rica. capacidades y mecanismos de gestión necesarios para su implementación. Network www.bd4d.net 3 7
Introducción ¿Qué es el BIG DATA? El contundente desarrollo de las tecnologías Es por ello que en el presente documento Especialistas de la información en analítica y comunicación en la de se datos argumentan hará una que: revisión general del contexto última década ha generado hoy en día las nacional en materia del uso de big data para “El término Big Data se aplica a la información que no transferencia de grandes volúmenes de datos medir los indicadores de los ODS, primero se puede procesar o analizar mediante los procesos (big data de ahora en adelante). Ejemplo de haciendo un reconocimiento contextual del o herramientas ello es la información tradicionales” que circula cada minuto ecosistema nacional de datos y el uso de en redes sociales, páginas web y teléfonos fuentes no tradicionales de datos usadas en (Zikopoulos inteligentes, cuya gestión y usoet al, 2011). representa un Costa Rica. nuevo reto para la Administración Pública. Igualmente, se busca acercar al lector El análisis de grandes datos (big data) puede a una conceptualización del término y mejorar la toma de decisiones en áreas críticas características del big data, con la finalidad del desarrollo, como la salud, el empleo, la de dar a conocer la importancia de este productividad, Partiendo la seguridad de esta y ladata noción, big gestión de puede tema Este enconcepto la Agenda 2030, y cuállas engloba ha sido el cinco desastrescomo definirse naturales, por nombrar un concepto algunas. evolutivo que avance desde laque características visióncomprenden de algunos actores al big Pero para laello, describe se deben generar transformación nuevas de grandes nacionales relevantes, data: variedad, volumen,quienes generan velocidad, valor, alianzas entrede conjuntos todos los actores(estructurados, datos involucrados e capacitación, y veracidad. investigación e implementación Para una mayor comprensión, impulsar verdaderasy revoluciones semiestructurados educativas no estructurados) o la de en herramientas el siguientedecaso big data. se ejemplifican las y culturales. combinación de estos, que se generan de características del big data: acuerdo con la dinámica de las sociedades Alineado a lo anterior, se hará un yElse abordaje de en traducen estas novedosas tendencias diagnósticos, directrices reconocimiento El mundial dede los de fútbol retos con2018 Rusia los atrajo que oen parámetros, la gestión nacional para de la información para correcta toma cuenta el país a miles dey personas los distintos sectores ciudades a distintas sociales, monitorear de el progreso decisiones en un de los países tiempo en el y espacio paradel la producción, utilización país organizador. Esto ysecolaboración convirtió en cumplimiento de determinado. Dellos Objetivos mismo de Desarrollo modo, big data queuna permitan el aprovechamiento gran oportunidad del big para las cadenas Sostenible (ODS), requiere también del debate es un insumo potencial para la extracción datahoteleras, en la medición y evaluaciónde al apoderarse de la laagenda mayor y reflexión de sobre entre correlaciones las nuevas herramientas, variables clave que desarrollo sostenible en Costa Rica. porción de demanda por habitaciones capacidades permiten y mecanismos explicar las causas dede gestión un evento, en las ciudades donde se celebraron los necesarios anticipar para su implementación. tendencias o resultados, e inferir partidos. Para cumplir con su objetivo, posibles soluciones a nivel global, nacional era necesario analizar la información y subnacional. recolectada de sus clientes durante los Network www.bd4d.net 3 8
Introducción días del evento, para así poder ofrecer los paquetes de estadía adecuados a los a fechas determinadas, el análisis de la información debía hacerse lo más rápido clientes potenciales. posible para tomar ventaja de esto y prever eventualidades desfavorables. La información recolectada puede comprender la edad, nacionalidad, sexo, Por último, analizar esta información preferencias desarrollo El contundente por servicios (paquetes de las de tecnologías representó Es por ello queuna enoportunidad el presente para la toma documento de transporte o de ysitios la información turísticos), en comunicación entre la se de hará decisiones una revisiónbasada general en del evidencia. contexto otros. última Con esta década havariedad generadoy gran hoyvolumen de en día las El big nacional en data representó materia del uso deun biggran valor data para información, transferencia delos hoteles grandes crearon perfiles volúmenes de datosde para medir loslasindicadores empresas de a laloshora deprimero ODS, unificar (bigclientes data depotenciales en los cuales ahora en adelante). podrían Ejemplo de recursos haciendo un areconocimiento través de la identificación de contextual del enfocar sus esfuerzos. Asimismo, cientos ello es la información que circula cada minuto oportunidades ecosistema en de nacional el uso de ylos datos el insumos. uso de en de clientes redes llegaban sociales, a losweb páginas hoteles en esta y teléfonos Por otra fuentes parte, la veracidad no tradicionales de los de datos datosen usadas es época, por inteligentes, estagestión cuya razón, ylauso información representaque un un Rica. Costa factor crítico, dado que no se tiene un se reto nuevo generaba para ladiariamente aumentaba Administración Pública. a control de la calidad de los mismos, ni un una velocidad impresionante. Debido a proceso estandarizado Igualmente, en la recolección se busca acercar al lector que la de El análisis duración grandesdel evento datos (big era data)limitado puede de la conceptualización a una información. del término y mejorar la toma de decisiones en áreas críticas características del big data, con la finalidad del desarrollo, como la salud, el empleo, la de dar a conocer la importancia de este productividad, la seguridad y la gestión de tema en la Agenda 2030, y cuál ha sido el desastres naturales, Contexto por nombrar algunas.del big avance data desde la visión de algunos actores en Pero para ello, se deben generar nuevas Colombia alianzas entre todos los actores involucrados e nacionales relevantes, quienes generan capacitación, investigación e implementación impulsar verdaderas revoluciones educativas de herramientas de big data. y culturales. Alineado a lo anterior, se hará un El abordajehade sido Colombia estasuno novedosas de lostendencias primeros reconocimiento de los retos con el fin de investigar con los que o visualizar esta en la gestión nacional de información países en promover políticas públicas para cuenta el país y los distintos sectores información y promover la publicación desociales, monitorear para el progreso el desarrollo de los países sostenible. en ve Esto se el para la producción, nuevos utilización conjuntos de y colaboración datos. En esta política cumplimiento reflejado en la de los Objetivos creación de Desarrollo de la Comisión ODS, que permitaninformación se comparte el aprovechamiento del big bajo la protección Sostenible (ODS), estructurada requiere por las también entidades del debate responsables data en la medición del Habeas Data, ycon evaluación de la agenda la finalidad de no y reflexión de sobre lasque impulsar acciones nuevas vayanherramientas, en línea con desarrollo sostenible en Costa Rica. vulnerar los derechos de los ciudadanos capacidades el y de cumplimiento mecanismos las metas dedela Agenda gestión durante el proceso. necesarios 2030. para su implementación. Adicionalmente, existe una ley y una política de datos abiertos que apoya Para ilustrar al lector acerca de la realidad la publicación de datos de interés general, colombiana en materia de planeación, el Network www.bd4d.net 3 9
y Social (CONPES) -que Introducción Consejo Nacional de Política Económica es el principal de esfuerzos dentro de sus políticas públicas. Por ejemplo, el gobierno nacional junto con organismo en materia de desarrollo el Departamento Nacional de Planeación económico y social- se encarga de brindar (DNP) presentó una de las herramientas asesoría al gobierno nacional en estos temas para la puesta en marcha de la Agenda 2030 y visibiliza su labor a través de documentos en Colombia: el Documento Conpes 3918, el denominados Conpes. cual comprende a las entidades encargadas El contundente desarrollo de las tecnologías Es por ello que en el presente documento de cada una de las 147 metas3 de los ODS, de la información y comunicación en la se hará una revisión general del contexto En el contexto de América Latina, Colombia la definición de indicadores nacionales y las última década ha generado hoy en día las nacional en materia del uso de big data para ha sido uno de los países más comprometidos metas del país para el año 2030, incluyendo transferencia de grandes volúmenes de datos medir los indicadores de los ODS, primero en promover espacios donde se generan la regionalización de las rutas de acción (big data de ahora en adelante). Ejemplo de haciendo un reconocimiento contextual del y comparten datos para el desarrollo y la definición del esquema de reporte de ello es la información que circula cada minuto ecosistema nacional de datos y el uso de sostenible. Esto se evidencia en la inclusión información para los indicadores. en redes sociales, páginas web y teléfonos fuentes no tradicionales de datos usadas en inteligentes, cuya gestión y uso representa un Costa Rica. nuevo reto para la Administración Pública. Organizaciones a cargo deIgualmente, los ODSseenbusca Colombia acercar al lector El análisis de grandes datos (big data) puede a una conceptualización del término y mejorar En la toma de existen Colombia decisiones30 en áreas críticas entidades características aquellas que del big data, tienen con la finalidad una responsabilidad del desarrollo, encargadas como la de liderar el salud, el empleo, cumplimiento la de la de dar a conocer directa, mientrasla importancia las de este instituciones productividad, Agenda laprincipal 2030. La seguridad y la gestión entidad de es el DNP, tema en la Agenda acompañantes son 2030, y cuál aquellas quehatienen sido el la desastres que además naturales, por nombrar de encargarse algunas. de la medición avance de misión desde la visión brindar apoyodea algunos actores las instituciones Pero de los para ello, seODS, indicadores deben generar formula nuevas las políticas nacionales líderes, puesrelevantes, quienesde generan pueden incidir manera alianzas entre públicas paratodos cadalosperíodo actores involucrados presidencial.e capacitación, directa sobreinvestigación e implementación esa meta. Por ejemplo, para impulsar Estas verdaderas luego revoluciones constituyen educativas el Plan Nacional de de meta la herramientas de big la 1.1 (erradicar data. pobreza extrema), y culturales. Desarrollo. la institución líder es el Departamento Alineado de a lo Social Prosperidad anterior, se entidades y como hará un El abordaje En de estas Conpes el documento novedosas tendencias 3918, están reconocimiento de acompañantes los los están retosministerios con los que de en la gestión nacional de información para definidas las instituciones a cargo de cada 4 cuenta el país y los distintos sectores sociales, Agricultura, Minas y Energía, y Educación. monitorear meta. el progreso Se definen de los paíseslíderes como instituciones en el para la producción, utilización y colaboración cumplimiento de los Objetivos de Desarrollo que permitan el aprovechamiento del big Sostenible (ODS), requiere también del debate data en la medición y evaluación de la agenda y reflexión sobre las nuevas herramientas, desarrollo sostenible en Costa Rica. capacidades y mecanismos de gestión necesarios para su implementación. 3 Dado que las 22 metas restantes requieren de esfuerzos conjuntos entre actores gubernamentales e internacionales. 4 Consultar Anexo E del documento Conpes 3918. Network www.bd4d.net 3 10
Comisión de Alto Nivel ODS en Colombia: Miembros - Miembrosyy estructura Figura 2. Comisión ODS en Colombia Introducción estructura El contundente desarrollo de las tecnologías Es por ello que en el presente documento de la información y comunicación en la se hará una revisión general del contexto última década ha generado hoy en día las nacional en materia del uso de big data para transferencia de grandes volúmenes de datos medir los indicadores de los ODS, primero (big data de ahora en adelante). Ejemplo de haciendo un reconocimiento contextual del ello es la información que circula cada minuto ecosistema nacional de datos y el uso de en redes sociales, páginas web y teléfonos fuentes no tradicionales de datos usadas en inteligentes, cuya gestión y uso representa un Costa Rica. nuevo reto para la Administración Pública. Igualmente, se busca acercar al lector Presidente y Secretaría Técnica: El análisis de grandes datos (bigDepartamento data) puede a Planeación-DNP Nacional de una conceptualización del término y mejorar la toma de decisiones en áreas críticas características del big data, con la finalidad Comité técnico*: Representantes de todas las instituciones miembro del desarrollo, como la salud, el empleo, la de dar a conocer la importancia de este Representantes de instituciones invitadas Representantes productividad, la seguridad y la gestión de de la tema unidad consultiva en la Agenda 2030, y cuál ha sido el GRUPOS DE TRABAJO desastres naturales, por nombrar algunas. avance desde la visión de algunos actores Pero para ello, se deben generar nuevas nacionales relevantes, quienes generan alianzas entre todos los actores involucrados e capacitación, investigación e implementación impulsar verdaderas revoluciones educativas de herramientas de big data. y culturales. Indicadores Movilización Implementación Alineado Comunicaciones a lo anterior, Incidenciaseinternacional hará un (Liderado de recursos Subnacional (Liderado por el DNP) (Liderado por la El abordaje por DANE)de estas novedosas (Liderado por tendencias (Liderado por elreconocimiento de los Cancillería) DNP) Crear una estrategia retos con los que Define los indicadores el Ministerio Apoyar a las unidades para aumentar Mantener la incidencia en la gestión nacional de información para cuenta el país y los distintos sectores sociales, nacionales de Hacienda) territoriales para alinear el conocimiento del país en los foros monitorear el progresoRecomendar de los medidas países en el locales los planes para la deproducción, la Agenda 2030 utilización y colaboración internacionales y fuentes de desarrollo en la ciudadanía, otras cumplimiento de los Objetivos de Desarrollo de financiamiento a los Objetivos que permitan instituciones el aprovechamiento del big y actores innovadoras Sostenible (ODS), requiere también del debate Globales interesados data en la medición y evaluación de la agenda y reflexión sobre las nuevas herramientas, desarrollo sostenible en Costa Rica. * De acuerdo al decreto 280 of 2015 capacidades y mecanismos de gestión ** Miembro no permanente necesarios para su implementación. Fuente y diseño: CEPEI. Network www.bd4d.net 3 11
diferentes regiones del país como la Caribe, Centro Oriente, Eje Cafetero y Antioquia, Pacífico y Centro Sur (con excepción de la región de los Llanos). Además de incorporar los ODS como referentes de sus procesos de planeación, los departamentos en mención hicieron una asociación explícita y detallada de los ODS con los componentes Introducción estratégicos Con el fin de desusidentificar planes de desarrollo fortalezasy/oycon losseguimiento indicadores definidos en los mismos.de al cumplimiento De tal la forma, es posible identificar 2 categorías debilidades del país en la implementación en estos planes, a saber: 1) PDD con incorporación Agenda 2030. Para garantizar que las rutas alta de los ODS, con énfasis en la de la Agenda 2030, el Departamentoasociación con los componentes de acción estratégicos (p. ej., asociación sean implementadas con a nivel dimensiones, ejes, líneas, objetivos, programas o proyectos, como lo evidencian los PDD de Boyacá, Administrativo Nacional de Estadística regional, la información de seguimiento Córdoba, Cundinamarca y Santander); y, 2) PDD con incorporación alta de los ODS, con énfasis en (DANE)- oficina nacional de estadística-, debe tener un nivel de desagregación que la asociación con componentes de medición (p. ej., en cuanto a indicadores, como en los casos de tiene la misión Caquetá, Quindíode medir los y Nariño). indicadores En las permita siguientes páginas identificar se presentan brechas características las principales sociales que ODS, así correspondientes decontundente los PDD como generar a cada y compartir orienten la toma decisiones de los actores una de las categorías El desarrollo de las tecnologías Es porseñaladas. ello que en el presente documento información para realizar el adecuado departamentales y municipales. de la información y comunicación en la se hará una revisión general del contexto última década ha generado hoy en día las Figura 4.5 nacional en materia del uso de big data para Figura 3. Buenas prácticas en la incorporación de los ODS en los PDD Buenas transferencia de grandes prácticasdeendatos volúmenes la incorporación de los medir losODS en los PDD de los ODS, primero indicadores (big data de ahora en adelante).San Andrés Ejemploy Providencia de haciendo un reconocimiento contextual del ello es la información que circula cada minuto La Guajira Santandernacional de datos y el uso de ecosistema Atlántico Población: 2.071.016 Hab. 30.537 Km² Magdalena en redes sociales, páginas web y teléfonos Sucre Cesar fuentesExtensión: no tradicionales de datos usadas en inteligentes, cuya gestión y uso representa un Córdoba Bolívar Costa Rica. Norte de Santander Córdoba Población: 1.736.170 Hab. Boyacá nuevo reto para la Administración Pública. Extensión: 25.020 Km² Población: 1.278.107 Hab. Km² Antioquia Santander Extensión: 23.189acercar Arauca Igualmente, se busca al lector Chocó Boyacá Caldas Casanare El análisis de grandes datos Quindío (big data)Quindío puede Bogotá Risaralda Cundinamarca a una Vichada conceptualización del término y mejorar la tomaPoblación: 568.506 Hab. en áreas de decisiones críticas Valle del Cauca Tolima características delCundinamarca big data, con la finalidad Extensión: 1.845 Km² Población: 2.721.368 Hab. Meta Extensión: la 24.210 Km² Guainía del desarrollo, como la salud, el empleo, Cauca Huila la Guaviare de dar a conocer importancia de este Nariño productividad, la seguridad Nariño y la gestión Putumayo de Caquetá tema Vaupés en la Agenda 2030, y cuál ha sido el desastres Población: 1.765.906 naturales, por Hab. nombrar algunas. avance desde la visión de algunos actores Extensión: 33.268 Km² Pero para ello, se deben generar nuevas Amazonas nacionales relevantes, quienes generan Caqueta alianzas entre todos los actoresPoblación: involucrados 483.846 Hab. e capacitación, investigación e implementación Extensión: impulsar verdaderas revoluciones educativas 88.965 Km ² de herramientas de big data. yFuente: culturales. DNP, DSEPP. Fuente: DNP, DSEPP5 (2017) Alineado a lo anterior, se hará un El 14 abordaje De acuerdo condeinformación estas novedosas tendencias del DANE (Departamento Administrativoreconocimiento deenlos Nacional de Estadística), retosestos su conjunto, con los que departamentos concentran En la el 22 figura% de la 3 población son total del país presentados (10,6 millones los frente a un total nacional Departamental de 48,7 millones (PDD). de Tanto habitantes, en la con base en alineación en la gestión nacional de información para cuenta el país y los distintos sectores sociales, las proyecciones para el año 2016). Así mismo, a partir de información del IGAC (Instituto Geográfico Agustín Codazzi), estos 7 departa- departamentos mentos representan monitorear de un 19 % delSantander, el progreso territorio Boyacá, de loscontinental países de enColombia el con componentes (217.976 para km2 estratégicos frente a una extensión la producción, 6 , como total dey1.141.748 utilización km2).con colaboración Cundinamarca, cumplimiento deCórdoba, los Objetivos Quindío, Nariño de Desarrollo componentes que permitan el medición 7 (inclusión de aprovechamiento del bigde ySostenible Caquetá, querequiere (ODS), son también reconocidos por del debate los Objetivos data de Desarrollo en la medición Sostenible y evaluación en de la agenda promover 48 los planes de desarrollo territoriales, 2016- y reflexiónbuenas prácticas sobre las nuevas en incluir los herramientas, desarrollo sostenible en Costa Rica. ODS dentro dey sus capacidades Planes de de mecanismos Desarrollo gestión 2019). necesarios para su implementación. 5 Dirección de Seguimiento y Evaluación de Políticas Públicas 6 Los componentes estratégicos son los que tienen asociación con dimensiones, ejes, líneas, objetivos, programas o proyectos como lo evidencian los PDD de Boyacá, Córdoba, Cundinamarca y Santander. 7 Los componentes de medición están enfocados a indicadores como en los casos de Caquetá, Quindío y Nariño. Network www.bd4d.net 3 12
Fuentes de datos Introducción Las fuentes de datos pueden ser clasificadas entre oficiales o tradicionales, y no oficiales El contundente en dos grandes desarrollo categorías.de Delas tecnologías acuerdo a su Es por o no ello que en el presente documento tradicionales. de la yinformación origen y con articulación comunicación en la las estadísticas se En hará una revisión la segunda general categoría, lasdel contexto fuentes de última década oficiales, y segúnhalagenerado estructurahoy de en losdía las datos. nacional en materia del uso de big data datos se caracterizan como estructuradas,para transferencia En el primerdecaso, grandes las volúmenes fuentes dede datos datos medir los indicadores semiestructuradas y node los ODS, primero estructuradas, lo (big data estarán de ahorapor definidas eneladelante). nivel de Ejemplo de rigurosidad haciendo un reconocimiento contextual del cual indicará el nivel, el tipo de formato de la ello es la información metodológica que circula de medición cada minuto dado por la ecosistema información,nacional deprocesamiento y su nivel datos y el usopara de en redes Oficina sociales, Nacional de páginas webyyseteléfonos Estadística, dividen fuentes obtener no tradicionales de datos usadas en resultados. inteligentes, cuya gestión y uso representa un Costa Rica. nuevo reto para la Administración Pública. Igualmente, se busca acercar al lector El análisis de grandesFuentes depuede datos (big data) datos según su origen a una conceptualización del término y mejorar la toma de decisiones en áreas críticas características del big data, con la finalidad del desarrollo, Las como lade fuentes oficiales salud, el empleo,son información la de darfigura En la a conocer la importancia 4 se presentan de este el número de productividad, aquellas la seguridad producidas y la gestión por o supervisadas de tema en la entidades 8 Agenda 2030, y cuál ha sido el que constituyen el SEN, las cuales desastres las oficinas naturales, por nombrar de estadística algunas. nacional de cada avance incluyendesde tantolaentidades visión de algunos estatalesactores como Pero para ello, se deben generar nuevas país. En el contexto colombiano, el Sistema nacionales relevantes, quienes generan personas de los sectores público, privado alianzas entre Estadístico todos los(SEN) Nacional actores esinvolucrados el conjuntoe capacitación, investigación y mixto. Asimismo, e implementación el SEN garantiza que impulsar verdaderas articulado revoluciones de componentes educativas encargados de de herramientas de big data. cada proceso estadístico tenga un código y culturales. producir y difundir las estadísticas oficiales de ética, que asegura la rigurosidad con la nacionales y territoriales. El DANE es ente Alineado a lo y difunde que se recopila anterior, la se hará uny información, El abordaje rector de estas del sistema novedosas (DANE, s.f.). tendencias reconocimiento de los retos protege la confidencialidad quecon los que proveen los en la gestión nacional de información para cuenta dueñoseldepaís losydatos los distintos sectores (Naciones sociales, Unidas, 2013). monitorear el progreso de los países en el para la producción, utilización y colaboración cumplimiento de los Objetivos de Desarrollo que permitan el aprovechamiento del big Sostenible (ODS), requiere también del debate data en la medición y evaluación de la agenda y reflexión sobre las nuevas herramientas, desarrollo sostenible en Costa Rica. capacidades y mecanismos de gestión necesarios para su implementación. 8 Para mayor información, el lector puede consultar el siguiente link, donde puede encontrar el listado de las entidades que conforman el SEN. Network www.bd4d.net 3 13
Figura 4. Integrantes del SEN Introducción El contundente desarrollo de las tecnologías Es por ello que en el presente documento de la información y comunicación en la se hará una revisión general del contexto última década ha generado hoy en día las nacional en materia del uso de big data para transferencia de grandes volúmenes de datos medir los indicadores de los ODS, primero (big data de ahora en adelante). Ejemplo de haciendo un reconocimiento contextual del Fuente: SEN y DANE ello es la información que circula cada minuto ecosistema nacional de datos y el uso de en redes sociales, páginas web y teléfonos fuentes no tradicionales de datos usadas en inteligentes, cuya gestión y uso representa un Costa Rica. Las fuentes de datos no oficiales se entienden Si se considera que las fuentes no oficiales nuevo reto para la Administración Pública. como aquellas que no cuentan con el aval de información tienen un alto potencial de la oficina nacional de estadística y, por Igualmente, senivel de uso, por el busca acercary al de detalle lector temáticas El análisis de grandes datos (big data) puede a una conceptualización del refleja términounay lo tanto, no son consideradas o incluidas específicas de trabajo, esto mejorar la toma de decisiones en áreas críticas características en las estadísticas oficiales. Un ejemplo son oportunidad dedel big data, trabajar con la nuevos finalidad campos de del desarrollo, como la salud, el empleo, la de dar a conocer la importancia de este las investigaciones, reportes o estudios que medición o complementar las estadísticas productividad, la seguridad y la gestión de tema en la Agenda 2030, y cuál ha sido el realizan algunas instituciones del sector oficiales. desastres naturales, por nombrar algunas. avance desde la visión de algunos actores privado o la sociedad civil. Pero para ello, se deben generar nuevas nacionales relevantes, quienes generan alianzas entre todos los actores involucrados e capacitación, investigación e implementación Fuentes impulsar verdaderas deeducativas revoluciones datos según su estructura de herramientas de big data. y culturales. El gran conjunto de fuentes de información Alineado a unloanálisis, hace posible anterior, sin lase hará un necesidad de El abordaje que de estaspara está disponible novedosas tendencias el análisis de datos reconocimiento de los retos con los procesamiento previo. Estas son las fuentesque enclasifica se la gestión nacional en tres tipos:de información semi estructurados, para cuenta de datosel país quey usualmente los distintos sectores genera sociales, el DANE monitorear el yprogreso estructurados de los países en el no estructurados. para la producción, utilización para calcular los indicadores ODS.y colaboración cumplimiento de los Objetivos de Desarrollo que permitan el aprovechamiento del big Sostenible Las (ODS), fuentes de requiere también del debate datos estructuradas son data en la existen También medición y evaluación las fuentes dededatos la agenda semi y reflexión sobre las nuevas herramientas, aquellas que se presentan en un formato desarrollo sostenible en Costa Rica. estructurados. Estas generalmente tienen capacidades predefinido (poryejemplo mecanismos las hojasde gestión de cálculo) un formato definido, pero son de difícil ynecesarios para su se caracterizan porimplementación. tener un orden claro que comprensión para el usuario y requieren Network www.bd4d.net 3 14
un procesamiento Introducción para facilitar su interpretación. Un ejemplo de estas fuentes significativa al cálculo de indicadores ODS. En especial si se consideran las falencias de de datos sería el texto de etiquetas en información que se presentan actualmente lenguajes XML y XTML. en el país, pues según la información del portal ODS de Colombia9, 61 de las 169 Finalmente, existen las fuentes de datos no metas carecen de información que permita estructuradas. El contundenteEstas carecen desarrollo de tecnologías de las un formato realizar Es un adecuado por ello seguimiento. que en el presente El DNP documento de de lapresentación información claro, pues consisten y comunicación en la en hará se su informe Avances una revisión y Desafíos general para del contexto de información última década ha proveniente generado hoydeen correos día las el Seguimiento nacional de los en materia ODSdeenbigColombia del uso data paray electrónicos, fotografías, transferencia de mensajes de grandes volúmenes texto de datos el documento medir Conpes los indicadores 3918, de los ODS,elaborado primero o(big archivos deahora data de audioen y vídeo. adelante). Ejemplo de por el un haciendo DNP, para el 2017, reconocimiento sólo del contextual el ello es la información que circula cada minuto 54% de nacional ecosistema la información de datos y para los el uso de Es en pertinente resaltar redes sociales, que web páginas las fuentes de y teléfonos indicadores fuentes ODS estaba no tradicionales disponible. de datos De usadas en datos semiestructurados inteligentes, cuya gestión yy no usoestructurados, representa un esta manera, Costa Rica. 30% era información parcial o que nuevoactualmente no son consideradas reto para la Administración Pública. requería mejoras, y no se contaban con datos como parte de las estadísticas oficiales, o metodologías Igualmente, se para el 16% busca restante. acercar al lector pueden El análisis llegar a contribuir de grandes de puede datos (big data) forma a una conceptualización del término y mejorar la toma de decisiones en áreas críticas características del big data, con la finalidad del desarrollo, como la salud, el empleo, la de dar a conocer la importancia de este productividad, la seguridad y la gestión de tema en la Agenda 2030, y cuál ha sido el desastres naturales, por nombrar algunas. avance desde la visión de algunos actores Pero para ello, se deben generar nuevas nacionales relevantes, quienes generan alianzas entre todos los actores involucrados e capacitación, investigación e implementación impulsar verdaderas revoluciones educativas de herramientas de big data. y culturales. Alineado a lo anterior, se hará un El abordaje de estas novedosas tendencias reconocimiento de los retos con los que en la gestión nacional de información para cuenta el país y los distintos sectores sociales, monitorear el progreso de los países en el para la producción, utilización y colaboración cumplimiento de los Objetivos de Desarrollo que permitan el aprovechamiento del big Sostenible (ODS), requiere también del debate data en la medición y evaluación de la agenda y reflexión sobre las nuevas herramientas, desarrollo sostenible en Costa Rica. capacidades y mecanismos de gestión necesarios para su implementación. 9 Consultar https://www.ods.gov.co/tools/data-availability Network www.bd4d.net 3 15
La importancia Introducción de las fuentes de datos El contundente desarrollo de las tecnologías Es por ello que en el presente documento de la información Colombia y comunicación ha mostrado en los gran interés en la se la hará una revisión protección de losgeneral del contexto derechos de los última no datos década ha generado estructurados. hoyesta Por en día las razón, nacional en materia ciudadanos del uso de en el contexto debig la data para creciente transferencia se de grandes desarrolló volúmenes de el Documento datos Conpes medir los indicadores transformación de la de vidalosdiaria ODS,en primero datos (big data 3920, de cual en el ahoraseenpropone: adelante). “laEjemplo de definición haciendo digitales un reconocimientoy contextual cuantificables del procesables“ elloun de es la información marco queecircula jurídico cada minuto institucional que ecosistema nacional (Conpes 3920). deforma, De esta datossey promueven el uso de en redes sociales, maximice páginas la obtención de web y teléfonos beneficios del fuentes no en esfuerzos tradicionales de datos la generación usadas en y divulgación inteligentes, cuya gestión aprovechamiento y uso representa de datos, permita unla Costa Rica. de datos no oficiales para el de fuentes nuevo reto para cooperación la Administración entre los sectores Pública. público desarrollo sostenible. y privado y, al mismo tiempo, refuerce Igualmente, se busca acercar al lector El análisis de grandes datos (big data) puede a una conceptualización del término y mejorar la toma de decisiones en áreas críticas características del big data, con la finalidad Datos abiertos en Colombia del desarrollo, como la salud, el empleo, la de dar a conocer la importancia de este productividad, la seguridad y la gestión de tema en la Agenda 2030, y cuál ha sido el Otro de los grandes avances en el país es en este módulo los usuarios pueden desastres naturales, por nombrar algunas. avance desde la visión de algunos actores su política de datos abiertos. Entre estos compartir información con el portal. Conoce Pero para ello, se deben generar nuevas nacionales relevantes, quienes generan adelantos se puede citar el portal de datos está a disposición de los usuarios que alianzas entre todos los actores involucrados e capacitación, investigación e implementación abiertos datos.gov.co, creado por Ministerio quieran enterarse sobre investigaciones y impulsar verdaderas revoluciones educativas de herramientas de big data. de las Tecnologías de la Información y visualizaciones hechas con datos abiertos. y culturales. las Comunicaciones (MINTIC), en el cual Alineado a lo anterior, se hará un se publican bases de datos que incluyen Otro ejemplo fue la aprobación de la ley El abordaje de estas novedosas tendencias reconocimiento de los retos con los que big data e investigaciones de diferentes 1712, “por medio de la cual se crea la Ley de en la gestión nacional de información para cuenta el país y los distintos sectores sociales, organizaciones gubernamentales para Transparencia y del Derecho de Acceso a monitorear el progreso de los países en el para la producción, utilización y colaboración libre consulta. Esta información es revisada la Información Pública Nacional y se dictan cumplimiento de los Objetivos de Desarrollo que permitan el aprovechamiento del big previamente por el MINTIC. El portal está otras disposiciones.” (Ley 1712, 2014). Esta ley Sostenible (ODS), requiere también del debate data en la medición y evaluación de la agenda compuesto por tres módulos: Descubre, obliga a todas las entidades a publicar sus y reflexión sobre las nuevas herramientas, desarrollo sostenible en Costa Rica. Publica y Conoce. Descubre sirve para datos, siempre y cuando no se encuentren capacidades y mecanismos de gestión consultar bases de datos publicadas dentro de dos categorías: información necesarios para su implementación. para investigación, crear visualizaciones pública clasificada e información pública o desarrollar historias. Publica funciona reservada. (Ver figura 5) desde la perspectiva de la oferta, ya que Network www.bd4d.net 3 16
También puede leer