Situación actual del Open Data en Latinoamérica
En épocas de constantes cambios tecnológicos, las compañías ahora se enfrentan a un nuevo actor preponderante en el desarrollo y modelamiento de sus negocios, “EL DATO” y es que ahora es normal escuchar términos tales como “Data Driven”, “Open Data” (datos abiertos), “Gobernanza” por mencionar algunos y necesariamente debemos hacernos un cuestionamiento acerca del cómo y en qué punto se encuentra el dato actualmente en Latinoamérica, tema que intento comentar en el siguiente artículo.
Los retos a los que se enfrentan las organizaciones
Según el último informe realizado por Global Data Barometer, hay mucho espacio disponible para la mejora en el aspecto del uso e impacto de los datos y con mejores indicadores, pero no los ideales, aspectos como la disponibilidad, capacidad, gobernanza y marcos regulatorios.
Precisamente y tomando como referencia los temas mencionados, vuelvo a referirme al enorme reto que tienen organizaciones y responsables de las áreas de datos en capturar, aplicar calidad, extraer y explotar los millones de datos que a diario albergan en sus centros de datos, para direccionarlos hacia los objetivos que el negocio y clientes demandan, objetivos que cambian a velocidades para las que nadie estaba preparado.
Otro tema que toma mayor relevancia en la realidad actual es el que tiene que ver con las proyecciones de trabajar bajo entornos de datos abiertos. Para este frente, el uso de datos en el sector público sigue siendo el de mayor desafío. Pese a que el apartado de marcos regulatorios y gobernanza presentan buenos indicadores, no sucede de la misma forma para el acceso a estos.
Hay un tema que mencioné anteriormente y que forma parte de la columna vertebral de los procesos y gestión de datos de las organizaciones, debido a la importancia que tiene tanto para los procesos de entrada como para todas y cada una de las acciones que se diseñen para su explotación, que es la calidad del dato. Cuando hablamos de calidad, se refiere a la planificación e implementación de actividades, técnicas, herramientas, guías, gobierno y métricas de gestión de calidad, en orden de asegurar que los datos sean aptos para consumo, satisfagan las necesidades de los consumidores y faciliten los procesos de toma de decisiones.
En este sentido y hablando de la situación en Latinoamérica, se evidencian avances, pero a pasos ligeramente más lentos de lo esperado. Teniendo en cuenta la alta demanda de intercambio de datos que el mercado está exigiendo, aún existen brechas y diferencias en las estandarizaciones que a nivel región se tenían que establecer. Hasta ahora cada país es autónomo en determinar su tipología e incluso, como es el caso de Colombia, son varias las entidades que generan estándares (IGAC, DNP, DANE, UAECD) y a nivel país, no se tiene un único marco estándar.
La explotación los datos abiertos a nivel regional
Adicional al tema de estandarización, en materia de calidad de datos, la región enfrenta también retos en torno a las herramientas tecnológicas a utilizar tanto para elevar la calidad como para la explotación de los datos. Existen múltiples opciones de soluciones robustas y globales presentes en el mercado con sus módulos de data quality, pero muy pocas opciones trabajan con datos propios de cada región.
Muchos de los países de Latinoamérica disponen de datos abiertos gubernamentales, al igual que callejeros. Son 15 países en total los que disponen de Portales de Datos Abiertos y/o Públicos: Argentina, Brasil, Chile Colombia, Costa Rica, Ecuador, El Salvador, Guatemala, Honduras, México, Panamá, Paraguay, Perú, República Dominicana y Uruguay.
Hay que tener en cuenta que existen notables diferencias culturales, geográficas y demográficas que hacen que, para el caso de datos, como los de contacto, sean diversos y específicos por región, como por ejemplo, los datos de localización. Es esta la razón por la que los callejeros gubernamentales se convierten en una herramienta indispensable. Argentina, Brasil, Chile, Colombia, Ecuador o México son algunos de los países que disponen de un callejero propio.
Los niveles administrativos de cada territorio son distintos. Por ejemplo, nos encontramos en Argentina con una jerarquía dividida en Provincia, Departamento, Localidad y Entidad Comprometida. En cambio, en Colombia se divide en Departamento, Municipio, Comuna y Barrio.
Con esto, la ratio de calidad de datos postales es también muy dispar. En Perú y Chile, desde un punto de vista data quality, las direcciones son más sencillas de tratar debido a su formato sencillo, con una calle alfabética, seguida de un número, un código postal y una población. Por el contrario, países como Colombia y México tienen un ratio bajo o medio de calidad de datos en direcciones postales por contar con calles numéricas, no utilizar el código postal o, en el caso concreto de México, una misma calle atraviesa varias colonias. Muchas veces el cliente no sabe si su colonia correcta y en una dirección pone una cercana.
La Carta Internacional de Datos Abiertos, hito del open data en Latinoamérica y el Caribe
El hito más reciente de los datos abiertos en Latinoamérica fue la celebración en México de la Alianza para el Gobierno Abierto, en 2015. Allí se presentó oficialmente la Carta Internacional de Datos Abiertos, documento que concentra una iniciativa multilateral y colaborativa apoyada y suscrita no solo por gobiernos, sino también por organizaciones de la sociedad civil, sector privado y expertos en el área. En síntesis, este instrumento tiene como objetivo fundamental el fomento de una mayor coherencia y la implementación de principios de open data en gobiernos nacionales y locales e instituciones de todo el mundo. Al igual que apoyar el establecimiento en los mismos de estándares y buenas prácticas en apertura de datos, incluyendo el data quality.
En esta perspectiva, la carta funcionaría como una guía para liberar el potencial de los datos, una declaración de compromisos y un recurso para obtener apoyo técnico y político. Al día de hoy, la carta ha sido suscrita por 88 gobiernos entre nacionales y locales y 76 organizaciones no gubernamentales. Los gobiernos nacionales de Latinoamérica y el Caribe adheridos son: Argentina, Chile, Colombia, Costa Rica, El Salvador, Guatemala, Honduras, México, Panamá, Paraguay y Uruguay.
México, Ciudad Abierta
La Comisión Económica para América Latina y el Caribe (CEPAL) destaca el proyecto de México en sus Boletines de Planificación para el Desarrollo.
Hablamos de una serie de iniciativas canalizadas mediante el Plan de Desarrollo 2013-2018 que dieron origen al Laboratorio para la Ciudad, un organismo encargado de promover la participación de la ciudadanía y plantear estrategias disruptivas para mejorar los procesos de toma de decisiones. En esta misma línea, mediante esfuerzos interinstitucionales fue establecida la Plataforma de Gobierno Abierto con el propósito de cocrear y afianzar un modelo de ciudad abierta en Ciudad de México. A partir de allí, se vienen realizando distintos programas de capacitación a funcionarios públicos en conocimientos y habilidades relacionadas con datos abiertos y gobierno abierto.
Junto con esto, se promovieron cambios institucionales para impulsar estos conceptos mediante la Ley para hacer de la Ciudad de México una ciudad más abierta. La promulgación de este instrumento legal en 2015 hizo posible la creación del Consejo de Gobierno Abierto. Este es un órgano integrado por gobierno, sociedad civil, academia y otros. Luego vendría la aprobación de la Ley de transparencia, acceso a la información pública y rendición de cuentas de la Ciudad de México (2016). Y más adelante se crearon el Portal de Transparencia y el Portal de Datos de la misma urbe.
Fincomercio, información completa, confiable y precisa
Como dijimos líneas arriba, la calidad es una de las características indispensables en los datos abiertos. Esta información debe ser exacta, completa y estar exenta de duplicados.
Fincomercio, cooperativa de ahorro y crédito colombiana con más de 64 años de experiencia, requería optimizar los recursos y el tiempo dedicado a realizar procesos manuales de identificación de datos incorrectos de los asociados. Teniendo en cuenta sus problemáticas, confió en el software propio MyDataQ de Deyde DataCentric el tratamiento de sus datos. En concreto en los módulos Names, Addresses, E-mail y Phones.
MyDataQ se nutre tanto de datos propios de cada región como oficiales abiertos de entidades gubernamentales para normalizar, mantener actualizadas y enriquecer las bases de datos de nuestros clientes. Algunas de las bases de datos abiertas que utiliza MyDataQ en Colombia son la Comisión de Regulación de Comunicaciones de la República de Colombia o el Departamento Administrativo Nacional de Estadísticas.
Gracias a MyDataQ, Fincomercio consiguió identificar correos electrónicos ficticios y/o vacíos para campañas de e-commerce, y unificar datos de contacto de asociados naturales y jurídicos. Además, logró obtener una base de datos correcta mediante el estandarizado de direcciones para cumplimiento de estándar de reportes a la DIAN, así como optimizar recursos dedicados a procesos manuales y segmentar asociados de Créditos, Seguros, Ahorro e inversión, logrando una visión única.
Privacidad de datos en Latinoamércia
Dicho esto, la caracterización de los datos y las posibilidades de acceder, validar y compartir la data, complican los escenarios ante una posible apertura regional de open data. Desde las entidades públicas se vienen trabajando en iniciativas para lograr avances en esa dirección y algunos sectores privados con sus agremiaciones están logrando materializar proyectos con el objetivo primordial de explotar y monetizar los datos. Pero aún queda mucho camino por recorrer para que los usuarios se puedan sentir tranquilos y confiados en el correcto uso de sus datos. No obstante, la región presenta algunos indicadores por encima de la media global y esto da un parte de tranquilidad del trabajo que se viene realizando por parte de los profesionales de datos, que cada vez es mayor en América Latina.
En relación con la privacidad de datos, en los países de Centro América y América del Sur no existe todavía una legislación transfronteriza que se parezca al RGPD de la Unión Europea. Ahora bien, cada país cuenta con sus normativas específicas.
Con el consentimiento de los titulares, las empresas privadas pueden utilizar sus datos para realizar campañas de comunicación por distintos canales. Para darse de baja de estas bases de datos comerciales, cada país tiene un fichero oficial negativo AntiSPAM. De los citados anteriormente en la tabla, Argentina y Colombia no tienen este fichero.
- Brasil: Listas de bloqueio del servicio AntiSpam
- Chile: Servicio «No Molestar» de la SERNAC
- Ecuador: Lista Robinson
- México:n REPEP
- Perú: Registro de Consumidores «Gracias… no insista» del Instituto Nacional de Defensa de la Competencia y de la protección de la propiedad intelectual (INDECOPI)
Educación, crecimiento y desarrollo
Finalmente, y ya que tocamos el tema de los profesionales, gracias al trabajo mancomunado de Gobierno, educación y entidades privadas, la región trabaja en desarrollo de planes a nivel educativo para estimular el crecimiento de especialistas en datos, fomentando la participación en programas como analítica, programación, estadística, matemáticas, etc, y con esto, elevar la cantidad de profesionales vinculados tanto a organizaciones privadas como estatales.
En resumen, Latinoamérica presenta unos indicadores favorables con respecto al crecimiento de la demanda, pero no los que se esperan, y en apartados como el de calidad del dato los niveles están muy por debajo de lo esperado. Las organizaciones se están preocupando más del almacenamiento, conservación, explotación y análisis de la data, que por los pilares fundamentales como son los de normalización, limpieza y validación. De esta manera se ven incrementados exponencialmente los esfuerzos generados por las áreas de negocio.
Teniendo como base unos datos consistentes, confiables, exactos, conformes, comprensibles, trazables, disponibles y actualizados -tal y como determinan las reglas de características de calidad que debe reunir el dato- estos esfuerzos disminuirían y la toma de decisiones sería más eficaz.
Ericcsson Pinto
Key Account Manager