Data governance en LATAM: la importancia del gobierno de los datos

data governance en LATAM

Al día de hoy, es casi impensable para muchas empresas prescindir de los datos para mantener la operatividad y productividad del negocio. No obstante, ante la ingente cantidad de información que las organizaciones pueden llegar a procesar, es preciso tener una dirección, un enfoque y objetivos claros. La gobernanza de datos provee las herramientas y directrices para guiar un uso acertado de la información que se refleje en la cuenta de resultados. A pesar de los importantes pasos que algunas empresas de la región comienzan a dar en este sentido, la data governance en LATAM todavía está en fase de inicio. Como veremos más adelante, las consultoras que proveen asesoramiento en esta área deben ser didácticas para hacer entender a los directivos empresariales las aplicaciones y beneficios de este proceso.

Elementos básicos para comprender la necesidad de la data governance en LATAM

Para entender por qué es necesaria su aplicabilidad en el ámbito empresarial latinoamericano, es preciso comenzar por definir qué es la gobernanza de datos. La data governance comprende un conjunto de procesos y procedimientos enfocados en la gestión de datos que permiten a las organizaciones administrar efectivamente sus flujos de datos internos y externos. A este concepto deben alinearse las personas, los procesos y la tecnología para apoyar una mejor comprensión de los datos. Esto permitirá convertir estos en verdaderos activos empresariales.

Ciertamente, la data governance en LATAM y en cualquier parte del mundo es un proceso de gestión que tiene en cuenta la disponibilidad, usabilidad, integridad y seguridad de la información de una empresa. Todo ello, fundamentado en políticas y normas internas de datos. Un gobierno de datos coherente asegura que los datos sean completos, correctos, comprensibles, fiables, seguros y ubicables. Estas líneas maestras engloban temas como la arquitectura, el modelado, el almacenamiento y las operaciones de datos. Así como también la interpretación, interoperabilidad y seguridad de los mismos. Al igual que abarca los documentos y contenidos, datos maestros, de referencia y metadatos; hasta el almacenamiento de datos y la aplicación de business intelligence. Por supuesto, en la gobernanza también está presente la calidad de los datos.

Objetivos y componentes del proceso, propósitos y elementos para aplicar data governance en LATAM

En síntesis, con la implementación de una gobernanza de datos, las organizaciones tendrán claro los procesos a implementar para lograr la estandarización, integración, protección y almacenamiento efectivos de los datos corporativos. En este sentido, los objetivos del gobierno de datos son:

  • Disminuir los riesgos de seguridad de los datos.
  • Determinar normativas internas para la gestión de los datos.
  • Establecer las formas de cumplimiento de dichas normas.
  • Hacer más fluida la comunicación interna y externa.
  • Incrementar el valor de los datos.
  • Suministrar fundamentos sólidos para garantizar la continuidad de la empresa, gracias a la gestión y optimización de los riesgos.

Los directores de las empresas de la región deben entender que la implementación de los programas de data governance en LATAM afectarán a sus empresas en los aspectos estratégico, táctico y operativo. En consecuencia, lograr la organización y gestión efectiva de los datos en el contexto del negocio y coordinarlos con otros proyectos de datos, implicará asumir los programas del gobierno de datos como un proceso continuo, iterativo e incremental.

¿Qué dificulta la implementación de la data governance en LATAM?

Sin duda, existe un gran interés entre las empresas latinoamericanas en convertirse en organizaciones guiadas por datos y sacar el mayor provecho de los mismos. Pero el camino para llegar a ello no es sencillo. En un foro online organizado por CDO LATAM, dos destacadas profesionales argentinas fueron consultadas en torno a las dificultades de aplicar el gobierno de datos en las empresas de la región. Ellas son María del Rosario Bruera, consultora especialista en Ciencia, Gobierno y Monetizado de Datos en MEC Consultores Asociados y Lucía Aranda, especialista en Data Management y mánager de la consultora Naranja X.

En opinión de Bruera las principales limitantes para la aplicación de data governance en LATAM son menos de origen tecnológico y sí más humanas. En primer lugar, aunque muchas compañías están informatizadas, hay una falta de “alfabetización” analítica de los cuerpos directivos. La única manera de franquear esta barrera es proporcionar una formación a los directivos para que ellos entiendan qué significa tomar decisiones en base a datos. Más aún, que conozcan la diferencia entre trabajar con y sin datos y cuáles son los beneficios esperables en el primer caso. Si no logramos este cambio, lo más probable es que los directivos no entiendan la propuesta de la consultora. O que terminen comprometiendo un presupuesto para, por ejemplo, una solución de Inteligencia Artificial, que se convierta en un pesada carga dada la falta de objetivos concretos de negocio.

Falta de comunicación y desconocimiento sobre los datos

Por otra parte, también es perceptible la falta de comunicación de las estrategias comerciales en algunas empresas. A modo de ilustración, los científicos de datos no saben cómo puede ganar dinero la compañía con los datos y los líderes de las empresas tampoco. Esto se debe tanto a la falta de formación de la que hablamos, pero también al poco interés en comunicar las estrategias comerciales. Razón por la que los científicos de datos pueden quedar en una suerte de limbo y no podrán aportar suficiente valor.

Por su parte, Arando agrega que el objetivo de  convertir a las empresas en data centric es que todos sus integrantes tomen decisiones basadas en evidencia. Sin embargo, los colaboradores de las empresas no usan lo que no conocen. Y se preguntan frecuentemente: ¿qué datos tenemos?, ¿dónde están?, ¿qué calidad tienen estos datos?, ¿podemos usarlos o no? No basta con crear un repositorio de datos centralizado, que está muy bien y es esencial. A esto debemos sumar una capa de visibilidad y entendimiento que proporcione respuestas a las preguntas expuestas. Esto solo se logra con un programa de gobierno de datos sólido y consistente.

Cambio cultural en las organizaciones

Aranda percibe que muchas organizaciones latinoamericanas van directamente a implementar las soluciones más avanzadas: IA, machine learning, big data y analítica. Pero esto es apenas la punta del iceberg. En la base, deben estar las disciplinas fundamentales como son: el gobierno de datos, la gestión de metadatos, datos maestros y datos de referencia. Igualmente, debemos considerar, la calidad de datos y su seguridad.

Esto no quiere decir que las organizaciones no puedan introducir las soluciones digitales que mencionamos sin llevar en paralelo un gobierno de datos. Lo que sí es cierto es que gestionar las mismas les llevará más tiempo, les resultará más costoso y asumirán más riesgos. Al final, aportarán menos valor. Desde esta perspectiva, hay que entender la data governance en LATAM como un habilitador de la democratización de los datos en las organizaciones. De hecho, al no aplicarla, lo más probable es que la capacidad de trabajar con datos sea excluyente y se reduzca a los científicos de datos o al equipo de data.

Para corregir lo anterior, es necesario hacer énfasis en el cambio cultural dentro de las empresas. ¡Es imprescindible atender el factor humano de los datos! En efecto, las personas y los procesos siguen siendo los principales obstáculos en la conversión de las empresas en data driven. Por tanto, es indispensable desmitificar una gran cantidad de paradigmas y vicios que tienen las compañías. En particular, aquellas que están transitando hacia la transformación digital. Esto hará posible aplicar las buenas prácticas de datos en las organizaciones.

Calidad de datos como parte de la data governance en LATAM

Consciente de la actual tendencia de las empresas latinoamericanas en asumir o continuar su transformación digital, en Deyde aportamos al mercado de la región nuestras soluciones en calidad de datos. En especial, MyDataQ, una herramienta versátil de desarrollo propio para el tratamiento automatizado en la especialidad de normalización, deduplicación y enriquecimiento de bases de datos.

Deyde es una multinacional tecnológica con base en España y presencia en más de 35 países, entre ellos: México, Colombia y Chile. Desde allí, acompañamos la transición de las organizaciones a data driven y, consecuentemente, la implementación de la data governance en LATAM.

Gobierno abierto y calidad de datos en México

calidad de datos en México

Sin duda, México es uno de los principales referentes latinoamericanos en el desarrollo del gobierno abierto y la disponibilidad de open data para los ciudadanos. En 2018, el Barómetro de Open Data, iniciativa promovida por la Fundación World Wide Web ubicó a este país en el sexto lugar entre los ocho Estados con calificación sobre 65% en cuanto a desempeño en datos abiertos. Mientras que el Barómetro de Datos Abiertos de América Latina y el Caribe (2020), de la Iniciativa Latinoamericana para los Datos Abiertos, la sitúa en el quinto lugar de la Región, por debajo de Uruguay, Argentina, Colombia y Brasil. Sobre la evolución del Gobierno abierto y la calidad de datos en México enfocada en open data hablaremos brevemente en el presente artículo.           

Definiciones para comprender el gobierno abierto y la calidad de datos en México

Antes de conocer el desarrollo y situación actual de la gestión de open data y calidad de datos en México, conviene recordar varias definiciones básicas. En primer lugar, precisamente, lo que conocemos como datos abiertos. De acuerdo con Open Knowledge International, entenderemos como tales aquellos datos que las personas pueden usar, modificar y compartir libremente con cualquier propósito. De este concepto devienen tres características intrínsecas de este tipo de información:

  • Es accesible de manera gratuita mediante Internet.
  • Cuentan con una licencia abierta o pertenecen al dominio público.
  • Son datos reutilizables, ya que pueden abrirse y leerse con equipos informáticos.

Esta categoría de datos viene adquiriendo una gran importancia, ya que son publicados mayormente por entidades públicas y privadas. Su accesibilidad por parte de los ciudadanos proporciona transparencia en cuanto a las acciones de aquellas que afectan de algún modo a estos.

Al igual que los datos privados o internos que gestionan las empresas, el open data requiere de una gobernanza de datos. Esta última, conocida también como data governance, reúne los mecanismos y políticas establecidas para monitorizar y evaluar la gestión y calidad de los datos a lo largo del proceso de captación, almacenamiento y uso de la información. Dicho concepto va más allá de la gestión de datos (data management). Porque la gobernanza implica que las empresas e instituciones asumen la responsabilidad en toda la secuencia de generación, empleo, modificación, transferencia y disposición de datos. Más aún, enfocada en los datos abiertos, la data governance incluye políticas e instrumentos para facilitar la apertura de datos y evaluar su impacto público. Bajo la perspectiva democrática y de gobierno abierto, deben servir para ayudar a solucionar problemas que afecten a los ciudadanos.     

Calidad de datos como parte las actividades clave de la data governance

En resumen, la gobernanza de datos contempla entre otros aspectos:

  • Identificar y clasificar los datos.
  • Establecer y ejecutar protocolos de gestión de datos.
  • Resolver los problemas relacionados con los datos.
  • Evaluar la calidad de los datos, así como su utilidad, mejora e impacto.
  • Implementar medidas técnicas y organizativas para garantizar la seguridad de los datos.

Entre estas acciones, haremos énfasis en la calidad de datos, que definiremos como el conjunto de condiciones que debe tener la data. De estas dependerá su utilidad y facilidad de procesamiento para fines privados y públicos. En general, los datos de calidad son:

  • Exactos.
  • Completos.
  • Consistentes. Es decir, deben ser coherentes respecto a otros datos dentro del mismo contexto de uso y libres de contradicciones.
  • Tener credibilidad. Esto es que provengan de fuentes fiables.
  • Actualizados.

Desde la perspectiva del open data, a estas características debemos añadir la accesibilidad, la apertura y la reutilización propias de los datos abiertos que ya comentamos.

Datos abiertos y calidad de datos en México, un camino con altibajos

Con la progresiva migración de la gestión gubernamental al empleo de recursos informáticos la tecnología digital comenzó a acercar el gobierno a los ciudadanos. En concreto, mediante trámites, información, servicios y acciones de gobierno específicas. Pero también, la sociedad civil y las comunidades de tecnología cívica empezaron a demandar transparencia, rendición de cuentas y eficacia administrativa mediante datos públicos abiertos.

Obviamente, este fenómeno, propio del siglo XXI, se extendió a México, donde  expertos en informática se reunían en los llamados “hackatones cívicos”. Allí, analizaban datos y aportaban soluciones tecnológicas a problemáticas públicas. En paralelo, hacían reflexiones sobre la importancia de la información pública y desarrollaban proyectos de tecnología cívica fundamentados en datos públicos obtenidos por organizaciones civiles. Entre esos eventos destacó el OpenDataMX (junio de 2011), en el que los participantes analizaron información sobre diversos programas de subsidios agrícolas. Asimismo, visualizaron por primera vez el Presupuesto de Egresos de la Federación con datos obtenidos por entes de la sociedad civil.

Otro “hackatón” memorable fue el realizado en julio de 2013, que promovía los Derechos de la Infancia. En este, se dieron a conocer datos procedentes de diversas dependencias públicas relacionadas con este tema. El evento contó con el liderazgo del Instituto Federal de Acceso a la Información Pública y Protección de Datos y de la Organización Internacional del Trabajo. Ese mismo año, el proyecto DataMX.IO desarrolló un primer portal de datos abiertos gestionado por actores de la sociedad civil mexicana. Mediante esta plataforma se publicaron conjuntos de datos abiertos cuyo acceso fue solicitado por ciudadanos organizados. Ciertamente, este fue un hito significativo para el desarrollo del open data y la calidad de datos en México.

Política Nacional de Datos Abiertos y adhesión a la Carta Internacional de Datos Abiertos

También en 2013, fue creada la Coordinación de Estrategia Digital Nacional (CEDN) y tuvo lugar la discusión del 2do. Plan de Acción 2013-2015 que allanaría el compromiso para definir la apertura de datos aplicable a la administración pública federal. Igualmente, el compromiso abarcó la implementación de una política nacional de datos abiertos y la creación de un portal de open data único: www.datos.gob.mx.

La Política Nacional de Datos Abiertos sería una realidad al oficializarse en febrero de 2015, mediante el Decreto por el que se establece la regulación en materia de Datos Abiertos. En particular, el artículo 6 de este decreto establece la responsabilidad de las dependencias, entidades y empresas productivas del Estado en la gobernanza de los datos abiertos que generen. Y, en colaboración con la Unidad de Gobierno Digital de la Secretaría de la Función Pública (SFP) y la CEDN, procurarán la calidad de los datos abiertos y la priorización de su publicación.

A finales de octubre de 2015, México suscribió la Carta Internacional de Datos Abiertos que comprometería más al gobierno en esta materia. En diciembre de 2017, fue publicada la Guía de Implementación de la Política de Datos Abiertos. Esta detalla las actividades y mecanismos para el proceso de apertura de datos:

  • Planear.
  • Publicar.
  • Perfeccionar.
  • Promover.

Evidentemente, este fue un período de esplendor para el gobierno de datos abiertos y calidad de datos en México.      

Cambio político de prioridades

En diciembre de 2018, al iniciar la administración del presidente López Obrador, las funciones de la CEDN y la SFP contempladas en el decreto y la guía mencionados quedaron suspendidas. La CEDN pasó a concentrar sus acciones en una serie de políticas digitales vinculadas al Plan Nacional de Desarrollo. Por otro lado, las labores de mantenimiento y actualización de la documentación relacionada con los datos abiertos no tuvieron continuidad. Lamentablemente, en la plataforma nacional www.datos.gob.mx solo algunas dependencias publicaron datos posteriores al 2020; algo insólito para un portal que llegó a concentrar más de 9 mil conjuntos de datos hasta 2018.

Lo más destacable desde 2018 hasta el presente es la publicación, en septiembre de 2021, del Acuerdo  que establece la Estrategia Digital Nacional (EDN) 2021-2024. De alguna manera, parte de los objetivos de esta estrategia están en línea con la apertura de datos y su gobernanza.

Institucionalización de la calidad de datos en México para los datos abiertos

A pesar del estancamiento apreciable en las acciones de gobernanza de datos del gobierno central, existen iniciativas relevantes a nivel local. Por ejemplo, en noviembre de 2020, la Administración Pública de la Ciudad de México publicó el Acuerdo por el que se emite la política de gestión de datos de la capital mexicana. Más allá de la normativa establecida para la gobernanza de datos, el documento establece ocho principios que deben atender los entes sujetos a este acuerdo. Entre los mismos, destaca el principio de calidad de datos, en el que determina que:

(…) los datos deben ser ciertos, consistentes, pertinentes, proporcionales, accesibles, oportunos e íntegros. De igual manera se procurará, cuando sea posible, que los datos provengan de una fuente única autorizada e identificable. Los Entes, en su calidad de generadores o recolectores de datos implementaran un proceso de mejora continua en la gestión de los datos (…)

Más adelante, el mismo documento define un Marco para la Gestión de Datos que también incluye la calidad de datos como uno de sus principales componentes. Más aún, el mencionado instrumento contempla el establecimiento de un Sistema de Información Unificado entre cuyos objetivos destaca:

(…) Mejorar la calidad de los datos que generan, recolectan y usan los Entes Públicos al integrarlos desde varias fuentes verificadas (…)

Prácticamente, estas consideraciones institucionalizan la calidad de datos en México (CDMX) y son un ejemplo a seguir por otros entes públicos para la gobernanza de sus datos abiertos.

Soluciones de Deyde DataCentric para la calidad de datos en México

Nuestra empresa, Deyde Data Centric, está presente en México con sus soluciones digitales enfocadas en la calidad de datos. En concreto, nuestro producto estrella MyDataQ es una herramienta versátil de desarrollo propio que ejecuta un tratamiento profundo  y automatizado en la especialidad de normalización, deduplicación y enriquecimiento de bases de datos.

Deyde Data Centric es una multinacional tecnológica especializada en el desarrollo de soluciones de calidad de datos. Esta organización cuenta con 25 años de experiencia y presencia en más de 35 países, entre ellos: México, Colombia y Chile. Razón por la que está en capacidad de suministrar recursos para potenciar la calidad de datos en México en el área de gobernanza de datos abiertos.