¿Qué es la normalización de datos?
La normalización es, como la propia palabra indica, el acto de establecer una norma sobre algo. Las normas que se aplican pueden ser muy diversas y aplicadas a una infinidad de datos distintos. En Deyde DataCentric hablamos de normalización, cuando se tratan los datos de nombre y/o dirección separándolos en sus diferentes componentes y verificando su validación.
Al separar una dirección postal se divide o campifica cada uno de sus componentes: tipo y nombre de vía, número de portal, complementos de la dirección (piso, puerta, letra, bloque y escalera), código postal y población. En el caso de los nombres se separa el dato tratado en: nombre, nexo del primer apellido, primer apellido, nexo del segundo apellido y segundo apellido.
Normalizar no es solamente dividir una dirección o nombre en los campos correspondientes, sino que también se aplican reglas y normas para corregir las palabras siempre de la misma manera, independientemente de cómo esté escrito en su origen.
Por ejemplo, convertimos las diferentes formas en las que se puede escribir el término “Avenida”, como puede ser: AVD; Avd; AV; AVA; Avinida; Abenida,… en una común: “AVDA”. Al igual sucede con las abreviaturas en apellidos y nombres, por ejemplo: “MTNEZ” que una vez tratado se normalizará por “MARTINEZ” y se identificará como apellido.
Los datos correspondientes al nombre además de normalizarse se enriquecen con el género en función del nombre de origen y los datos de dirección se contrastan con fuentes oficiales para verificar si son o no válidos, incorporando indicadores que permiten saber el grado de validación de la dirección postal y la fiabilidad de la misma.
En Deyde DataCentric también normalizamos teléfonos bajo un estándar, en este caso se eliminan los caracteres no numéricos, se asigna el prefijo y se validan los primeros dígitos del número. Al igual sucede con el DNI, el cual estandarizamos eliminando los caracteres habituales como puntos, guiones y comas, para mantener un formato común. En el caso de los e-mails podemos hablar de la misma situación, eliminamos caracteres no habituales y normalizamos estandarizando las direcciones de correos más habituales como Gmail o Hotmail, cuando se encuentran mal escritas.
Ventajas de la normalización de datos
Base de datos bien estructurada libre de errores y de calidad
Mayor conocimiento de tus clientes y mejora en la segmentación de los mismos
Prevención en la identificación de fraude
Indispensable para la transformación digital
Mayor facilidad para la toma de decisiones correctas
Ahorro de costes y tiempo en campañas
Otras formas de optimización de datos
Deduplicación de datos
Identificamos duplicidades en las bases de datos para conseguir una visión única de cliente.
Enriquecimiento de datos
Aportamos riqueza y aumentamos la información de las bases de datos con información geográfica y estadística.