En el caso ideal, ambas tablas que se van a procesar contienen un criterio que permite vincularlas de forma inequívoca, por ejemplo, un ID o el número de artículo. En este caso, el primer paso, que consiste en vincular ambas tablas, se realiza rápidamente. Si no es así, le recomendamos que consulte este artículo: "Enriquecer direcciones"

Por último, existe el problema de que los datos que se van a utilizar para el enriquecimiento pueden estar en diferentes formatos. La tabla de destino para el enriquecimiento podría ser, por ejemplo, una lista almacenada en un archivo de Excel. Y la tabla de origen podría ser un archivo de texto. O se trata de datos de una base de datos gestionada por un servidor de bases de datos como MySQL o SQL Server. Por supuesto, antes del enriquecimiento propiamente dicho, se podría garantizar en un primer paso que ambos conjuntos de datos estén en el mismo formato, exportándolos y/o convirtiéndolos adecuadamente. Sin embargo, es mucho más sencillo prescindir de ello y poder procesar los datos directamente en el formato en el que se encuentran.

DataQualityTools, entre otras, domina todo esto y mucho más. Para enriquecer los datos con ello, proceda de la siguiente manera:

  1. Si previamente no lo ha hecho, descargue DataQualityTools gratuitamente desde aquí. Instale el programa y solicite una activación de prueba. Ahora podrá trabajar con el programa durante una semana sin restricciones.
  2. La función que necesitamos se encuentra en el menú, en el bloque "Seleccionar datos". Seleccionamos allí la función "Enriquecer datos (2 Tablas)" para el enriquecimiento:

    Enriquecer datos

  3. Después de haber activado esta función, aparecerá en pantalla la administración de projecto. Aquí debe crear un proyecto nuevo con cualquier nombre y a continuación haga clic en el botón 'siguiente'.
  4. En el siguiente paso, abrimos primero las dos tablas con los datos que se van a procesar utilizando el botón "Abrir archivo":

    Abrir archivo

    Aquí se pueden utilizar archivos Excel, Access, dBase, CSV y de texto.

    En el caso de los servidores de bases de datos (MS SQL Server, MySQL, MariaDB, Oracle, Azure SQL o PostgreSQL), primero hay que seleccionar el servidor de bases de datos correspondiente en la lista desplegable "Formato/Acceso a". A continuación, hay que introducir el nombre del servidor de bases de datos. Tras hacer clic en el botón "Conectar con el servidor", hay que introducir los datos de acceso. Por último, seleccione la base de datos deseada y la tabla correspondiente en las listas de selección correspondientes.
  5. A continuación, indique al programa el criterio con el que se deben vincular las dos tablas. Por ejemplo, podríamos vincular las dos tablas mediante el campo de datos "ID" de la primera tabla y "ID_B" de la segunda tabla:

    Vincular tablas

    En este caso, el resultado incluye todos los pares de registros en los que el contenido de la columna "ID" de la primera tabla coincide con el contenido de la columna "ID_B" de la segunda tabla.
  6. Si es necesario, se puede crear un filtro para cada una de estas dos tablas:

    Filtrar datos

    En este caso, solo se utilizarán los registros de la primera tabla para vincularlos con la segunda tabla si el contenido de la columna "ID" es inferior a 100.
  7. Al hacer clic en el botón "Continuar" se inicia el procesamiento de los datos. En poco tiempo se muestra un resumen del resultado:

    Resultado de la selección

    Si el programa ha encontrado coincidencias entre las tablas que se van a procesar, al hacer clic en el botón "Aceptar" se abre el cuadro de diálogo con las funciones con las que se puede seguir procesando el resultado.
  8. En el cuadro de diálogo con las funciones con las que se puede seguir procesando el resultado, hay un botón en la parte superior con la etiqueta "Postprocesamiento manual". Aquí se muestra el resultado de la comparación en forma de tabla. Los registros que se deben seleccionar están marcados con una marca verde, que se puede eliminar si es necesario.

    Un ejemplo de cómo se pueden enriquecer los datos

  9. Por último, el resultado debe procesarse aún más. Como ya se ha mencionado anteriormente, queremos enriquecer los datos, es decir, transferir cierta información de una base de datos a otra basándonos en el resultado de la selección. Para ello, seleccionamos la función correspondiente haciendo clic primero en "Funciones de enriquecimiento":

    Funciones de enriquecimiento

    Y luego en "Enriquecer en la tabla de origen":

    Enriquecer en la tabla de origen

  10. La tabla en la que se escriben los datos (= tabla de destino) es, en nuestro caso, la tabla "sample1.xls":

    Tabla de objetivos

    Los datos del conjunto de datos sin marcar se transfieren al conjunto de datos marcado (véase el procesamiento manual posterior):

    Transferir datos al registro CON marca

    Para enriquecer los datos, ahora solo tenemos que indicar al programa qué información debe escribir y dónde. Para ello, añadimos uno o varios pares de columnas:

    Añadir par de columnas

    Por ejemplo, la información de la columna "Tel" de la tabla de origen podría escribirse en el campo de datos "Resultado A" de la tabla de destino, y la información de la columna "Correo electrónico" en el campo de datos "Resultado B".

    Asignación de columnas

    En ambos casos, el contenido del campo de datos de destino debe sobrescribirse, si es necesario, con la información de la tabla de origen (= "Acción"):

    Acción: sobrescribir

  11. Opcionalmente, en los registros enriquecidos con información adicional se puede almacenar un dato que indique la procedencia de dichos datos. Este dato es necesario para poder cumplir plenamente con el derecho de acceso a la información en el caso de los datos personales y, de este modo, cumplir con los requisitos de diversas leyes de protección de datos, como el RGPD (Reglamento General de Protección de Datos):

    Origen de los datos

    De este modo, ya se dispone de toda la información necesaria para el enriquecimiento de datos. Al hacer clic en el botón "Procesar datos", se inicia el proceso.

Nota: También existe un video tutorial para DataQualityTools que nos introduce en el manejo del programa mediante una muestra de comparación de duplicados dentro de una tabla.