Antes de proceder al análisis y la visualización de los datos en un software como Tableau, debemos preparar los datos, que no siempre están listos para el análisis y requieren una «Data Preparation» o “Preparación de datos” (conocida como ETL – Extract Transform Load). Una vez configurada la fuente de datos, comienza la preparación de los datos, de nuevo en la página «Dara Source» u “Origen de datos”. En esta etapa, necesitamos establecer la relación entre los datos, un paso simplificado en Tableau con herramientas como «Join», «Union», «Relationships» y muchas otras.
En este artículo, veremos Wildcard Union, una forma simplificada de unir datos automáticamente, incluso si provienen de diferentes fuentes de datos.
La «Unión» de datos en resumen
En primer lugar, debemos entender qué es union y cuándo utilizarlo en Tableau Desktop.
Union consiste en «colocar» las tablas una debajo de la otra, dando lugar a múltiples filas. Una operación de union se utiliza principalmente para combinar el contenido de dos o más tablas; para realizar una operación de union, el número de columnas y los tipos de datos almacenados en esas columnas deben ser los mismos en todas las tablas en las que se realiza la operación de union. La operación de union garantiza la eliminación de todos los duplicados de la tabla resultante: esto significa que si un registro está presente en diferentes tablas, sólo estará presente una vez en la tabla resultante.
En resumen, una unión es un enlace vertical de datos, que da lugar a un único dataset creado a partir de varias tablas.
¿Cuándo utilizar «Union» en Tableau Desktop?
Tomemos el ejemplo de los datos de los resultados de Eurovisión de 1998 a 2000.
En este caso, para comparar los resultados de los países de un año a otro, tenemos que crear una única tabla combinando estas tres tablas de los años 1998, 1999 y 2000.
Después de establecer la fuente de datos en la página «Fuente de datos», podemos empezar con la fusión. Tenemos dos formas diferentes de fusionar los datos: manual y automática. Pero antes, como puedes ver en la siguiente imagen (en el panel izquierdo resaltado en amarillo en la página de la Fuente de Datos), Tableau indica la posibilidad de proceder a la unión, si las fuentes de datos soportan la unión. En este caso, hacemos clic en «New Union».
Ahora podemos proceder a la unión. Al hacer clic en «New Union» tendremos las dos opciones de Unión: Manual y Automática.
Manual de la Unión – Específico (Manual)
- Haz clic en «Nueva Unión”
- Arrastra y suelta las 3 tablas en la imagen
CONSEJO: pulsando CTRL mientras se seleccionan las diferentes tablas, puedes arrastrar las tres tablas y soltarlas en el marco.
- Finaliza la fusión haciendo clic en Apply y Ok.
- Puedes comprobar la operación de fusión y modificarla haciendo clic en Open o Modify.
- Y ahora puedes ver una única tabla con los resultados de 1998 a 2000.
Ten en cuenta que para fusionar datos de diferentes tablas utilizando la fusión manual, las tablas deben proceder de la misma conexión. Por ejemplo, los usuarios pueden fusionar en Tableau dos tablas de Microsoft Excel o dos tablas de SQL, pero no pueden hacerlo si una tabla procede de Microsoft Excel y la otra de SQL. El uso de la fusión manual restringe la entrada de datos sólo dentro de una única conexión de datos. El intento de importar datos desde otra conexión te obligará a configurar un join. Para evitar esta limitación, puedes utilizar una unión con Wildcard Automatic, que se describe a continuación.
Wildcard Automatic: una forma simplificada de fusionar datos
- Conéctate la fuente de datos de Eurovisión1998
- Arrastra y suelta «Tablas1» y luego haz clic en «Convert to Union».
- Selecciona «Wildcard (Automatic)».
«Search in» indica un directorio específico en el que Tableau buscará libros de trabajo u hojas específicas.
«Matching Pattern» es una configuración que indica a Tableau que busque hojas específicas (sheets) dentro de un libro de trabajo o libros de trabajo (workbook) dentro de este directorio, y que una todos los datos que encuentre. También puede utilizarse para excluir hojas o libros de trabajo específicos, si es necesario.
- En la sección “Workbook“ de ”Matching Pattern”, escribe Eurovisión*. En este caso, Tableau procederá a fusionar todos los libros de trabajo llamados Eurovisión.
También puede dejarlo en blanco para incluir todas las tablas con el mismo formato que la tabla ya importada. Este tipo de fusión es conveniente porque no es necesario añadir las nuevas tablas manualmente: basta con actualizar la fuente de datos.
Como puedes ver en la imagen del primer paso, las 3 carpetas de Eurovisión* son de distinto tipo: xls y CSV. Así que, utilizando la función Wildcard de Tableau, pudimos fusionar tablas de diferentes tipos.
- Haz clic en Apply y Ok.
- Ve a la hoja de trabajo y pon «Year» en las filas. Ahora puedes ver que has importado con éxito los resultados de Eurovisión de los 3 años 1998, 1999 y 2000.
Y ahora, ¡nuestros datos están listos para ser analizados y visualizados en Tableau!