Si te perdiste la última actualización de Tableau, la versión 2024.1, echa un vistazo a nuestro artículo dedicado en el que te contamos todas las novedades más interesantes.
1. Selección de las líneas iniciales
Una de las herramientas más potentes de los productos de Tableau es el intérprete, que resulta especialmente útil cuando nos encontramos con fuentes de datos con un formato especial.
Imaginemos que nos encontramos en una situación de este tipo:
En esta hoja de cálculo Excel, además de los numerosos títulos y subtítulos, debajo de los títulos de las columnas encontramos los metadatos: descripciones detalladas de los datos en sí, que son esenciales para comprender plenamente el contenido de la tabla.
Aunque es aconsejable proporcionar un título claro y descripciones adecuadas para comprender los datos de forma óptima, no se recomienda colocarlos directamente dentro de la hoja de cálculo de Excel. Afortunadamente, en situaciones en las que el formato no es el ideal, el intérprete de datos de Tableau acude al rescate para resolver el problema, aunque su fiabilidad no siempre está garantizada.
A menudo, en estos casos, el intérprete es capaz de identificar y eliminar títulos y subtítulos, pero no se da cuenta de que hay metadatos en la fila situada debajo de los encabezados de columna, lo que provoca desorden en los datos.
La versión 2024.1 de Tableau Prep introduce una solución: la posibilidad de establecer manualmente la cabecera y el inicio de nuestros datos.
Tras arrastrar nuestra tabla al Canva de Tableau Prep 2024.1, directamente en el primer paso de entrada, seleccionamos elencabezado «Establecer encabezado» e indicamos el número de la fila en la que se encuentran los encabezados y el inicio de los datos.
El resultado será el siguiente:
2. Detección de filas duplicadas
Trabajar con datos duplicados puede ser a menudo un problema para la calidad del análisis, así como un desperdicio de espacio en memoria. Por ello, eliminar duplicados garantiza la unicidad de cada valor, asegurando una representación precisa de nuestros datos.
En versiones anteriores de Tableau Prep, la detección y eliminación de filas duplicadas ya era posible, pero con las nuevas características de 2024, este proceso se ha hecho significativamente más rápido y funcional. Veamos cómo, mientras seguimos analizando nuestra tabla:
Al abrir un paso de limpieza, haga clic en«Identificar filas duplicadas«.
Cuando se selecciona esta opción, se crea automáticamente un campo calculado booleano (de tipo True/False) utilizando el siguiente código:
IF ({PARTITION [[Field 1]], [[Field 2]], [[Field 3]]: { ORDERBY [[Field 3]] DESC: ROW_NUMBER() } } = 1) THEN ‘Unica’ ELSE ‘Duplica’ END
Este campo etiquetará todas las filas con duplicados basados en los campos especificados como«Duplicado» y las que no tengan duplicados como«Único«.
Ahora sólo queda eliminar las filas duplicadas:
Haga clic con el botón derecho del ratón en la cadena»Duplicar», luego en»Excluir» y obtendrás el resultado deseado:
Conclusiones
Las nuevas funciones de Tableau Prep 2024.1 introducen mejoras significativas en la preparación de datos. La funcionalidad de selección inicial de filas permite un manejo más preciso de los datos en el momento de la importación, evitando confusiones causadas por encabezados y metadatos innecesarios. La adición de la detección de filas duplicadas simplifica la limpieza de datos, garantizando un análisis más preciso y eficiente. Estas actualizaciones hacen de Tableau Prep una herramienta aún más potente para los analistas, facilitando la preparación de los datos y permitiéndoles centrarse en la extracción de perspectivas significativas.
Lee todos nuestros artículos sobre Tableau
¿Quieres conocer las últimas novedades o profundizar en algunas características para convertirte en un experto?
Visualitics Team
Este artículo ha sido escrito y editado por uno de nuestros consultores.
Compártelo ahora en tus redes sociales o por correo electrónico: