En su día ya vimos los principios básicos de la eficiencia de los libros de trabajo en Tableau. En esta segunda parte sobre el rendimiento, vamos a ver uno de los temas más importantes de todo el ecosistema de Tableau: las conexiones de datos y la diferencia entre extract y live.
Los diferentes tipos de conexiones
Tableau ofrece la posibilidad de conectarse a diferentes fuentes: basadas en archivos, informes, OLAP (On-Line Analytical Processing) o basadas en la web.
Una conexión en live es la conexión básica: Tableau, en esos casos, está constantemente preguntando al archivo si hay algún dato más que actualizar. Por otro lado, el extracto es un tipo de archivo que genera Tableau, que permite crear una fotografía de la tabla en el momento en que se crea ese extracto.
Extract vs Live
Entonces, ¿cuándo usar el extracto y cuándo usar la conexión en vivo/ live? Extract ofrece algunas ventajas específicas, como la mejora del rendimiento de una consulta especialmente pesada. Como especifica Tableau en este whitepaper, «el formato de datos de extract está diseñado para proporcionar respuestas rápidas a las consultas de análisis, por lo que extract puede considerarse como una caché para acelerar la consulta». Extract también permite trabajar sin conexión, ya que no requiere una conexión activa y en funcionamiento con la fuente de datos.
¿Cuándo no utilizar extractos y sí una conexión en directo? El caso principal es cuando necesitamos datos en tiempo real (los extractos son una instantánea de los datos en un momento dado, por lo que, aunque pueden actualizarse, no son adecuados para quienes necesitan un flujo constantemente actualizado), pero también si trabajamos con grandes cantidades de datos que harían el archivo demasiado grande o si se requiere protección a nivel de usuario.
Aunque el extracto es una instantánea de los datos en un momento determinado, es posible programar Tableau Server para que actualice los datos de forma programada, de modo que el extracto se actualice siempre de forma completa o incremental.