En el artículo anterior, vimos cómo el procesamiento In-DB permite la gestión de datos sin salir del entorno de la BD. De hecho, las herramientas In-DB establecen una conexión con la base de datos sin transferir los datos al ordenador local, lo que aumenta considerablemente el rendimiento.
A continuación se presentan algunas preguntas que nos permiten conocer mejor esta valiosa herramienta de Alteryx.
¿Cuándo utilizar las herramientas In-DB?
Un ejemplo clásico en el que es posible utilizar herramientas In-DB en lugar de las herramientas estándar sería el siguiente: tienes una tabla enorme en Oracle, necesitas integrar información de un pequeño archivo de Excel y escribir la nueva tabla en Oracle. En este ejemplo, se podrían utilizar las herramientas In-DB para transmitir los datos de Excel a una tabla temporal de la base de datos y, a continuación, utilizar la herramienta Join In-DB. Esto reduciría considerablemente el movimiento global de datos por la red y optimizaría el tiempo de ejecución del workflow.
¿En qué casos cabe esperar que los flujos de trabajo In-DB sean más lentos que las herramientas normales?
Esto depende del tipo de base de datos que utilices y de la rapidez con la que pueda procesar las consultas. Algunas bases de datos, como SQL Server, están optimizadas para gestionar las consultas mucho más rápido, mientras que otras pueden ser más lentas. Los flujos de trabajo que contienen múltiples joins y uniones pueden aumentar la longitud y complejidad de la consulta, tardando más en procesarse. En estos casos, la introducción de datos con las herramientas de entrada normales (en una red de baja latencia) y el procesamiento en Designer pueden ser más rápidos.
¿Qué autorizaciones de base de datos necesito para utilizar las herramientas In-DB?
- Se necesitan permisos de lectura para acceder a la base de datos subyacente.
- Se necesitan privilegios de escritura para crear una tabla en la base de datos.
- Es necesario los permisos creados para poder transmitir datos a la base de datos y escribir datos en la base de datos. La excepción es Microsoft SQL Server.
- Para permitir que una tabla temporal sea visible entre sesiones, Alteryx debe crear una tabla permanente que eventualmente se elimina al final de un flujo de trabajo.
¿Cómo generan las herramientas In-DB consultas SQL específicas de la base de datos?
Las consultas específicas de la base de datos se codifican en la mayoría de los casos para las herramientas In-DB y para cada fuente de datos compatible. Cada fuente de datos intenta utilizar funciones genéricas.
¿Cómo funcionan las sesiones y las tablas temporales con las herramientas In-DB?
Las herramientas In-DB tienen la funcionalidad adicional de almacenar sesiones en caché durante una ejecución. Si varias herramientas In-DB utilizan la misma conexión (ya sea usuario, sistema o archivo), sólo se creará una sesión activa para el flujo de trabajo. Sólo las sesiones de lectura y escritura se almacenan en caché por separado. Estas sesiones sólo están activas cuando se ejecuta el flujo de trabajo (en particular, cuando el motor está en marcha). Una vez que las consultas se han ejecutado y la sesión ya no es necesaria, Alteryx comprobará si existen tablas temporales creadas durante la ejecución, las eliminará y cerrará la conexión.
Si un flujo de trabajo falla o se bloquea durante una ejecución, es posible que no elimine las tablas temporales.
Si te han surgido dudas no resueltas en este post y quieres más información, no dudes en escribirnos a info@visualitics.es.