Desde hace ya varias versiones, Tableau Desktop proporciona algunas herramientas para predecir cómo se comportarán los datos que estamos analizando. Hablamos de las opciones de Forecast que ya habíamos tratado en profundidad en dos artículos diferentes (parte 1 y parte 2).
Con la llegada de la nueva versión 2020.3, Tableau ha introducido nuevas funciones en el ámbito del análisis predictivo. De hecho, escuchando las peticiones de la comunidad, Tableau incluirá nuevas funciones para poderlas utilizar en los campos calculados: MODEL_PERCENTILE y MODEL_QUANTILE.
Estas funciones generan Table Calculations que permiten aumentar el grado de flexibilidad con el que realizar predicciones, permitiendo recalcular los análisis en función de los datos visualizados y, por tanto, trabajando sobre jerarquías, filtros, parámetros, marcas seleccionadas y LOD.
Pongamos algún ejemplo utilizando la fuente de datos World Indicators, presente en la instalación de Tableau Desktop. Para lograr distribuciones más adecuadas, a efectos del ejemplo, realizaremos transformaciones logarítmicas.
Empezaremos por una visualización que compara el gasto sanitario de cada país con la esperanza de vida femenina, filtrada para el año 2012.
MODEL_PERCENTILE
Con la nueva Table Calculation MODEL_PERCENTILE podremos obtener la probabilidad de que un valor no observado pueda ser menor o igual a un dato observado, definido por la expresión de destino, basándose en otro dato que desempeña el papel de predictor. Esta función, para quien tenga conocimientos de estadística o esté interesado, coincide con la función de distribución predictiva a posteriori también conocida como Cumulative Density Function (CDF) y podrá tener un valor entre 0 y 1.
La sintaxis de esta función es:
MODEL_PERCENTILE (target_expression, predictor_expression)
que aplicada en nuestro ejemplo será
MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))
- target_expression: corresponde a la medida que debe estimar el modelo;
- predictor_expression: el segundo argumento (o argumentos adicionales) es el predictor (valores, por tanto, estrechamente relacionados con la medida que se está estimando) y definen el modelo; en este caso se puede utilizar, Medidas o Dimensiones o ambos.
Cómo utilizar e interpretar MODEL_PERCENTILE
El motivo principal por el que se puede utilizar esta nueva función de Tableau es para destacar posibles correlaciones y relaciones presentes dentro de nuestro conjunto de datos. Cuanto más cerca esté el valor resultante de 0,5, más cerca estará de la mediana del intervalo y de los valores modelados. Cuando el valor esté cerca de 0 o 1, el caso observado estará en el límite de lo que predice el modelo configurado a partir de los predictores seleccionados.
MODEL_QUANTILE
La función MODEL_QUANTILE devuelve el valor objetivo a un determinado percentil, basándose en otros criterios predictivos (Posterior Predictive Quantile). El resultado obtenido será un valor con un radio de probabilidad definido por la target_expression y los predictores. Es básicamente el inverso del MODEL_PERCENTILE.
La sintaxis de esta Table Calculation es:
MODEL_QUANTILE (percentile, target_expression, predictor_expression)
donde
- percentile: este valor debe ser un número decimal entre 0 y 1 y especifica el percentil que se debe utilizar para la estimación (por ejemplo, 0,5 equivale a la mediana del valor de referencia);
- target_expression: corresponde a la medida que debe estimar el modelo;
- predictor_expression: el tercer argumento corresponde al valor predictor que será considerado en el modelo (recordando que como en el MODEL PERCENTIL, aquí los argumentos también podrán ser más de uno en función de nuestros análisis).
Cómo utilizar e interpretar MODEL_QUANTILE
La principal aplicación de esta nueva función es generar predicciones numéricas, a partir de los predictores y el percentil objetivo especificado. MODEL_QUANTILE también puede estimar valores ausentes, pero también hacer proyecciones para fechas futuras, o incluso predecir diferentes escenarios en los que se redefinen las relaciones existentes en el conjunto de datos. Por último, una función igualmente importante, cuando se trata de realizar estimaciones e hipótesis, será la de calcular intervalos de confianza para cuantificar el nivel de incertidumbre de las propias predicciones.
Ahora que has descubierto las nuevas funciones para crear modelos predictivos en Tableau, ¡ya no tienes excusas para no utilizarlo! Descarga ahora tu versión de prueba aquí. Continúa siguiéndonos en nuestro blog y nuestras redes sociales de LinkedIn y Facebook.