El Violin Chart forma parte de ese conjunto de gráficos que puedes construir a partir de unos pasos muy sencillos. Antes de entrar en los detalles de cómo construir este tipo de gráfico, veamos cómo está estructurado y para qué se utiliza.
El Violin Chart es un tipo de gráfico útil para ver y comparar la distribución de los datos de una misma dimensión continua. La información que transmite un Violin Chart también puede ser similar a la que se obtiene al observar un Box Plot, con la diferencia de que en el Violin Chart también se muestra la densidad de probabilidad de los datos en correspondencia a la diversidad de valores.
Veamos cuáles son los pasos para construir un Violin Chart desde cero en Tableau Desktop.
El dataset
En primer lugar, necesitamos un conjunto de datos de partida. El conjunto de datos de ejemplo contiene datos sobre los resultados de los exámenes de estadística de 20 estudiantes.
Para mostrar la implementación de este gráfico comenzamos con dos hojas de Excel. La primera hoja contiene tres columnas. La tercera columna contiene la evaluación del examen (entre 18 y 30).
La segunda hoja de Excel contiene valores de «apoyo» que van de 1 a 99, en pasos de 1. La función de estos valores la veremos más adelante.
El Inner Join
Ahora, vamos a unir las columnas con un join. Esto puede hacerse utilizando la opción «Create Join Calculation» en las opciones de join. Creamos un campo calculado que contenga una cadena, por ejemplo «key», y la utilizamos como key para el inner join que vamos a implementar.
Al hacerlo, vamos a atribuir a cada número de serie los 99 valores de soporte de los que hablábamos antes.
Construcción de parámetros
Vamos a crear dos parámetros que vamos a insertar dentro de los campos calculados del paso 4: llamemos al primer parámetro «Radius». Su función será ampliar o reducir el rango de valores que abarca nuestro Violin Chart. Este parámetro debe ser un número entero.
Podemos llamar al segundo parámetro «Width». También, en este caso, su función será modificar la forma del gráfico. Los dos parámetros pueden ajustarse en función del tipo de representación que queramos obtener y de la estructura del conjunto de datos que tratemos.
Creación de los campos calculados
Pasemos ahora a la creación de dos campos calculados.
El primero se utilizará para definir el rango en el que vamos a posicionarnos a nivel de fila. Como ya hemos comentado, podemos modificar dinámicamente este rango sobre el que se distribuirán los valores utilizando los parámetros generados en el paso 3. A medida que el parámetro Radius aumenta, por ejemplo, el rango de la distribución de valores será más amplio.
Teniendo esto en cuenta, podemos crear el primer campo calculado de la siguiente manera:
El segundo campo calculado que vamos a crear en su lugar se utilizará para realizar una operación de suavizado o smoothing en nuestro gráfico. De hecho, este campo calculado se utiliza para reproducir la distribución de probabilidad de una Normal (también conocida comúnmente como «curva de campana»). De este modo, el Violin Chart mostrará unos picos que representen una mayor probabilidad de realización de determinados valores.
Creación de un Violin Chart
Una vez creados los campos, arrastramos el primero (en formato de tamaño continuo) a filas. Al hacerlo, obtendremos la escala de valores a lo largo de la cual se trazará nuestra distribución. A continuación, arrastramos el campo «Normal» a columnas. Por último, nos tenemos que asegurar de que el tipo de marca esté configurado como «Área».
Para que el gráfico sea simétrico con respecto al eje vertical, bastará con duplicar (manteniendo pulsada la tecla CTRL) el campo Normal a columnas y arrastrarlo al lado de la pill existente (es decir, en columnas), insertando el signo «-» dentro de la nueva pastilla duplicada.
Ahora, haciendo clic derecho en el segundo pill, vamos a proceder a seleccionar la opción «eje doble». Luego, con un clic derecho sobre el eje horizontal seleccionamos la opción «Sincronizar eje».
Por último, vamos a modificar los colores, las dimensiones y todos los demás detalles personalizables como queramos.
Eso es todo, ¡nuestro Violin Chart está listo! ¿Cómo podemos interpretarlo entonces? En general, podemos decir que las secciones más grandes representan una mayor probabilidad de que la población tome ese valor determinado, mientras que las secciones menos gruesas se asocian a una probabilidad menor.
Síguenos en nuestras redes sociales de Linkedin y Facebook para descubrir nuevas funcionalidades de Tableau.