Hoy vamos a centrarnos en las diferencias entre estos dos métodos y, vamos a entender juntos, cuándo hay que utilizar un join y cuándo es mejor aplicar data blending. En primer lugar, empecemos por hacernos algunas preguntas:
- ¿Cuántas uniones tenemos dentro del libro de trabajo?
- ¿Cómo están conectadas las fuentes de datos?
- ¿Cuántos datos contienen las fuentes de datos?
- ¿Qué vistas debemos crear?
Una vez que hayamos respondido a estas preguntas iniciales, tendremos una idea casi completa de cuál es el mejor método a aplicar. Pero primero, hagamos un rápido resumen: cómo funciona una unión y qué es el data blending. Consideremos las siguientes tablas que pertenecen a la misma fuente de datos, por ejemplo, un archivo de Excel que consta de dos hojas, una para cada tabla:
Tabella 1: (elenco clienti con ordini resi)
Cliente ID | Nome Cliente | Età | Ordine ID | Quantità ordine |
1 | Mario | 27 | 76 | 50 |
2 | Giovanni | 55 | 77 | 20 |
3 | Luca | 18 | 78 | 30 |
4 | Luisa | 40 | 79 | 70 |
Tabella 2: (elenco ordini con stato reso o sospeso)
Ordine ID | Quantità ordine | Ordine Reso/sospeso |
77 | 20 | reso |
78 | 30 | reso |
79 | 70 | reso |
79 | 15 | sospeso |
A través de un join, establecemos y fijamos una relación entre ellas: piensa en la lógica de conjuntos e intersecciones e imagina las tablas como dos conjuntos. Supongamos que queremos crear una nueva tabla que contenga sólo los pedidos con estado «devuelto». En ese caso, usaríamos un inner join, de manera que tome sólo los valores comunes a ambas tablas, y estableceríamos el campo Order ID como key. La nueva tabla tendría la siguiente forma:
Cliente ID | Nome Cliente | Età | Ordine ID | Quantità ordine | Ordine Reso/sospeso |
2 | Giovanni | 55 | 77 | 20 | reso |
3 | Luca | 18 | 78 | 30 | reso |
4 | Luisa | 40 | 79 | 70 | reso |
Existen otros tipos de unión:
- En el caso del left join tomamos todas las filas de la tabla 1 y su información asociada de la tabla 2; en ausencia de información mostramos null
liente ID | Nome Cliente | Età | Ordine ID | Quantità ordine | Ordine Reso/sospeso |
1 | Mario | 27 | 76 | 50 | null |
2 | Giovanni | 55 | 77 | 20 | reso |
3 | Luca | 18 | 78 | 30 | reso |
4 | Luisa | 40 | 79 | 70 | reso |
- En el caso del right join, tomamos todas las filas de la tabla 2 y su información asociada de la tabla 1; si no hay información, mostramos null.
Cliente ID | Nome Cliente | Età | Ordine ID | Quantità ordine | Ordine Reso/sospeso |
2 | Giovanni | 55 | 77 | 20 | reso |
3 | Luca | 18 | 78 | 30 | reso |
4 | Luisa | 40 | 79 | 70 | reso |
null | null | null | 79.1 | 15 | sospeso |
- Full Outer join: tomamos todas las filas de ambas tablas:
Cliente ID | Nome Cliente | Età | Ordine ID | Quantità ordine | Ordine Reso/sospeso |
1 | Mario | 27 | 76 | 50 | null |
2 | Giovanni | 55 | 77 | 20 | reso |
3 | Luca | 18 | 78 | 30 | reso |
4 | Luisa | 40 | 79 | 70 | reso |
null | null | null | 79 | 15 | sospeso |
En el caso del data blending, volvemos a considerar las dos tablas; pero supongamos que están en dos fuentes de datos con orígenes diferentes. La combinación entre ellas, a diferencia de las uniones, nunca combina realmente los datos, sino que los resultados se agregan al nivel apropiado y se presentan visualmente juntos en la vista. En este punto, vamos a cargarlas por separado en Tableau y luego establecemos desde el menú Datos -> Edit blending relationship las claves de relación, en nuestro caso «ID de pedido». Después, en cada hoja del libro de trabajo, podemos decidir cuál de las dos tablas utilizar como fuente primaria. Por ejemplo, si queremos mostrar todos los clientes con estado devuelto que pertenezcan a la fuente n.1, utilizaremos la fuente de datos 1 como fuente primaria y filtraremos teniendo en cuenta sólo los pedidos devueltos.
Tanto realizando un data blending como eligiendo un join, obtenemos el mismo resultado. Entonces, ¿cuál es la mejor opción? En general, se recomienda utilizar las uniones en lugar del data blending por las siguientes razones:
- son más eficaces, ya que el trabajo lo realiza la base de datos y no la máquina local;
- y hay pocas limitaciones en su uso. Pero eso no es todo: Veamos en detalle los pros y contras de ambos métodos. A continuación, se presenta un cuadro resumen. Pasa el ratón por encima de los iconos para ver más información.
¡Para leer otros consejos útiles y continuar tu formación en Tableau, puedes seguirnos en nuestras redes sociales de Linkedin y Facebook, para comentar este y otros contenidos con otros miembros de la plataforma!