In der Datenanalyse mit Tableau kommt es oft vor,​ dass die Datenverschmelzung und die Datenverknüpfung verwechselt werden. Nachfolgend werden die Unterschiede der beiden Methoden dargestellt.

Was ist Datenverschmelzung (Data Blending)?

Die Datenverschmelzung ist eine Methode zum Kombinieren von Daten, die eine Datenquelle mit​ ​einer anderen Datenquelle ergänzt.
Dabei kombiniert Tableau Daten aus einer Tabelle, die einer bestimmten Datenquelle (primäre Datenquelle) zugeordnet sind, mit einer Datenspalte aus einer anderen Datenquelle (sekundäre Datenquelle). Für jede Datenquelle wird eine Abfrage im Arbeitsblatt an die Datenbank gesendet. Die Ergebnisse werden dann zusammen mit den aggregierten Daten an Tableau zurückgesendet. Die Ergebnisansicht verwendet alle Zeilen aus der primären Datenquelle und die aggregierten Zeilen aus der sekundären Datenquelle, basierend auf der Dimension der Verknüpfungsfelder.​​

Beispiel:

Tabelle 1: Team 2014

Team Coach Games Won in 2014
Badgers Jim 17
Bears Tom 24
Falcons Ryan 28
Knights Sally 36
Lightning Susan 16
Lions Nina 26
Ninjas Hannah 16
Tigers Rob 43

Hier sieht man ein aggregiertes Ergebnis, d.h. in einer Zeile sieht man das Ergebnis von allen Spielen im Jahr 2014.

Tabelle 2: Games

Home Team Away Team Date Runs for Home Team Runs for Away Team Winning Team
Badgers Bears 01.01.2015 8 7 Badgers
Bears Falcons 01.01.2015 7 5 Bears
Falcons Knights 01.01.2015 3 10 Knights
Knights Lightning 01.01.2015 4 3 Knights
Lightning Lions 01.01.2015 3 5 Lions
Lions Ninjas 01.01.2015 6 10 Ninjas
Ninjas Tigers 01.01.2015 6 8 Tigers
Tigers Badgers 01.01.2015 8 9 Badgers
Badgers Falcons 04.01.2015 2 3 Falcons
Bears Knights 04.01.2015 4 2 Bears
Falcons Lightning 04.01.2015 0 8 Lightning
Knights Lions 04.01.2015 10 6 Knights
Lightning Ninjas 04.01.2015 3 5 Ninjas
Lions Tigers 04.01.2015 1 8 Tigers
Ninjas Badgers 04.01.2015 2 10 Badgers
Tigers Bears 04.01.2015 9 5 Tigers
Badgers Knights 07.01.2015 6 5 Badgers
Bears Lightning 07.01.2015 8 6 Bears

Hier sieht man in jeder Zeile das Ergebnis von jedem Spiel.
Nachdem man die Datenverschmelzung aktiviert hat, bekommt man folgendes Ergebnis:

Wann wird die Datenverschmelzung in Tableau genutzt?

Eine Benutzung der Datenverknüpfung (Data Join) würde in diesem Fall wenig Sinn ergeben. Der Grund dafür ist, dass es in der Tabelle Games in jeder Zeile ein Ergebnis pro Spiel gibt. In der Tabelle Team2014 gibt es ein aggregiertes Ergebnis pro Jahr. Würde man diese beiden Tabellen miteinander verknüpfen (Datenverknüpfung), würde Tableau das Ergebnis von der Tabelle Team2014 duplizieren und in die Tabelle Games schreiben. Dies wird mit der Datenverschmelzung vermieden. Achtung: Bei einer Datenverschmelzung geht es nur um eine Linksverknüpfung, d.h. man sollte im Voraus überlegen, welche Tabelle als primäre Tabelle ausgewählt wird.
​​Hier ist ein Beispiel wie man Datenverschmelzung hinzufügt:

Auf dem Arbeitsblatt gehen Sie wie folgt​ ​vor:
-> Daten
-> Beziehung bearbeiten
-> Beziehung hinzufügen

Was ist Datenverknüpfung (Data Join)?

​​Die in Tableau analysierten Daten bestehen häufig aus mehreren Tabellen, die über bestimmte Felder miteinander verbunden sind. Das Verknüpfen ist eine Methode zum Kombinieren der zugehörigen Daten in diesen gemeinsamen Feldern.
​Werden Daten über den rechten Join ​(​Rechtsverknüpfung) ​​verknüpft, dann sendet Tableau eine Abfrage an die Datenbank, in der die Verknüpfung erfolgt. Bei einer ​​Rechtsverknüpfung werden alle Zeilen aus der rechten Tabelle zurückgegeben​ und​ zusätzlich​​ werden alle Zeilen aus der linken Tabelle, die mit der rechten übereinstimmen, ebenso zurückgegeben.

Beispiel:
Tabelle: Team 2013

Baseball Team Coach Games Won in 2013
Badgers Scott 17
Bears Bill 23
Falcons Mike 28
Knights Sally 39
Lightning Susan 16
Lions Nina 29
Ninjas Lisa 17
Tigers Rob 42

 

Tabelle: Team 2014

Team Coach Games Won in 2014
Badgers Jim 17
Bears Tom 24
Falcons Ryan 28
Knights Sally 36
Lightning Susan 16
Lions Nina 26
Ninjas Hannah 16
Tigers Rob 43

In beiden Tabellen ist das Gesamtergebnis für das jeweilige Jahr in einer Zeile erfasst.

Wann ​wird die ​Datenverknüpfung​ in Tableau genutzt​?

Falls Tabellen mit der gleichen Tabellenstruktur und Logik gegeben sind, kann die Datenverknüpfung eingesetzt werden.
Tableau bietet drei Arten von Verknüpfung:

​Linksverknüpfung (LEFT JOIN)

Wenn Sie die Verknüpfung „Links“ verwenden, enthält die erzeugte Tabelle alle Werte aus der linken Tabelle und die entsprechenden Übereinstimmungen aus der rechten Tabelle.
Ist für einen Wert in der linken Tabelle keine entsprechende Übereinstimmung in der rechten Tabelle vorhanden, wird ein NULL-Wert im Datenraster angezeigt.

Rechtsverknüpfung (RIGHT JOIN)

Wenn Sie die Verknüpfung „Rechts“ verwenden, enthält die erzeugte Tabelle alle Werte aus der rechten Tabelle und die entsprechenden Übereinstimmungen aus der linken Tabelle.
Ist für einen Wert in der rechten Tabelle keine entsprechende Übereinstimmung in der linken Tabelle vorhanden, wird ein NULL-Wert im Datenraster angezeigt.

Innenverknüpfung (INNER JOIN)

Wenn Sie die Verknüpfung „Innen“ verwenden, enthält die erzeugte Tabelle Werte, die Übereinstimmungen in beiden Tabellen haben.

Vollständig außen (FULL OUTER JOIN)

Wenn Sie die Verknüpfung „Vollständig außen“ verwenden, enthält die erzeugte Tabelle alle Werte aus beiden Tabellen.
Ist für einen Wert in einer der beiden Tabellen keine entsprechende Übereinstimmung in der anderen Tabelle vorhanden, wird ein NULL-Wert im Datenraster angezeigt.

Hier ist ein Beispiel wie man Datenverknüpfung erstellt:
​​Im Panel „Datenquelle“ ​werden bestimmte Blätter aus​gewählt​ und ​über ​die Innen-, Rechts- oder Linksverknüpfung​ zusammengefügt​. Das sind sogenannte Joins.

Zusammenfassung

Datenverschmelzung

Datenverknüpfung

Es handelt sich um Linksverknüpfung Es gibt folgende Typen der Verknüpfung:

  • Linksverknüpfung
  • Rechtsverknüpfung
  • Innenverknüpfung
Datenverschmelzung soll benutzt werden, wenn Tabellenstruktur und Logik nicht identisch sind Datenverknüpfung soll benutzt werden, wenn Tabellenstruktur und Logik identisch sind

 

Probieren Sie es selbst, die obenstehenden Tabellen in Tableau nachzubauen, um die Unterschiede zu verstehen. Anbei eine Excel Datei: Link zur Exceldatei