In der Datenanalyse mit Tableau kommt es oft vor, dass die Datenverschmelzung und die Datenverknüpfung verwechselt werden. Nachfolgend werden die Unterschiede der beiden Methoden dargestellt.
Was ist Datenverschmelzung (Data Blending)?
Die Datenverschmelzung ist eine Methode zum Kombinieren von Daten, die eine Datenquelle mit einer anderen Datenquelle ergänzt.
Dabei kombiniert Tableau Daten aus einer Tabelle, die einer bestimmten Datenquelle (primäre Datenquelle) zugeordnet sind, mit einer Datenspalte aus einer anderen Datenquelle (sekundäre Datenquelle). Für jede Datenquelle wird eine Abfrage im Arbeitsblatt an die Datenbank gesendet. Die Ergebnisse werden dann zusammen mit den aggregierten Daten an Tableau zurückgesendet. Die Ergebnisansicht verwendet alle Zeilen aus der primären Datenquelle und die aggregierten Zeilen aus der sekundären Datenquelle, basierend auf der Dimension der Verknüpfungsfelder.
Beispiel:
Tabelle 1: Team 2014
Team | Coach | Games Won in 2014 |
Badgers | Jim | 17 |
Bears | Tom | 24 |
Falcons | Ryan | 28 |
Knights | Sally | 36 |
Lightning | Susan | 16 |
Lions | Nina | 26 |
Ninjas | Hannah | 16 |
Tigers | Rob | 43 |
Hier sieht man ein aggregiertes Ergebnis, d.h. in einer Zeile sieht man das Ergebnis von allen Spielen im Jahr 2014.
Tabelle 2: Games
Home Team | Away Team | Date | Runs for Home Team | Runs for Away Team | Winning Team |
Badgers | Bears | 01.01.2015 | 8 | 7 | Badgers |
Bears | Falcons | 01.01.2015 | 7 | 5 | Bears |
Falcons | Knights | 01.01.2015 | 3 | 10 | Knights |
Knights | Lightning | 01.01.2015 | 4 | 3 | Knights |
Lightning | Lions | 01.01.2015 | 3 | 5 | Lions |
Lions | Ninjas | 01.01.2015 | 6 | 10 | Ninjas |
Ninjas | Tigers | 01.01.2015 | 6 | 8 | Tigers |
Tigers | Badgers | 01.01.2015 | 8 | 9 | Badgers |
Badgers | Falcons | 04.01.2015 | 2 | 3 | Falcons |
Bears | Knights | 04.01.2015 | 4 | 2 | Bears |
Falcons | Lightning | 04.01.2015 | 0 | 8 | Lightning |
Knights | Lions | 04.01.2015 | 10 | 6 | Knights |
Lightning | Ninjas | 04.01.2015 | 3 | 5 | Ninjas |
Lions | Tigers | 04.01.2015 | 1 | 8 | Tigers |
Ninjas | Badgers | 04.01.2015 | 2 | 10 | Badgers |
Tigers | Bears | 04.01.2015 | 9 | 5 | Tigers |
Badgers | Knights | 07.01.2015 | 6 | 5 | Badgers |
Bears | Lightning | 07.01.2015 | 8 | 6 | Bears |
Hier sieht man in jeder Zeile das Ergebnis von jedem Spiel.
Nachdem man die Datenverschmelzung aktiviert hat, bekommt man folgendes Ergebnis:
Wann wird die Datenverschmelzung in Tableau genutzt?
Eine Benutzung der Datenverknüpfung (Data Join) würde in diesem Fall wenig Sinn ergeben. Der Grund dafür ist, dass es in der Tabelle Games in jeder Zeile ein Ergebnis pro Spiel gibt. In der Tabelle Team2014 gibt es ein aggregiertes Ergebnis pro Jahr. Würde man diese beiden Tabellen miteinander verknüpfen (Datenverknüpfung), würde Tableau das Ergebnis von der Tabelle Team2014 duplizieren und in die Tabelle Games schreiben. Dies wird mit der Datenverschmelzung vermieden. Achtung: Bei einer Datenverschmelzung geht es nur um eine Linksverknüpfung, d.h. man sollte im Voraus überlegen, welche Tabelle als primäre Tabelle ausgewählt wird.
Hier ist ein Beispiel wie man Datenverschmelzung hinzufügt:
Auf dem Arbeitsblatt gehen Sie wie folgt vor:
-> Daten
-> Beziehung bearbeiten
-> Beziehung hinzufügen
Was ist Datenverknüpfung (Data Join)?
Die in Tableau analysierten Daten bestehen häufig aus mehreren Tabellen, die über bestimmte Felder miteinander verbunden sind. Das Verknüpfen ist eine Methode zum Kombinieren der zugehörigen Daten in diesen gemeinsamen Feldern.
Werden Daten über den rechten Join (Rechtsverknüpfung) verknüpft, dann sendet Tableau eine Abfrage an die Datenbank, in der die Verknüpfung erfolgt. Bei einer Rechtsverknüpfung werden alle Zeilen aus der rechten Tabelle zurückgegeben und zusätzlich werden alle Zeilen aus der linken Tabelle, die mit der rechten übereinstimmen, ebenso zurückgegeben.
Beispiel:
Tabelle: Team 2013
Baseball Team | Coach | Games Won in 2013 |
Badgers | Scott | 17 |
Bears | Bill | 23 |
Falcons | Mike | 28 |
Knights | Sally | 39 |
Lightning | Susan | 16 |
Lions | Nina | 29 |
Ninjas | Lisa | 17 |
Tigers | Rob | 42 |
Tabelle: Team 2014
Team | Coach | Games Won in 2014 |
Badgers | Jim | 17 |
Bears | Tom | 24 |
Falcons | Ryan | 28 |
Knights | Sally | 36 |
Lightning | Susan | 16 |
Lions | Nina | 26 |
Ninjas | Hannah | 16 |
Tigers | Rob | 43 |
In beiden Tabellen ist das Gesamtergebnis für das jeweilige Jahr in einer Zeile erfasst.
Wann wird die Datenverknüpfung in Tableau genutzt?
Falls Tabellen mit der gleichen Tabellenstruktur und Logik gegeben sind, kann die Datenverknüpfung eingesetzt werden.
Tableau bietet drei Arten von Verknüpfung:
Linksverknüpfung (LEFT JOIN)
Wenn Sie die Verknüpfung „Links“ verwenden, enthält die erzeugte Tabelle alle Werte aus der linken Tabelle und die entsprechenden Übereinstimmungen aus der rechten Tabelle.
Ist für einen Wert in der linken Tabelle keine entsprechende Übereinstimmung in der rechten Tabelle vorhanden, wird ein NULL-Wert im Datenraster angezeigt.
Rechtsverknüpfung (RIGHT JOIN)
Wenn Sie die Verknüpfung „Rechts“ verwenden, enthält die erzeugte Tabelle alle Werte aus der rechten Tabelle und die entsprechenden Übereinstimmungen aus der linken Tabelle.
Ist für einen Wert in der rechten Tabelle keine entsprechende Übereinstimmung in der linken Tabelle vorhanden, wird ein NULL-Wert im Datenraster angezeigt.
Innenverknüpfung (INNER JOIN)
Wenn Sie die Verknüpfung „Innen“ verwenden, enthält die erzeugte Tabelle Werte, die Übereinstimmungen in beiden Tabellen haben.
Vollständig außen (FULL OUTER JOIN)
Wenn Sie die Verknüpfung „Vollständig außen“ verwenden, enthält die erzeugte Tabelle alle Werte aus beiden Tabellen.
Ist für einen Wert in einer der beiden Tabellen keine entsprechende Übereinstimmung in der anderen Tabelle vorhanden, wird ein NULL-Wert im Datenraster angezeigt.
Hier ist ein Beispiel wie man Datenverknüpfung erstellt:
Im Panel „Datenquelle“ werden bestimmte Blätter ausgewählt und über die Innen-, Rechts- oder Linksverknüpfung zusammengefügt. Das sind sogenannte Joins.
Zusammenfassung
Datenverschmelzung |
Datenverknüpfung |
Es handelt sich um Linksverknüpfung | Es gibt folgende Typen der Verknüpfung:
|
Datenverschmelzung soll benutzt werden, wenn Tabellenstruktur und Logik nicht identisch sind | Datenverknüpfung soll benutzt werden, wenn Tabellenstruktur und Logik identisch sind |
Probieren Sie es selbst, die obenstehenden Tabellen in Tableau nachzubauen, um die Unterschiede zu verstehen. Anbei eine Excel Datei: Link zur Exceldatei