Ich lese in Foren und Beiträgen immer und immer wieder: der Left Outer Join in Power Query entspricht dem SVERWEIS in Excel. In diesem Beitrag erkläre ich Dir, warum dies nicht der Wahrheit entspricht und welche Gefahr sich hinter einem falschen Verständnis des Joins verbirgt.
Als Abonnent meines Newsletters erhältst Du die Beispieldateien zu den Beiträgen dazu. Hier geht’s zum Abonnement des Newsletters!
Der LEFT OUTER JOIN bei genau einem Treffer
(Bewegte) Bilder sagen mehr als 1.000 Worte: Sieh Dir an, wie der LEFT OUTER JOIN funktioniert:
Allgemein beschrieben sucht der LEFT OUTER JOIN zu einer Tabelle A (links), basierend auf einem Schlüsselkriterium S (die farbig hinterlegten Zahlenwerte), alle passenden Datensätze aus Tabelle B (rechts). Tabelle B muss hierbei natürlich (genauso wenig wie Tabelle A) aus nur zwei Spalte bestehen. Es können beliebig viele sein. Der Spezialfall, in welchem das Ergebnis zwischen dem LEFT OUTER JOIN und dem SVERWEIS gleich erscheint, ist der, in welchem die rechte Tabelle B (häufig als „Nachschlagetabelle“ bezeichnet), genau einen Treffer auf Basis des Schlüsselkriteriums liefert.
Der LEFT OUTER JOIN bei mehr als einem Treffer
Häufig liefert ein solcher JOIN jedoch mehr als einen Treffer in der rechten „Nachschlagetabelle„. Das Ergebnis ist dann ein vollkommen anderes, welches Excelnutzer, die den SVERWEIS gewohnt sind, häufig verwirrt, denn: Durch mehrere Treffer in der Nachschlagetabelle ändert sich die Anzahl der Datensätze in der Ergebnistabelle:
Schau Dir die Animation genau an: Die Datensätze der linken Tabelle, in denen das Schlüsselkriterium den Wert 2 hat, werden dupliziert, weil auf Basis des Schlüsselkriterium „2“, zwei Treffer in der Nachschlagetabelle existieren. Ist dem Nutzer des Joins diese Verhalten nicht klar, kann es natürlich zu ungewünschten Ergebnissen führen.
Ein weiterer Unterschied zum SVERWEIS ist der, dass der SVERWEIS einen einzigen Wert zurückliefert, während der JOIN eine Tabelle zurückliefert.
Bitte habe diese wichtigen Unterschiede im Hinterkopf, wenn Du das nächste mal liest, dass der JOIN dem SVERWEIS entspricht. Ich weiß, dass viele Trainer, die diesen Vergleich nutzen, sich des Unterschieds sehr bewußt sind. Sie nutzen diesen Vergleich, weil er für Excelnutzer, die nicht wissen was ein JOINS ist, eine Analogie zieht (die zum SVERWEIS) die Interesse weckt. In diesen Fällen finde ich diesen Vergleich keineswegs schadhaft, sofern im Training der Unterschied erläutert wird. Für alljene, die Überschriften auf Werbeflyern wie „Power Query macht Schluss mit dem SVERWEIS“ jedoch nur lesen (und nicht am Training teilnehmen) entsteht eine falsche Erwartungshaltung bzw. ein falsches Verständnis.
Bis zum nächsten Mal und denk dran: Sharing is caring. Wenn Dir der Beitrag gefallen hat, dann teile ihn gerne. Falls Du Anmerkungen hast, schreibe gerne einen Kommentar, oder schicke mir eine Mail an lars@ssbi-blog.de
Viele Grüße aus Hamburg,
Lars
Lars ist Berater, Entwickler und Trainer für Microsoft Power BI. Er ist zertifizierter Power BI-Experte und Microsoft Trainer. Für sein Engagement in der internationalen Community wurde Lars seit 2017 jährlich durch Microsoft der MVP-Award verliehen. Lies hier mehr…
Manfred Häfner meint
Sehr gute Visualisierung! Ich bin beeindruckt.
Lars Schreiber meint
Hallo Manfred,
vielen Dank. Wie aber im Beitrag beschrieben, sind die nicht auf meinem Mist gewachsen… Ich will mich ja nicht mit fremden Federn schmücken 😉 Mit Morphing-Effekten kann man dies aber auch einfach in PowerPoint nachbilden. Für Schulungen mache ich das sehr gerne.
Viele Grüße,
Lars