Blog

Rainer Pollmann

Rainer Pollmann

Power Query (#013): Nicht übereinstimmende Daten verbinden

Mit Power Query oder nun Daten abrufen und transformieren, kann man sehr performant Tabellen verbinden und benötigt keinen SVERWEIS() mehr. Allerdings ist auch Power Query darauf angewiesen, dass die Schlüsselkriterien übereinstimmen, ja es ist sogar noch strenger: Der Datentyp muss auch übereinstimmen! Irgendwann im Sommer 2019, mit einem wöchentlichen Update von Excel365 , gab es plötzlich für Power Query eine neue Funktionalität: Fuzzy Matching!

Damit können nun auch Datensätze verbunden werden, bei denen die Schlüsselkriterien ähnlich, aber nicht übereinstimmend sind. Diese neue Technik heißt Fuzzy Matching und ist als weitere Join-Variante verfügbar. Sie kann dann aktiviert werden, wenn man mit dem Befehl Abfragen zusammenführen arbeitet. Die gab es schon seit einiger Zeit für PowerBi, das ja Power Query und PowerPivot integriert hat.

Im folgenden Beispiel haben wir Abweichungen bei den Produktbezeichnungen zweier Tabellen. Hier sollen für die „A-Klasse K“  Umsatz und Kosten in einer Tabelle ausgegeben werden. In der zweiten Tabelle ist nur „A-Klasse“ zu finden. Keine Übereinstimmung!

Fuzzy1

Im Dialog Zusammenführen werden die beiden Tabellen angegeben und die Spalten, die die übereinstimmenden Merkmale enthalten (sollen).

Fuzzy2

Dann wird das Kontrollkästchen für Fuzzyübereinstimmung zum Zusammenführen verwenden aktiviert sowie die Optionen für die Fuzzyzusammenführung.

Der Schwellenwert für Ähnlichkeit muss experimentell herausgefunden werden. Je größer der Wert, desto mehr Wert legt man auf Übereinstimmung.

Achtung, das Dezimaltrennzeichen ist ein „.“ !!!

Die Maximale Anzahl von Übereinstimmungen setzen Sie auf „1“. Und das ist dann das Ergebnis:

Fuzzy3

Wer noch nicht mit Excel365 arbeitet, muss sich mit „Übersetzungstabellen“ behelfen.

Fuzzy4

Fazit:

Löst das Problem mit abweichenden Eingaben verschiedenen Datenquellen, meist verursacht durch fehlerhafte Datenerfassung oder Datenübertragung in verschiedenen IT-Systemen.

Mit wenigen Klicks ist dieses Problem gelöst und Dank Fuzzy Matching (Fuzzy = unklar, verschwommen) werden auch nicht übereinstimmende Datensätze perfekt zugeordnet.

Weitere Details….

können Sie in unseren Seminar Power Query 1:  – Daten laden, verdichten erfahren.


Wenn Ihnen dieser Beitrag gefallen hat, dann teilen  Sie ihn gerne. Falls Sie Anmerkungen haben, schreiben Sie bitte einen Kommentar, oder senden Sie mir eine Mail an info@prt.de.

Beitrag teilen:

Share on facebook
Share on twitter
Share on linkedin
Share on whatsapp
Share on xing
Share on email
Share on print

Up to date bleiben

Melden Sie sich für unseren Newsletter an!