Wie kann ich in Power Query mehrere Tabellen aus verschiedenen Quellen zusammenführen?
- Einführung
- Importieren der Daten aus unterschiedlichen Quellen
- Vorbereitung der Daten
- Zusammenführen der Tabellen
- Praktische Umsetzung
- Abschluss und Laden der kombinierten Daten
- Zusammenfassung
Einführung
Power Query ist ein mächtiges Werkzeug zur Datenaufbereitung und -transformation, das in Excel und Power BI genutzt wird. Oftmals steht man vor der Aufgabe, Daten aus verschiedenen Quellen, beispielsweise Excel-Dateien, Datenbanken, CSV-Dateien oder Webdaten, zusammenzuführen. In diesem Beitrag wird ausführlich erklärt, wie mehrere Tabellen aus unterschiedlichen Quellen in Power Query importiert und zusammengeführt werden können.
Importieren der Daten aus unterschiedlichen Quellen
Der erste Schritt besteht darin, die gewünschten Tabellen aus ihren jeweiligen Quellen in Power Query zu laden. Im Power Query Editor wählen Sie über den Menüpunkt Daten abrufen (in Excel: Daten > Abrufen und transformieren oder Daten abrufen) die jeweiligen Datenquellen aus. Das kann eine Excel-Arbeitsmappe, eine CSV-Datei, eine SQL-Datenbank, eine Webquelle oder eine andere unterstützte Quelle sein. Für jede Tabelle, die Sie importieren möchten, müssen Sie den Importvorgang wiederholen. Jede importierte Tabelle wird dabei als separate Abfrage im Power Query-Editor dargestellt.
Vorbereitung der Daten
Nachdem die Tabellen geladen wurden, sollten Sie die Daten in jeder Abfrage ggf. bereinigen und transformieren. Dazu gehört das Entfernen von Leerzeilen, das Umbenennen von Spalten, das Anpassen von Datentypen oder das Filtern von Daten. Eine konsistente Struktur über alle Tabellen hinweg erleichtert das Zusammenführen erheblich, insbesondere wenn diese Tabellen ähnlichen Inhalt besitzen (z. B. identische Spaltennamen für verwandte Daten).
Zusammenführen der Tabellen
Es gibt in Power Query zwei Hauptmethoden, um Datentabellen zusammenzuführen: Abfragen zusammenführen (Join-Operation) und Abfragen anfügen (Vereinigung). Welche Methode Sie wählen, hängt davon ab, wie die Tabellen zusammenhängen.
Wenn Sie die Daten nach übereinstimmenden Schlüsselspalten verbinden möchten, verwenden Sie Abfragen zusammenführen. Dabei wählen Sie eine Hauptabfrage aus und fügen die zweite als eine verknüpfte Tabelle hinzu, wobei ein Join-Typ (Inner Join, Left Outer Join usw.) bestimmt, wie die Zeilen zusammengebracht werden. Das Verfahren folgt dabei ähnlichen Prinzipien wie in klassischen Datenbanksystemen.
Wenn Sie dagegen Daten aus mehreren Tabellen untereinander anfügen möchten – also die Zeilen der Tabellen zusammenführen – dann verwenden Sie Abfragen anfügen. Dabei erstellen Sie eine neue Abfrage, welche die Zeilen aus allen ausgewählten Tabellen untereinander kombiniert. Wichtig ist hierbei, dass die Spaltenstrukturen möglichst kompatibel sind, damit die Daten korrekt zusammengeführt werden.
Praktische Umsetzung
Um mehrere Tabellen aneinanderzufügen, gehen Sie im Power Query-Editor auf Start > Abfragen kombinieren > Abfragen anfügen. Sie können entweder zwei Abfragen anfügen oder mehrere Abfragen auswählen. Nach Bestätigung führt Power Query die Daten zeilenweise zusammen.
Für das Zusammenführen per Join wählen Sie unter Abfragen kombinieren die Option Abfragen zusammenführen. Im folgenden Dialog wählen Sie die beiden Abfragen sowie die Schlüsselspalten aus und legen den Join-Typ fest. Power Query zeigt dann eine neue Spalte mit den verknüpften Daten an, die Sie bei Bedarf erweitern können, um die eingebetteten Daten als zusätzliche Spalten darzustellen.
Abschluss und Laden der kombinierten Daten
Nachdem Sie die Tabellen erfolgreich zusammengeführt haben, können Sie weitere Transformationen durchführen oder direkt auf Schließen & laden klicken, um die finale Tabelle in Excel oder Power BI zu speichern. Es empfiehlt sich, die Abfragen zu benennen und bei komplexeren Kombinationen in mehreren Schritten zu arbeiten, um die Nachvollziehbarkeit zu erhöhen.
Zusammenfassung
Das Zusammenführen mehrerer Tabellen aus unterschiedlichen Quellen in Power Query erfolgt durch den Import der einzelnen Quellen als Abfragen, die Datenvorbereitung, sowie die Anwendung von Abfragen zusammenführen für ein Joining auf Basis von Schlüsselspalten oder Abfragen anfügen für das Aneinanderreihen von Zeilen. Power Query bietet dadurch ein flexibles und leistungsfähiges Framework zur Integration heterogener Datenquellen.