Wie verknüpfe ich in Tableau Public mehrere Datenquellen korrekt?

Melden
  1. Einführung
  2. Datenquellen hinzufügen
  3. Datenverknüpfung durch Beziehungen herstellen
  4. Alternative: Datenquellen per Join verbinden
  5. Verwendung der verknüpften Daten in Arbeitsblättern
  6. Besonderheiten bei Tableau Public
  7. Zusammenfassung

Einführung

In Tableau Public besteht häufig die Notwendigkeit, Daten aus verschiedenen Quellen gemeinsam auszuwerten. Dies kann beispielsweise dann der Fall sein, wenn unterschiedliche Datensätze unterschiedliche Informationen über dasselbe Thema bereitstellen oder verschiedene Tabellen miteinander kombiniert werden müssen. Tableau bietet dafür flexible Möglichkeiten zur Verknüpfung mehrerer Datenquellen, um eine integrierte Analyse zu ermöglichen.

Datenquellen hinzufügen

Um mehrere Datenquellen in Tableau Public zu verknüpfen, beginnt man meist damit, eine Hauptdatenquelle zu verbinden. Im Anschluss daran fügen Sie weitere Datenquellen hinzu. Diese können verschiedene Formate haben, beispielsweise Excel-Dateien, Textdateien, Datenbanken oder Webdaten. Über die Funktion Daten im Menü oder den Bereich Daten im Arbeitsblatt wählen Sie Neue Datenquelle hinzufügen und selektieren die gewünschte Quelle.

Datenverknüpfung durch Beziehungen herstellen

Seit Tableau Version 2020.2 gibt es die Möglichkeit, sogenannte Beziehungen (Relationships) zwischen verschiedenen Datenquellen herzustellen. Dabei bleiben die einzelnen Datensätze jeweils in ihrer ursprünglichen Struktur erhalten, und Tableau sorgt zur Laufzeit dafür, dass die Daten logisch zusammengeführt werden. Beziehungen erlauben eine flexible und performante Analyse über mehrere Datenquellen hinweg.

Um eine Beziehung zu erstellen, öffnen Sie zunächst den Datenquellen-Tab und ziehen Sie eine Tabelle aus der zweiten Datenquelle auf die Hauptquelle. Tableau zeigt Ihnen dann Optionen an, um eine Beziehung zu definieren. Dort wählen Sie die passenden Schlüsselfelder aus, mittels derer die Datensätze verknüpft werden sollen. Diese Felder sollten gemeinsame Werte enthalten, etwa Kundennummern oder Artikelcodes.

Im Gegensatz zu klassischen Joins werden bei Beziehungen die Daten erst beim Erstellen der Visualisierung kombiniert, was bessere Performance und Anpassungsfähigkeit ermöglicht. Außerdem können verschiedene Kardinalitäten (1:1, 1:n, n:m) berücksichtigt werden und die Datenquellen bleiben entkoppelt.

Alternative: Datenquellen per Join verbinden

Alternativ können Sie auch klassische Joins innerhalb einer Datenquelle herstellen. Dazu fügen Sie mehrere Tabellen in den Datenquellen-Tab ein und verbinden diese mit Join-Bedingungen (inner join, left join, right join, full outer join). Hierbei entstehen tatsächlich kombinierte Datenzeilen, was bei großen Datenmengen performanceintensiv sein kann. Außerdem kann die Flexibilität gegenüber Beziehungen eingeschränkt sein.

Der Join wird definiert, indem Sie die Tabellen passend nebeneinander positionieren und die Felder auswählen, über die gejoint werden soll. Tableau zeigt die kompatiblen Felder als mögliche Verknüpfungen an. Wichtig ist, dass die Schlüssel gut gewählt sind, um Datenverluste oder fehlerhafte Duplikate zu vermeiden.

Verwendung der verknüpften Daten in Arbeitsblättern

Sobald die Verknüpfungen erstellt sind, können Sie in den Arbeitsblättern Felder aus beiden Datenquellen verwenden. Bei Beziehungen erkennt Tableau automatisch die Zusammenhänge und verbindet die Felder kontextabhängig. Bei mehreren Datenquellen kann es notwendig sein, in Ihre Analyse sogenannte Datenquelle wechseln oder Datenquelle synchronisieren-Optionen einzusetzen. Achten Sie darauf, dass die Felder, mit denen Sie arbeiten möchten, korrekt verknüpft sind, um Konsistenz sicherzustellen.

Besonderheiten bei Tableau Public

Bei Tableau Public ist zu beachten, dass bestimmte Funktionen, die in der professionellen Tableau Desktop Version zur Verfügung stehen, eingeschränkt oder nicht enthalten sind. Dennoch unterstützt Tableau Public die meisten grundlegenden Methoden zur Verknüpfung von Datenquellen, insbesondere über Beziehungen und Joins. Es empfiehlt sich, die Datenquellen nach Möglichkeit vorzuverarbeiten (z. B. in Excel oder einer Datenbank), da umfangreiche Datenintegrationen direkt in Tableau Public manchmal an technische Grenzen stoßen können.

Zusammenfassung

Die korrekte Verknüpfung mehrerer Datenquellen in Tableau Public erfolgt hauptsächlich über das Hinzufügen der Datenquellen und das Herstellen von Beziehungen oder Joins zwischen den Tabellen. Beziehungen werden empfohlen, da sie Flexibilität und Performancevorteile bieten. Joins sind klassisch und erzeugen kombinierte Datensätze, können jedoch bei großen Datenmengen zu Einschränkungen führen. Eine sorgfältige Auswahl der Verknüpfungsfelder ist stets entscheidend für korrekte Analysen.

0

Kommentare