Wie importiere ich eine CSV-Datei korrekt in Mathematica?

Melden
  1. Grundlagen des Imports
  2. Optionen und Dateipfade angeben
  3. Erweiterte Optionen für den Import
  4. Umgang mit Datentypen nach dem Import
  5. Beispiel: Kompletter Importprozess
  6. Zusammenfassung

Das Importieren einer CSV-Datei in Mathematica funktioniert in der Regel sehr unkompliziert, da das System speziell für den Umgang mit unterschiedlichen Dateiformaten optimiert ist. Die Datei wird dabei meist als Tabelle, also als Liste von Listen, eingelesen, wobei jede innere Liste einer Zeile aus der CSV-Datei entspricht und die Elemente die einzelnen Zellen dieser Zeile darstellen.

Grundlagen des Imports

Der grundlegende Befehl zum Einlesen einer CSV-Datei heißt Import. Um eine Datei mit dem Namen "datei.csv" zu laden, verwendet man den Befehl:

daten = Import ;

Standardmäßig erkennt Mathematica das CSV-Format an der Dateiendung .csv selbstständig und lädt die Daten als Liste von Listen ein. Jede Zeile der CSV-Datei wird zu einer Unterliste, und darin sind die Werte als Strings oder Zahlen abgelegt, je nachdem, was der Parser erkennt.

Optionen und Dateipfade angeben

Wenn sich die Datei nicht im Standard-Arbeitsverzeichnis befindet, muss der vollständige oder relative Pfad angegeben werden, z.B.

daten = Import ;

Unter Windows sollten Backslashes doppelt geschrieben oder durch einfache Schrägstriche ersetzt werden:

daten = Import ;

Alternativ kann man auch den Dialog SystemDialogInput nutzen, um die Datei interaktiv auszuwählen.

Erweiterte Optionen für den Import

Möchte man das Verhalten des Imports genauer steuern, kann man einen zweiten Parameter an Import übergeben, z.B. "CSV". Dies ist besonders sinnvoll, wenn man eine Datei ohne CSV-Endung importiert oder sicherstellen will, dass das Format als CSV interpretiert wird:

daten = Import ;

Weiterhin kann man den Parameter "FieldSeparators" angeben, falls ein anderes Trennzeichen als das Komma (z.B. Semikolon bei deutschen CSV-Dateien) verwendet wird:

daten = Import ;

So liest Mathematica die Daten korrekt ein, auch wenn statt Kommas Semikolons als Feldertrenner benutzt werden.

Umgang mit Datentypen nach dem Import

Nach dem Import liegen die Daten meist als Strings vor. Möchte man Zahlen erhalten, kann man die Werte nachträglich mit Hilfe von Funktionen wie ToExpression oder Interpreter konvertieren. Ein typisches Vorgehen sieht so aus:

zahlen = Map ;

Hierbei wandelt Map auf Ebene 2 (also auf die einzelnen Zellen) alle Strings in numerische Ausdrücke um. Falls in der Datei auch nicht-numerische Werte vorhanden sind, empfiehlt sich vorher eine Überprüfung oder das Abfangen von Fehlern, um Probleme zu vermeiden.

Beispiel: Kompletter Importprozess

Angenommen, man hat eine CSV-Datei mit Semikolon-Trennung, die Zahlen enthält, dann könnte ein vollständiger, robuster Import so aussehen:

dateipfad = "C:/Benutzer/MeinBenutzer/Dokumente/daten.csv";rohdaten = Import ;zahlen = Map ;

Nach Ausführung dieser Befehle enthält die Variable zahlen eine Liste von Listen mit numerischen Werten, die Sie nun problemlos in Berechnungen verwenden können.

Zusammenfassung

Mathematica bietet mit dem Befehl Import eine flexible und einfache Möglichkeit, CSV-Dateien einzulesen. Wichtig ist dabei, den richtigen Pfad anzugeben, das Format optional zu spezifizieren und bei Bedarf die Feldtrenner anzupassen. Nach dem Import empfiehlt es sich, die Strings ggf. in Zahlen zu konvertieren, um die Daten weiterverarbeiten zu können.

0

Kommentare