Welche Dateitypen werden von Recoll unter Windows unterstützt?

Melden
  1. Allgemeine Einführung
  2. Unterstützte Text- und Office-Dokumente
  3. Unterstützung für E-Mails und Archive
  4. Sonstige Dateitypen und Multimedia
  5. Abhängigkeit von externen Programmen
  6. Fazit

Allgemeine Einführung

Recoll ist ein leistungsfähiger Desktop-Suchindexer, der es ermöglicht, den Inhalt verschiedenster Dokumenttypen zu durchsuchen. Unter Windows nutzt Recoll eine Vielzahl von eingebauten Parsern und externe Hilfsprogramme, um Inhalte aus unterschiedlichen Dateiformaten zu extrahieren und zu indexieren. Dadurch können Benutzer nicht nur nach Dateinamen, sondern auch nach Textinhalten innerhalb der Dokumente suchen.

Unterstützte Text- und Office-Dokumente

Recoll kann eine breite Palette von Office-Formaten verarbeiten. Dazu zählen unter Windows gängige Formate wie Microsoft Word Dokumente (.doc, .docx), Excel-Tabellen (.xls, .xlsx) sowie PowerPoint-Präsentationen (.ppt, .pptx). Ebenso werden OpenOffice- und LibreOffice-Dateien erkannt und indiziert, beispielsweise .odt, .ods und .odp. Darüber hinaus unterstützt Recoll einfache Textdateien, Rich Text Format (.rtf) und PDF-Dokumente. Für PDF-Dateien verwendet Recoll häufig externe Tools wie pdftotext, um den Textinhalt zu extrahieren.

Unterstützung für E-Mails und Archive

Recoll bietet auch Unterstützung für E-Mail-Formate, darunter Dateien im mbox-Format oder .eml-Dateien. Dadurch können Benutzer den Inhalt von E-Mails durchsuchen. Auch Archive wie ZIP und TAR können verarbeitet werden. Recoll extrahiert hierbei die darin enthaltenen Dateien und indiziert deren Inhalte, sofern die Dateitypen unterstützt werden.

Sonstige Dateitypen und Multimedia

Neben den genannten Dokumenttypen verarbeitet Recoll verschiedene weitere Formate, z. B. HTML- und XML-Dateien. Für Multimedia-Dateien wie Bilder, Audio- oder Videoformate besitzt Recoll jedoch keine Inhaltsindizierung; hier können gegebenenfalls Metadaten extrahiert werden, sofern die verwendeten Hilfsprogramme dies erlauben. Unter Windows ist die Funktionalität auch davon abhängig, welche externe Software installiert und vom System erkannt wird.

Abhängigkeit von externen Programmen

Die Leistungsfähigkeit von Recoll bei der Unterstützung diverser Dateitypen hängt stark von den auf dem Windows-System verfügbaren externen Hilfsprogrammen ab. Beispielsweise benötigt Recoll für die PDF-Text-Extraktion üblicherweise pdftotext (Teil von Xpdf oder Poppler), für Office-Dokumente spezielle Parser oder Konverter und für manche Archiv-Formate entsprechende Kommandozeilen-Tools. Ohne diese externen Werkzeuge ist die Unterstützung eingeschränkt.

Fazit

Zusammenfassend unterstützt Recoll unter Windows eine Vielzahl von regulären Dokument- und Office-Dateiformaten, E-Mail-Archiven sowie komprimierten Archiven. Die Inhaltsindizierung basiert auf integrierten Parsern sowie externen Programmen, die installiert sein müssen. Dadurch eignet sich Recoll hervorragend für die umfassende Volltextsuche auf dem Desktop, vorausgesetzt, die erforderlichen Zusatztools sind vorhanden.

0

Kommentare