Schnelle Wort- oder Phrasensuche in Dokumenten.

Zuweilen passiert es, dass man einen Text verfasst hat, ihn abgespeichert hat, aber nicht aufgepasst hat, wo er liegt. Sicherlich kann man sofort nachsehen, wo die Anwendung, also z.B. Word, gerade Texte speichert. Dort kann man den Text dann mit etwas Glück finden. Was aber, wenn man auf diesen Text Wochen später zugreifen will und längst mit Word an anderen Stellen Dokumente abgespeichert hat? Ein anderes Problem ist, dass man sich erinnern kann, dass man vor langer Zeit irgendetwas geschrieben hat, man kann sich nicht mehr erinnern, wie der Name der Textdatei war, geschweige denn, wo die Datei liegt. Man kann sich aber an einzelne Begriffe oder Phrasen oder sogar ganze Sätze erinnern.

In solchen Fällen ist eine Suchmaschine, die in Dateien nach Wörtern oder Phrasen sucht, echt Gold wert. Man gibt das/die bestimmte Wort/Phrase ein und schon werden alle Texte angezeigt, in denen das/die Wort/Phrase vorkommt. Natürlich gibt man tunlichst Worte/Phrasen ein, die besonders zu diesem Text passen, also nicht in allen Texten immer wieder kehrende Begriffe oder Phrasen, denn dann werden viel zu viele gefundene Dateien angezeigt.

Es gibt das kostenpflichtige 'TextSeek', das sehr schnell und sicher arbeitet. Entweder erstellt es sehr schnell eine Datenbank oder arbeitet ohne eine Indexierung aller Dokumente. Auf jeden Fall war es sehr schnell einsatzbereit und findet genauso schnell auch Wörter/Phrasen.

Es gibt aber auch ein kostenloses Suchprogramm: DocFetcher. Dieses Programm legt zunächst einen Index aller Dokumente an. Das dauerte bei mir für meine Datenfestplatte mit 300 GB Daten, etwa eine halbe Stunde. Danach ist das Programm aber pfeilschnell, wenn man einen Begriff oder eine Phrase eingibt und wirft sehr gute Ergebnisse in Sekunden heraus. 

Sie erhalten das Programm unter folgendem Link: https://docfetcher.sourceforge.net/de/index.html . Es gibt eine portable Version, die brauchen Sie nicht zu installieren. Die Datenbank legt DocFetcher dann in seinem eigenen Verzeichnis an. Diese Datenbank liegt dann im 'DocFetcher-Verzeichnis in dem Unterordner 'indexes'. Bei mir war nach der Indexierung aller Dokumente dieser Ordner 600 MB groß - sehr groß - was aber der Suchgeschwindigkeit nicht schadete.

Entpacken Sie das Programm und kopieren dann den Programmordner an eine beliebige Stelle und stellen am besten dann eine Verknüpfung auf den Desktop her (Rechtsklick auf die Datei 'DocFetcher.exe', die Taste gedrückt halten und auf den Desktop schieben und dort loslassen. Im aufspringenden Kontextmenü dann einen Linksklick auf 'Verknüpfung hier erstellen'.).

Starten Sie dann DocFetcher und Sie sehen in etwa solch ein Programmfenster: 01 docfetch startfenster und indexierung

Es öffnet sich ein weiteres Fenster, indem Sie Parameter festlegen können. Ich habe dort alles so gelassen, wie es war. 02 docfetch indexierung 1  Sie können aber in dem Fenster nach unten scrollen (roter Pfeil) und Einstellungen vornehmen: 03 docfetch indexierung 2 . Wenn Sie alles eingestellt haben, klicken Sie unten rechts auf 'Start'. 

Diese Indexierung kann, je nach Datenmenge, länger dauern. Wenn alles fertig ist, finden Sie, wie bei mir oben im Bild, den zuvor zur Indexierung ausgesuchten Ordner. Sie können dann sofort mit einer Suche beginnen:  04 docfetch suche und ergebnisse  Das grüne Fenster unten rechts können Sie ignorieren oder auf 'Diese Mitteilung nicht mehr anzeigen' klicken.

  1. Hier tippen Sie den Suchbegriff ein, hier Münster - es dreht sich hier um einen Fahrradausflug mit Word-Texten, Bilder und GPX-Navigationsdateien. Groß- und Kleinschreibung sind egal, tippen Sie den Begriff ein und drücken dann die Enter-Taste oder auf die Schaltfläche 'Suchen'.   ⇒ Über simple Konstrukte wie OR, AND und NOT hinaus unterstützt DocFetcher unter Anderem: Wildcards, Phrasen-Suche, Fuzzy-Suche ("finde Wörter, die folgenden Wörtern ähneln: ..."), Nachbarschafts-Suche ("folgende Wörter sollen höchstens 10 Wörter voneinander entfernt sein"), Boosting ("gib Dateien höheres Gewicht, die folgende Wörter enthalten: ...") [entnommen: https://docfetcher.sourceforge.net/de/index.html]. Also, Sie möchten eine Phrase suchen, wie z.B. 'Fotobücher selber machen, die Grundlagen'. Setzen Sie diese Phrase in Anführungszeichen, also "Fotobücher selber machen, die Grundlagen" und lassen suchen. --> 04b docfetch suchevariablen
  2. Hier wird ein Text angezeigt, in dem irgendwo das Wort 'Münster' auftaucht.
  3. Hier wird ein Bild angezeigt, in dessen Namen das Wort 'Münster' vorkommt.
  4. Hier wird eine GPX-Datei angezeigt, in deren Namen das Wort 'Münster' vorkommt.
  5. In diesem Fenster wird der gefundene unformatierte Text angezeigt, wenn man links auf die Datei klickt, hier z.B. unter '2'. (Ich habe in diesem Beispiel noch nicht auf eine Datei getippt, weswegen hier noch die Erläuterungen von DocFetcher zu sehen sind.) Achtung: In diesem Fenster werden nur Texte angezeigt. Bei einer GPX-Datei bleibt dieses Fenster weiß und bei einer Bilddatei werden Metadaten des Bildes angezeigt. Entscheidend ist aber, dass Sie die Datei gefunden haben.

Bedeutsam ist jetzt natürlich, die gewünschte Datei zu öffnen oder auch zu sehen, wo Sie im PC gespeichert ist: Machen Sie dazu auf die gefundene Datei einen Rechtsklick und es öffnet sich ein Kontextmenü.05 docfetch suche und ergebnisse anzeigen

 Klicken Sie auf 'Öffnen' oder auf 'Übergeordneten Ordner öffnen'.

Sie können die Suche auf Unterordner einschränken: 06 docfetch suche verfeinern  

Klicken Sie auf den Pfeil nach unten (1) und es werden Unterordner des indizierten Ordners angezeigt. Jetzt können Sie (2) durch Linksklicks die Häkchen vor den Ordnern wegnehmen, in denen nicht gesucht werden soll.

Machen Sie einen Rechtsklick auf den indizierten Ordner (in meinem Beispiel also auf 'D') und es erscheint ein Kontextmenü: 07 docfetch kontextmenü

  1. 'Index erstellen aus': Beim Start startet hier die Indexierung. Sie können aber hier auch zusätzlich von anderen Festplatten Ordner indizieren lassen.
  2. 'Aktualisieren': macht Sinn, wenn es in den zu indizierenden Ordnern neue Dokumente gibt.
  3. 'Index neu erstellen lassen': Der Index wird nicht aktualisiert, sondern komplett neu erstellt.
  4. 'Index umbenennen': Wenn Sie einen anderen Namen vergeben wollen, also in diesem Beispiel nicht 'D:\', sondern z.B. 'Dokumente'.
  5. 'Entfernen': So würde hier also 'D:\' entfernt werden und man muss neue Ordner indizieren lassen.
  6. 'Verwaiste Indizes entfernen': Wenn sich in den indizierten Dokumenten welche befunden haben, die Sie zwischenzeitlich gelöscht haben.
  7. 'Alles auswählen' und 'Nichts auswählen' dürfte klar sein.
  8. 'Einzelne Ordner (de)selektieren': Dasselbe, was Sie machen, wenn Sie mit einem Linksklick ein Häkchen setzen oder wegnehmen.
  9. 'Ordner öffnen': Es startet der WinExplorer und öffnet den Ordner, auf den Sie diesen Rechtsklick gesetzt haben.
  10. 'Dokumente auflisten': Es werden im mittleren Fenster alle Dokumente aufgelistet, die in dem Ordner sind (indizierbare Dokumente und nicht Unterordner).

Im Fenster links oben können Sie Dokument-Typen ab- oder zu wählen.:  08 docfetch suche verfeinern 2 Es werden übrigens folgende Dateitypen unterstützt: 

  • Microsoft Office (doc, xls, ppt)
  • Microsoft Office 2007 und neuere Versionen (docx, xlsx, pptx, docm, xlsm, pptm)
  • Microsoft Outlook (pst)
  • OpenOffice.org (odt, ods, odg, odp, ott, ots, otg, otp)
  • Portable Document Format (pdf)
  • EPUB (epub)
  • HTML (html, xhtml, ...)
  • TXT und andere Textdatei-Formate (anpassbar)
  • Rich Text Format (rtf)
  • AbiWord (abw, abw.gz, zabw)
  • Microsoft Compiled HTML Help (chm)
  • MP3-Metadaten (mp3)
  • FLAC-Metadaten (flac)
  • JPEG-Exif-Metadaten (jpg, jpeg)
  • Microsoft Visio (vsd)
  • Scalable Vector Graphics (svg)  [entnommen: https://docfetcher.sourceforge.net/de/index.html]

Wenn Sie vielleicht nur bei ein oder zwei Datei-Typen suchen lassen wollen, ist es lästig, alle Dateitypen einzeln abzuwählen: Machen Sie einen Rechtsklick auf einen Datei-Typ und im sich öffnenden Kontextmenü wählen Sie 'Nichts auswählen'. Anschließend wählen Sie den gewünschten Datei-Typ aus. Alle Datei-Typen auswählen 'Alles auswählen'. 

Wenn Sie einen häufiger benutzten Begriff suchen, und Sie lassen alle Dateitypen aktiviert, kann es sein, dass Sie ein völlig unübersichtliches Suchergebnis erhalten, weil einfach zu viele Suchergebnisse angezeigt werden. Spätestens dann macht es Sinn, die Suche auf bestimmte Dateitypen einzuschränken.

Setzen Sie einfach ein Häkchen vor einen Datei-Typ und es wird nur nach Inhalten bei diesen Typen gesucht.

Bei '1' habe ich einen Datei-Typ ausgeschlossen, dh. in diesem Fall würde nicht in Word Dokumenten ab Word 2007, also mit den Endungen -.docx und -.docm gesucht. 

Sie können auch die Suche in großen oder kleinen Dokumenten einstellen: Geben Sie bei '2' die Untergrenze eines Dokuments an und bei '3' die Obergrenze.

Im gefundenen Dokument werden die gefundenen Suchbegriffe farblich hervorgehoben: 09 docfetch suche anzeigen Blau wird der gerade im Fokus stehende Begriff angezeigt (1). Gelb werden alle in diesem Dokument gefundenen Suchbegriffe angezeigt und mit '3' und '4' kann man Fokus auf die nächste bzw. vorherige Fundstelle richten.