PDF-Dokumente mit Windows Desktop Search durchsuchen


    Tags: , , ,

    Fehlerhafte PDF-SucheDie Desktop-Suche von Windows kann alle mög­lichen Datei­typen indi­zieren. Für Formate, die Micro­soft nicht selbst unter­stützt, muss man einen iFilter instal­lieren. Für PDF ge­hört ein solcher seit Windows 8 zum Liefer­umfang, seine Konfi­guration geht aber oft ver­loren und eine Inhalts­suche ist dann nicht mehr mög­lich.

    Die Suchfunktion gehört sicher nicht zu den Prunkstücken von Windows, zu inkonsistent ist ihr Verhalten und zu oft fällt das Ergebnis unbe­friedigend aus (siehe dazu: Keine Dateien gefunden: Suche in Windows 7 richtig konfigu­rieren). Daran hat sich seit der Version 7 nichts geändert.

    Liste der indizierten Ordner prüfen

    Wenn die Suche in PDF-Dokumenten wider Erwarten keine Treffer liefert, dann dürfte das meistens nicht an den allgemeinen Unzuläng­lichkeiten der Desktop-Suche liegen, sondern am Fehlen oder an der falschen Konfiguration des iFilters für das Adobe-Dateiformat.

    Bevor man sich an das Troubleshooting des iFilters macht, sollte man im ersten Schritt prüfen, ob die zu durchsuchenden PDF-Dokumente in einem Verzeichnis liegen, das vom Index erfasst wird. Ist das nicht der Fall, dann greift die langsame sequentielle Suche und die wird in PDFs nicht fündig.

    Für den Check öffnet man die System­steuerung und sucht nach Indizierungs­optionen. Der anschließende Dialog enthält eine Liste aller indizierten Verzeichnisse, die man notfalls um weitere ergänzen muss.

    Die Verzeichnisse für die Indizierung durch die Windows-Suche lassen sich auch über GPOs festlegen.

    Der Administrator kann alternativ diese Pfade zentral über Gruppen­richtlinien festlegen, und zwar unter Computer- oder Benutzerkonfiguration => Richtlinien => Administrative Vorlagen => Windows-Komponenten => Suche. Die Einstellung heißt Standardmäßig indizierte Pfade.

    Existenz des PDF-iFilter verifizieren

    Werden die Ordner, in denen man PDF-Dokumente durchsuchen möchte, vom Indexer berücksichtigt, aber Windows liefert trotzdem keine Treffer, dann klickt man auf den Button Erweitert, wofür man administrative Rechte benötigt. Im folgenden Dialog wechselt man auf die Registerkarte Dateitypen.

    Vorhandensein eines iFilter für PDF prüfen

    Windows 7 hat keine eigenen PDF-iFilter

    Unter Windows 7 stehen die Chancen gut, dass der Eintrag .pdf unter der Spalte Erweiterung nicht vorhanden ist. Bei dieser Version des OS gehört nämlich der iFilter für Adobes Datei­format nicht zum Lieferumfang. In der 32-Bit-Version von Windows 7 kann man sich durch die Installation des Acrobat Reader behelfen, der auch den passenden iFilter mitbringt.

    Unter Windows 7 x64 muss der iFilter für PDF explizit installiert werden.

    Für Windows 7 x64 stellt Adobe einen eigenen iFilter bereit, den man herunterladen und installieren muss. Er liegt aktuell in der Version 11 vor und steht auf dem FTP-Server des Herstellers unter diesem Link zum Download bereit. Nach dem Ausführen des Setup und der Aktualisierung des Suchindexes sollte man nun PDF-Dokumente erfolgreich durchsuchen können.

    iFilter-Konfiguration in Windows 8.1 und 10 prüfen

    Neuere Versionen des Betriebs­systems enthalten ihren eigenen iFilter für PDF. Dieser ist standard­mäßig so konfiguriert, dass er nicht nur die Metadaten der Dokumente, sondern auch die Inhalte ausliest.

    Allerdings passiert es relativ häufig, dass die Registrierung dieses Filters als Standard-Handler zur Indizierung von PDF-Dokumenten verloren geht. Eine mögliche Ursache sind die De-/Re-installation von Acrobat Reader oder eines anderen Programms für das Ansehen und Bearbeiten solcher Dokumente.

    In diesem Fall bleibt .pdf in der Liste mit den Erweiterungen zwar weiterhin vorhanden, aber die Einstellung für die Indizierung wechselt auf Nur Eigenschaften indizieren.

    Wenn der iFilter für PDF nur Dateieigenschaften ausliest, dann findet die Suche nichts in den Inhalten der PDF-Dokumente.

    Ändert man diese wieder zurück auf Eigenschaften und Dateiinhalte indizieren, dann taucht unter Filter­beschreibung der Klartextfilter auf. Dieser ist natürlich nicht in der Lage, das binäre PDF-Format zu verstehen und liefert daher keinen brauchbaren Beitrag zum Index.

    Der Klartextfilter springt ein, wenn kein iFilter für ein Dateiformat existiert. Aus PDF kann er keine Inhalte auslesen.

    Registrierung reparieren

    Um dieses Problem zu beheben, öffnet man den Registrierungseditor (regedit.exe) und sucht dort nach PDF Persistent Handler. Anschließend kopiert man die GUID des Schlüssels, in dem dieser Wert enthalten ist, und wechselt zu HKEY_CLASSES_ROOT => .pdf.

    Suche nach der GUID des Persistent Handler für PDFs in der Registry

    Darunter findet sich der Subkey mit der Bezeichnung Persistent Handler, der den eben ermittelten GUID-Wert haben sollte. Wenn die oben beschriebenen Probleme mit der PDF-Suche existieren, dann ist das in aller Regel nicht der Fall.

    Hier ist der Bezug zum Persistent Handler für PDF verloren gegangen, der Wert für (Standard) ist leer.

    In dieser Situation trägt man die kopierte GUID als Wert für (Standard) ein. Dabei muss man darauf achten, dass die geschweiften Klammern am Anfang und Ende der GUID erhalten bleiben.

    Nach der Reparatur des Registry-Eintrags sollte der Wert für den Pesistent Handler so aussehen.

    Auf zwei von mir reparierten Systemen lautete der Wert {1AA9BF05-9A97-48c1-BA28-D9DCE795E93C}. Ist das auf Ihrem Rechner auch so, dann lässt sich der Vorgang beschleunigen, indem man folgenden Code in eine Datei mit der Endung .reg kopiert und diese dann durch Doppelklick ausführt:

    Suchdienst über services.msc neu starten

    Zum Schluss öffnet man services.msc und startet dort den Dienst Windows Search neu, damit er die neue Konfiguration einlesen kann.

    Täglich Know-how für IT-Pros mit unserem Newsletter

    Wir ver­wenden Ihre Mail-Adresse nur für den Ver­sand der News­letter.
    Es erfolgt keine per­sonen­be­zogene Auswertung.

    Bild von Wolfgang Sommergut
    Wolfgang Sommergut hat lang­jährige Erfahrung als Fach­autor, Berater und Kon­ferenz­sprecher zu ver­schie­denen Themen der IT. Da­ne­ben war er als System­ad­mi­ni­stra­tor und Con­sultant tätig.
    // Kontakt: E-Mail, XING, LinkedIn //

    Verwandte Beiträge

    Weitere Links

    2 Kommentare

    Habe wie von dir angegeben, eine Computer-GPO für das Indexing eingerichtet. Das Indexing funktioniert sogar mit DFS-Pfadeingabe. In der GPO können mehrere Pfade angegeben werden. Topp Danke

    Danke! Ein sehr sehr hilfreicher Artikel, auch wenn man auf dem SQL Server die Volltextsuche nutzen möchte. Herzlichen Dank! :-)