Verwandeln Sie gescannte PDFs am iPhone in durchsuchbare PDFs, indem Sie eine OCR-Textebene hinzufügen. Text suchen, Inhalte kopieren, das Aussehen des Originalscans erhalten.
Ein durchsuchbares PDF ist eine PDF-Datei mit einer unsichtbaren OCR-Textebene (Texterkennung), die über jede gescannte Seite gelegt ist. Die Seite sieht identisch zum Originalscan aus, aber die Datei ist in jedem PDF-Reader durchsuchbar — Wörter über Cmd+F finden, Sätze markieren und kopieren, Text für Archive oder Tabellen extrahieren. Ein normales gescanntes PDF enthält nur Seitenbilder — nichts kann gefunden oder kopiert werden.
ScanLens erstellt durchsuchbare PDFs am iPhone, indem es OCR auf dem Gerät über das Apple Vision framework ausführt und dann den erkannten Text vor dem Export hinter jedes Seitenbild einbettet. Die OCR-Ebene bleibt im PDF, daher bleibt das Dokument in jedem Betriebssystem, in jedem PDF-Reader, auch nach Jahren durchsuchbar.
Für die breitere Textextraktion aus jedem Bild oder Foto (nicht nur PDF) — siehe OCR-App für iPhone. Für den vollständigen Workflow Scan-zu-PDF — beginnen Sie mit dem PDF-Scanner. Typische Folgeschritte nach dem Erstellen eines durchsuchbaren PDF: mehrere PDFs am iPhone zusammenführen, ein langes PDF aufteilen oder einen Vertrag unterzeichnen.
ScanLens nutzt das Apple Vision framework für die On-Device-Texterkennung. Die OCR-Ebene erkennt Wörter, Zahlen und Dokumentenstruktur in 50+ Sprachen, einschließlich Deutsch, und behält die Verarbeitung am iPhone.
Der erkannte Text liegt exakt hinter dem gescannten Bild. Die Position jedes Wortes stimmt mit seinem visuellen Platz überein. Beim Markieren von Text deckt die Markierung den entsprechenden Bildbereich ab.
Das durchsuchbare PDF folgt dem Archivstandard PDF/A. Die Textebene wird direkt in die Dokumentstruktur eingebettet. Jeder PDF-Reader kann auf den eingebetteten Text ohne Spezialsoftware zugreifen.
Die gesamte OCR läuft lokal am iPhone. Dokumente verlassen das Gerät während der Verarbeitung nie. Das gewährleistet die Privatsphäre für sensible Dokumente und funktioniert ohne Internet.
Verwenden Sie Strg+F (oder Cmd+F am Mac), um jedes Wort im Dokument zu finden. Sie müssen nicht mehr durch Seiten blättern, um eine bestimmte Klausel im Vertrag oder eine Zahl im Beleg zu finden. Die Suche findet sofort.
Klicken und ziehen Sie zum Markieren, dann in die Zwischenablage kopieren. Einfügen in Mails, Dokumente, Tabellen. Zitate extrahieren, Adressen kopieren, Telefonnummern übernehmen — ohne Abtippen.
Spotlight am Mac und die Windows-Suche können durchsuchbare PDFs indexieren. Finden Sie Dokumente nach Inhalt, nicht nur nach Dateinamen. Die Suche „Rechnung März 2024" — und sie findet jedes übereinstimmende Dokument.
Unternehmenssysteme wie SharePoint, Google Drive, Dropbox und OneDrive können durchsuchbare PDFs indexieren. Die Unternehmenssuche liefert relevante gescannte Dokumente neben nativen Dateien.
Screenreader können durchsuchbare PDFs vorlesen. Die Textebene bietet zugängliche Inhalte für Nutzer mit Sehbehinderungen. Die Einhaltung der Barrierefreiheits-Anforderungen wird möglich.
Das Bild der Seite bleibt gleich. Was sich ändert, ist, was Sie nach dem Scan mit der Datei tun können: suchen, markieren, kopieren, indexieren und korrekt archivieren.
| Funktion | Normales gescanntes PDF | Durchsuchbares PDF |
|---|---|---|
| Aussehen | Gescanntes Bild | Identisch (unverändert) |
| Textsuche (Strg+F) | Nicht verfügbar | Volle Unterstützung |
| Textmarkierung | Nicht verfügbar | Volle Unterstützung |
| Text kopieren/einfügen | Nicht verfügbar | Volle Unterstützung |
| OS-Suchindexierung | Nur Dateiname | Inhalt indexiert |
| Screenreader-Unterstützung | Nur Bild | Voller Textzugriff |
| Dateigröße | Kleiner | Etwas größer (+5–15 %) |
Der einzige Kompromiss ist eine kleine Größenzunahme zur Speicherung der Textebene. Für die meisten Dokumente sind das +5–15 % — ein geringer Preis für die deutliche Funktionsverbesserung.
Für mehrsprachige Archive ist die Sprachunterstützung genauso wichtig wie die OCR-Geschwindigkeit. Aktuelle Abdeckung gruppiert nach Schriftfamilien.
| Sprachgruppe | Sprachen |
|---|---|
| Westeuropäisch | Deutsch, Englisch, Französisch, Spanisch, Italienisch, Portugiesisch, Niederländisch |
| Osteuropäisch | Polnisch, Tschechisch |
| Kyrillisch | Russisch, Ukrainisch, Bulgarisch |
| Asiatisch | Chinesisch (vereinfacht), Japanisch, Koreanisch |
| Naher Osten | Arabisch, Hebräisch |
Mehrsprachige Dokumente funktionieren gut — die OCR-Engine verarbeitet Seiten mit mehreren Sprachen. Technische Dokumente mit englischen Begriffen, gemischt mit anderen Sprachen (typisch für deutschsprachige IT-Dokumente), werden korrekt erkannt.
Verträge, Vereinbarungen, Gerichtsdokumente — alle durchsuchbar. Finden Sie konkrete Klauseln in Hunderten von Dokumenten. Juristische Verfahren werden mit Volltextsuche handhabbar.
Suchen Sie Belege nach Lieferant, Betrag oder Datum. Die Steuererklärung wird einfacher — finden Sie jede absetzbare Ausgabe per Inhaltssuche statt durch Erraten von Dateinamen.
Scannen Sie Lehrbücher und Aufsätze in durchsuchbare PDFs. Finden Sie Zitate, verweisen Sie auf Quellen, stellen Sie Bibliographien zusammen — alles per Textsuche.
Suchen Sie Patientenakten nach Diagnose, Medikament oder Arzt. Klinisches Personal findet relevante Vorgeschichte schnell. Compliance-Berichte entstehen aus durchsuchbaren Archiven.
Wandeln Sie alte Papierarchive in durchsuchbares Digitalformat um. Familiengenealogische Aufzeichnungen, Geschäftsarchive, historische Dokumente — alles wird zugänglich und durchsuchbar.
Ein durchsuchbares PDF enthält eine unsichtbare Textebene, erstellt durch OCR (Optical Character Recognition). Das Dokument sieht aus wie ein normaler Scan, aber Sie können Strg+F zur Textsuche verwenden, Inhalte markieren und kopieren sowie Ihre Dokumentenbibliothek über die Systemsuche durchsuchen.
Nein, das Aussehen bleibt identisch zum normalen gescannten PDF. Die OCR-Ebene ist vollständig unsichtbar — exakt hinter dem gescannten Bild positioniert. Sie bemerken sie nur beim Suchen, Markieren oder Kopieren von Text.
OCR in ScanLens unterstützt 50+ Sprachen, einschließlich Deutsch. Westeuropäische Sprachen werden zuverlässig erkannt. Mehrsprachige Dokumente (typisch — Deutsch mit englischen Begriffen) werden automatisch verarbeitet.
Ja, durchsuchbare PDFs funktionieren in jedem Standard-Reader. Adobe Acrobat, Apple Preview, der eingebaute PDF-Viewer von Chrome, Microsoft Edge und alle mobilen PDF-Apps können Text aus durchsuchbaren PDFs durchsuchen und markieren. Spezielle Software ist nicht nötig.
Die Textebene fügt typischerweise 5–15 % zur Dateigröße hinzu, abhängig von der Textmenge. Ein 1-MB-Scan kann mit Textebene 1,1 MB werden. Die gewonnene Funktionalität ist die geringe Größenzunahme meist wert.