OCR auf dem Gerät vs. Cloud: Datenschutz, Geschwindigkeit und Genauigkeit

On-Device-OCR führt die Texterkennung vollständig auf Ihrem iPhone aus — über die Apple Neural Engine. Das Dokumentbild verlässt das Telefon nie. Cloud-OCR lädt das Bild auf einen entfernten Server hoch, wo ein Erkennungsmodell den extrahierten Text zurückgibt. Beide Ansätze liefern 2026 bei sauberen gedruckten Dokumenten vergleichbare Genauigkeit. Der eigentliche Unterschied ist strukturell: Wo befindet sich das Dokument während der Verarbeitung? Das entscheidet über Datenschutz, Compliance, Offline-Verhalten und die rechtliche Jurisdiktion Ihrer Daten.

Dieser Artikel erklärt, was die beiden Ansätze technisch tun, wann der Unterschied zählt und wann nicht.

Was «OCR auf dem Gerät» technisch bedeutet

Auf dem iPhone nutzt On-Device-OCR Apples Vision-Framework — konkret die VNRecognizeTextRequest-API —, das ein vortrainiertes neuronales Netz lokal auf der Neural Engine ausführt (dem dedizierten KI-Beschleuniger im iPhone ab A11 Bionic). Das Modell ist Bestandteil von iOS, die Erkennung erfolgt in Millisekunden pro Seite, die Bildrohdaten bleiben in der App-Sandbox. Es wird nichts hochgeladen. Nichts verlässt das Telefon, bis die App den erkannten Text oder das PDF aktiv versendet.

Apple Vision OCR unterstützt 2026 mehr als 50 Sprachen, einschließlich Handschriftenerkennung für Latein, Kyrillisch und einige weitere Schriften. Die Genauigkeit auf sauberem Drucktext liegt bei 95–99 % je nach Kontrast, Auflösung und Schriftkomplexität. ScanLens und Apple Notes Live Text setzen darauf auf.

Was «Cloud-OCR» technisch bedeutet

Cloud-OCR überträgt das Dokumentbild per HTTPS auf einen entfernten Server — Adobe Document Cloud bei Adobe Scan, Microsoft Azure bei Microsoft Lens, die CamScanner-Infrastruktur bei CamScanner oder Google Cloud Vision / AWS Textract bei anderen Apps. Auf dem Server verarbeitet ein größeres neuronales Netz (oft ein Transformer-Modell mit Milliarden Parametern, das nicht auf das Telefon passt) das Bild und gibt den erkannten Text zurück.

Der Server cached Bild und Erkennungsergebnis in der Regel — manchmal vorübergehend, manchmal dauerhaft —, abhängig von der Anbieterrichtlinie und den anwendbaren Aufbewahrungsgesetzen. Das Dokument kann CDNs, Load Balancer und Logging-Systeme passieren, bevor es den OCR-Dienst erreicht. Jeder dieser Übergänge ist ein potenzieller Punkt der Datenoffenlegung, selbst bei seriösen Anbietern.

Genauigkeit: wann der Unterschied wirklich zählt

Für sauberen Drucktext in Standardauflösung (A4, mit Schreibmaschine oder Laser gedruckt) liefern On-Device- und Cloud-OCR 2026 gleichwertige Ergebnisse. Der über zehn Jahre bestehende Genauigkeitsabstand ist geschlossen — Apple Vision, Google ML Kit und vergleichbare On-Device-Systeme reichen bei gewöhnlichen Dokumenten an Cloud-Dienste heran.

Cloud-OCR liegt in drei konkreten Fällen weiter vorn:

  • Beschädigte oder historische Scans. Mit Kaffee überschüttete Belege, verblasstes Thermopapier, Manuskripte des 19. Jahrhunderts und schlecht ausgeleuchtete Telefonfotos profitieren von größeren, auf vielfältigeren Daten trainierten Servermodellen. Adobe Acrobats Cloud-OCR hat zu Recht den Ruf, lesbaren Text aus Scans zu holen, an denen On-Device-OCR scheitert.
  • Ungewöhnliche Alphabete oder Schriften. Kursive Schreibschrift, gotische Frakturschrift, Zierfonts und Sprachen mit komplexen Ligaturen (Arabisch, Devanagari) werden mitunter besser von Cloud-Modellen verarbeitet, die auf großen multilingualen Datensätzen trainiert wurden.
  • Strukturierte Datenextraktion. Tabellenstruktur aus einem Beleg auslesen, Rechnungsfelder identifizieren, Posten extrahieren — all das profitiert von Cloud-Modellen mit fachspezifischem Training. Microsoft Lens mit Excel-Export und Adobe Acrobat Liquid Mode sind Beispiele.

Für die übrigen 90 % des Alltagsscans — Steuerbelege, Mietverträge, Ausweise, Visitenkarten, Meeting-Notizen, Lehrbuchseiten — ist On-Device-OCR so gut, dass der Unterschied praktisch nicht sichtbar ist.

Datenschutz: wo das Dokument liegt — das zählt

Hier weichen die beiden Ansätze deutlich voneinander ab.

Mit On-Device-OCR:

  • Das Dokumentbild wird in der App-Sandbox auf dem iPhone verarbeitet
  • Es findet kein Netzwerkaufruf zur OCR statt
  • Der App-Entwickler hat keinen Zugriff auf den Dokumentinhalt
  • Cloud-Synchronisation (sofern aktiviert) ist ein eigener, optionaler Schritt unter Ihrer Kontrolle

Mit Cloud-OCR:

  • Das Dokumentbild wird per HTTPS an einen Server eines Drittanbieters übertragen
  • Der Server kann das Bild gemäß Anbieterrichtlinie unterschiedlich lange cachen, loggen oder speichern
  • Der App-Entwickler und sein Cloud-Anbieter haben technisch Zugriff auf den Dokumentinhalt während der Verarbeitung
  • Die Datenübertragung über CDNs, Load Balancer und Logging-Systeme schafft zusätzliche Angriffsflächen
  • Die Jurisdiktion des Servers (USA, EU, China) gilt während der Aufbewahrung für Ihr Dokument; bei Drittlandtransfers greift Schrems II

Für öffentliche Dokumente — Scan einer Speisekarte, eines Zeitschriftenartikels, eines Konferenz-Handouts — spielt das alles keine Rolle. Für vertrauliche Dokumente sind Jurisdiktion und Speicherort ein realer Punkt.

Compliance: DSGVO, BDSG, GoBD und Unternehmens-DLP

Mehrere Regelwerke behandeln «wo werden die Daten verarbeitet» als wesentliche, nicht dekorative Frage:

DSGVO und BDSG

Die DSGVO verlangt eine Rechtsgrundlage für jede Verarbeitung personenbezogener Daten (Art. 6) und besondere Anforderungen für Sonderkategorien wie Gesundheitsdaten (Art. 9). Cloud-OCR erzeugt einen Auftragsverarbeiter — den OCR-Anbieter —, mit dem ein Auftragsverarbeitungsvertrag (AVV, Art. 28 DSGVO) abzuschließen ist. Bei US-Anbietern stellt sich zusätzlich die Frage des Drittlandtransfers — abgesichert üblicherweise über das Trans-Atlantic Data Privacy Framework. Bei On-Device-OCR gibt es keinen Auftragsverarbeiter. Das Dokument verbleibt bei der betroffenen Person.

Sektorale Vorgaben (Gesundheitsdaten, Steuergeheimnis, Berufsgeheimnis)

Das ärztliche Berufsgeheimnis (§203 StGB) und das Steuergeheimnis (§30 AO) verlangen besonderen Schutz für Krankenakten, Steuerdaten und vergleichbare Informationen. Ein Cloud-OCR-Dienst, der Daten Dritter unter ärztlicher Schweigepflicht verarbeitet, ist nur bei vertraglicher Einbindung als Erfüllungsgehilfe und wirksamer Vertraulichkeitsverpflichtung zulässig. On-Device-OCR umgeht die Frage strukturell.

GoBD (Steuerunterlagen)

Die GoBD verlangen für die digitale Belegführung Unveränderbarkeit und Verfahrensdokumentation. Cloud-OCR-Verarbeitung steuerlicher Belege braucht eine entsprechende Verfahrensdokumentation, die den Verarbeiter und den Verarbeitungsweg beschreibt. On-Device-Verarbeitung vereinfacht das deutlich.

DLP-Richtlinien in Unternehmen

Data Loss Prevention in größeren Unternehmen blockiert üblicherweise das Hochladen bestimmter Dokumente auf externe Dienste. On-Device-OCR hält diese Richtlinien architektonisch ein — kein Upload. Cloud-OCR kann durch Unternehmens-DLP komplett blockiert werden.

Geschwindigkeit und Offline-Betrieb

On-Device-OCR läuft in 100–500 Millisekunden pro Seite. Cloud-OCR braucht typischerweise 1–5 Sekunden bei schnellem Anschluss und deutlich länger in schwachen Netzen. Beim Stapelscan mehrseitiger Dokumente summiert sich der Latenzunterschied.

Offline ist ein struktureller On-Device-Vorteil. Apple Vision arbeitet im Flugmodus, im Flugzeug, im Keller oder an jedem Ort ohne Signal. Cloud-OCR ist ohne Internet vollständig funktionsunfähig — das Bild kann nicht hochgeladen werden.

Fazit

Für die meisten Alltagsdokumente liefern beide Ansätze ein gleichwertiges Ergebnis. Für vertrauliche Dokumente, regulierte Branchen oder Offline-Szenarien löst On-Device-OCR strukturelle Probleme, die Cloud-OCR nicht lösen kann. Ist Ihr typisches Scan-Dokument eine Speisekarte, wählen Sie nach Komfort. Ist es eine Krankenakte, eine Steuererklärung oder ein NDA-pflichtiger Vertrag, wählen Sie nach Architektur.

Sie möchten On-Device-OCR auf dem iPhone ausprobieren? Die ScanLens-OCR-App nutzt Apple Vision vollständig auf dem Gerät. Den Vergleich mit Cloud-Alternativen finden Sie auf der Seite ScanLens vs. CamScanner.