OCR op het toestel vs cloud: privacy, snelheid en nauwkeurigheid

On-device OCR voert tekstherkenning volledig uit op je iPhone via de Apple Neural Engine — de afbeelding van het document verlaat de telefoon nooit. Cloud-OCR uploadt de afbeelding naar een externe server, waar een herkenningsmodel de tekst eruit haalt. Beide aanpakken leveren in 2026 vergelijkbare nauwkeurigheid op schone gedrukte documenten. Het echte verschil is structureel: waar het document tijdens de verwerking staat. Dat bepaalt privacy, compliance, offline-gedrag en de juridische jurisdictie van je gegevens.

Dit artikel legt uit wat elke aanpak precies doet, wanneer het verschil ertoe doet en wanneer niet.

Wat "OCR op het toestel" technisch betekent

Op iPhone gebruikt on-device OCR het Vision framework van Apple — concreet de VNRecognizeTextRequest-API — die een vooraf getraind neuraal netwerk lokaal draait op de Neural Engine (de speciale AI-versneller in iPhones vanaf de A11 Bionic). Het model is in iOS ingebouwd, herkenning gebeurt in milliseconden per pagina, en de ruwe beelddata blijft in de sandbox van de app. Niets wordt geupload. Niets verlaat de telefoon, totdat de app expliciet de herkende tekst of een PDF verstuurt.

Apple Vision OCR ondersteunt in 2026 50+ talen, inclusief handschriftherkenning voor Latijns en Cyrillisch schrift en enkele andere alfabetten. De nauwkeurigheid op schone gedrukte tekst ligt tussen 95-99%, afhankelijk van contrast, resolutie en de complexiteit van het lettertype. ScanLens en Apple Notes Live Text zijn op deze basis gebouwd.

Wat "cloud-OCR" technisch betekent

Cloud-OCR uploadt de afbeelding van het document via HTTPS naar een externe server — Adobe Document Cloud voor Adobe Scan, Microsoft Azure voor Microsoft Lens, de infrastructuur van CamScanner voor CamScanner of Google Cloud Vision / AWS Textract voor andere apps. Op de server verwerkt een groter neuraal netwerk (vaak een transformer-model met miljarden parameters dat niet op de telefoon past) de afbeelding en stuurt de herkende tekst terug.

De server cachet doorgaans de afbeelding en het herkenningsresultaat — soms tijdelijk, soms permanent — afhankelijk van het beleid van de leverancier en de geldende wetten over dataopslag. Het document kan onderweg langs CDNs, load balancers en logging-systemen komen voordat het de OCR-dienst bereikt. Elke overgang is een potentieel punt waar data wordt blootgesteld, ook bij een legitieme leverancier.

Nauwkeurigheid: wanneer het verschil echt telt

Voor schone gedrukte tekst op standaardresolutie (een A4-pagina, getypt of laser geprint) leveren on-device en cloud-OCR in 2026 vergelijkbare resultaten. Het tien jaar oude verschil in OCR-nauwkeurigheid is gedicht — Apple Vision, Google ML Kit en vergelijkbare on-device systemen zijn nu vergelijkbaar met cloud-diensten op alledaagse documenten.

Cloud-OCR loopt nog voor in drie specifieke gevallen:

  • Beschadigde of historische scans. Bonnetjes met koffievlekken, verbleekt thermisch papier, 19e-eeuwse manuscripten en slecht belichte telefoonfoto's profiteren van grotere serverside modellen die op meer gevarieerde data zijn getraind. Cloud-OCR van Adobe Acrobat heeft bijvoorbeeld een terechte reputatie om leesbare tekst uit scans te halen waar on-device OCR het laat afweten.
  • Ongebruikelijke alfabetten of lettertypen. Cursief, gotische blackletter, sierlijke decoratieve fonts en talen met complexe ligaturen (Arabisch, Devanagari) worden soms beter verwerkt door cloudmodellen die op grote meertalige datasets zijn getraind.
  • Uitlezen van gestructureerde data. Het uitlezen van een tabelstructuur uit een bon, het identificeren van factuurvelden, het isoleren van regels — dat alles profiteert van cloudmodellen met domeintraining. Microsoft Lens met export naar Excel en Adobe Acrobat Liquid Mode zijn voorbeelden.

Voor de overige 90% van het dagelijkse scannen — belastingbonnen, huurcontracten, ID's, visitekaartjes, vergadernotities, schoolboekpagina's — is on-device OCR zo goed dat het verschil in de praktijk onzichtbaar is.

Privacy: waar het document staat is belangrijk

Hier lopen de twee aanpakken duidelijk uiteen.

Met on-device OCR:

  • De afbeelding van het document wordt verwerkt in de sandbox van de app op de iPhone
  • Er wordt geen netwerkverzoek voor OCR gedaan
  • De ontwikkelaar van de app heeft geen toegang tot de inhoud van het document
  • Cloudsynchronisatie (indien aan) is een aparte, optionele stap die jij beheert

Met cloud-OCR:

  • De afbeelding van het document wordt via HTTPS naar een externe server gestuurd
  • De server kan de afbeelding cachen, loggen of voor verschillende periodes opslaan volgens het beleid van de leverancier
  • De ontwikkelaar van de app en zijn cloudleverancier hebben technisch toegang tot de inhoud van het document tijdens de verwerking
  • Doorgifte via CDNs, load balancers en logging-systemen creëert extra plekken waar data wordt blootgesteld
  • De juridische jurisdictie van de server (VS, EU, China) is gedurende de opslag op je document van toepassing

Voor publieke documenten — een gescand restaurantmenu, tijdschriftartikel of conferentie-handout — maakt niets daarvan uit. Voor privédocumenten zijn de vragen over jurisdictie en opslag echt.

Compliance: AVG, Schrems II, NIS2 en DLP-beleid

Diverse regelgevingskaders behandelen "waar de gegevens worden verwerkt" als een wezenlijke vraag, niet een decoratief detail:

AVG en Schrems II (persoonsgegevens in de EU)

De AVG vereist een rechtsgrond voor de verwerking van persoonsgegevens en uitdrukkelijke toestemming voor bepaalde bijzondere categorieën. Cloud-OCR creëert een verwerker — de OCR-leverancier — die de AVG via een verwerkersovereenkomst (artikel 28) moet naleven. Bij doorgifte naar de VS spelen het Schrems II-arrest en het Trans-Atlantic Data Privacy Framework. Bij on-device OCR is er geen verwerker. Het document blijft bij de betrokkene. Toezicht in Nederland ligt bij de Autoriteit Persoonsgegevens (AP).

Zorg en de Wabvpz

De Wet aanvullende bepalingen verwerking persoonsgegevens in de zorg en de NEN 7510-norm stellen aanvullende eisen aan de verwerking van medische gegevens. Cloud-OCR voor recepten, labuitslagen of medische dossiers vereist een degelijke verwerkersovereenkomst en risicobeoordeling. On-device OCR omzeilt het vraagstuk: er is geen derde partij die gegevens verwerkt.

Financiële sector (DNB, AFM)

De Wet financieel toezicht en DORA (Digital Operational Resilience Act) verplichten financiële instellingen externe leveranciers te beoordelen en uitbestedingsrisico's te beheersen. Cloud-OCR is een externe leverancier. On-device OCR is dat niet.

DLP-beleid bij organisaties

Data Loss Prevention bij grotere organisaties blokkeert vaak het uploaden van bepaalde documenten naar externe diensten. On-device OCR voldoet hier al aan vanuit de architectuur — er is geen upload. Cloud-OCR kan door corporate DLP volledig worden geblokkeerd.

Snelheid en offline

On-device OCR werkt in 100-500 milliseconden per pagina. Cloud-OCR doet er meestal 1-5 seconden over op een snelle verbinding en aanzienlijk langer op zwakke netwerken. Bij batch-scannen van een document met meerdere pagina's stapelt het latency-verschil zich op.

Offline is een structureel voordeel van on-device. Apple Vision werkt in vliegtuigmodus, in een vliegtuig, in een kelder of op elke andere plek zonder bereik. Cloud-OCR werkt zonder internet helemaal niet — de afbeelding kan niet worden geupload.

Samenvatting

Voor de meeste alledaagse documenten leveren beide aanpakken een vergelijkbaar resultaat. Voor vertrouwelijke documenten, gereguleerde sectoren of offline-scenario's lost on-device OCR fundamentele structurele problemen op die cloud-OCR niet kan oplossen. Is je gemiddelde scan een restaurantmenu, kies dan voor gemak. Is het een medisch dossier, een aangifte of een contract onder NDA — kies dan voor de architectuur.

On-device OCR op iPhone uitproberen? De ScanLens OCR-app draait volledig op het toestel via Apple Vision. Vergelijking met cloudalternatieven vind je op ScanLens vs CamScanner.