OCR sur appareil vs cloud : confidentialité, vitesse et précision

L'OCR sur appareil exécute la reconnaissance de texte entièrement sur votre iPhone via Apple Neural Engine — l'image du document ne quitte jamais le téléphone. L'OCR cloud téléverse l'image vers un serveur distant où un modèle de reconnaissance renvoie le texte extrait. Les deux approches donnent une précision comparable sur les documents imprimés propres en 2026. La vraie différence est structurelle : où se trouve le document pendant le traitement. Cela détermine la confidentialité, la conformité, le comportement hors-ligne et la juridiction juridique de vos données.

Cet article explique précisément ce que fait chaque approche, quand la différence compte et quand elle ne compte pas.

Ce que «OCR sur appareil» signifie techniquement

Sur iPhone, l'OCR sur appareil utilise le framework Vision d'Apple — précisément l'API VNRecognizeTextRequest — qui exécute un réseau neuronal préentraîné localement sur le Neural Engine (l'accélérateur d'IA dédié des iPhone à partir de l'A11 Bionic). Le modèle est intégré à iOS, la reconnaissance s'effectue en quelques millisecondes par page, les données d'image source restent dans le bac à sable de l'application. Rien n'est téléversé. Rien ne quitte le téléphone tant que l'application n'envoie pas explicitement le texte reconnu ou le PDF.

Apple Vision OCR prend en charge plus de 50 langues en 2026, y compris la reconnaissance d'écriture manuscrite pour le latin, le cyrillique et plusieurs autres alphabets. La précision sur le texte imprimé propre se situe entre 95 et 99 % selon le contraste, la résolution et la complexité de la police. ScanLens et Apple Notes Live Text fonctionnent sur cette base.

Ce que «OCR cloud» signifie techniquement

L'OCR cloud téléverse l'image du document en HTTPS vers un serveur distant — Adobe Document Cloud pour Adobe Scan, Microsoft Azure pour Microsoft Lens, l'infrastructure CamScanner pour CamScanner, ou Google Cloud Vision / AWS Textract pour d'autres applications. Sur le serveur, un réseau neuronal plus volumineux (souvent un modèle Transformer à plusieurs milliards de paramètres, ne tenant pas sur le téléphone) traite l'image et renvoie le texte reconnu.

Le serveur met généralement l'image et le résultat de reconnaissance en cache — parfois temporairement, parfois durablement — selon la politique du fournisseur et les lois applicables sur la conservation des données. Le document peut transiter par CDN, équilibreurs de charge et systèmes de journalisation avant le service OCR. Chacune de ces étapes est un point potentiel de divulgation de données, même quand le fournisseur est légitime.

Précision : quand la différence compte vraiment

Pour le texte imprimé propre à résolution standard (page A4 dactylographiée ou imprimée laser), l'OCR sur appareil et l'OCR cloud donnent des résultats équivalents en 2026. L'écart de précision OCR vieux de 10 ans s'est refermé — Apple Vision, Google ML Kit et les systèmes équivalents sur appareil sont désormais comparables aux services cloud sur les documents ordinaires.

L'OCR cloud reste en tête dans trois cas précis :

  • Numérisations dégradées ou historiques. Reçus tachés de café, papier thermique effacé, manuscrits du XIXe siècle et photos téléphone mal éclairées profitent de modèles serveurs volumineux entraînés sur des données plus diverses. L'OCR cloud d'Adobe Acrobat, par exemple, a une réputation méritée d'extraire du texte lisible de scans où l'OCR sur appareil échoue.
  • Alphabets ou polices inhabituels. Italique, gothique blackletter, polices décoratives ornementées et langues à ligatures complexes (arabe, devanagari) sont parfois mieux traitées par les modèles cloud entraînés sur de grands jeux de données multilingues.
  • Extraction de données structurées. Extraction de structure de tableau d'un reçu, identification de champs de facture, mise en évidence de lignes — tout cela bénéficie de modèles cloud à entraînement spécialisé. Microsoft Lens avec export Excel et Adobe Acrobat Liquid Mode en sont des exemples.

Pour les 90 % restants de la numérisation quotidienne — reçus fiscaux, contrats de bail, pièces d'identité, cartes de visite, notes de réunion, pages de manuels — l'OCR sur appareil est suffisamment bon pour que la différence soit en pratique invisible.

Confidentialité : où se trouve le document, ça compte

C'est ici que les deux approches divergent significativement.

Avec l'OCR sur appareil :

  • L'image du document est traitée dans le bac à sable de l'application sur l'iPhone
  • Aucune requête réseau n'est faite pour l'OCR
  • Le développeur de l'application n'a pas accès au contenu du document
  • La synchronisation cloud (si activée) est une étape distincte et optionnelle que vous contrôlez

Avec l'OCR cloud :

  • L'image du document est transmise à un serveur tiers en HTTPS
  • Le serveur peut mettre en cache, journaliser ou conserver l'image pendant des durées variables selon la politique du fournisseur
  • Le développeur de l'application et son fournisseur cloud ont techniquement accès au contenu du document pendant le traitement
  • Le transit de données via CDN, équilibreurs de charge et systèmes de journalisation crée des surfaces de divulgation supplémentaires
  • La juridiction juridique du serveur (UE, États-Unis, Chine) s'applique à votre document pendant la durée de stockage

Pour les documents publics — scan de menu de restaurant, article de magazine, document distribué en conférence —, rien de tout cela n'a d'importance. Pour les documents privés, la question de juridiction et de conservation est réelle.

Conformité : RGPD, CNIL, ANSSI et politiques DLP

Plusieurs cadres réglementaires considèrent «où sont traitées les données» comme une question de fond, pas un détail décoratif :

RGPD et CNIL (données personnelles UE)

Le RGPD impose une base légale pour le traitement des données personnelles et un consentement explicite pour certaines catégories sensibles. L'OCR cloud crée un sous-traitant — le fournisseur d'OCR — qui doit respecter le RGPD via un contrat de sous-traitance (article 28 RGPD) et, pour les transferts hors UE, des clauses contractuelles types (CCT) après l'arrêt Schrems II et le Data Privacy Framework UE-US (2023). La CNIL recommande la minimisation des données et le traitement local lorsque c'est possible. Pour l'OCR sur appareil, il n'y a pas de sous-traitant. Le document reste chez la personne concernée.

Secteurs réglementés (santé, juridique, financier)

En santé, le secret médical (Code de la santé publique) et la certification HDS (Hébergeur de Données de Santé) imposent un encadrement strict des prestataires manipulant des données de santé. Pour les avocats, le secret professionnel impose une vigilance équivalente sur les documents clients. Pour les établissements financiers, les obligations de la directive sur la protection des données financières imposent une évaluation des sous-traitants. L'OCR cloud est un sous-traitant. L'OCR sur appareil ne l'est pas.

ANSSI et cryptographie

L'ANSSI publie des recommandations sur la cryptographie et la sécurité des systèmes d'information. Pour les documents particulièrement sensibles, le traitement local évite la complexité de l'évaluation de la sécurité d'un fournisseur cloud, de ses pratiques de chiffrement et de ses risques de transfert.

Politiques DLP des entreprises

Le Data Loss Prevention dans les grandes entreprises bloque généralement le téléversement de certains documents vers des services externes. L'OCR sur appareil respecte ces politiques par architecture — il n'y a pas de téléversement. L'OCR cloud peut être totalement bloqué par le DLP corporatif.

Vitesse et hors-ligne

L'OCR sur appareil s'exécute en 100 à 500 millisecondes par page. L'OCR cloud prend généralement 1 à 5 secondes sur connexion rapide et nettement plus sur réseaux faibles. Pour la numérisation par lot d'un document multipage, la différence de latence s'accumule.

Le hors-ligne est un avantage structurel de l'OCR sur appareil. Apple Vision fonctionne en mode avion, en avion, dans une cave ou en tout lieu sans signal. L'OCR cloud est totalement inutilisable sans Internet — l'image ne peut pas être téléversée.

Conclusion

Pour la plupart des documents quotidiens, les deux approches donnent un résultat équivalent. Pour les documents confidentiels, les secteurs réglementés ou les usages hors-ligne, l'OCR sur appareil résout des problèmes structurels fondamentaux que l'OCR cloud ne peut pas résoudre. Si votre document type est un menu de restaurant, choisissez le confort. Si c'est un dossier médical, une déclaration fiscale ou un contrat sous NDA, choisissez l'architecture.

Vous voulez essayer l'OCR sur appareil sur iPhone ? L'application OCR ScanLens fonctionne avec Apple Vision entièrement sur l'appareil. Comparaison avec les alternatives cloud sur la page ScanLens vs CamScanner.

Questions fréquentes

Quelle est la différence entre OCR sur appareil et OCR cloud ?

L'OCR sur appareil exécute la reconnaissance de texte entièrement sur l'iPhone via Apple Neural Engine et l'API VNRecognizeTextRequest de Vision. L'image du document reste dans le bac à sable de l'application et ne quitte jamais le téléphone. L'OCR cloud téléverse l'image en HTTPS vers un serveur distant — Adobe Document Cloud, Microsoft Azure, AWS Textract, Google Cloud Vision ou l'infrastructure propre du fournisseur — où un modèle plus volumineux renvoie le texte reconnu. Pour des documents imprimés propres, la précision est comparable en 2026. Les différences structurelles concernent la confidentialité, le comportement hors-ligne et la juridiction des données.

L'OCR sur appareil est-il aussi précis que celui dans le cloud ?

Pour le texte imprimé propre à résolution standard — oui. Apple Vision OCR atteint 95 à 99 % de précision sur les pages imprimées dans plus de 50 langues, y compris la reconnaissance manuscrite pour le latin et le cyrillique. L'OCR cloud reste en tête dans trois cas : numérisations dégradées ou historiques (papier thermique effacé, reçus tachés de café), alphabets inhabituels et polices ornementées, et extraction de données structurées de factures et tableaux. Pour 90 % de la numérisation quotidienne — reçus, contrats, pièces d'identité, cartes de visite, notes — la différence est invisible.

Le RGPD impose-t-il l'OCR sur appareil ?

Le RGPD n'impose pas spécifiquement l'OCR sur appareil, mais il exige une base légale pour le traitement des données personnelles et un encadrement contractuel des sous-traitants. L'OCR cloud crée un sous-traitant — le fournisseur d'OCR — qui doit respecter le RGPD via un contrat de sous-traitance et, le cas échéant, des clauses contractuelles types (CCT) pour les transferts hors UE. La CNIL recommande la minimisation des données et le traitement local lorsque c'est possible. L'OCR sur appareil supprime entièrement la question : il n'y a pas de tiers qui traite les données. Pour les documents sensibles (santé, juridique, financier), c'est une approche plus simple à justifier.

L'OCR sur appareil fonctionne-t-il hors-ligne ?

Oui. L'OCR sur appareil fonctionne entièrement sur le Neural Engine de l'iPhone — en mode avion, en avion, dans une cave ou là où il n'y a pas de signal. Les applications fondées sur Apple Vision — y compris ScanLens et Apple Notes Live Text — continuent de reconnaître le texte hors-ligne. L'OCR cloud est totalement inutilisable sans Internet : l'image ne peut pas être téléversée pour traitement. La fiabilité hors-ligne est un avantage structurel de l'OCR sur appareil pour les voyages et le travail de terrain.

L'OCR sur appareil est-il plus lent que l'OCR cloud ?

Habituellement plus rapide. La reconnaissance sur appareil s'exécute en 100 à 500 millisecondes par page via le Neural Engine de l'iPhone. L'OCR cloud doit téléverser l'image (souvent l'étape la plus lente sur réseau mobile), traiter sur le serveur et renvoyer le résultat — en général 1 à 5 secondes par page sur connexion rapide, et beaucoup plus sur réseau faible. L'avantage de latence est l'une des raisons pour lesquelles l'OCR sur appareil paraît plus réactif dans les scanners, surtout en capture lot de documents multipages.