OCR sur appareil vs cloud : confidentialité, vitesse et précision

L'OCR sur appareil exécute la reconnaissance de texte entièrement sur votre iPhone via Apple Neural Engine — l'image du document ne quitte jamais le téléphone. L'OCR cloud téléverse l'image vers un serveur distant où un modèle de reconnaissance renvoie le texte extrait. Les deux approches donnent une précision comparable sur les documents imprimés propres en 2026. La vraie différence est structurelle : où se trouve le document pendant le traitement. Cela détermine la confidentialité, la conformité, le comportement hors-ligne et la juridiction juridique de vos données.

Cet article explique précisément ce que fait chaque approche, quand la différence compte et quand elle ne compte pas.

Ce que «OCR sur appareil» signifie techniquement

Sur iPhone, l'OCR sur appareil utilise le framework Vision d'Apple — précisément l'API VNRecognizeTextRequest — qui exécute un réseau neuronal préentraîné localement sur le Neural Engine (l'accélérateur d'IA dédié des iPhone à partir de l'A11 Bionic). Le modèle est intégré à iOS, la reconnaissance s'effectue en quelques millisecondes par page, les données d'image source restent dans le bac à sable de l'application. Rien n'est téléversé. Rien ne quitte le téléphone tant que l'application n'envoie pas explicitement le texte reconnu ou le PDF.

Apple Vision OCR prend en charge plus de 50 langues en 2026, y compris la reconnaissance d'écriture manuscrite pour le latin, le cyrillique et plusieurs autres alphabets. La précision sur le texte imprimé propre se situe entre 95 et 99 % selon le contraste, la résolution et la complexité de la police. ScanLens et Apple Notes Live Text fonctionnent sur cette base.

Ce que «OCR cloud» signifie techniquement

L'OCR cloud téléverse l'image du document en HTTPS vers un serveur distant — Adobe Document Cloud pour Adobe Scan, Microsoft Azure pour Microsoft Lens, l'infrastructure CamScanner pour CamScanner, ou Google Cloud Vision / AWS Textract pour d'autres applications. Sur le serveur, un réseau neuronal plus volumineux (souvent un modèle Transformer à plusieurs milliards de paramètres, ne tenant pas sur le téléphone) traite l'image et renvoie le texte reconnu.

Le serveur met généralement l'image et le résultat de reconnaissance en cache — parfois temporairement, parfois durablement — selon la politique du fournisseur et les lois applicables sur la conservation des données. Le document peut transiter par CDN, équilibreurs de charge et systèmes de journalisation avant le service OCR. Chacune de ces étapes est un point potentiel de divulgation de données, même quand le fournisseur est légitime.

Précision : quand la différence compte vraiment

Pour le texte imprimé propre à résolution standard (page A4 dactylographiée ou imprimée laser), l'OCR sur appareil et l'OCR cloud donnent des résultats équivalents en 2026. L'écart de précision OCR vieux de 10 ans s'est refermé — Apple Vision, Google ML Kit et les systèmes équivalents sur appareil sont désormais comparables aux services cloud sur les documents ordinaires.

L'OCR cloud reste en tête dans trois cas précis :

  • Numérisations dégradées ou historiques. Reçus tachés de café, papier thermique effacé, manuscrits du XIXe siècle et photos téléphone mal éclairées profitent de modèles serveurs volumineux entraînés sur des données plus diverses. L'OCR cloud d'Adobe Acrobat, par exemple, a une réputation méritée d'extraire du texte lisible de scans où l'OCR sur appareil échoue.
  • Alphabets ou polices inhabituels. Italique, gothique blackletter, polices décoratives ornementées et langues à ligatures complexes (arabe, devanagari) sont parfois mieux traitées par les modèles cloud entraînés sur de grands jeux de données multilingues.
  • Extraction de données structurées. Extraction de structure de tableau d'un reçu, identification de champs de facture, mise en évidence de lignes — tout cela bénéficie de modèles cloud à entraînement spécialisé. Microsoft Lens avec export Excel et Adobe Acrobat Liquid Mode en sont des exemples.

Pour les 90 % restants de la numérisation quotidienne — reçus fiscaux, contrats de bail, pièces d'identité, cartes de visite, notes de réunion, pages de manuels — l'OCR sur appareil est suffisamment bon pour que la différence soit en pratique invisible.

Confidentialité : où se trouve le document, ça compte

C'est ici que les deux approches divergent significativement.

Avec l'OCR sur appareil :

  • L'image du document est traitée dans le bac à sable de l'application sur l'iPhone
  • Aucune requête réseau n'est faite pour l'OCR
  • Le développeur de l'application n'a pas accès au contenu du document
  • La synchronisation cloud (si activée) est une étape distincte et optionnelle que vous contrôlez

Avec l'OCR cloud :

  • L'image du document est transmise à un serveur tiers en HTTPS
  • Le serveur peut mettre en cache, journaliser ou conserver l'image pendant des durées variables selon la politique du fournisseur
  • Le développeur de l'application et son fournisseur cloud ont techniquement accès au contenu du document pendant le traitement
  • Le transit de données via CDN, équilibreurs de charge et systèmes de journalisation crée des surfaces de divulgation supplémentaires
  • La juridiction juridique du serveur (UE, États-Unis, Chine) s'applique à votre document pendant la durée de stockage

Pour les documents publics — scan de menu de restaurant, article de magazine, document distribué en conférence —, rien de tout cela n'a d'importance. Pour les documents privés, la question de juridiction et de conservation est réelle.

Conformité : RGPD, CNIL, ANSSI et politiques DLP

Plusieurs cadres réglementaires considèrent «où sont traitées les données» comme une question de fond, pas un détail décoratif :

RGPD et CNIL (données personnelles UE)

Le RGPD impose une base légale pour le traitement des données personnelles et un consentement explicite pour certaines catégories sensibles. L'OCR cloud crée un sous-traitant — le fournisseur d'OCR — qui doit respecter le RGPD via un contrat de sous-traitance (article 28 RGPD) et, pour les transferts hors UE, des clauses contractuelles types (CCT) après l'arrêt Schrems II et le Data Privacy Framework UE-US (2023). La CNIL recommande la minimisation des données et le traitement local lorsque c'est possible. Pour l'OCR sur appareil, il n'y a pas de sous-traitant. Le document reste chez la personne concernée.

Secteurs réglementés (santé, juridique, financier)

En santé, le secret médical (Code de la santé publique) et la certification HDS (Hébergeur de Données de Santé) imposent un encadrement strict des prestataires manipulant des données de santé. Pour les avocats, le secret professionnel impose une vigilance équivalente sur les documents clients. Pour les établissements financiers, les obligations de la directive sur la protection des données financières imposent une évaluation des sous-traitants. L'OCR cloud est un sous-traitant. L'OCR sur appareil ne l'est pas.

ANSSI et cryptographie

L'ANSSI publie des recommandations sur la cryptographie et la sécurité des systèmes d'information. Pour les documents particulièrement sensibles, le traitement local évite la complexité de l'évaluation de la sécurité d'un fournisseur cloud, de ses pratiques de chiffrement et de ses risques de transfert.

Politiques DLP des entreprises

Le Data Loss Prevention dans les grandes entreprises bloque généralement le téléversement de certains documents vers des services externes. L'OCR sur appareil respecte ces politiques par architecture — il n'y a pas de téléversement. L'OCR cloud peut être totalement bloqué par le DLP corporatif.

Vitesse et hors-ligne

L'OCR sur appareil s'exécute en 100 à 500 millisecondes par page. L'OCR cloud prend généralement 1 à 5 secondes sur connexion rapide et nettement plus sur réseaux faibles. Pour la numérisation par lot d'un document multipage, la différence de latence s'accumule.

Le hors-ligne est un avantage structurel de l'OCR sur appareil. Apple Vision fonctionne en mode avion, en avion, dans une cave ou en tout lieu sans signal. L'OCR cloud est totalement inutilisable sans Internet — l'image ne peut pas être téléversée.

Conclusion

Pour la plupart des documents quotidiens, les deux approches donnent un résultat équivalent. Pour les documents confidentiels, les secteurs réglementés ou les usages hors-ligne, l'OCR sur appareil résout des problèmes structurels fondamentaux que l'OCR cloud ne peut pas résoudre. Si votre document type est un menu de restaurant, choisissez le confort. Si c'est un dossier médical, une déclaration fiscale ou un contrat sous NDA, choisissez l'architecture.

Vous voulez essayer l'OCR sur appareil sur iPhone ? L'application OCR ScanLens fonctionne avec Apple Vision entièrement sur l'appareil. Comparaison avec les alternatives cloud sur la page ScanLens vs CamScanner.