Technologie OCR

PDF avec recherche sur iPhone

Transformez vos PDF numérisés en PDF consultables sur iPhone en ajoutant une couche de texte OCR. Recherchez le texte, copiez le contenu, conservez l'apparence du scan d'origine.

Recherche de texte Copie du contenu Mise en page conservée OCR sur l'appareil

Idéal pour : contrats, reçus, documents et archives numérisés qui doivent ressembler à la page originale et se comporter ensuite comme du texte consultable.

Qu'est-ce qu'un PDF consultable et en quoi diffère-t-il d'un scan classique ?

Un PDF consultable est un fichier PDF avec une couche OCR (reconnaissance optique de caractères) invisible, intégrée par-dessus chaque page numérisée. La page apparaît à l'identique du scan d'origine, mais la recherche fonctionne dans n'importe quel lecteur PDF — vous pouvez retrouver des mots avec Ctrl+F, surligner et copier des phrases, extraire du texte pour les archives ou les tableurs. Un PDF numérisé classique ne contient que des images de pages — rien ne peut y être recherché ni copié.

ScanLens crée des PDF consultables sur iPhone en exécutant l'OCR sur l'appareil via le framework Apple Vision, puis en intégrant le texte reconnu derrière chaque image de page avant l'export. La couche OCR reste à l'intérieur du PDF, donc le document reste consultable dans tout système d'exploitation, dans tout lecteur PDF, même des années plus tard.

Pour une extraction de texte plus large depuis n'importe quelle image ou photo (pas uniquement PDF) — voir l'application OCR pour iPhone. Pour le scénario complet de capture de scans en PDF — commencez par le scanner PDF. Étapes typiques après la création d'un PDF consultable : fusionner plusieurs PDF sur iPhone, diviser un long PDF ou signer un contrat.

Ce qu'est réellement la couche texte invisible

Imaginez un PDF consultable comme deux couches empilées sur chaque page. Au-dessus se trouve l'image de la page — le scan que vous avez capturé, exactement tel qu'il apparaissait sur le papier. En dessous se trouve une couche texte : chaque mot reconnu par le moteur OCR, placé aux mêmes coordonnées que le mot correspondant dans l'image, mais rendu dans une police invisible. Vous ne voyez que l'image ; les logiciels, eux, voient les mots qui se trouvent derrière.

Tout le tour de force tient à ce positionnement. Comme chaque mot reconnu est ancré à l'endroit où il apparaît dans le scan, surligner du texte met en évidence la bonne partie de l'image et la recherche saute au bon endroit, sur la bonne page. La police invisible a une opacité nulle, donc elle ne modifie jamais l'apparence ni l'impression du document — la page reste identique au pixel près au simple scan. Ce qui a changé, c'est que le fichier contient désormais son propre texte, et plus seulement une image de celui-ci.

ScanLens construit cette couche au moment de l'export : après que le framework Apple Vision a reconnu le texte sur l'appareil, ScanLens inscrit chaque mot et sa zone englobante dans le PDF, derrière l'image de page. Dès lors, le texte voyage à l'intérieur du fichier — copiez le PDF sur un Mac ou un PC, ouvrez-le dans n'importe quel lecteur des années plus tard, et le texte consultable est toujours là, sans aucune dépendance à ScanLens ni à une connexion Internet. C'est une fonctionnalité PDF standard, intégrée au document lui-même.

PDF numérisé plat vs PDF consultable avec OCR — et comment les distinguer

Les deux fichiers peuvent sembler identiques à l'écran, et c'est précisément ce qui prend les gens au dépourvu. Un PDF numérisé plat ne contient que des images : une pile de photos de pages sans aucun texte à l'intérieur. Vous ne pouvez ni y rechercher ni y surligner une phrase, et un téléphone ou un ordinateur qui indexe vos fichiers ne le retrouve que par son nom, jamais par ce qui est écrit sur la page. C'est ce que produisent la plupart des applications de scan basiques, la numérisation de document de l'appareil photo iOS ou le « scan vers PDF » d'un photocopieur avec l'OCR désactivé.

Un PDF consultable avec OCR a la même apparence, mais porte la couche texte invisible décrite plus haut. La recherche y retrouve des mots, vous pouvez surligner et copier, et le système d'exploitation peut indexer l'intégralité de son contenu. La page visuelle est inchangée ; la différence tient entièrement à ce que le fichier sait faire.

Pour savoir lequel vous avez entre les mains, ouvrez le PDF et essayez de surligner un mot — glissez le long d'une ligne, ou appuyez longuement. Si des mots isolés se surlignent, il y a une couche texte et le fichier est consultable. Si la page entière se sélectionne comme un seul bloc, ou si rien ne se sélectionne, c'est un scan plat composé uniquement d'images. L'autre test rapide est la recherche : ouvrez la fonction Rechercher et cherchez un mot que vous voyez clairement sur la page. Un scan plat ne renvoie aucun résultat. Faire passer la page par ScanLens ajoute la couche, et les deux tests se mettent alors à réussir.

Comment fonctionne techniquement un PDF avec recherche

Reconnaissance de texte par OCR

ScanLens utilise le framework Apple Vision pour reconnaître le texte sur l'appareil. La couche OCR sait reconnaître mots, nombres et structure de document dans 14 langues, dont le français, en gardant tout le traitement sur l'iPhone.

Positionnement de la couche texte

Le texte reconnu est placé exactement derrière l'image numérisée. La position de chaque mot correspond à son emplacement visuel. Quand vous surlignez du texte, la sélection couvre la zone correspondante de l'image.

Traitement sur l'appareil

Tout l'OCR se fait localement sur l'iPhone. Les documents ne quittent jamais l'appareil pendant le traitement. Cela garantit la confidentialité pour les documents sensibles et fonctionne sans Internet.

Avantages du PDF avec recherche

Trouver du texte instantanément

Utilisez Ctrl+F (ou Cmd+F sur Mac) pour trouver n'importe quel mot dans le document. Plus besoin de feuilleter les pages à la recherche d'une clause précise dans un contrat ou d'un montant sur un reçu. La recherche trouve immédiatement.

Surligner et copier du texte

Cliquez et glissez pour surligner du texte, puis copiez-le dans le presse-papiers. Collez-le dans des e-mails, documents, tableurs. Récupérez des citations, copiez des adresses, prenez des numéros de téléphone — sans ressaisir.

Recherche en texte intégral dans les documents

Spotlight sur Mac et la recherche Windows peuvent indexer les PDF consultables. Trouvez les documents par contenu, et pas seulement par nom de fichier. Cherchez « facture mars 2024 » — et l'outil retrouve chaque document correspondant.

Systèmes de gestion documentaire

Les systèmes d'entreprise comme SharePoint, Google Drive, Dropbox et OneDrive peuvent indexer les PDF consultables. La recherche d'entreprise renvoie les documents numérisés pertinents au même titre que les fichiers natifs.

Accessibilité

Les lecteurs d'écran peuvent lire à voix haute les PDF consultables. La couche texte fournit du contenu accessible aux utilisateurs malvoyants. La conformité aux exigences d'accessibilité devient possible.

Ce qui change

PDF classique vs PDF avec recherche

L'image de page reste identique. Ce qui change, c'est ce que vous pouvez faire du fichier après numérisation : rechercher, surligner, copier, indexer et archiver correctement.

Fonction	PDF numérisé classique	PDF avec recherche
Apparence	Image numérisée	Identique (sans changement)
Recherche de texte (Ctrl+F)	Indisponible	Prise en charge complète
Sélection de texte	Indisponible	Prise en charge complète
Copier/coller du texte	Indisponible	Prise en charge complète
Indexation par l'OS	Nom de fichier uniquement	Indexation du contenu
Lecteurs d'écran	Image uniquement	Accès complet au texte
Taille du fichier	Plus petite	Légèrement plus grande (+5–15 %)

Le seul compromis est une légère hausse de taille pour stocker la couche texte. Pour la plupart des documents, c'est +5 à 15 % — un faible prix pour un gain notable de fonctionnalité.

Là où la couche texte porte ses fruits : Spotlight, Fichiers et iCloud

L'intérêt d'un PDF consultable n'est pas le moment où vous le créez — c'est le moment, six mois plus tard, où vous devez retrouver quelque chose à l'intérieur. Sur iPhone et dans tout l'écosystème Apple, la couche texte invisible se branche sur les outils de recherche que vous utilisez déjà.

Recherche Spotlight

Spotlight sur iOS — la recherche que vous atteignez en glissant vers le bas sur l'écran d'accueil — indexe le contenu des PDF stockés sur l'appareil, et pas seulement leur nom. Dès qu'un scan porte une couche texte, saisir une phrase tirée de l'intérieur d'un document peut faire remonter ce document directement, même si vous avez depuis longtemps oublié comment vous l'aviez nommé. Sans la couche, Spotlight n'a rien à lire et ne peut faire correspondre que le nom du fichier.

L'application Fichiers

Enregistrer un PDF consultable dans l'application Fichiers le rend repérable par son contenu depuis la barre de recherche de Fichiers. Cela compte surtout pour les archives : un dossier de reçus ou de contrats numérisés devient un corpus de texte que vous pouvez interroger, au lieu d'un mur de vignettes de pages identiques que vous devez ouvrir une à une.

iCloud Drive et vos autres appareils

Comme la couche texte vit à l'intérieur du fichier, elle se synchronise partout où le fichier va. Placez un PDF consultable dans iCloud Drive et il est aussi consultable sur votre iPad et votre Mac — Spotlight sur le Mac et l'application Fichiers sur iPad lisent le même texte intégré. La reconnaissance a eu lieu une seule fois, sur votre iPhone, sur l'appareil ; la consultabilité suit ensuite le document partout, y compris dans des systèmes tiers comme Dropbox, Google Drive et SharePoint, qui indexent le texte intégré de la même façon.

Couverture linguistique

Langues prises en charge pour le PDF avec recherche

Pour des archives multilingues, la prise en charge des langues compte autant que la vitesse de l'OCR. Couverture actuelle regroupée par familles d'écriture.

Groupe de langues	Langues
Latin (Europe occidentale)	Français, anglais, allemand, espagnol, italien, portugais, néerlandais
Cyrillique	Russe, ukrainien, bulgare
Europe orientale	Polonais, tchèque
Asiatique	Chinois (simplifié), japonais, coréen
Moyen-Orient	Arabe, hébreu

Les documents multilingues fonctionnent bien — le moteur OCR traite les pages mêlant plusieurs langues. Les documents techniques en français contenant des termes anglais (situation typique pour la documentation IT) sont reconnus correctement.

Cas d'usage du PDF avec recherche

Archives de documents juridiques

Contrats, accords, pièces de procédure — tous consultables. Trouvez des clauses précises dans des centaines de documents. Les contentieux deviennent gérables avec une recherche en texte intégral.

Gestion des reçus et factures

Recherchez les reçus par fournisseur, montant ou date. La préparation de la déclaration fiscale est simplifiée — retrouvez chaque dépense déductible par recherche dans le contenu, plutôt qu'en devinant les noms de fichiers.

Recherche et publications scientifiques

Numérisez manuels et articles en PDF consultables. Trouvez des citations, recoupez des sources, constituez des bibliographies — le tout par recherche textuelle.

Dossiers médicaux

Recherchez les dossiers patients par diagnostic, médicament ou médecin. Le personnel clinique retrouve rapidement l'historique pertinent. Les rapports de conformité s'appuient sur des archives consultables.

Numérisation de documents historiques

Convertissez de vieilles archives papier en numérique consultable. Registres familiaux de généalogie, archives d'entreprise, documents historiques — tout devient accessible et consultable.

La vraie raison de rendre les scans consultables : les retrouver plus tard

Les PDF consultables prouvent leur valeur avec le temps, et non au moment de la numérisation. Trois situations montrent pourquoi la couche texte vaut son léger coût en taille de fichier.

Archiver pour que la pile reste exploitable

Une archive grandissante de scans plats devient discrètement inutilisable : cent reçus se ressemblent tous sous forme de vignettes, et le seul moyen d'en trouver un est de les ouvrir un par un. Rendez chaque scan consultable au moment de le classer, et l'archive reste un corpus de texte que vous pouvez interroger — fournisseur, montant, numéro de dossier — quelle que soit sa taille. L'OCR à l'enregistrement est ce qui empêche une archive à long terme de se transformer en boîte à chaussures numérique.

Contentieux et revue de documents

Lorsqu'une affaire exige de passer au crible des milliers de pages pour trouver celles qui mentionnent un nom, une date ou un terme, la recherche en texte intégral fait la différence entre des heures et des minutes — lancez la recherche sur l'ensemble du corpus au lieu de lire chaque page. Comme ScanLens exécute l'OCR sur l'appareil, des pièces couvertes par le secret professionnel peuvent être rendues consultables sans jamais être téléversées vers un service externe.

Retrouver une clause des mois plus tard

Vous signez un bail ou un contrat, vous classez le scan et vous en oubliez les détails. Des mois plus tard, une question surgit — le délai de préavis, une date de renouvellement, une obligation précise. Avec un PDF consultable, vous ouvrez le fichier, recherchez le mot et tombez sur la clause exacte en quelques secondes ; avec un scan plat, vous faites défiler en plissant les yeux. Votre futur vous-même à la recherche d'une ligne dans un document à peine mémorisé, c'est le cas quotidien pour lequel la couche texte est conçue.

Questions fréquentes

Qu'est-ce qu'un PDF avec recherche ?

Un PDF avec recherche contient une couche texte invisible créée par OCR (Optical Character Recognition). Le document a l'apparence d'un scan classique, mais vous pouvez utiliser Ctrl+F pour rechercher du texte, surligner et copier le contenu, et rechercher dans votre bibliothèque de documents via la recherche système.

Le PDF avec recherche change-t-il l'apparence du document ?

Non, l'apparence reste identique à un PDF numérisé classique. La couche OCR est totalement invisible — placée précisément derrière l'image numérisée. Vous ne la remarquez qu'au moment de rechercher, surligner ou copier du texte.

Quelles langues sont prises en charge pour le PDF avec recherche ?

L'OCR de ScanLens prend en charge 14 langues, dont le français. L'écriture latine est reconnue de façon stable. Les documents multilingues (cas typique : français avec termes anglais) sont traités automatiquement.

Peut-on rechercher du texte dans n'importe quel lecteur PDF ?

Oui, les PDF avec recherche fonctionnent dans n'importe quel lecteur standard. Adobe Acrobat, Aperçu Apple, le lecteur PDF intégré à Chrome, Microsoft Edge et toutes les applications PDF mobiles savent rechercher et surligner le texte d'un PDF consultable. Aucun logiciel spécifique n'est requis.

De combien augmente la taille des PDF avec recherche ?

La couche texte ajoute généralement 5 à 15 % à la taille du fichier, selon la quantité de texte. Un scan de 1 Mo peut devenir 1,1 Mo avec la couche texte. La fonctionnalité gagnée vaut largement la légère hausse de taille.