Transformez vos PDF numérisés en PDF consultables sur iPhone en ajoutant une couche de texte OCR. Recherchez le texte, copiez le contenu, conservez l'apparence du scan d'origine.
Un PDF consultable est un fichier PDF avec une couche OCR (reconnaissance optique de caractères) invisible, intégrée par-dessus chaque page numérisée. La page apparaît à l'identique du scan d'origine, mais la recherche fonctionne dans n'importe quel lecteur PDF — vous pouvez retrouver des mots avec Ctrl+F, surligner et copier des phrases, extraire du texte pour les archives ou les tableurs. Un PDF numérisé classique ne contient que des images de pages — rien ne peut y être recherché ni copié.
ScanLens crée des PDF consultables sur iPhone en exécutant l'OCR sur l'appareil via le framework Apple Vision, puis en intégrant le texte reconnu derrière chaque image de page avant l'export. La couche OCR reste à l'intérieur du PDF, donc le document reste consultable dans tout système d'exploitation, dans tout lecteur PDF, même des années plus tard.
Pour une extraction de texte plus large depuis n'importe quelle image ou photo (pas uniquement PDF) — voir l'application OCR pour iPhone. Pour le scénario complet de capture de scans en PDF — commencez par le scanner PDF. Étapes typiques après la création d'un PDF consultable : fusionner plusieurs PDF sur iPhone, diviser un long PDF ou signer un contrat.
ScanLens utilise le framework Apple Vision pour reconnaître le texte sur l'appareil. La couche OCR sait reconnaître mots, nombres et structure de document dans plus de 50 langues, dont le français, en gardant tout le traitement sur l'iPhone.
Le texte reconnu est placé exactement derrière l'image numérisée. La position de chaque mot correspond à son emplacement visuel. Quand vous surlignez du texte, la sélection couvre la zone correspondante de l'image.
Le PDF consultable suit le standard d'archivage PDF/A. La couche texte est intégrée directement dans la structure du document. N'importe quel lecteur PDF peut accéder au texte intégré sans logiciel spécifique.
Tout l'OCR se fait localement sur l'iPhone. Les documents ne quittent jamais l'appareil pendant le traitement. Cela garantit la confidentialité pour les documents sensibles et fonctionne sans Internet.
Utilisez Ctrl+F (ou Cmd+F sur Mac) pour trouver n'importe quel mot dans le document. Plus besoin de feuilleter les pages à la recherche d'une clause précise dans un contrat ou d'un montant sur un reçu. La recherche trouve immédiatement.
Cliquez et glissez pour surligner du texte, puis copiez-le dans le presse-papiers. Collez-le dans des e-mails, documents, tableurs. Récupérez des citations, copiez des adresses, prenez des numéros de téléphone — sans ressaisir.
Spotlight sur Mac et la recherche Windows peuvent indexer les PDF consultables. Trouvez les documents par contenu, et pas seulement par nom de fichier. Cherchez « facture mars 2024 » — et l'outil retrouve chaque document correspondant.
Les systèmes d'entreprise comme SharePoint, Google Drive, Dropbox et OneDrive peuvent indexer les PDF consultables. La recherche d'entreprise renvoie les documents numérisés pertinents au même titre que les fichiers natifs.
Les lecteurs d'écran peuvent lire à voix haute les PDF consultables. La couche texte fournit du contenu accessible aux utilisateurs malvoyants. La conformité aux exigences d'accessibilité devient possible.
L'image de page reste identique. Ce qui change, c'est ce que vous pouvez faire du fichier après numérisation : rechercher, surligner, copier, indexer et archiver correctement.
| Fonction | PDF numérisé classique | PDF avec recherche |
|---|---|---|
| Apparence | Image numérisée | Identique (sans changement) |
| Recherche de texte (Ctrl+F) | Indisponible | Prise en charge complète |
| Sélection de texte | Indisponible | Prise en charge complète |
| Copier/coller du texte | Indisponible | Prise en charge complète |
| Indexation par l'OS | Nom de fichier uniquement | Indexation du contenu |
| Lecteurs d'écran | Image uniquement | Accès complet au texte |
| Taille du fichier | Plus petite | Légèrement plus grande (+5–15 %) |
Le seul compromis est une légère hausse de taille pour stocker la couche texte. Pour la plupart des documents, c'est +5 à 15 % — un faible prix pour un gain notable de fonctionnalité.
Pour des archives multilingues, la prise en charge des langues compte autant que la vitesse de l'OCR. Couverture actuelle regroupée par familles d'écriture.
| Groupe de langues | Langues |
|---|---|
| Latin (Europe occidentale) | Français, anglais, allemand, espagnol, italien, portugais, néerlandais |
| Cyrillique | Russe, ukrainien, bulgare |
| Europe orientale | Polonais, tchèque |
| Asiatique | Chinois (simplifié), japonais, coréen |
| Moyen-Orient | Arabe, hébreu |
Les documents multilingues fonctionnent bien — le moteur OCR traite les pages mêlant plusieurs langues. Les documents techniques en français contenant des termes anglais (situation typique pour la documentation IT) sont reconnus correctement.
Contrats, accords, pièces de procédure — tous consultables. Trouvez des clauses précises dans des centaines de documents. Les contentieux deviennent gérables avec une recherche en texte intégral.
Recherchez les reçus par fournisseur, montant ou date. La préparation de la déclaration fiscale est simplifiée — retrouvez chaque dépense déductible par recherche dans le contenu, plutôt qu'en devinant les noms de fichiers.
Numérisez manuels et articles en PDF consultables. Trouvez des citations, recoupez des sources, constituez des bibliographies — le tout par recherche textuelle.
Recherchez les dossiers patients par diagnostic, médicament ou médecin. Le personnel clinique retrouve rapidement l'historique pertinent. Les rapports de conformité s'appuient sur des archives consultables.
Convertissez de vieilles archives papier en numérique consultable. Registres familiaux de généalogie, archives d'entreprise, documents historiques — tout devient accessible et consultable.
Un PDF avec recherche contient une couche texte invisible créée par OCR (Optical Character Recognition). Le document a l'apparence d'un scan classique, mais vous pouvez utiliser Ctrl+F pour rechercher du texte, surligner et copier le contenu, et rechercher dans votre bibliothèque de documents via la recherche système.
Non, l'apparence reste identique à un PDF numérisé classique. La couche OCR est totalement invisible — placée précisément derrière l'image numérisée. Vous ne la remarquez qu'au moment de rechercher, surligner ou copier du texte.
L'OCR de ScanLens prend en charge plus de 50 langues, dont le français. L'écriture latine est reconnue de façon stable. Les documents multilingues (cas typique : français avec termes anglais) sont traités automatiquement.
Oui, les PDF avec recherche fonctionnent dans n'importe quel lecteur standard. Adobe Acrobat, Aperçu Apple, le lecteur PDF intégré à Chrome, Microsoft Edge et toutes les applications PDF mobiles savent rechercher et surligner le texte d'un PDF consultable. Aucun logiciel spécifique n'est requis.
La couche texte ajoute généralement 5 à 15 % à la taille du fichier, selon la quantité de texte. Un scan de 1 Mo peut devenir 1,1 Mo avec la couche texte. La fonctionnalité gagnée vaut largement la légère hausse de taille.