Перетворіть відскановані PDF на PDF з пошуком на iPhone, додавши OCR-шар тексту. Шукайте текст, копіюйте контент, зберігайте вигляд оригінального скана.
PDF з пошуком — це PDF-файл з невидимим OCR-шаром (розпізнавання тексту), вбудованим поверх кожної відсканованої сторінки. Сторінка виглядає ідентично оригінальному скану, але у файлі працює пошук у будь-якій PDF-читалці — можна знайти слова через Cmd+F, виділити і скопіювати речення, витягти текст для архівів чи таблиць. Звичайний відсканований PDF містить лише зображення сторінок — нічого не можна ні знайти, ні скопіювати.
ScanLens створює PDF з пошуком на iPhone, запускаючи OCR на пристрої через Apple Vision framework, потім вбудовуючи розпізнаний текст за кожним зображенням сторінки перед експортом. OCR-шар лишається всередині PDF, тому документ лишається доступним для пошуку в будь-якій ОС, у будь-якій PDF-читалці, роки потому.
Для ширшого витягу тексту з будь-якого зображення чи фото (не лише PDF) — див. застосунок OCR для iPhone. Для повного сценарію захоплення сканів у PDF — почніть з сканера PDF. Типові наступні кроки після створення PDF з пошуком: об’єднати кілька PDF на iPhone, розділити довгий PDF або підписати договір.
ScanLens використовує Apple Vision framework для розпізнавання тексту на пристрої. OCR-шар уміє розпізнавати слова, числа і структуру документа на 50+ мовах, зокрема українській, лишаючи обробку на iPhone.
Розпізнаний текст розташовується точно за відсканованим зображенням. Позиція кожного слова збігається з його візуальним місцем. Коли ви виділяєте текст, виділення покриває відповідну ділянку зображення.
PDF з пошуком слідує архівному стандарту PDF/A. Текстовий шар вбудовується прямо у структуру документа. Будь-яка PDF-читалка може отримати доступ до вбудованого тексту без спеціального софту.
Увесь OCR відбувається локально на iPhone. Документи ніколи не покидають пристрій під час обробки. Це гарантує приватність для чутливих документів і працює без інтернету.
Використовуйте Ctrl+F (або Cmd+F на Mac), щоб знайти будь-яке слово в документі. Більше не потрібно гортати сторінки в пошуках конкретного пункту в договорі чи числа в чеку. Пошук знаходить миттєво.
Клікніть і тягніть, щоб виділити текст, потім скопіюйте у буфер. Вставте в листи, документи, таблиці. Витягуйте цитати, копіюйте адреси, забирайте номери телефонів — без передруковування.
Spotlight на Mac і пошук Windows можуть індексувати PDF з пошуком. Знайдіть документи за вмістом, а не лише за іменем файла. Пошук «рахунок березень 2024» — і знайде кожен збіжний документ.
Корпоративні системи на кшталт SharePoint, Google Drive, Dropbox і OneDrive можуть індексувати PDF з пошуком. Корпоративний пошук повертає релевантні скановані документи поруч з рідними файлами.
Скрінрідери можуть читати PDF з пошуком уголос. Текстовий шар дає доступний контент для користувачів з порушеннями зору. Відповідність вимогам доступності стає можливою.
Зображення сторінки лишається тим самим. Змінюється те, що можна робити з файлом після сканування: шукати, виділяти, копіювати, індексувати і правильно архівувати.
| Функція | Звичайний сканований PDF | PDF з пошуком |
|---|---|---|
| Зовнішній вигляд | Скановане зображення | Ідентично (без змін) |
| Пошук тексту (Ctrl+F) | Недоступний | Повна підтримка |
| Виділення тексту | Недоступне | Повна підтримка |
| Копіювання/вставлення тексту | Недоступне | Повна підтримка |
| Індексація пошуку ОС | Лише ім’я файла | Індексується вміст |
| Підтримка скрінрідерів | Лише зображення | Повний доступ до тексту |
| Розмір файла | Менший | Трохи більший (+5–15%) |
Єдиний компроміс — невелике збільшення розміру для зберігання текстового шару. Для більшості документів це +5–15% — невелика ціна за значне покращення функціональності.
Для багатомовних архівів підтримка мови важлива так само, як швидкість OCR. Поточне покриття згруповане за родинами писемності.
| Група мов | Мови |
|---|---|
| Кирилиця | Українська, російська, болгарська |
| Західноєвропейські | Англійська, німецька, французька, іспанська, італійська, португальська, голландська |
| Східноєвропейські | Польська, чеська |
| Азійські | Китайська (спрощена), японська, корейська |
| Близькосхідні | Арабська, іврит |
Багатомовні документи працюють добре — OCR-рушій обробляє сторінки з кількома мовами. Технічні документи з англійськими термінами, змішаними з іншими мовами (типова ситуація для україномовних IT-документів), розпізнаються коректно.
Договори, угоди, судові документи — усі доступні для пошуку. Знайдіть конкретні пункти в сотнях документів. Юридичні розгляди стають керованими з повнотекстовим пошуком.
Шукайте чеки за контрагентом, сумою чи датою. Підготовка декларації спрощена — знайдіть кожну врахувану витрату пошуком за вмістом, а не вгадуванням імен файлів.
Скануйте підручники і статті в PDF з пошуком. Знаходьте цитати, перехресно посилайтеся на джерела, збирайте бібліографію — все через текстовий пошук.
Шукайте записи пацієнтів за діагнозом, ліками чи лікарем. Клінічний персонал швидко знаходить релевантну історію. Звіти про відповідність формуються з архівів з пошуком.
Конвертуйте старі паперові архіви в цифровий формат з пошуком. Сімейні генеалогічні записи, бізнес-архіви, історичні документи — усе стає доступним і шукабельним.
PDF з пошуком містить невидимий текстовий шар, створений OCR (Optical Character Recognition). Документ виглядає як звичайний скан, але можна використовувати Ctrl+F для пошуку тексту, виділення і копіювання контенту, а також пошуку по бібліотеці документів через системний пошук.
Ні, зовнішній вигляд лишається ідентичним звичайному відсканованому PDF. OCR-шар повністю невидимий — розташований точно за відсканованим зображенням. Ви помічаєте його лише при пошуку, виділенні чи копіюванні тексту.
OCR у ScanLens підтримує 50+ мов, зокрема українську. Кирилиця розпізнається стабільно. Багатомовні документи (типова ситуація — українська з англійськими термінами) обробляються автоматично.
Так, PDF з пошуком працюють у будь-якій стандартній читалці. Adobe Acrobat, Apple Preview, вбудований PDF-переглядач Chrome, Microsoft Edge і всі мобільні PDF-застосунки вміють шукати і виділяти текст з PDF з пошуком. Спеціальний софт не потрібен.
Текстовий шар зазвичай додає 5–15% до розміру файла, залежно від кількості тексту. Скан на 1 МБ може стати 1.1 МБ з текстовим шаром. Отримувана функціональність зазвичай варта невеликого збільшення розміру.