Превратите отсканированные PDF в PDF с поиском на iPhone, добавив OCR-слой текста. Ищите текст, копируйте контент, сохраняйте вид оригинального скана.
PDF с поиском — это PDF-файл с невидимым OCR-слоем (распознавания текста), встроенным поверх каждой отсканированной страницы. Страница выглядит идентично оригинальному скану, но в файле работает поиск в любой PDF-читалке — можно найти слова через Cmd+F, выделить и скопировать предложения, извлечь текст для архивов или таблиц. Обычный отсканированный PDF содержит только изображения страниц — ничего нельзя ни найти, ни скопировать.
ScanLens создаёт PDF с поиском на iPhone, запуская OCR на устройстве через Apple Vision framework, затем встраивая распознанный текст за каждым изображением страницы перед экспортом. OCR-слой остаётся внутри PDF, поэтому документ остаётся доступным для поиска в любой ОС, в любой PDF-читалке, годы спустя.
Для более широкого извлечения текста из любого изображения или фото (не только PDF) — см. приложение OCR для iPhone. Для полного сценария захвата сканов в PDF — начните с сканера PDF. Типичные следующие шаги после создания PDF с поиском: объединить несколько PDF на iPhone, разделить длинный PDF или подписать договор.
ScanLens использует Apple Vision framework для распознавания текста на устройстве. OCR-слой умеет распознавать слова, числа и структуру документа на 50+ языках, включая русский, сохраняя обработку на iPhone.
Распознанный текст располагается точно за отсканированным изображением. Позиция каждого слова совпадает с его визуальным местом. Когда вы выделяете текст, выделение покрывает соответствующую область изображения.
PDF с поиском следует архивному стандарту PDF/A. Текстовый слой встраивается прямо в структуру документа. Любая PDF-читалка может получить доступ к встроенному тексту без специального софта.
Весь OCR происходит локально на iPhone. Документы никогда не покидают устройство во время обработки. Это обеспечивает приватность для чувствительных документов и работает без интернета.
Используйте Ctrl+F (или Cmd+F на Mac), чтобы найти любое слово в документе. Больше не нужно листать страницы в поисках конкретного пункта в договоре или числа в чеке. Поиск находит мгновенно.
Кликните и тяните, чтобы выделить текст, потом скопируйте в буфер. Вставьте в письма, документы, таблицы. Извлекайте цитаты, копируйте адреса, забирайте номера телефонов — без перепечатывания.
Spotlight на Mac и поиск Windows могут индексировать PDF с поиском. Найдите документы по содержимому, а не только по имени файла. Поиск «счёт март 2024» — и найдёт каждый совпадающий документ.
Корпоративные системы вроде SharePoint, Google Drive, Dropbox и Яндекс Диск могут индексировать PDF с поиском. Корпоративный поиск возвращает релевантные сканированные документы наряду с родными файлами.
Скринридеры могут читать PDF с поиском вслух. Текстовый слой даёт доступный контент для пользователей с нарушениями зрения. Соответствие требованиям доступности становится возможным.
Изображение страницы остаётся прежним. Меняется то, что можно делать с файлом после сканирования: искать, выделять, копировать, индексировать и правильно архивировать.
| Функция | Обычный сканированный PDF | PDF с поиском |
|---|---|---|
| Внешний вид | Сканированное изображение | Идентично (без изменений) |
| Поиск текста (Ctrl+F) | Недоступен | Полная поддержка |
| Выделение текста | Недоступно | Полная поддержка |
| Копирование/вставка текста | Недоступно | Полная поддержка |
| Индексация поиска ОС | Только имя файла | Индексируется содержимое |
| Поддержка скринридеров | Только изображение | Полный доступ к тексту |
| Размер файла | Меньше | Чуть больше (+5–15%) |
Единственный компромисс — небольшое увеличение размера для хранения текстового слоя. Для большинства документов это +5–15% — небольшая цена за значительное улучшение функциональности.
Для многоязычных архивов поддержка языка важна так же, как скорость OCR. Текущее покрытие сгруппировано по семействам письменности.
| Группа языков | Языки |
|---|---|
| Кириллица | Русский, Украинский, Болгарский |
| Западноевропейские | Английский, немецкий, французский, испанский, итальянский, португальский, голландский |
| Восточноевропейские | Польский, чешский |
| Азиатские | Китайский (упрощённый), японский, корейский |
| Ближневосточные | Арабский, иврит |
Многоязычные документы работают хорошо — OCR-движок обрабатывает страницы с несколькими языками. Технические документы с английскими терминами, смешанными с другими языками (типичная ситуация для русскоязычных IT-документов), распознаются корректно.
Договоры, соглашения, судебные документы — все доступны для поиска. Найдите конкретные пункты в сотнях документов. Юридические разбирательства становятся управляемыми с полнотекстовым поиском.
Ищите чеки по контрагенту, сумме или дате. Подготовка декларации упрощена — найдите каждый учитываемый расход поиском по содержимому, а не угадыванием имён файлов.
Сканируйте учебники и статьи в PDF с поиском. Находите цитаты, перекрёстно ссылайтесь на источники, собирайте библиографию — всё через текстовый поиск.
Ищите записи пациентов по диагнозу, лекарству или врачу. Клинический персонал быстро находит релевантную историю. Отчёты о соответствии формируются из архивов с поиском.
Конвертируйте старые бумажные архивы в цифровой формат с поиском. Семейные генеалогические записи, бизнес-архивы, исторические документы — всё становится доступным и искомым.
PDF с поиском содержит невидимый текстовый слой, созданный OCR (Optical Character Recognition). Документ выглядит как обычный скан, но можно использовать Ctrl+F для поиска текста, выделения и копирования контента, а также поиска по библиотеке документов через системный поиск.
Нет, внешний вид остаётся идентичным обычному отсканированному PDF. OCR-слой полностью невидим — расположен точно за отсканированным изображением. Вы замечаете его только при поиске, выделении или копировании текста.
OCR в ScanLens поддерживает 50+ языков, включая русский. Кириллица распознаётся стабильно. Многоязычные документы (типичная ситуация — русский с английскими терминами) обрабатываются автоматически.
Да, PDF с поиском работают в любой стандартной читалке. Adobe Acrobat, Apple Preview, встроенный PDF-просмотрщик Chrome, Microsoft Edge и все мобильные PDF-приложения умеют искать и выделять текст из PDF с поиском. Специальный софт не нужен.
Текстовый слой обычно добавляет 5–15% к размеру файла, в зависимости от количества текста. Скан на 1 МБ может стать 1.1 МБ с текстовым слоем. Получаемая функциональность обычно стоит небольшого увеличения размера.