Извлекайте редактируемый текст из PDF на iPhone с помощью OCR на устройстве. ScanLens распознаёт текст в сканированных и текстовых PDF на 50+ языках, включая рукописный, отдаёт распознанный текст для копирования, а вы вставляете его в Apple Pages или Microsoft Word и сохраняете как .docx. Без аккаунта, без облачной загрузки, без сторонних конвертеров, касающихся вашего документа.
Конвертация PDF в документ Word на iPhone — это процесс из двух приложений: OCR-приложение, которое считывает текст из PDF, и текстовый редактор (Apple Pages или Microsoft Word), который принимает этот текст и сохраняет файл как .docx. Универсального инструмента «PDF в Word», который честно делает это на iPhone, в App Store нет — большинство «PDF в Word» приложений загружают ваш PDF на удалённый конвертер и присылают .docx обратно. Это нормально для неконфиденциальных PDF, но опасно для договоров, медицинских карт и личных данных.
ScanLens берёт на себя OCR-шаг на устройстве с помощью фреймворка Apple Vision. Он читает текст из сканированных PDF (изображений страниц) и из текстовых PDF (реального текста внутри файла) на 50+ языках, включая рукописный. Затем вы копируете распознанный текст в Apple Pages (предустановлен бесплатно на каждом iPhone) или Microsoft Word из App Store — оба нативно экспортируют в .docx. Весь процесс остаётся на телефоне.
Два типа PDF на экране выглядят одинаково, но ведут себя совершенно по-разному, когда нужно вытащить текст. Текстовые PDF созданы программно — документ Word, экспортированный в PDF, «Сохранить как PDF» из браузера, счёт, сгенерированный бухгалтерским ПО. Текст внутри файла — настоящий. Вы можете нажать и выделить слова на странице. ScanLens читает этот текст напрямую, OCR-проход не нужен, конвертация почти мгновенная.
Сканированные PDF — это изображения бумажных страниц, даже если расширение файла .pdf. Они получаются с планшетных сканеров, из встроенного сканера в Камере iPhone или из приложений вроде самого ScanLens, когда вы сканируете бумажный документ. Касание страницы выделяет всё изображение, а не отдельные слова. Чтобы получить текст, нужен OCR — ПО, которое распознаёт буквы из пикселей. ScanLens запускает OCR через фреймворк Apple Vision на устройстве. Качество на чистых печатных страницах почти идеальное; на выцветших копиях или сканах ниже 200 DPI заметно слабее.
Понять, какой у вас тип, можно, нажав внутри PDF в Файлах или Mail: если выделяются отдельные слова — это текстовый PDF. Если вся страница выделяется как блок — это сканированный. ScanLens обрабатывает оба, но знание типа задаёт правильные ожидания от результата.
Принесите PDF в ScanLens оттуда, где он лежит. Вложение в Mail: меню «Поделиться» → ScanLens. Файл в iCloud Drive или приложении Файлы: долгое нажатие → «Поделиться» → ScanLens. AirDrop с другого устройства работает напрямую. Уже в ScanLens (потому что вы здесь сканировали бумагу) — импорт не нужен, документ уже в библиотеке.
Откройте PDF в ScanLens и запустите OCR на панели инструментов. Для текстовых PDF текст появляется меньше чем за секунду. Для сканированных PDF (и многостраничных документов) OCR-проход выполняется по страницам; 10-страничный скан завершается за несколько секунд на iPhone 13 и новее. Выберите язык, если это не английский — поддерживается 50+, можно выбрать несколько для документов на смешанных языках.
Распознанный текст появляется как выделяемый и копируемый обычный текст. Выделить всё, скопировать. Или через меню «Поделиться» отправить текст в другое приложение как обычный текст. Исходный PDF остаётся нетронутым в библиотеке ScanLens — вы извлекли копию его текстового содержимого, а не преобразовали сам файл.
Откройте Apple Pages (уже есть на вашем iPhone) или Microsoft Word из App Store. Новый пустой документ, вставка, повторно применяйте нужные стили (заголовки, жирный). Меню «Поделиться» → «Экспортировать» → Word (.docx). Сохраните в Файлы или отправьте по email. Готово: настоящий файл .docx, сгенерированный на iPhone без удалённого конвертера. Pages нативно пишет .docx как формат совместимости от Apple; Word делает то же самое в своём собственном формате.
20-страничный текстовый PDF занимает меньше 30 секунд от начала до конца. 20-страничный сканированный PDF — минута-две в зависимости от модели iPhone и сложности языка. Шесть шагов, два приложения, всё на телефоне.
| Шаг | Действие | Подсказки |
|---|---|---|
| 1 | Откройте PDF в ScanLens | Меню «Поделиться» в Mail, долгое нажатие в Файлах, AirDrop или уже в библиотеке |
| 2 | Нажмите OCR / «Извлечь текст» | Выберите язык документа; для смешанных языков выберите несколько |
| 3 | Дождитесь OCR-прохода | Текстовый PDF: мгновенно. Сканированный: несколько секунд на страницу |
| 4 | Выделите всё и скопируйте распознанный текст | Или через меню «Поделиться» → «Скопировать как обычный текст» |
| 5 | Откройте Pages или Word, вставьте в пустой документ | Pages предустановлен и бесплатен; Word нужно установить из App Store |
| 6 | Экспортируйте в Word (.docx) | Pages: «Поделиться» → «Экспорт» → Word. Word: «Поделиться» → «Отправить копию» → .docx |
Юристы, помощники и фрилансеры, собирающие новое соглашение на основе старого. Открыли старый PDF, запустили OCR, скопировали нужные пункты, вставили в свежий черновик Word, внесли правки. PDF остаётся ссылочной версией; .docx становится рабочим черновиком. Конфиденциальные материалы клиента не покидают устройство.
Студенты с PDF-материалами для чтения и сканированными раздатками. Извлеките нужные фрагменты, вставьте в учебный документ или эссе в Word, оформите цитаты. Распознавание рукописного захватывает заметки на полях, если вы их отсканировали. Исходная страница остаётся — вы не уничтожаете PDF, а просто вытаскиваете из него текст для повторного использования.
Корпоративные отчёты десятилетней давности, государственные документы, семейные генеалогические записи. Бумага существует, вы (или кто-то ещё) её отсканировали, и теперь нужно получить текст в современном редактируемом формате. OCR на iPhone достаточно хорош для чистых отпечатков с 1980-х; более старые материалы или копировальная бумага могут потребовать чистки.
Сочетайте PDF в текст с Pages или встроенным «Переводом». Отсканируйте печатную страницу, OCR, скопируйте, вставьте в «Перевод», получите переведённый текст. Весь цикл идёт на устройстве для языков, которые поддерживает офлайн-переводчик Apple. Для использования с уважением к авторскому праву — собственные записи, материалы общественного достояния, выдержки в рамках добросовестного использования.
OCR извлекает суммы и названия продавцов из PDF-чеков, вставка в шаблон авансового отчёта в Word. Для структурированных данных чеков отдельно есть страница про сканер чеков, она описывает специализированный сценарий. PDF в Word — правильный инструмент, когда у вас уже есть многостраничный PDF с чеками и нужно перенести текст в шаблон.
Нет. ScanLens извлекает текст из PDF с помощью OCR на устройстве и отдаёт редактируемый текст, который можно скопировать. Чтобы получить настоящий .docx, вставьте извлечённый текст в Apple Pages или Microsoft Word на iPhone и экспортируйте в формате Word. Pages предустановлен на каждом iPhone и нативно экспортирует .docx; Word из App Store делает то же самое. Честное разделение: ScanLens берёт на себя сложную часть (распознавание текста со сканированной страницы), а Pages или Word отвечают за формат файла.
С обоими. Текстовые PDF (созданные в Word, Pages или через «Сохранить как PDF» в браузере) уже содержат выделяемый текст — ScanLens считывает его напрямую. Сканированные PDF (полученные из фотографий бумажных страниц) — это изображения текста, для них ScanLens запускает OCR на 50+ языках, включая рукописный, чтобы восстановить текст. Рукописный почерк и сканы низкого разрешения распознаются, но с меньшей точностью; чистые печатные страницы — практически идеально.
На устройстве. ScanLens использует фреймворк Apple Vision, который запускает модель распознавания текста локально на iPhone. PDF, распознанный текст и любая копия остаются на телефоне — никакой загрузки на сервер ScanLens нет. Для конфиденциальных договоров и медицинских карт это важно: документ не покидает устройство, пока вы сами его не отправите.
Частично. Порядок чтения сохраняется для абзацев и заголовков. Таблицы выходят строками текста, разделёнными пробелами или табуляцией — обычно их можно быстро восстановить в таблицу в Pages или Word через «Специальную вставку». Многоколоночная вёрстка (газеты, научные статьи) читается сверху вниз по каждой колонке, границы колонок определяются, но не всегда идеально. Если нужна попиксельная точность вёрстки — экспорт в Word не подходящий путь, лучше оставить PDF или работать с аннотациями.
Распознанный текст — это простой текст. Визуальное форматирование (жирные участки, курсив, размеры заголовков) OCR-движок видит как визуальные подсказки, но при копировании в Word оно не переносится. Вы получаете слова и структуру абзацев и заново применяете стили в Pages или Word. Этого достаточно для повторного использования пунктов договора, черновиков статей или конспектов из отсканированных книг. Для визуальной точности по-прежнему уместен десктопный конвертер (Adobe Acrobat Pro на macOS).
Да. Весь процесс на телефоне: ScanLens распознаёт текст в PDF, вы копируете распознанный текст, открываете Pages или Word на том же iPhone, вставляете и через меню «Поделиться» экспортируете .docx. Pages предустановлен на каждом современном iPhone и пишет .docx напрямую. Microsoft Word из App Store работает так же. Никакого Mac, никакого облачного шага, никакой регистрации в онлайн-конвертере, который загружает ваш PDF на чужой сервер.