OCR на устройстве выполняет распознавание текста полностью на вашем iPhone через Apple Neural Engine — изображение документа никогда не покидает телефон. Облачный OCR загружает изображение на удалённый сервер, где модель распознавания возвращает извлечённый текст. Оба подхода дают сравнимую точность на чистых печатных документах в 2026 году. Реальная разница — структурная: где находится документ во время обработки. Это определяет приватность, комплаенс, поведение офлайн и юридическую юрисдикцию ваших данных.
Эта статья объясняет, что именно делает каждый подход, когда разница имеет значение и когда нет.
Что значит «OCR на устройстве» технически
На iPhone OCR на устройстве использует Vision framework Apple — конкретно API VNRecognizeTextRequest — который запускает предобученную нейросеть локально на Neural Engine (выделенный AI-ускоритель в iPhone от A11 Bionic и новее). Модель встроена в iOS, распознавание происходит за миллисекунды на страницу, исходные данные изображения остаются в песочнице приложения. Ничего не загружается. Ничего не покидает телефон, пока приложение явно не отправит распознанный текст или PDF.
Apple Vision OCR поддерживает 50+ языков в 2026 году, включая рукописный текст для латиницы, кириллицы и нескольких других алфавитов. Точность на чистом печатном тексте — в диапазоне 95–99% в зависимости от контраста, разрешения и сложности шрифта. ScanLens и Apple Notes Live Text работают на этой основе.
Что значит «облачный OCR» технически
Облачный OCR загружает изображение документа по HTTPS на удалённый сервер — Adobe Document Cloud для Adobe Scan, Microsoft Azure для Microsoft Lens, инфраструктуру CamScanner для CamScanner или Google Cloud Vision / AWS Textract для других приложений. На сервере более крупная нейросеть (часто transformer-модель с миллиардами параметров, не помещающаяся на телефоне) обрабатывает изображение и возвращает распознанный текст.
Сервер обычно кэширует изображение и результат распознавания — иногда временно, иногда навсегда — в зависимости от политики поставщика и применимых законов о хранении данных. Документ может проходить через CDN, балансировщики и системы логирования до OCR-сервиса. Каждый из этих переходов — потенциальная точка раскрытия данных, даже когда поставщик легитимный.
Точность: когда разница реально важна
Для чистого печатного текста стандартного разрешения (страница 8.5×11 дюймов, набранная на машинке или лазерной печатью) on-device и облачный OCR дают эквивалентные результаты в 2026 году. 10-летний разрыв в точности OCR закрылся — Apple Vision, Google ML Kit и аналогичные on-device системы теперь сравнимы с облачными сервисами на обычных документах.
Облачный OCR всё ещё лидирует в трёх конкретных случаях:
- Испорченные или исторические сканы. Чеки в кофе, выцветшая термобумага, рукописи XIX века и плохо освещённые телефонные фотографии выигрывают от больших серверных моделей, обученных на более разнообразных данных. Облачный OCR Adobe Acrobat, например, имеет заслуженную репутацию доставать читаемый текст из сканов, где on-device OCR пасует.
- Необычные алфавиты или шрифты. Курсив, готический blackletter, витиеватые декоративные шрифты и языки со сложными лигатурами (арабский, деванагари) иногда лучше обрабатываются облачными моделями, обученными на больших мультиязычных датасетах.
- Извлечение структурированных данных. Извлечение структуры таблицы из чека, идентификация полей счёта, выделение строк — всё это выигрывает от облачных моделей с предметным обучением. Microsoft Lens с экспортом в Excel и Adobe Acrobat Liquid Mode — примеры.
Для остальных 90% повседневного сканирования — налоговые чеки, договоры аренды, удостоверения, визитки, заметки на встречах, страницы учебников — on-device OCR хорош настолько, что разница на практике невидима.
Приватность: где находится документ — это важно
Здесь два подхода значимо расходятся.
С on-device OCR:
- Изображение документа обрабатывается в песочнице приложения на iPhone
- Сетевой запрос для OCR не делается
- Разработчик приложения не имеет доступа к содержимому документа
- Облачная синхронизация (если включена) — отдельный, опциональный шаг, который вы контролируете
С облачным OCR:
- Изображение документа передаётся на сторонний сервер по HTTPS
- Сервер может кэшировать, логировать или хранить изображение в течение разного времени по политике поставщика
- Разработчик приложения и его облачный поставщик технически имеют доступ к содержимому документа во время обработки
- Передача данных через CDN, балансировщики и системы логирования создаёт дополнительные поверхности раскрытия
- Юридическая юрисдикция сервера (США, ЕС, Китай) применяется к вашему документу на время хранения
Для публичных документов — скан меню ресторана, журнальной статьи, раздаточного материала с конференции — ничего из этого не имеет значения. Для приватных документов вопрос юрисдикции и хранения реален.
Комплаенс: HIPAA, GDPR, GLBA и DLP-политики
Несколько регуляторных рамок относятся к «где обрабатываются данные» как к существенному вопросу, а не декоративной детали:
HIPAA (медицина в США)
По HIPAA любой сервис, обрабатывающий Protected Health Information (PHI) от имени Covered Entity (больница, врач, страховщик), является Business Associate и должен подписать Business Associate Agreement (BAA). Использование облачного OCR-сервиса без BAA для сканирования рецепта, результата анализа или медицинской записи — нарушение HIPAA. On-device OCR полностью обходит вопрос — третьей стороны, обрабатывающей данные, нет.
GDPR и UK GDPR (персональные данные ЕС/Великобритании)
GDPR требует юридического основания для обработки персональных данных и явного согласия для определённых типов чувствительных категорий. Облачный OCR создаёт обработчика — поставщика OCR — который должен соблюдать GDPR через договор обработки. Для on-device OCR обработчика нет. Документ остаётся у субъекта данных.
GLBA (финансы в США)
Gramm-Leach-Bliley Act требует от финансовых учреждений защищать nonpublic personal information и оценивать сторонних провайдеров. Облачный OCR — сторонний провайдер. On-device OCR — не сторонний.
DLP-политики предприятий
Data Loss Prevention в крупных компаниях обычно блокирует загрузку определённых документов на внешние сервисы. On-device OCR соблюдает эти политики по архитектуре — загрузки нет. Облачный OCR может быть полностью заблокирован корпоративным DLP.
Скорость и офлайн
On-device OCR работает за 100–500 миллисекунд на страницу. Облачный OCR обычно занимает 1–5 секунд при быстром соединении и значительно дольше на слабых сетях. Для пакетного сканирования многостраничного документа разница в латентности накапливается.
Офлайн — структурное преимущество on-device. Apple Vision работает в авиарежиме, в полёте, в подвале или в любом месте без сигнала. Облачный OCR полностью неработоспособен без интернета — изображение нельзя загрузить.
Резюме
Для большинства повседневных документов оба подхода дают эквивалентный результат. Для конфиденциальных документов, регулируемых отраслей или офлайн-сценариев — on-device OCR решает фундаментальные структурные проблемы, которые облачный OCR не может. Если ваш типичный сканируемый документ — это меню ресторана, выбирайте удобство. Если это медицинская запись, налоговая декларация или контракт под NDA — выбирайте архитектуру.
Хотите попробовать on-device OCR на iPhone? ScanLens OCR-приложение работает на Apple Vision полностью на устройстве. Сравнение с облачными альтернативами — на странице ScanLens vs CamScanner.