OCR на пристрої виконує розпізнавання тексту повністю на вашому iPhone через Apple Neural Engine — зображення документа ніколи не покидає телефон. Хмарний OCR завантажує зображення на віддалений сервер, де модель розпізнавання повертає видобутий текст. Обидва підходи дають порівнянну точність на чистих друкованих документах у 2026 році. Реальна різниця — структурна: де перебуває документ під час обробки. Це визначає приватність, комплаєнс, поведінку офлайн і юридичну юрисдикцію ваших даних.
Ця стаття пояснює, що саме робить кожен підхід, коли різниця має значення і коли ні.
Що означає «OCR на пристрої» технічно
На iPhone OCR на пристрої використовує Vision framework Apple — конкретно API VNRecognizeTextRequest — який запускає попередньо навчену нейромережу локально на Neural Engine (виділений AI-прискорювач у iPhone від A11 Bionic і новіше). Модель вбудована в iOS, розпізнавання відбувається за мілісекунди на сторінку, вихідні дані зображення залишаються у пісочниці застосунку. Нічого не завантажується. Нічого не покидає телефон, поки застосунок явно не надішле розпізнаний текст або PDF.
Apple Vision OCR підтримує 50+ мов у 2026 році, включно з рукописним текстом для латиниці, кирилиці та кількох інших алфавітів. Точність на чистому друкованому тексті — у діапазоні 95–99% залежно від контрасту, роздільності та складності шрифту. ScanLens та Apple Notes Live Text працюють на цій основі.
Що означає «хмарний OCR» технічно
Хмарний OCR завантажує зображення документа по HTTPS на віддалений сервер — Adobe Document Cloud для Adobe Scan, Microsoft Azure для Microsoft Lens, інфраструктуру CamScanner для CamScanner або Google Cloud Vision / AWS Textract для інших застосунків. На сервері більша нейромережа (часто transformer-модель з мільярдами параметрів, що не вміщується на телефоні) обробляє зображення і повертає розпізнаний текст.
Сервер зазвичай кешує зображення і результат розпізнавання — іноді тимчасово, іноді назавжди — залежно від політики постачальника та застосовних законів про зберігання даних. Документ може проходити через CDN, балансувальники та системи логування до OCR-сервісу. Кожен з цих переходів — потенційна точка розкриття даних, навіть коли постачальник легітимний.
Точність: коли різниця реально важлива
Для чистого друкованого тексту стандартної роздільності (сторінка 8.5×11 дюймів, набрана на машинці чи лазерним друком) on-device і хмарний OCR дають еквівалентні результати у 2026 році. 10-річний розрив у точності OCR закрився — Apple Vision, Google ML Kit та аналогічні on-device системи тепер порівнянні з хмарними сервісами на звичайних документах.
Хмарний OCR усе ще лідирує у трьох конкретних випадках:
- Зіпсовані чи історичні скани. Чеки в каві, вицвілий термопапір, рукописи XIX століття та погано освітлені телефонні фотографії виграють від великих серверних моделей, навчених на більш різноманітних даних. Хмарний OCR Adobe Acrobat, наприклад, має заслужену репутацію витягувати читабельний текст із сканів, де on-device OCR пасує.
- Незвичні алфавіти чи шрифти. Курсив, готичний blackletter, вибагливі декоративні шрифти і мови зі складними лігатурами (арабська, деванагарі) іноді краще обробляються хмарними моделями, навченими на великих мультимовних датасетах.
- Витяг структурованих даних. Витяг структури таблиці з чека, ідентифікація полів рахунка, виділення рядків — усе це виграє від хмарних моделей із предметним навчанням. Microsoft Lens з експортом до Excel і Adobe Acrobat Liquid Mode — приклади.
Для решти 90% повсякденного сканування — податкові чеки, договори оренди, посвідчення, візитки, нотатки на зустрічах, сторінки підручників — on-device OCR хороший настільки, що різниця на практиці невидима.
Приватність: де перебуває документ — це важливо
Тут два підходи значуще розходяться.
З on-device OCR:
- Зображення документа обробляється у пісочниці застосунку на iPhone
- Мережевий запит для OCR не робиться
- Розробник застосунку не має доступу до вмісту документа
- Синхронізація з хмарою (якщо увімкнено) — окремий, опціональний крок, який ви контролюєте
З хмарним OCR:
- Зображення документа передається на сторонній сервер по HTTPS
- Сервер може кешувати, логувати чи зберігати зображення протягом різного часу за політикою постачальника
- Розробник застосунку та його хмарний постачальник технічно мають доступ до вмісту документа під час обробки
- Передача даних через CDN, балансувальники та системи логування створює додаткові поверхні розкриття
- Юридична юрисдикція сервера (США, ЄС, Китай) застосовується до вашого документа на час зберігання
Для публічних документів — скан меню ресторану, журнальної статті, роздаткового матеріалу з конференції — нічого з цього не має значення. Для приватних документів питання юрисдикції і зберігання реальне.
Комплаєнс: HIPAA, GDPR, GLBA і DLP-політики
Кілька регуляторних рамок ставляться до «де обробляються дані» як до суттєвого питання, а не декоративної деталі:
HIPAA (медицина у США)
За HIPAA будь-який сервіс, що обробляє Protected Health Information (PHI) від імені Covered Entity (лікарня, лікар, страховик), є Business Associate і має підписати Business Associate Agreement (BAA). Використання хмарного OCR-сервісу без BAA для сканування рецепта, результату аналізу чи медичного запису — порушення HIPAA. On-device OCR повністю обходить питання — третьої сторони, що обробляє дані, немає.
GDPR і UK GDPR (персональні дані ЄС/Великої Британії)
GDPR вимагає юридичної підстави для обробки персональних даних і явної згоди для певних типів чутливих категорій. Хмарний OCR створює обробника — постачальника OCR — який має дотримуватися GDPR через договір обробки. Для on-device OCR обробника немає. Документ залишається у суб'єкта даних. В Україні аналогічно діє Закон 2297-VI «Про захист персональних даних».
GLBA (фінанси у США)
Gramm-Leach-Bliley Act вимагає від фінансових установ захищати nonpublic personal information і оцінювати сторонніх провайдерів. Хмарний OCR — сторонній провайдер. On-device OCR — не сторонній.
DLP-політики підприємств
Data Loss Prevention у великих компаніях зазвичай блокує завантаження певних документів на зовнішні сервіси. On-device OCR дотримується цих політик за архітектурою — завантаження немає. Хмарний OCR може бути повністю заблокований корпоративним DLP.
Швидкість і офлайн
On-device OCR працює за 100–500 мілісекунд на сторінку. Хмарний OCR зазвичай займає 1–5 секунд при швидкому з'єднанні і значно довше у слабких мережах. Для пакетного сканування багатосторінкового документа різниця в латентності накопичується.
Офлайн — структурна перевага on-device. Apple Vision працює в режимі польоту, у польоті, у підвалі чи у будь-якому місці без сигналу. Хмарний OCR повністю непрацездатний без інтернету — зображення не можна завантажити.
Резюме
Для більшості повсякденних документів обидва підходи дають еквівалентний результат. Для конфіденційних документів, регульованих галузей чи офлайн-сценаріїв — on-device OCR вирішує фундаментальні структурні проблеми, які хмарний OCR не може. Якщо ваш типовий сканований документ — це меню ресторану, обирайте зручність. Якщо це медичний запис, податкова декларація чи контракт під NDA — обирайте архітектуру.
Хочете спробувати on-device OCR на iPhone? ScanLens OCR-застосунок працює на Apple Vision повністю на пристрої. Порівняння з хмарними альтернативами — на сторінці ScanLens vs CamScanner.