OCR (Optical Character Recognition, оптичне розпізнавання символів) — технологія, яка перетворює зображення тексту — фото сторінки, відсканований документ, скріншот — на машинно-читаний текст, доступний для пошуку, копіювання, редагування і повторного використання. OCR-застосунок для iPhone запускає це розпізнавання на мобільному пристрої, а не на комп’ютері або сервері, перетворюючи камеру на інструмент захвату тексту для чеків, договорів, візиток, сторінок підручників і рукописних нотаток. ScanLens виконує OCR на пристрої через Apple Vision і Neural Engine — документи не покидають iPhone у процесі розпізнавання.
Ця сторінка — про витягання тексту через OCR. Повний маршрут «зняти і зберегти» — на сторінці сканера документів для iPhone. Для OCR усередині PDF (невидимий текстовий шар) — сторінка пошукового PDF. Порівняння сканерів — на сторінці огляду PDF-сканера.
Коли ви скануєте документ, ScanLens запускає пайплайн розпізнавання тексту повністю на iPhone:
Уся OCR-обробка відбувається локально через Apple Neural Engine. Документи не покидають iPhone — повна приватність навіть для чутливих матеріалів.
OCR у ScanLens працює з великим набором мов і алфавітів — для міжнародних документів, академічних досліджень і багатомовних робочих процесів:
Для документів із кількома мовами — наприклад, англійський підручник із японськими анотаціями — ScanLens автоматично визначає й обробляє кожну мову без ручного налаштування.
ScanLens найкраще працює на чистих, добре освітлених друкованих документах і лишається корисним для багатьох рукописних нотаток і сторінок зі змішаним макетом. Якість OCR все одно залежить від вихідного матеріалу, тому коректніше описувати результати за умовами документа, а не вдавати, що кожна сторінка поводиться однаково.
Для рукописного тексту результат залежить від розбірливості й контрасту. Чіткий почерк часто підходить одразу, а неохайні чи щільно притиснуті нотатки радше потребуватимуть ручного перегляду.
Коли ScanLens витягнув текст із документів, ви можете:
OCR (Optical Character Recognition) перетворює зображення тексту на машинно-читаний текст. ScanLens аналізує макет сторінки, визначає текстові ділянки і перетворює їх на текст, по якому можна шукати і який можна виділяти — для повторного використання в PDF, нотатках та інших документах.
OCR у ScanLens підтримує понад 50 мов, зокрема українську, англійську, іспанську, французьку, німецьку, китайську (спрощену й традиційну), японську, корейську, арабську, іврит, російську й багато інших. Працює з латиницею і нелатинськими алфавітами та автоматично визначає кілька мов в одному документі.
Так, ScanLens розпізнає рукописний текст. Результат залежить від розбірливості, освітлення і якості скана — найкращі результати дають чіткий почерк і сильний контраст між чорнилом і папером.
Так, ScanLens вбудовує OCR-текст невидимо в PDF, роблячи їх повністю з пошуком. Візуальний вигляд не змінюється, але Ctrl+F (або Cmd+F) у будь-якому PDF-рідері знайде будь-яке слово чи фразу.
Так, усе розпізнавання відбувається локально на iPhone через Apple Neural Engine. Інтернет не потрібен, документи не покидають пристрій. Повна приватність навіть для чутливих документів.
Завантажте ScanLens безкоштовно і спробуйте OCR на пристрої. Повний набір функцій — на сторінці цін.