OCR(Optical Character Recognition、光学的文字認識)は、ページの写真、スキャンした書類、スクリーンショットなどの画像化された文字を、機械が読み取れるテキストへ変換する技術です。検索、コピー、編集、再利用ができるようになります。iPhone用OCRアプリは、この認識をパソコンやサーバーではなくモバイル端末上で実行し、カメラを領収書、契約書、名刺、教科書のページ、手書きメモなどのテキスト取り込みツールに変えます。ScanLensはApple VisionとNeural Engineを使ってデバイス内でOCRを実行するため、認識中に書類がiPhoneを離れることはありません。
このページはOCRによる文字抽出について解説します。「撮影と保存」までの流れ全体はiPhone用ドキュメントスキャナーのページを、PDF内のOCR(不可視のテキストレイヤー)は検索可能なPDFのページを、スキャナーの比較はPDFスキャナーの解説のページをご覧ください。
書類をスキャンすると、ScanLensは文字認識のパイプラインをすべてiPhone上で実行します:
OCR処理はすべてApple Neural Engineを使ってローカルで行われます。書類はiPhoneを離れません。機密性の高い資料でも完全なプライバシーを保てます。
ScanLensのOCRは多くの言語と文字体系に対応しており、国際的な書類、学術研究、多言語のワークフローで活用できます:
英語の教科書に日本語の注釈が入っているような複数言語の書類でも、ScanLensは各言語を自動検出して処理します。手動設定は不要です。
ScanLensは、明るく整った印刷書類で最も力を発揮し、多くの手書きメモやレイアウトが混在するページでも実用的です。OCRの品質は元の素材に左右されるため、すべてのページが同じように動くと装うのではなく、書類の状態ごとに結果を説明するのがフェアです。
手書き文字の場合、結果は読みやすさとコントラストに依存します。整った字はそのまま使えることが多く、雑な字や詰まったメモは目視確認が必要になりがちです。
ScanLensが書類からテキストを抽出すると、次のことができます:
OCR(Optical Character Recognition)は、テキストの画像を機械が読み取れるテキストに変換します。ScanLensはページレイアウトを解析し、テキスト領域を特定して、検索や選択ができるテキストへ変換します。これによりPDF、メモ、その他の書類で再利用できます。
ScanLensのOCRは50以上の言語に対応しています。英語、スペイン語、フランス語、ドイツ語、中国語(簡体字と繁体字)、日本語、韓国語、アラビア語、ヘブライ語、ロシア語など多数の言語に対応します。ラテン文字と非ラテン文字の両方に対応し、1つの書類に複数の言語があっても自動で検出します。
はい、ScanLensは手書き文字を認識します。結果は読みやすさ、照明、スキャン品質に依存します。読みやすい字とインクと紙のコントラストが強い場合に最良の結果になります。
はい、ScanLensはOCRテキストをPDFに不可視で埋め込み、完全に検索可能にします。見た目は変わりませんが、PDFリーダーでCtrl+F(またはCmd+F)を使えば任意の単語やフレーズを検索できます。
はい、すべての認識処理はApple Neural Engineを使ってiPhone上でローカルに行われます。インターネットは不要で、書類が端末を離れることもありません。機密性の高い書類でも完全なプライバシーを保てます。
ScanLensを無料でダウンロードしてオンデバイスOCRをお試しください。全機能の詳細は料金ページにあります。