OCR技術

iPhoneで検索可能なPDF

スキャンしたPDFにOCRテキストレイヤーを追加して検索可能にします。テキスト検索、内容のコピー、元スキャンの見た目をそのまま保持。

テキスト検索内容のコピーレイアウト保持デバイス内OCR

こんな用途に最適：元のページのように見えながら、後で検索可能なテキストとして振る舞う必要のあるスキャン契約書、領収書、文書、アーカイブに。

検索可能なPDFとは？通常のスキャンとの違い

検索可能なPDFとは、スキャンされた各ページの上に見えないOCR（文字認識）レイヤーが埋め込まれたPDFファイルです。ページは元のスキャンと同じに見えますが、ファイル内ではどのPDFリーダーでも検索が機能します — Cmd+Fで単語を見つけ、文をハイライト・コピーし、アーカイブや表のためにテキストを抽出できます。通常のスキャンPDFはページ画像のみを含み、検索もコピーもできません。

ScanLensはApple Vision frameworkでデバイス内OCRを実行し、書き出し前に各ページ画像の背後に認識テキストを埋め込んで検索可能なPDFを作成します。OCRレイヤーはPDF内に残るので、文書はどのOSでも、どのPDFリーダーでも、何年も検索可能なまま保たれます。

PDF以外の任意の画像や写真からのより広範なテキスト抽出はiPhone用OCRアプリを参照してください。スキャンからPDFへの完全なシナリオはPDFスキャナーから始めてください。検索可能PDF作成後の典型的な次ステップ：iPhoneで複数のPDFを結合、長いPDFを分割、契約書に署名。

見えないテキストレイヤーの正体

検索可能なPDFは、各ページに2つのレイヤーが重なっていると考えてください。上に乗っているのがページの画像 — 紙にあったとおりの、キャプチャしたスキャンそのものです。その下にあるのがテキストレイヤーです。OCRエンジンが認識したすべての単語が、画像内の対応する単語と同じ座標に、見えないフォントで配置されています。あなたには絵だけが見え、ソフトウェアにはその背後の単語が見えます。

この位置決めがすべての鍵です。認識された各単語がスキャン上の出現箇所に固定されているため、テキストを選択すると画像の正しい部分がハイライトされ、検索すると正しいページの正しい場所に飛びます。見えないフォントは不透明度ゼロなので、文書の見た目や印刷結果を一切変えません — ページは通常のスキャンとピクセル単位で同一のままです。変わったのは、ファイルが今やテキストの画像だけでなく、テキストそのものを含んでいるという点です。

ScanLensはこのレイヤーを書き出し時に構築します。Apple Vision frameworkがデバイス内でテキストを認識した後、ScanLensは各単語とその境界ボックスをページ画像の背後のPDFに書き込みます。そこから先、テキストはファイル内を移動します — PDFをMacやPCにコピーし、何年も後に任意のリーダーで開いても、検索可能なテキストはそのまま残り、ScanLensやインターネット接続に依存しません。これは文書そのものに焼き込まれた、標準的なPDFの機能です。

フラットなスキャンPDF vs OCR済み検索可能PDF — 見分け方

この2つのファイルは画面上では同一に見えることがあり、まさにそれが人を惑わせる原因です。フラットなスキャンPDFは画像のみ — 中にテキストのないページ画像の束です。検索も文の選択もできず、ファイルをインデックス化するスマホやデスクトップも、ページに何が書かれているかではなく、ファイル名でしか見つけられません。これはほとんどの基本的なスキャンアプリ、iOSのカメラの書類スキャン、あるいはOCRをオフにしたコピー機の「PDFにスキャン」で得られるものです。

OCR済みの検索可能PDFは同じに見えますが、上で説明した見えないテキストレイヤーを備えています。検索でその中の単語が見つかり、選択・コピーができ、OSはその全内容をインデックス化できます。見た目のページは変わりません。違いはすべて、ファイルに何ができるかにあります。

どちらを手にしているか見分けるには、PDFを開いて単語を選択してみてください — 行をなぞるか、長押しします。個々の単語がハイライトされるなら、テキストレイヤーがあり、ファイルは検索可能です。ページ全体が1つのブロックとして選択される、または何も選択されないなら、フラットな画像のみのスキャンです。もう1つの簡単なテストは検索です：「検索」を開き、ページにはっきり見える単語を探します。フラットなスキャンは一致なしを返します。そのページをScanLensに通すとレイヤーが追加され、両方のテストが通るようになります。

検索可能PDFの技術的な仕組み

OCRによる文字認識

ScanLensはApple Vision frameworkでデバイス内文字認識を行います。OCRレイヤーは日本語を含む14言語で単語、数字、文書構造を認識でき、処理はiPhone内で完結します。

テキストレイヤーの位置決め

認識されたテキストはスキャン画像の真後ろに正確に配置されます。各単語の位置は視覚的な場所と一致します。テキストを選択すると、対応する画像領域を選択範囲がカバーします。

デバイス内処理

すべてのOCRはiPhone上でローカルに行われます。処理中、文書は端末を離れません。これにより機微な文書のプライバシーが確保され、インターネットなしでも動作します。

検索可能PDFのメリット

テキストを瞬時に検索

Ctrl+F（Macではcommand+F）で文書内の任意の単語を見つけられます。契約書の特定条項や領収書の数字を探してページをめくる必要はもうありません。検索が瞬時に見つけます。

テキストの選択とコピー

クリックしてドラッグしてテキストを選択し、クリップボードにコピーします。メール、文書、表計算に貼り付けます。引用を抽出、住所をコピー、電話番号を取得 — 再入力なしで。

文書の全文検索

MacのSpotlightとWindowsの検索は、検索可能PDFをインデックス化できます。ファイル名だけでなく内容で文書を見つけられます。「請求書 2024年3月」で検索すれば、該当するすべての文書が見つかります。

文書管理システム

SharePoint、Google Drive、Dropboxなどの企業システムは検索可能PDFをインデックス化できます。社内検索でスキャンされた文書もネイティブファイルと並んで関連結果として返されます。

アクセシビリティ

スクリーンリーダーは検索可能PDFを読み上げできます。テキストレイヤーは視覚障害のあるユーザーにアクセシブルなコンテンツを提供します。アクセシビリティ要件への対応が可能になります。

変わるもの

通常のPDF vs 検索可能なPDF

ページの画像は変わりません。変わるのは、スキャン後にファイルでできること：検索、選択、コピー、インデックス化、適切なアーカイブです。

機能	通常のスキャンPDF	検索可能なPDF
見た目	スキャン画像	同一（変化なし）
テキスト検索（Ctrl+F）	不可	完全対応
テキスト選択	不可	完全対応
テキストのコピペ	不可	完全対応
OS検索のインデックス	ファイル名のみ	内容がインデックス化
スクリーンリーダー対応	画像のみ	テキストへ完全アクセス
ファイルサイズ	小さい	わずかに大きい（+5〜15%）

唯一のトレードオフは、テキストレイヤー保管のためのわずかなサイズ増加です。ほとんどの文書で+5〜15% — 大きな機能向上に対する小さな代償です。

テキストレイヤーが活きる場面：Spotlight、ファイル、iCloud

検索可能なPDFの本当の価値は、作成したその瞬間ではありません — 半年後、その中の何かを見つける必要が出たときにあります。iPhone上でも、Appleエコシステム全体でも、見えないテキストレイヤーはあなたがすでに使っている検索ツールに組み込まれます。

Spotlight検索

iOSのSpotlight — ホーム画面で下にスワイプして開く検索 — は、PDFの名前だけでなく、端末に保存されたPDFの内容をインデックス化します。スキャンがテキストレイヤーを備えていれば、文書内のフレーズを入力するだけでその文書を直接表示できます。ファイルに何という名前を付けたか忘れてしまっていても大丈夫です。レイヤーがなければ、Spotlightは読むものがなく、ファイル名でしか一致させられません。

「ファイル」アプリ

検索可能なPDFを「ファイル」アプリに保存すると、「ファイル」の検索バーから内容で見つけられるようになります。これが最も効いてくるのがアーカイブです。スキャンした領収書や契約書のフォルダが、見た目の同じページサムネイルの壁を1つずつ開いていく代わりに、クエリできるテキストの集合体になります。

iCloud Driveと他のデバイス

テキストレイヤーはファイル内に存在するため、ファイルが行く先どこへでも一緒に移動します。検索可能なPDFをiCloud Driveに入れれば、iPadやMacでも検索可能になります — MacのSpotlightとiPadの「ファイル」アプリは、同じ埋め込みテキストを読み取ります。認識はiPhone上でデバイス内で一度だけ行われ、その後は検索可能性が文書のどこへでも付いて回ります。Dropbox、Google Drive、SharePointといったサードパーティのシステムも、同じように埋め込みテキストをインデックス化します。

言語カバレッジ

検索可能PDFの対応言語

多言語アーカイブでは、言語のサポートはOCR速度と同じくらい重要です。現在のカバレッジを文字体系別にグループ化しています。

言語グループ	言語
東アジア	日本語、中国語（簡体字）、韓国語
西欧	英語、ドイツ語、フランス語、スペイン語、イタリア語、ポルトガル語、オランダ語
東欧	ポーランド語、チェコ語
キリル文字	ロシア語、ウクライナ語、ブルガリア語
中東	アラビア語、ヘブライ語

多言語文書も問題ありません — OCRエンジンは複数言語のページを処理します。日本語と英語の専門用語が混ざる技術文書（日本のIT文書では典型的）も正しく認識されます。

検索可能PDFの活用シナリオ

法務文書のアーカイブ

契約書、合意書、訴訟書類 — すべて検索可能に。何百もの文書から特定の条項を見つけます。全文検索で法務調査が管理可能になります。

領収書と請求書の管理

取引先、金額、日付で領収書を検索します。確定申告の準備が容易に — ファイル名を推測するのではなく、内容検索で対象経費を見つけられます。

研究と学術論文

教科書や論文を検索可能PDFにスキャンします。引用を見つけ、相互参照し、参考文献を集める — すべてテキスト検索で。

医療記録

診断、薬剤、医師で患者記録を検索します。臨床スタッフは関連する病歴を素早く見つけられます。検索可能アーカイブから法令対応レポートも作成できます。

歴史的文書のデジタル化

古い紙のアーカイブを検索可能なデジタル形式に変換します。家系図記録、ビジネスアーカイブ、歴史的文書 — すべてアクセス可能で検索可能になります。

スキャンを検索可能にする本当の理由：あとで見つけるため

検索可能なPDFが真価を発揮するのは、スキャンした瞬間ではなく、時間が経ってからです。テキストレイヤーがわずかなファイルサイズ増に見合う理由を、3つの場面が示します。

使える状態を保つアーカイブ

フラットなスキャンが増え続けるアーカイブは、いつの間にか役に立たなくなります。100枚の領収書はサムネイルではどれも同じに見え、1枚を見つけるには順番に開いていくしかありません。ファイルに保存するときに各スキャンを検索可能にしておけば、どれだけ大きくなっても、アーカイブはクエリできるテキストの集合体のまま保たれます — 取引先、金額、案件番号で。保存時にOCRをかけることが、長期アーカイブをデジタルの「靴箱」にしないための鍵です。

法務調査と文書レビュー

ある案件で、特定の氏名・日付・用語に言及するページを数千ページの中から洗い出す必要があるとき、全文検索は数時間と数分の差を生みます — すべてのページを読む代わりに、文書セット全体に検索をかけられます。ScanLensはOCRをデバイス内で行うため、秘匿特権のある資料を外部サービスにアップロードすることなく検索可能にできます。

数か月後に1つの条項を見つける

賃貸契約や契約書に署名し、スキャンをファイルに保存して、細部は忘れます。数か月後に疑問が出てきます — 解約予告期間、更新日、特定の義務。検索可能なPDFならファイルを開いて単語を検索し、数秒で正確な条項にたどり着けます。フラットなスキャンではスクロールして目を凝らすことになります。ぼんやりとしか覚えていない文書から1行を探す未来のあなた自身こそ、テキストレイヤーが想定する日常的な使い方です。

よくある質問

検索可能なPDFとは？

検索可能なPDFは、OCR（光学文字認識）で作成された見えないテキストレイヤーを含みます。文書は通常のスキャンのように見えますが、Ctrl+Fでテキストを検索したり、内容を選択・コピーしたり、システム検索で文書ライブラリを横断検索したりできます。

検索可能PDFは文書の見た目を変えますか？

いいえ、見た目は通常のスキャンPDFと同一のままです。OCRレイヤーは完全に見えません — スキャン画像の真後ろに配置されています。テキストの検索、選択、コピーをするときだけ気付きます。

検索可能PDFはどんな言語に対応していますか？

ScanLensのOCRは日本語を含む14言語に対応します。日本語は安定して認識されます。多言語文書（日本語と英語の混在は典型例）は自動で処理されます。

どのPDFリーダーでもテキストを検索できますか？

はい、検索可能PDFはあらゆる標準的なリーダーで動作します。Adobe Acrobat、Apple プレビュー、Chrome内蔵PDFビューア、Microsoft Edge、すべてのモバイルPDFアプリで検索可能PDFのテキスト検索とハイライトができます。特別なソフトは不要です。

検索可能PDFはどれくらい大きくなりますか？

テキストレイヤーは通常ファイルサイズに5〜15%追加します（テキスト量による）。1 MBのスキャンはテキストレイヤー付きで1.1 MBになるかもしれません。得られる機能は、通常このわずかなサイズ増加に見合います。