Apple 在 2017 年的 iOS 11 中把文档扫描器放进了备忘录 App,到 iOS 13 又扩展到了文件 App。实况文本(Live Text)——对任意照片或扫描件点选即可复制的文字识别——在近年的 iOS 中登场,如今在 iOS 18 上覆盖 15 种以上语言。内置工具很好用,安静地、出乎意料地好用。普通人一年里遇到的扫描任务,大约有 70% 用开箱即用的 iPhone 就够了。
本文是一个常被问到的问题的诚实版本:我到底需不需要一个扫描 App,还是 iPhone 内置的就行? 文章会逐一说明内置工具真正能做到什么、在哪里力有不逮、哪具体 30% 的任务能从专用 App 受益,以及安装之前值得核对的标准。
iPhone 免费给你的东西
值得把 iPhone 已经能做的事说清楚,因为答案随着每个 iOS 版本明显变好。与文档扫描相关的内置能力有四项:
备忘录扫描器
打开备忘录 App,点按备忘录里的相机图标,选择扫描文稿。相机取景框会自动检测页面边缘,在页面稳定时拍摄,应用透视校正把扫描件展平,并让你把多页叠成一份多页文档。输出模式包括彩色、灰度、黑白,以及一个保留原始颜色、不做增强的「照片」模式。结果以多页 PDF 的形式保存在备忘录中,可通过 iOS 共享菜单分享、邮寄或导出。
文件扫描器
文件 App 使用相同的扫描引擎,但置身于一个文档 App 的体验中。在任意文件夹中长按,点按扫描文稿,按上面的方式拍摄,生成的 PDF 会直接落入该文件夹——本地、iCloud 云盘,或已连接的第三方提供方(Dropbox、Google Drive、Box)。对于已经在文件而非备忘录中整理文件的人,这是更自然的流程。
实况文本(Live Text)
实况文本(Live Text)能识别任意照片或扫描图像中的文字。在照片里长按,拖动选择文字,然后复制、查询、翻译或分享。在 iOS 18 上,实况文本可靠支持约 15 种语言,并通过 Apple Vision 框架完全在设备上运行。它适用于图库中的照片、截图、备忘录中的扫描文档以及实时相机取景框。这是 iPhone 在没有专用 App 的情况下最接近真正 OCR 体验的功能。
相机的二维码扫描
相机 App 自 iOS 11 起就能扫描二维码。把相机对准它,出现一个通知横幅,点按即可。与文档工作流程无关,但为求完整一并提及。
诚实的评估:这些内置工具不花一分钱,无需安装、无需账户、无需做隐私抉择,并与 iCloud 及 iOS 的其余部分干净地整合。对于每周扫描一份文档的人——报销用的收据、要邮寄的租房合同、要寄回的学校表格——它们确实够用。没有理由再装别的东西。
内置扫描器力有不逮之处
当扫描成为一项反复出现的任务、当文档使用实况文本不擅长的语言、或当输出需要是基本 PDF 以外的东西时,这条界线就会移动。日常使用中冒出来的具体空缺:
- 语言覆盖。实况文本在 iOS 18 上可靠支持约 15 种语言。为其提供支持的 Apple Vision 框架支持 50 多种——但第三方 App 必须自行附带这份更广的语言列表。如果你扫描波兰语、土耳其语、希伯来语、希腊语、阿拉伯语、印地语或另外十几种语言的文档,实况文本往往是死胡同,而专用 App 能处理。
- 输出格式。内置扫描器只导出 PDF。没有 JPG 或 PNG 的批量导出,没有直接的 .docx 转换,没有把识别文字提取为 .txt。你可以对扫描件截图来得到 JPG,但那是一种变通。
- 没有集成的电子签名流程。从备忘录导出后,你可以通过标记给 PDF 签名——但那是多步骤过程,签名存放在标记库里,而不在扫描器内。
- 没有密码保护。备忘录可以锁定单条备忘录,但导出的 PDF 本身没有密码、没有加密。如果你邮寄一份扫描的纳税申报表,接收方网络上能接触到那封邮件的任何人,都拿到了这份未加保护的 PDF。
- 没有可搜索 PDF(OCR 文字层)。这一点微妙却重要。实况文本让你点选备忘录扫描件中的文字,但导出的 PDF 不含真正的 OCR 文字层。该文件在 Spotlight、在文件、在任何后续 PDF 阅读器中都不可搜索。来自专用 App 的真正的 OCR 版 PDF 终生可搜索。
- 没有面向大批量的批量采集。备忘录每次拍一页,并带一个确认步骤。没有专用 App 为律师助理、理赔查勘员、销售代表一口气扫描一摞文件而提供的「先拍完所有页,再排序和编辑」的快速模式。
- 对文件命名或整理没有精细控制。备忘录默认生成「已扫描的文稿.pdf」。重命名需要在文件中先分享再改名。没有扫描时命名、没有模板、没有自动分发到文件夹。
- 除彩色/黑白外没有模式切换。专用 App 为白板(自动纠偏并提升对比度)、证件(正反面合并到一页)、名片(按名片比例自动裁剪)和条形码提供专门模式。内置工具有彩色、灰度、黑白和照片——有用,但不专门。
- 对共享文件没有水印控制。对内置扫描器不是问题(它不添加水印),但相对于某些付费的专用 App,值得作为一个空缺指出。
这些都不是灾难。每一个都是一点小摩擦。值得越过的门槛,是当这些小摩擦在一个你每周或每天都要走的工作流程中叠加起来的时候。
能从专用 App 受益的那 30% 任务
上述空缺会变成真实成本的具体类别:
多语言文档
外文合同、学术论文、移民材料、翻译往来文件。如果文档使用实况文本不覆盖的语言,用备忘录扫描虽能采集图像,却得不到可用的文字。一个具备 Apple Vision(或更广)50 多种语言 OCR 完整覆盖的专用 App,从第一次扫描就返回可选取、可搜索的文字。
高批量的专业工作
在展会上采集二十张名片的销售代表。把证据卷宗数字化的律师助理。记录一起小追尾的理赔查勘员。扫描三十块设备铭牌的现场技术人员。备忘录(每次一页并需确认)与专用 App(连续采集、之后再编辑)之间的采集速度差异,就是好用工具和难以忍受工具之间的差异。
已签名 PDF 与文档工作流程
扫描-填写-签名-发送对许多小企业、自由职业者和承包商来说是一个完整工作流程。一个把采集、电子签名和邮件集成进单一流程的专用 App,比备忘录-再标记-再邮件的来回折腾明显更快。
隐私敏感材料
病历、化验结果、法律往来文件、财务对账单、移民文件、人事材料。内置扫描器尊重隐私(一切都留在设备上或 iCloud 中),但对导出的文件不提供密码保护。当文档要前往你自己的 iCloud 之外的任何地方时,一个具备设备端加密和逐文件密码的专用 App 才是对的工具。
注意:如果你扫描敏感材料,云端 OCR 的问题比专用还是内置的问题更重要。请看CamScanner 安全吗?,作为免费云端 OCR App 如何引入备忘录和注重隐私的专用 App 都不会引入的风险的例子。
长篇扫描
书籍章节、杂志合订、多卷法律卷宗、学习笔记。任何超过约 20 页的内容在备忘录里都会变得痛苦,因为没有扫描内重排、没有在此插入、没有替换此页。专用 App 的「先采集再编辑」模式正是为此而生。
跨格式工作
PDF 转 Word、PDF 转一批 JPG、扫描文字转纯 .txt 文件、仅图像 PDF 转完全可搜索的 PDF。内置扫描器只输出一种格式,仅此而已。
选专用 App 时该看什么
如果上述用例与你真实使用手机的方式相符,下一个问题就是选哪个专用 App。在安装任何东西之前,值得核对:
- 设备端 OCR 还是云端 OCR。这是最重要的单一架构问题。设备端 OCR(Apple Vision 框架、Google ML Kit)在 iPhone 本机处理文档;什么都不上传。云端 OCR 把图像发送到远程服务器。对隐私、离线和合规的影响并不微妙——在设备端 OCR 与云端 OCR 中有深入讨论。
- 是否强制账户。许多免费扫描 App 在让你保存扫描件之前,要求邮箱注册或社交登录。那个邮箱会变成一份营销名单。一个真正注重隐私的 App,应当让你扫描、做 OCR 和导出,全程无需创建账户。
- 订阅还是一次性付费。大多数专用扫描 App 收取按月或按年的订阅费。少数提供一次性的终身方案,给更愿意一次付清的用户。两种模式都正当;问题在于哪种符合你真实使用工具的方式。如果你大量使用云端功能,订阅价更合理;如果你主要使用本地的扫描加 OCR 循环,一次性付费更合理。
- OCR 语言数量——用你的文档实测。「支持 50 多种语言」是一种营销说法。真正的检验是:拿三份你真正会扫描的文档,在试用版里跑 OCR,核对准确度。有些 App 会列出它们几乎处理不了的语言。
- 批量功能。连续采集、采集后重排、批量增强、批量导出。App 要么有,要么没有。
- 导出格式范围。PDF、可搜索 PDF、JPG、PNG、TXT、.docx、.xlsx(用于表格数据)。你越需要跨格式,空缺就越大。
- 与 iOS 共享菜单的整合。一个做得好的扫描 App 应当出现在共享菜单里,让你把扫描件直接发送到邮件、信息、文件或任意第三方 App,而无需手动先导出再导入。
- 免费档的水印。有些免费档会给每一份导出的 PDF 加水印,如果在你投入这套工作流程之前没有披露,那就有点不厚道。安装前先确认。
- 离线行为。如果你在飞机上、地下室或信号时断时续的区域扫描,请确认 App 在没有网络时也能完成采集和 OCR。需要留意的具体故障情形见iPhone 离线扫描 App。
- 实况文本还是整篇文档 OCR。有些 App 本质上只是实况文本的一层外壳——它们拍一张照片,让你点选文字,却不生成可搜索 PDF。区别见在 iPhone 上从照片扫描文字。
一棵诚实的决策树
归结为真正要紧的情形:
- 每周一两次扫描、中文文字、只需要一个 PDF → 备忘录或文件就够了。装专用 App 是杀鸡用牛刀。
- 多语言文档、多页项目、电子签名、结构化工作流程 → 一个专用扫描 App 物有所值。
- 隐私具体地重要(医疗、法律、财务) → 寻找设备端 OCR、不强制账户和逐文件密码保护。内置扫描器是私密的,但不提供文件级加密;注重隐私的专用 App 填补了这个空缺。
- 你经常离线扫描 → 内置可用;具备设备端 OCR 的专用 App 也可用。无论品牌如何,都要避开云端 OCR 的 App。
- 大批量、批量采集、专业工作流程 → 内置很快成为瓶颈。专用 App 才是正确选择。
关于 ScanLens 的说明
为求完整:ScanLens 是符合上文所列专用 App 标准的若干 App 之一。它通过 Apple Vision 框架以 50 多种语言进行设备端 OCR,扫描或导出无需账户,提供终身方案作为订阅的替代,并支持批量采集、电子签名、密码保护和可搜索 PDF 导出。它不是唯一符合这些标准的 App——Adobe Scan、Microsoft Lens、Scanner Pro 等占据同一张地图上的不同位置(直接对比见扫描 App 对比)。本文的目的不是为某个具体 App 站台,而是诚实地说明内置扫描器何时真正够用、何时不够。
结论
iPhone 内置扫描器不是「真正」扫描 App 功能的缩水预览。它是一个称职的、设备端的、尊重隐私的工具,把日常情形处理得很好。在过去八个 iOS 版本里,Apple 在备忘录、文件和实况文本上认真投入,这一点看得出来。如果你没有一个会让内置工具明显崩掉的反复出现的扫描工作流程,就省下安装和订阅的开销吧。
如果你确实有一个会崩掉的工作流程——而你现在已经有了一份它具体长什么样的清单——那么专用 App 才是正确选择。上面的标准就是在安装任何东西之前值得核对的:设备端 OCR、无需账户、诚实的语言覆盖、合理的定价、真正的批量功能。专用扫描 App 大多数的失败,源于跳过了这份清单,而不是因为内置扫描器悄悄比宣传得更好。
延伸阅读
- 设备端 OCR 与云端 OCR — App Store 上每一个扫描 App 背后的隐私与架构问题
- CamScanner 安全吗? — 为什么「免费」扫描 App 值得多看一眼的实际例子
- iPhone 文档扫描器 — 覆盖专用 App 完整功能集的能力页面
- 在 iPhone 上从照片扫描文字 — 实况文本能替代什么、不能替代什么
- iPhone 离线扫描 App — 「支持离线」在实践中究竟意味着什么