本地 OCR 完全在您的 iPhone 上通过 Apple Neural Engine 完成文字识别 — 文档图像从不离开手机。云端 OCR 把图像上传到远程服务器,由识别模型返回提取的文字。2026 年,两种方法在清晰印刷文档上的精度相当。真正的区别是结构性的:文档处理时位于何处。这决定了您数据的隐私、合规、离线表现与司法管辖。
本文解释每种方法究竟在做什么,何时差异重要、何时不重要。
「本地 OCR」的技术含义
iPhone 上的本地 OCR 使用 Apple 的 Vision 框架 — 具体为 VNRecognizeTextRequest API — 在 Neural Engine(iPhone 自 A11 Bionic 起内置的专用 AI 加速器)上本地运行预训练的神经网络。模型内置于 iOS,识别每页耗时数百毫秒,原始图像数据保留在应用沙盒中。无任何上传。在应用明确发送识别后的文字或 PDF 之前,什么都不会离开手机。
2026 年 Apple Vision OCR 支持 50 多种语言,包括拉丁文、西里尔字母与若干其他文字的手写识别。中文方面,简体中文印刷文字的识别准确率与主流中文 OCR 服务持平。清晰印刷文字的准确率在 95%–99%,具体取决于对比度、分辨率与字体复杂度。ScanLens 与 Apple Notes 的 Live Text 都基于此。
「云端 OCR」的技术含义
云端 OCR 通过 HTTPS 把文档图像上传到远程服务器 — Adobe Scan 用 Adobe Document Cloud,Microsoft Lens 用 Azure,CamScanner 用其自有基础设施,其他应用可能用 Google Cloud Vision 或 AWS Textract。在服务器上,更大的神经网络(常常是几十亿参数的 transformer 模型,无法装入手机)处理图像并返回识别后的文本。
服务器通常会缓存图像与识别结果 — 时长视厂商政策与适用数据法律而定。文档可能在到达 OCR 服务前经过 CDN、负载均衡与日志系统。每个环节都是潜在的暴露点,即使服务商本身合规。
精度:差异何时真的重要
对常规分辨率的清晰印刷文本(A4、机打或激光打印的页面),2026 年本地 OCR 与云端 OCR 给出等同结果。十年前的精度差距已经填平 — Apple Vision、Google ML Kit 与同类本地系统在常规文档上已与云端服务持平。
云端 OCR 在三种情形下仍占优:
- 退化或历史扫描件。被咖啡浸过的小票、褪色的热敏纸、19 世纪的手稿、光线很差的手机照片,会得益于在更多样数据上训练的大型服务器模型。Adobe Acrobat 的云端 OCR 在本地 OCR 失败的扫描件上仍能拿出可读文字,这一点确有口碑。
- 生僻字体或文字。草书、哥特黑体、装饰花体,以及连字复杂的语言(阿拉伯语、天城文),有时云端在大型多语数据集上训练的模型表现更好。
- 结构化数据抽取。从发票中识别表格结构、从增值税普通发票中提取税额与项目、从表格中切出行 — 这些受益于带领域训练的云端模型。Microsoft Lens 的 Excel 导出与 Adobe Acrobat 的 Liquid Mode 是例子。
对其他 90% 的日常扫描 — 税务凭证、租赁合同、身份证、名片、会议笔记、教材页 — 本地 OCR 已经足够好,实务上看不到差异。
隐私:文档在哪里被处理很重要
这是两种方法显著分化的地方。
本地 OCR:
- 文档图像在 iPhone 的应用沙盒中处理
- OCR 不发起任何网络请求
- 应用开发者无法访问文档内容
- 云同步(若启用)是您可控的独立、可选步骤
云端 OCR:
- 文档图像通过 HTTPS 传输到第三方服务器
- 服务器可能按厂商政策缓存、记录或保留图像不同时长
- 应用开发者及其云提供商在处理过程中技术上可访问文档内容
- 经过 CDN、负载均衡、日志系统的传输形成额外暴露面
- 服务器所在司法管辖区(美国、欧盟、中国大陆)的法律,在保留期间适用于您的文档
对于公开内容 — 餐厅菜单、杂志文章、会议讲义 — 这些都不重要。对于敏感文档,管辖与保留是真实问题。
合规:PIPL、HIPAA、GDPR、企业 DLP 政策
多个监管框架把「数据在哪里被处理」视为关键问题:
PIPL 与 DSL(中国大陆)
《个人信息保护法》对处理敏感个人信息要求单独同意;《数据安全法》对重要数据有分级保护要求。云端 OCR 把文档传给第三方处理,需评估处理者的合规与安全。涉及跨境时,《个人信息保护法》第 38 条要求通过国家网信办的安全评估、取得专业机构认证或与境外接收方签订标准合同等路径。本地 OCR 没有第三方处理,跨境路径自然不适用。
HIPAA(美国医疗)
HIPAA 要求处理 Protected Health Information(PHI)的第三方与覆盖实体签订 BAA。多数消费级云端 OCR 服务不提供 BAA,在未签 BAA 情况下用云端 OCR 扫描处方、化验结果或病历构成 HIPAA 违规。本地 OCR 不存在第三方处理,无此风险。
GDPR / UK GDPR(欧盟/英国个人数据)
GDPR 要求个人数据处理具备合法依据,对部分敏感类别还需要明示同意。云端 OCR 创造了一个数据处理者(OCR 提供商),需通过 DPA 履行 GDPR。本地 OCR 没有处理者,文档留在数据主体手中。
企业 DLP 政策
大型企业的数据防泄露(DLP)通常会阻止特定文档上传到外部服务。本地 OCR 在架构上符合此类政策 — 没有上传。云端 OCR 可能直接被企业 DLP 阻断。
速度与离线
本地 OCR 每页 100–500 毫秒。云端 OCR 在快速连接下每页通常 1–5 秒,弱网更慢。批量扫描多页文档时,延迟差距会累加。
离线是本地 OCR 的结构优势。Apple Vision 在飞行模式、飞机上、地下室或任何无信号区域都能工作。云端 OCR 在没有网络时完全无法工作 — 图像无法上传。
小结
多数日常文档,两种方法效果等同。对敏感文档、受监管行业或离线场景,本地 OCR 解决了云端 OCR 无法解决的根本性结构问题。如果您日常扫描的多是餐厅菜单,选便利;如果是病历、纳税申报或带保密协议的合同,选架构。
想在 iPhone 上试本地 OCR?ScanLens OCR 应用完全基于 Apple Vision 在本地运行。与云端方案的对比详见 ScanLens vs CamScanner。