El OCR en el dispositivo ejecuta el reconocimiento de texto íntegramente en tu iPhone mediante el Apple Neural Engine: la imagen del documento nunca sale del teléfono. El OCR en la nube sube la imagen a un servidor remoto, donde un modelo de reconocimiento devuelve el texto extraído. Ambos enfoques ofrecen una precisión comparable con documentos impresos limpios en 2026. La diferencia real es estructural: dónde está el documento durante el procesado. Eso determina la privacidad, el cumplimiento normativo, el comportamiento offline y la jurisdicción legal de tus datos.
Este artículo explica qué hace exactamente cada enfoque, cuándo importa la diferencia y cuándo no.
Qué significa técnicamente «OCR en el dispositivo»
En iPhone, el OCR on-device usa el framework Vision de Apple —en concreto la API VNRecognizeTextRequest— que ejecuta una red neuronal preentrenada localmente en el Neural Engine (el acelerador de IA dedicado en los iPhone desde el A11 Bionic). El modelo está integrado en iOS, el reconocimiento ocurre en milisegundos por página y los datos brutos de la imagen permanecen en la sandbox de la app. No se sube nada. Nada sale del teléfono mientras la app no envíe explícitamente el texto reconocido o el PDF.
El OCR de Apple Vision soporta más de 50 idiomas en 2026, incluido el reconocimiento manuscrito en alfabeto latino, cirílico y varios otros. La precisión sobre texto impreso limpio se sitúa en el rango del 95-99 %, según el contraste, la resolución y la complejidad de la tipografía. ScanLens y Live Text de Apple Notes funcionan sobre esta base.
Qué significa técnicamente «OCR en la nube»
El OCR en la nube sube la imagen del documento por HTTPS a un servidor remoto: Adobe Document Cloud para Adobe Scan, Microsoft Azure para Microsoft Lens, la infraestructura de CamScanner para CamScanner, o Google Cloud Vision / AWS Textract para otras apps. En el servidor, una red neuronal mayor (a menudo un modelo transformer con miles de millones de parámetros que no cabe en el teléfono) procesa la imagen y devuelve el texto reconocido.
El servidor suele cachear la imagen y el resultado del reconocimiento —a veces de forma temporal, a veces permanente— según la política del proveedor y las leyes de retención aplicables. El documento puede pasar por CDN, balanceadores y sistemas de logging antes de llegar al servicio de OCR. Cada uno de esos saltos es un punto potencial de exposición de datos, incluso cuando el proveedor es legítimo.
Precisión: cuándo importa de verdad la diferencia
Para texto impreso limpio a resolución estándar (página A4 mecanografiada o impresa en láser), el OCR on-device y el OCR en la nube dan resultados equivalentes en 2026. La brecha de precisión de hace una década se ha cerrado: Apple Vision, Google ML Kit y sistemas on-device equivalentes están ya a la altura de los servicios en la nube en documentos corrientes.
El OCR en la nube sigue por delante en tres casos concretos:
- Escaneos dañados o históricos. Tiques con manchas de café, papel térmico desvaído, manuscritos del siglo XIX y fotografías de móvil mal iluminadas se benefician de modelos de servidor más grandes, entrenados con datos más variados. El OCR en la nube de Adobe Acrobat, por ejemplo, tiene fama merecida de rescatar texto legible de escaneos donde el on-device se rinde.
- Alfabetos o tipografías inusuales. Cursiva, blackletter gótico, tipografías decorativas ornamentales y lenguas con ligaduras complejas (árabe, devanagari) a veces los procesan mejor los modelos en la nube, entrenados con datasets multilingües enormes.
- Extracción de datos estructurados. Extraer la estructura de una tabla de un tique, identificar campos de una factura, separar líneas de detalle: todo ello se beneficia de modelos en la nube con entrenamiento de dominio. Microsoft Lens con exportación a Excel y el Liquid Mode de Adobe Acrobat son ejemplos.
Para el otro 90 % del escaneo cotidiano —tiques fiscales, contratos de alquiler, identificaciones, tarjetas de visita, notas de reuniones, páginas de manuales— el OCR on-device es lo bastante bueno como para que la diferencia sea, en la práctica, invisible.
Privacidad: dónde está el documento sí importa
Aquí ambos enfoques se separan de forma significativa.
Con OCR en el dispositivo:
- La imagen del documento se procesa en la sandbox de la app, en el iPhone
- No se hace ninguna petición de red para el OCR
- El desarrollador de la app no tiene acceso al contenido del documento
- La sincronización en la nube (si está activada) es un paso aparte, opcional, que tú controlas
Con OCR en la nube:
- La imagen del documento se transmite por HTTPS a un servidor de terceros
- El servidor puede cachear, registrar o conservar la imagen durante distintos periodos según la política del proveedor
- El desarrollador de la app y su proveedor en la nube tienen, técnicamente, acceso al contenido del documento durante el procesado
- El paso por CDN, balanceadores y sistemas de logging crea superficies adicionales de exposición
- La jurisdicción legal del servidor (UE, EE. UU., China) se aplica a tu documento mientras esté almacenado
Para documentos públicos —el escaneo del menú de un restaurante, un artículo de revista, un dosier de una conferencia— nada de esto importa. Para documentos privados, las cuestiones de jurisdicción y retención son reales.
Cumplimiento: RGPD, LOPDGDD, HIPAA y políticas de DLP
Varios marcos regulatorios tratan el «dónde se procesan los datos» como una cuestión sustantiva, no como un detalle decorativo:
RGPD y LOPDGDD (datos personales en la UE/España)
El RGPD exige una base jurídica para tratar datos personales y consentimiento explícito para ciertas categorías sensibles. El OCR en la nube convierte al proveedor en encargado del tratamiento, que debe cumplir el RGPD mediante un contrato de encargo. Si los servidores están fuera del EEE, hay además una transferencia internacional con sus propios requisitos. Con OCR en el dispositivo no hay encargado: el documento se queda con el responsable. La AEPD ha venido recordando que los tratamientos en sectores regulados (sanidad, abogacía, banca) requieren especial cuidado al elegir proveedores en la nube.
HIPAA (sanidad en EE. UU.)
HIPAA exige que cualquier servicio que procese Protected Health Information por cuenta de una entidad cubierta firme un Business Associate Agreement (BAA). La mayoría de los servicios de OCR en la nube de consumo no ofrecen BAA. El OCR on-device evita por completo el problema: no hay tercero procesando los datos.
GLBA (finanzas en EE. UU.)
La Gramm-Leach-Bliley Act obliga a las entidades financieras a proteger la información personal no pública y a evaluar a sus proveedores externos. El OCR en la nube es un proveedor externo. El OCR on-device, no.
Políticas DLP corporativas
Los sistemas de Data Loss Prevention de las grandes empresas suelen bloquear la subida de determinados documentos a servicios externos. El OCR on-device cumple esas políticas por arquitectura: no hay subida. El OCR en la nube puede quedar totalmente bloqueado por el DLP corporativo.
Velocidad y modo offline
El OCR on-device tarda entre 100 y 500 milisegundos por página. El OCR en la nube suele tardar 1-5 segundos con buena conexión y bastante más en redes débiles. En el escaneo por lotes de un documento de varias páginas, la diferencia de latencia se acumula.
El modo offline es una ventaja estructural del on-device. Apple Vision funciona en modo avión, en un vuelo, en un sótano o en cualquier sitio sin cobertura. El OCR en la nube no funciona sin internet: no se puede subir la imagen.
Resumen
Para la mayoría de documentos cotidianos, los dos enfoques dan un resultado equivalente. Para documentos confidenciales, sectores regulados o escenarios offline, el OCR on-device resuelve problemas estructurales que el OCR en la nube no puede resolver. Si tu documento típico es un menú de restaurante, elige la comodidad. Si es un historial médico, una declaración de la renta o un contrato bajo NDA, elige la arquitectura.
¿Quieres probar el OCR on-device en iPhone? La app de OCR de ScanLens funciona sobre Apple Vision, íntegramente en el dispositivo. La comparación con alternativas en la nube está en ScanLens vs CamScanner.