910 22 01 42 (Madrid) / 934 09 32 60 (Barcelona)
910 22 01 42 (Madrid) / 934 09 32 60 (Barcelona)
info@reprise.es

¿Qué es el OCR?

El OCR consiste en una tecnología que intenta emular la capacidad del ojo humano en el reconocimiento de objetos.

Es una tecnología que le permite convertir diferentes tipos de documentos, tales como documentos en papel escaneados, archivos de PDF o imágenes captadas por una cámara digital en los datos editables y con opción de búsqueda.

Es decir, todo documento que sea escaneado, o bien que se le pase OCR me permitirá poder buscar palabras dentro del mismo.

¿Qué tipos de OCR existen?

INDEXACIÓN FULLTEXT:

Se indexa TODO el contenido, para poder realizar búsquedas por cada palabra o dato que forma parte del documento.

OCR ZONAL:

Funciona por plantillas, creando una para cada documento. El sistema busca los datos, pero a priori le marcamos un sitio aproximado. Cada vez que se escanea el documento, busca automáticamente entre las plantillas, para ver si coincide la estructura de datos con alguna de las plantillas existentes.

Los documentos en los que no se ha podido reconocer los datos van a un apartado de “no encatrados” en el que se permite la extracción manual.

El sistema aprende: Por lo que si una plantilla da el mismo error varias veces y lo corregimos a la 2º o 3º vez se hará automáticamente.

IOCR U OCR INTELIGENTE:

No necesita plantillas, se genera una lista de palabras o datos que debe buscar dentro del documento sin importar el sitio donde estén ubicadas.

¿ Para qué necesito el OCR?

Toda empresa que necesite buscar, comparar, extraer, o enviar datos que forman parte de un documento, nos ayuda a ahorrar tiempo y a trabajar más ágil, corregir un montón de errores humanos que nos hace retrasar pedidos, facturas y trabajos del día a día.

Aplicaciones del OCR

Cuando recibes documentos o libros escaneados o impresos en formato pdf, tiff o jpg. En multitud de ocasiones los estudiantes y trabajadores necesitarán escribir a mano o teclear en su ordenador parte del contenido que nos han entregado como una imagen. Con técnicas de OCR podremos transformar el texto de imagen a texto real de forma prácticamente automática y así no hay que copiarlo.

Si recibes o trabajas con documentos y certificados que se entregan escaneados como imagen. Los ficheros acostumbran a ser largos y extensos, por lo tanto, en muchas ocasiones sería interesante hacer una búsqueda por palabras clave para de esta forma acceder al contenido que nos interesa de forma directa, rápida y sin tener que perder tiempo leyendo de forma detallada el documento. Con técnicas OCR podremos realizar las búsquedas por palabras clave sin ningún tipo de problema y acceder al contenido que nos interesa de forma inmediata.

En el ámbito bancario a la hora de realizar ingresos de cheques de forma automática, en el sector médico para escanear e introducir formularios con datos de los pacientes a la base de datos, reconocimiento de matrículas de coche en un parking o en un radar de tráfico, etc.

Digitalización y transformación a texto de documentos y libros históricos que solo están disponibles en soporte de papel.

Digitalización de tickets y que automáticamente se vuelquen los datos y no tengas que hacer la nota de gastos a mano.

Combinado con otras técnicas, es una herramienta ideal para que personas con deficiencias visuales o auditivas puedan tener acceso a documentos e información. Hoy en día existen herramientas que transforman el texto resultante del reconocimiento OCR a Braile o archivos de audio.

Existe OCR capaz de leer y reproducir las notas musicales representadas en un pentagrama. Este software puede ser una herramienta de utilidad para compositores o para personas que queremos escuchar como suenan ciertas notas musicales, aprender idiomas y corregir pronunciaciones.

La conocida camcard utiliza OCR. Esta aplicación sirve para almacenar y clasificar tarjetas comerciales o de negocios. Tan solo tenemos que capturar la imagen de una tarjeta y camcard mediante técnicas OCR podrá extraer la totalidad de contenidos que contiene la tarjeta como por ejemplo mails, teléfonos, nombres, etc.