ABBYY FineReader Engine

El SDK de OCR más completo para desarrolladores de software.

Integre en sus aplicaciones funciones de OCR basadas en la IA.

Reconocimiento

Set completo de tecnologías de reconocimiento

Para la fase de reconocimiento de texto propiamente dicha, ABBYY FineReader Engine ofrece un kit completo de tecnologías de reconocimiento. Entre las tecnologías incluidas, se encuentra el reconocimiento de textos impresos (OCR), textos escritos a mano (ICR) y códigos de barra (OBR). Como líder del mercado, ABBYY ofrece el mayor número de idiomas de OCR, que pueden ser combinados individualmente. Vea a continuación la lista de tecnologías y opciones de procesamiento disponibles.

Factoids 026 77X77

Reconocimiento óptico de carácteres (OCR)

La tecnología OCR está disponible para más de 200 idiomas:

  • Lenguas europeas (alfabetos latino, cirílico, armenio, griego)
  • Lenguas no-europeas: chino, japonés, coreano, árabe, farsi , tailandés, vietnamita, hebreo, birmano (previsualización)
  • FineReader XIX – para documentos, libros y periódicos antiguos publicados entre 1600 y 1937 en inglés, frances, alemán, italiano y español, en fuentes antiguas tales como Fraktur, Schwabacher y Gothic
  • Reconocimiento de fuentes OCR-A, OCR-B, MICR (E13B) y CMC7 y de dcoumentos imprimidos de matriz de puntos o dactilografiados
Factoids 024 77X77

Reconocimiento inteligente de carácteres (ICR)

La tecnología ICR está disponible para más de 120 idiomas:

  • Lenguas europeas y no-europeas
  • 22 estilos regionales de impresión a mano
  • Reconocimiento de carácteres imprimidos a mano en campos y marcos
  • ICR para dígitos indianos usados en países árabes

Es posible el reconocimiento de información imprimida a mano en idiomas diferentes (ICR multilingüe)

Factoids 017 77X77

Reconocimiento óptico de códigos de barra (OBR)

  • Tipos de códigos de barra 1D y 2D
  • Reconocimiento rápido de códigos de barra. Esta función permite detección y reconocimiento automatizados de códigos de barra en cualquier ángulo dentro del documento.

Modos de reconocimiento

Con modos prefinidos de procesamiento, los desarrolladores tienen capacidad de ajustar y afinar la velocidad y precisión de procesamiento. En adición a modo de procesamiento por defecto, como reconocimiento OCR tanto ICR puede realizarse en modos de reconocimiento normal, rápido y balanceado:

Benefits 119B 77X77

Modo de reconocimiento normal

El modo más preciso para obtener la calidad más alta de reconocimiento, por ejemplo si Ud planea reutilizar el contenido reconocido.

Benefits 102V 77X77

Modo de reconocimiento rápido

Este modo aumenta la velocidad de procesamiento por 200-250% haciendo la tecnología ideal para usar en sistemas de gestión de contenidos (CMS), gestión de documentos (DMS) y almacenamiento.

Reconocimiento de texto completo y a nivel de campo

Hay dos tipos de reconocimiento que pueden separarse: texto completo y reconocimiento a nivel de campo. El reconocimiento de texto completo se usa para conversión de documentos y normalmente incluye tecnología OCR. El reconocimiento a nivel de campo se usa extracción de datos particulares y incluye OCR, ICR y otras tecnologías.
La siguiente tabla muestra las diferencias:

Especificación Reconocimiento de texto completo Reconocimiento a nivel de campo
Uso: Conversión de documentos, archivo de libros Captura de datos / Extracción de datos
Análisis de document: Análisis general de documentos, análisis de documentos para facturas, análisis de documentos para indexación de texto completo Especificación manual de bloques para reconocimiento a nivel de campo
Tecnologías de reconocimiento: OCR con precisión hasta 99% OCR, ICR, OMR, códigos de barras, reconocimiento de datos con tipos pre-definidos y rango de valores. Precisión 99,99%
Verificación: Recomendada (para reutilización de contenido) Obligatoria (en la mayoría de casos)
Síntesis: Usada para recuperación del documento No se usa
Formato de exportación: Ficheros de documentos (RTF, DOC, PDF, etc.) Exportación a fichero XML o base de datos
Reconocimiento de texto completo

El reconocimiento de texto completo es un tipo básico de reconocimiento para diferentes tareas, por ejemplo:

  • Conversión de documentos y libros para archivo
  • Conversión de documentos para reutilización del contenido
  • Extracción básica del texto para detección de campos y clasificación de documentos

Todos de aquellos necesitan reconocimiento (OCR) de todo el texto. El texto resultante se exporta como texto puro o como un documento de formato soportado.

Reconocimiento a nivel de campo

ABBYY FineReader Engine extrae texto de de campos o zonas para soportar procesos comerciales clave tales como procesamiento de formularios, clasificación de palabras clave, visión automática y automatización robótica de procesos. Funcionalidad clave incluye OCR y ICR multilingüe, OMR, reconocimiento de códigos de barras y una gama de funciones específicas, tales como:

  • Extracción de datos de campos con varias fronteras y marcos, incluso cuadras combinadas
  • Definición del contenido de campo configurando alfabetos, diccionarios, expresiones regulares, tipos de escritura, etc.
  • Detección de separación en el campo
  • Procesamiento inteligente de bloques con partes y líneas cruzadas
  • Text block despeckling, with the ability to specify the size of "garbage"
  • Desmanchado de bloque de texto con capacidad de especificar el tamaño de “basura”
  • El reconocimiento a nivel de campo está también soportado por herramientas especiales para desarrolladores tales como API Votante y Ajuste de Reconocimiento "On-the-Fly"

Idiomas del usuario

Para aumentar la calidad del reconocimiento, ABBYY FineReader Engine provee un API para creación y edición de idiomas de reconocimiento, ajuste de idiomas de reconocimiento predefinida y adición de nuevas palabras a idiomas del usuario. Ejemplos:

  • Para mejorar la calidad de reconocimiento ICR, Ud puede usar idiomas del usuario para describir la información que puede ser entrada en cada campo (códigos postales, códigos de productos, sumas).
  • Para mejorar el reconocimiento de códigos de productos, números de teléfono o números de pasaporte, Ud puede crear un nuevo idioma de r econocimiento que va ayudar al programa a leer correctamente tipos específicos de datos.

Formación de patrones (pattern training)

En gran mayoría de casos, FineReader Engine puede exitosamente leer textos sin formación preliminar. Aunque, en casos que incluyen reconocimiento de fuentes decorativas o esbozadas, o entrada masiva de documentos con baja calidad de impresión, formación de patrones preliminar resultará útil.

Solicite información

Versión de prueba

Rellene el formulario siguiente y nos pondremos en contacto con usted en breve.

Soy consciente de que se pued revocar mi consentimiento en cualquier momento haciendo clic en el enlace para cancelar la suscripción dentro de cualquier correo electrónico recibido de ABBYY Solutions Ltd. o a través del Formulario de derechos de acceso del sujeto de los datos de ABBYY.

Al enviar este formulario, doy mi consentimiento para el uso de mis datos personales con los fines descritos en el Aviso de Privacidad.

Este sitio está protegido por reCAPTCHA y se aplican la política de privacidad y términos del servicio de Google.

¡Muchas gracias por su interés por los productos de ABBYY!

Su solucitud está procesándose y el gerente de ventas en su región le responderá lo antes posible.

Con los mejores deseos,
El equipo de ABBYY