ABBYY FineReader Engine ABBYY FineReader Engine

El SDK de OCR más completo para desarrolladores de software

Integre en sus aplicaciones funciones de OCR basadas en la inteligencia artificial.

Especificaciones técnicas de ABBYY FineReader Engine 12

ABBYY FineReader Engine 12 se encuentra disponible en tres versiones:

  • ABBYY FineReader Engine 12 para Windows
  • ABBYY FineReader Engine 12 para Linux
  • ABBYY FineReader Engine 12 para Mac

Requisitos del sistema

Hardware

PC con procesador compatible con x86 (1 GHz o superior)

Sistema operativo

  • Windows Server 2019, Windows Server 2016, Windows Server 2012, Windows Server 2012 R2 con el paquete acumulativo de actualizaciones de abril de 2014 (KB2919355), y Windows Server 2008 R2 SP1
  • Windows 10, Windows 8.1 con el paquete acumulativo de actualizaciones de abril de 2014 (KB2919355), Windows 8 y Windows 7 SP1

Nubes y entornos virtuales probados

  • Azure App Services
  • Azure Cloud Services
  • Azure Service Fabric
  • Azure Virtual Machines
  • Amazon EC2
  • Microsoft Hyper-V Server 2008
  • Microsoft Hyper-V Server 2008 R2 SP1
  • Microsoft Hyper-V Server 2012
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • Parallels Desktop para Mac 13.0.1
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0

ABBYY FineReader Engine también puede ejecutarse en un contenedor de Docker en plataformas compatibles.

Entornos de desarrollo Java probados

ABBYY FineReader Engine Java wrapper ha sido probado en los siguientes kits de desarrollo de Java:

  • en sistemas operativos de 32 bits:
    • Oracle Java SE Development Kit 8u201 i586
    • Oracle Java SE Development Kit 8u202 i586
  • en sistemas operativos de 64 bits:
    • OpenJDK 11.0.2 x64
    • OpenJDK 12.0.2 x64
    • OpenJDK 13 x64
    • Oracle Java SE Development Kit 8u201 x64
    • Oracle Java SE Development Kit 8u202 x64
    • Oracle Java SE Development Kit 11.0.2 x64
    • Oracle Java SE Development Kit 12.0.2 x64
    • Oracle Java SE Development Kit 13 x64

Memoria

  • para procesar documentos de una página: mínimo 400 MB de RAM (recomendado 1 GB de RAM)
  • para procesar documentos de varias páginas: mínimo 1 GB de RAM (recomendado 1,5 GB de RAM)
  • para procesar en paralelo: 450 MB de RAM + 350 MB de RAM para cada núcleo
  • para procesar en paralelo documentos en árabe, chino, japonés o coreano: 750 MB de RAM + 850 MB de RAM para cada núcleo

Espacio en disco duro

  • 1600 MB para la instalación de la biblioteca (funcionalidad esencial)
  • 400 MB adicionales para la instalación de la biblioteca de módulos de OfficeConverters
  • 100 MB para la operación de programación
  • más 15 MB por página a la hora de procesar un documento de varias páginas

Otros requisitos

  • Escáner compatible con TWAIN, cámara digital o módem fax para escanear o importar imágenes
  • Para el entrenamiento de patrones, la edición de diccionarios y el escaneo mediante una interfaz gráfica de usuario: tarjeta de vídeo y monitor (resolución mínima 1024×768)
  • Tener instalado Microsoft® Internet Explorer 8.0 o una versión superior. Para una detección correcta de las fuentes, deben estar instaladas las fuentes contenidas en los documentos.

Requisitos del servicio de licencias de ABBYY SDK 12

Hardware

PC con procesador compatible con x86 (1 GHz o superior)

Sistema operativo

  • Windows Server 2016, Windows Server 2012 R2, Windows Server 2012 y Windows Server 2008 R2
  • Windows 10, Windows 8.1, Windows 8 y Windows 7 SP1

El servicio de licencias de ABBYY SDK 12 se ha probado en los siguientes entornos virtuales:

  • Microsoft Hyper-V Server 2008
  • Microsoft Hyper-V Server 2008 R2 SP1
  • Microsoft Hyper-V Server 2012
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • Parallels Desktop para Mac 13.0.1
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0

Herramientas de desarrollo

La interfaz de programación de aplicaciones (API) de ABBYY FineReader Engine para Windows es conforme al estándar COM y puede usarse fácilmente en C/C++, Visual Basic, .NET, Delphi, Java o cualquier herramienta de desarrollo compatible con los componentes COM. ABBYY FineReader Engine puede adaptarse para su uso con lenguajes de programación como VBS, JS y Perl.

ABBYY FineReader Engine 12 para Linux está diseñado para la versión glibc 2.11 y superior. Si necesita ABBYY FineReader Engine para versiones de glibc anteriores, póngase en contacto con la oficina de ABBYY. Para la librería dinámica de FineReader Engine, deben usarse las bibliotecas estándares libstdc++.so.6, libgcc_s.so.1 y libgomp.so.1.

Hardware

PC con procesador compatible con x86 (1 GHz o superior) que admite los conjuntos de instrucciones SSE y SSE2

Sistema operativo

  • Fedora 31, 30, 29
  • Red Hat Enterprise Linux 8.1, 7.7, 6.10
  • SUSE Linux Enterprise Server 15SP1, 12 SP4, 11 SP4
  • Debian GNU/Linux 10.2, 9.11, 8.11
  • Ubuntu 19.10, 19.04, 18.04.3 LTS, 16.04.6 LTS, 14.04.6 LTS
  • CentOS 8.0, 7.7 y 6.10
  • ALT Linux 9.0, 8.2 (no compatible con llaves de Wibu)
  • Amazon Linux AMI 2018.03

Además, ABBYY ofrece servicios profesionales para adaptar el software a otras plataformas.

Nubes y entornos virtuales probados:

  • Microsoft Azure Virtual Machines
  • Amazon EC2
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0
  • Linux KVM

ABBYY FineReader Engine también puede ejecutarse en un contenedor de Docker en plataformas compatibles.

El wrapper Java de ABBYY FineReader Engine ha sido probado en los siguientes kits de desarrollo Java:

  • OpenJDK 13 x64
  • OpenJDK 14 Early-Access (build 21) x64
  • Oracle Java SE Development Kit 8u231 x64
  • Oracle Java SE Development Kit 11.0.5 (LTS) x64
  • Oracle Java SE Development Kit 13.0.1 x64

Memoria

  • para procesar documentos de una página: mínimo 400 MB de RAM (recomendado 1 GB de RAM)
  • para procesar documentos de varias páginas: mínimo 1 GB de RAM (recomendado 1,5 GB de RAM)
  • para procesar en paralelo: 450 MB de RAM + 350 MB de RAM para cada núcleo
  • para procesar en paralelo documentos en árabe, chino, japonés o coreano: 750 MB de RAM + 850 MB de RAM para cada núcleo

Espacio en disco duro

  • 2150 MB para la instalación de la biblioteca
  • 100 MB para la operación de programación
  • más 15 MB por página a la hora de procesar un documento de varias páginas

Otros requisitos

  • Tamaño del tmpfs: 4 GB + 1 GB x número de núcleos
  • Tamaño de la memoria virtual: 4 GB + 1 GB x número de núcleos
  • ABBYY FineReader Engine es compatible con el sistema systemd init.
  • Para una detección correcta de las fuentes, deben estar instaladas las fuentes contenidas en los documentos.

Herramientas de desarrollo

ABBYY FineReader Engine para Linux incluye la API nativa de C/C++ y un envoltorio de Java, por lo que las aplicaciones deben estar escritas en C/C++ o Java.

Hardware

PC con procesador Intel (x86) de 1 GHz o superior

Sistema operativo

  • macOS 10.13.x High Sierra
  • macOS 10.14.x Mojave
  • macOS 10.15.x Catalina

Memoria

  • para procesar documentos de una página: mínimo 400 MB de RAM (recomendado 1 GB de RAM)
  • para procesar documentos de varias páginas: mínimo 1 GB de RAM (recomendado 1,5 GB de RAM)

Espacio en disco duro

2150 MB para la instalación de bibliotecas y 100 MB para la operación de programación, más 15 MB por página a la hora de procesar un documento de varias páginas

Para una detección correcta de las fuentes, deben estar instaladas las fuentes contenidas en los documentos.

Herramientas de desarrollo

La versión para Mac incluye solo la API nativa de C/C++, por lo que las aplicaciones deben estar escritas en C/C++.

Idiomas de reconocimiento admitidos

ABBYY FineReader Engine 12 incluye el mayor número de idiomas de reconocimiento del mercado. Reconoce los caracteres latinos, cirílicos, griegos y armenios, además del árabe, el birmano (vista preliminar técnica), el farsi, el hebreo, el chino, el japonés, el coreano, el ruso, el tailandés y otros idiomas. Para mejorar la precisión de reconocimiento, se han integrado diccionarios en numerosas lenguas. Para mejorar el reconocimiento de palabras y fuentes poco frecuentes, se puede usar una pequeña herramienta integrada para la implementación de diccionarios propios y la creación de patrones de caracteres propios.

Además, el SDK reconoce documentos históricos impresos entre los siglos XVII y XIX en inglés, francés, alemán, italiano y español; lenguajes artificiales (esperanto, interlingua, ido y occidental); lenguajes de programación (Basic, C/C++, COBOL, Fortran, JAVA y Pascal); fórmulas químicas sencillas; y dígitos estándares.

× Con soporte de diccionario:

Abjasio
Adigué
Afrikaans
Agul
Aimara
Albanés
Alemán (Luxemburgo)
Alemán (nueva ortografía)×
Alemán antiguo×
Alemán×
Altaico
Árabe (Arabia Saudí)
Armenio (grábar)×
Armenio (occidental)×
Armenio (oriental)×
Avar
Azerbaiyano (cirílico)
Azerbaiyano (latino)×
Baskir×
Bemba
Bielorruso
Birmano (vista preliminar técnica)
Bretón
Bugotu
Búlgaro×
Buriato
Cabardiano
Calmuco
Caracteres de tinta magnética MICR (CMC-7)
Castellano antiguo×
Casubio
Catalán×
Cebuano
Chamorro
Checheno
Checo×
Chichewa
Chino simplificado
Chino tradicional
Chucoto
Chuvasio
Coreano (hangul)×
Coreano×
Coriaco
Corso
Croata×
Crow
Cumuco
Danés×
Dargwa
Dungano
Eslavo antiguo
Eslovaco×
Esloveno×
Español×
Español×
Esperanto
Esquimal (cirílico)
Esquimal (latino)
Estonio×
Euskera
Even
Evenki
Farsi×
Feroés
Finlandés×
Fiyiano
Fórmulas químicas sencillas
Fórmulas matemáticas sencillas
Francés antiguo×
Francés×
Frisón
Friulano
Fuente OCR-A
Fuente OCR-B
Gaélico escocés
Gagaúzo
Galés
Gallego
Georgiano
Griego×
Guaraní
Hani
Hausa
Hawaiano
Hebreo×
Húngaro×
Ido
Indonesio×
Inglés antiguo×
Inglés×
Ingusetio
Interlingua
Irlandés
Islandés
Italiano antiguo×
Italiano×
Jakasio
Janty
Japonés (moderno)×
Japonés×
Jingpho
Karacho-bálkaro
Karakalpako
Kawa
Kazajo
Kikongo
Kikuyu
Kinyarwanda
Kirguís
Kirundí
Kpelle
Kurdo
Lak
Latino×
Lenguaje de programación BASIC
Lenguaje de programación C/C++
Lenguaje de programación COBOL
Lenguaje de programación Fortran
Lenguaje de programación Java
Lenguaje de programación Pascal
Lenguas mordvínicas
Lenguas retorrománicas
Letón en alfabeto gótico
Letón×
Lezgiano
Lituano×
Luba
Luganda
Macedonio
Malayo
Malgache
Maltés
Mandinga
Mansi
Maorí
Mari
Maya
Miao
Minangkabau
Mohawk
Mongol
Náhuatl
Neerlandés (Bélgica)×
Neerlandés (Países Bajos)×
Nenezo
Nivejí
Nogayo
Noruego (bokmål)×
Noruego (nynorsk)×
Noruego×
Números
Occidental
Ojibwa
Osetio
Papiamento
Polaco×
Portugués (Brasil)×
Portugués (Portugal)×
Provenzal
Quechua
Reconocimiento de caracteres de tinta magnética MICR (E-13B)
Romaní
Rumano (Moldavia)
Rumano×
Ruso (con acentos marcando la posición de la sílaba tónica)×
Ruso (ortografía antigua)×
Ruso×
Sami (lapón)
Samoano
Selkup
Serbio (cirílico)
Serbio (latino)
Sesotho
Setsuana
Shona
Siksiká
Sioux (Dakota)
Somalí
Sondanés
Sorbio
Suajili
Suazi
Sueco×
Tabasaran
Tagalo
Tahitiano
Tailandés×
Tártaro
Tártaro×
Tayiko
Tok Pisin
Tongano
Tun
Turco×
Turcomano (latino)
Turcomano
Tuvano
Ucraniano×
Udmurto
Uigur (cirílico)
Uigur (latino)
Uzbeko (cirílico)
Uzbeko (latino)
Vietnamita×
Wólof
Xhosa
Yakuto
Yiddish
Zapoteco
Zulú
Afrikáans
Aimara
Albanés
Alemán (Luxemburgo)
Alemán (nueva ortografía)
Alemán antiguo
Alemán
Árabe (Arabia Saudí)*
Azerbaiyano (cirílico)
Baskir
Bemba
Bréton
Bugotu
Búlgaro
Buriato
Castellano antiguo
Casubio
Cebuano
Chamorro
Checo
Chichewa
Corso
Croata
Crow
Cumuco
Danés
Eslovaco
Esloveno
Español
Estonio
Even
Evenki
Finlandés
Fiyiano
Francés antiguo
Francés
Frisón
Friulano
Gaélico escocés
Gallego
Griego
Guarani
Hani
Hawaiano
Húngaro
Ido
Indonesio
Inglés antiguo
Inglés
Interlingua
Irlandés
Italian
Italiano antiguo
Jingpho
Karachay-Balkaro
Kawa
Kazajo
Kikongo
Kinyarwanda
Kirguís
Kirundí
Kpelle
Kurdo
Latín
Lenguas mordvínicas
Lenguas retorrománicas
Lezgiano
Lituano
Luba
Luganda
Malayo
Mandinga
Maorí
Maya
Miao
Minangkabau
Mohawk
Mongol
Náhuatl
Neerlandés (Bélgica)
Neerlandés (Países Bajos)
Nenezo
Nivejí
Nogayo
Noruego (bokmål)
Noruego (nynorsk)
Noruego
Números
Ojibwy
Osetio
Polaco
Portugués (Brasil)
Portugués (Portugal)
Quechua
Romaní
Rumano (Moldavia)
Rumano
Ruso
Sami (lapón)
Samoano
Selkup
Serbio (cirílico)
Serbio (latino)
Sesotho
Setsuana
Siksiká
Sioux (Dakota)
Somalí
Suajili
Suazi
Sueco
Tagalo
Tahitiano
Tajiko
Tártaro
Tok Pisin
Tongano
Tun
Turkmano
Turko
Tuvano
Ucrainiano
Uigur (latino)
Uzbeko (latino)
Wólof
Xhosa
Zapotec

* No se admite el ICR en árabe. Sin embargo, se pueden reconocer los dígitos arábigos impresos a mano.

Chino simplificado
Chino tradicional
Checo
Danés
Holandés (Países Bajos)
Inglés
Estonio
Finlandés
Francés
Alemán
Griega
Húngaro
Indonesio
Italiano
Nipona
Coreano
Noruego
Noruego (Bokmål)
Noruego (Nynorsk)
Polaco
Portugués (Brasil)
Portugués (Portugal)
Ruso
Castellano
Sueco
Turco
Ucraniano

Idiomas de interacción con el usuario

Los cuadros en los que se muestra información, como los mensajes de error, los consejos y los avisos, se encuentran disponibles en inglés, búlgaro, checo, chino (República Popular China y Taiwán), danés, neerlandés, estonio, francés, alemán, griego, húngaro, italiano, japonés, coreano, polaco, portugués (Brasil), ruso, eslovaco, español, sueco, turco y ucraniano.

Formatos de entrada de Office compatibles

ABBYY FineReader Engine puede abrir documentos electrónicos creados en uno de los siguientes formatos:

  • Formatos de texto: formats .doc, .docx, .rtf, .htm / .html, .txt, .odt
  • Formatos de tabla: .xls, .xlsx, .ods
  • Formatos de presentación: .ppt, .pptx, .odp
  • PDF creados digitalmente: .pdf

Formatos de imagen compatibles (se pueden abrir y guardar)

ABBYY FineReader Engine puede abrir archivos de imagen en numerosos formatos. Además, el SDK de OCR puede guardar los resultados en diversos formatos de imagen.

Lista de formatos de imagen compatibles:

Formato Extensión Se puede abrir Se puede guardar
BMP
blanco y negro sin comprimir
4 y 8 bits: paleta de colores sin comprimir
16 bits: sin comprimir, máscara sin comprimir
24 bits: sin comprimir
32 bits: sin comprimir, máscara sin comprimir
bmp    
BMP
4 y 8 bits: paleta de colores con compresión RLE
bmp    
DCX
blanco y negro
2, 4 y 8 bits: paleta de colores
24 bits: en color
dcx    
DjVu (solo en la versión de Windows)
blanco y negro, gris y en color
djvu, djv    
GIF
blanco y negro con compresión LZW
2, 3, 4, 5, 6, 7 y 8 bits: paleta de colores con compresión LZW
gif    
JBIG2
blanco y negro
jb2    
JPEG
gris y en color
jpg, jpeg, jfif    
JPEG 2000
gris: Parte 1
en color: Parte 1
jp2, jpc, j2k    
PCX
blanco y negro
2, 4 y 8 bits: paleta de colores
24 bits: en color
pcx    
Imagen PDF (PDF escaneado) pdf    
PDF creado digitalmente (versión 1.7 o anterior) pdf    
PNG
blanco y negro, gris y en color
png    
TIFF
blanco y negro: sin comprimir, CCITT3, CCITT4, PackBits, ZIP y LZW
gris: sin comprimir, PackBits, JPEG, ZIP y LZW
24 bits: en color, sin comprimir, JPEG, ZIP y LZW
1, 4 y 8 bits: paleta de colores, sin comprimir, PackBits, ZIP y LZW
(incluidos archivos TIFF de varias páginas)
tif, tiff    
TIFF
blanco y negro: CCITT3FAX
tif, tiff    
WDP (solo en la versión de Windows)
blanco y negro, gris y en color
(WIC o Microsoft .NET Framework 3.0 necesarios)
Wdp    
Compatible con WIC (solo en la versión de Windows)
(WIC o Microsoft .NET Framework 3.0 necesarios)
     

Nota: ABBYY FineReader Engine no abre imágenes de más de 32512x32512 píxeles.

Formatos de documentos que pueden guardarse

ABBYY FineReader Engine podrá guardar el texto reconocido en los siguientes formatos:

  • RTF
  • DOCX
  • XLSX y XLS (solo en la versión de Windows)

    FineReader Engine admite los formatos MS Excel 5 y 8 al guardar el formato XLS.

  • PPTX
  • PDF, PDF 2.0 y PDF/UA
  • PDF/A-1 (a,b), PDF/A-2 (a,b,u) y PDF/A-3 (a,b,u)

    FineReader Engine es compatible con la compresión MRC de todos los formatos PDF.

  • HTML y HTML 5

    FineReader Engine admite varias páginas de código (Windows, DOS, Mac e ISO) y la codificación Unicode (UTF-16 y UTF-8).

  • TXT

    FineReader Engine admite varias páginas de código (Windows, DOS, Mac e ISO) y la codificación Unicode (UTF-16 y UTF-8).

  • CSV
  • XML: formato de archivo que contiene texto reconocido y cuya estructura se describe con la ayuda de etiquetas XML.
  • ALTO 3.1
  • XPS (solo en la versión de Windows)
  • FB2
  • EPUB
  • ODT
  • vCard: solo para la exportación de tarjetas de visita

Tipos de códigos de barra admitidos

ABBYY FineReader Engine reconoce los siguientes tipos de códigos de barra:

  • 1D: Codabar, Code 128, Code 39, Code 93, Code 32, EAN 8 y 13, versión Full ASCII de Code 39, GS1-128, IATA 2 de 5, Industrial 2 de 5, Interleaved 2 de 5, Intelligent Mail (también conocido como USPS 4-CB), Matrix 2 de 5, Patch, PostNet, UPC-A y UPC-E (además de la lista anterior, la versión para Windows y Linux incluye los siguientes códigos de barras 1D: KIX, Royal Mail 4-State (RM4SCC) y Australia Post 4-State).
  • 2D: Aztec, Data Matrix, MaxiCode, PDF 417 y código QR.

Extracción de datos de zonas de lectura mecánica (ZLM)

ABBYY FineReader Engine puede detectar una zona de lectura mecánica en la imagen de un documento de identidad o de viaje y extraer los datos codificados conforme al documento 9303 de la OACI.

ABBYY FineReader Engine puede extraer datos de lectura mecánica de ambos tipos de campos de ZLM:

  • 2 líneas
  • 3 líneas

Se puede extraer la siguiente información:

  • Número de líneas en la ZLM
  • Todos los caracteres de cada línea
  • Datos opcionales de cada línea
  • Tipo y subtipo de documento de identidad
  • Número de documento de identidad
  • Código del estado de emisión
  • Fecha de validez
  • Nombre y apellidos
  • Nacionalidad
  • Fecha de nacimiento y sexo
  • Número personal

Cuando se encuentren disponibles, ABBYY FineReader Engine extrae dígitos de control de cada valor. Para facilitar información sobre la calidad de la extracción de datos, ABBYY FineReader Engine utiliza un valor booleano que especifica si la suma de control sobre el valor individual coincide con el dígito de control.

Reconocimiento óptico de marcas

ABBYY FineReader Engine reconoce marcas de verificación simples, agrupadas, modelos y corregidas a mano:

  • Marcas de verificación en un cuadro
  • Marcas de verificación sobre fondo vacío
  • Marcas de verificación no estándares (este tipo de marcas de verificación requiere entrenamiento previo)

Si desea obtener más información técnica, consulte ABBYY.technology o el archivo de ayuda de ABBYY FineReader Engine.

¿Listo para probar? ¿Necesita más información?

Simplemente rellene el formulario abajo y nos pondremos en contacto con usted en breve.

Soy consciente de que puedo revocar mi consentimiento total o parcialmente en cualquier momento y de cara al futuro.

Para revocar su consentimiento, entre en la página web dedicada a la eliminación de las suscripciones o envíe un correo electrónico a dataprotection@abbyy.com.

Al enviar este formulario, doy mi consentimiento para el uso de mis datos personales con los fines descritos en el Aviso de Privacidad.

¡Muchas gracias por su interés por los productos de ABBYY!

Su solucitud está procesándose y el gerente de ventas en su región le responderá lo antes posible.

Con los mejores deseos,
El equipo de ABBYY