ABBYY FineReader Engine ABBYY FineReader Engine

O SDK de OCR mais completo para desenvolvedores

Integre a tecnologia de OCR inteligente em seus aplicativos.

Especificações técnicas

ABBYY FineReader Engine está disponível em três versões:

  • ABBYY FineReader Engine 12 for Windows
  • ABBYY FineReader Engine 12 for Linux
  • ABBYY FineReader Engine 11 for Mac

Requisitos do Sistema

Hardware

PC com processador de compatibilidade x86 (1 GHz ou mais)

Sistema operacional

  • Windows Server 2019, Windows Server 2016, Windows Server 2012, Windows Server 2012 R2 com o pacote cumulativo de atualizações de abril de 2014 (KB2919355), Windows Server 2008 R2 SP1
  • Windows 10, Windows 8.1 com o pacote cumulativo de atualizações de abril de 2014 (KB2919355), Windows 8, Windows 7 SP1

Ambientes virtuais e em nuvem testados

  • Azure App Services
  • Azure Cloud Services
  • Azure Service Fabric
  • Azure Virtual Machines
  • Amazon EC2
  • Microsoft Hyper-V Server 2008
  • Microsoft Hyper-V Server 2008 R2 SP1
  • Microsoft Hyper-V Server 2012
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • Parallels Desktop for Mac 13.0.1
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0

O ABBYY FineReader Engine também pode ser executado em um contêiner do Docker em plataformas suportadas.

Ambientes de desenvolvimento Java testados

O wrapper Java do ABBYY FineReader Engine foi testado nos seguintes Kits de Desenvolvimento Java:

  • para sistemas operacionais de 32 bits:
    • Oracle Java SE Development Kit 8u201 i586
    • Oracle Java SE Development Kit 8u202 i586
  • para sistemas operacionais de 64 bits:
    • OpenJDK 11.0.2 x64
    • OpenJDK 12.0.2 x64
    • OpenJDK 13 x64
    • Oracle Java SE Development Kit 8u201 x64
    • Oracle Java SE Development Kit 8u202 x64
    • Oracle Java SE Development Kit 11.0.2 x64
    • Oracle Java SE Development Kit 12.0.2 x64
    • Oracle Java SE Development Kit 13 x64

Memória

  • para processamento de documentos de uma página — mínimo de 400 MB de RAM, recomendado 1 GB de RAM
  • para processamento de documentos com várias páginas — mínimo de 1 GB de RAM, recomendado 1,5 GB de RAM
  • para processamento paralelo — 450 MB de RAM + 350 MB de RAM para cada núcleo
  • para processamento paralelo de documentos em árabe, chinês, japonês ou coreano — 750 MB de RAM + 850 MB de RAM para cada núcleo

Espaço no disco rígido

  • 1600 MB para instalação da biblioteca (funcionalidade principal)
  • 400 MB adicionais para instalação da biblioteca do módulo OfficeConverters
  • 100 MB para o funcionamento do programa
  • mais 15 MB adicionais para cada página de processamento de um documento de várias páginas

Outros requisitos

  • Scanner compatível com TWAIN, câmera digital ou modem de fax para digitalização ou importação de imagens
  • Para treinamento de padrão, edição de dicionário, digitalização através de uma GUI: Placa de vídeo e monitor (resolução mínima 1024×768)
  • Microsoft® Internet Explorer 8.0 ou superior deve estar instalado. Para a detecção correta de fontes, as fontes contidas nos documentos devem ser instaladas.

Requisitos do ABBYY SDK 12 Licensing Service

Hardware

PC com processador de compatibilidade x86 (1 GHz ou mais)

Sistema operacional

  • Windows Server 2016, Windows Server 2012 R2, Windows Server 2012, Windows Server 2008 R2
  • Windows 10, Windows 8.1, Windows 8, Windows 7 SP1

O ABBYY SDK 12 Licensing Service foi testado nos seguintes ambientes virtuais:

  • Microsoft Hyper-V Server 2008
  • Microsoft Hyper-V Server 2008 R2 SP1
  • Microsoft Hyper-V Server 2012
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • Parallels Desktop for Mac 13.0.1
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0

Ambientes de desenvolvimento

A interface de programação de aplicativos (API) do ABBYY FineReader Engine for Windows está em conformidade com o padrão COM e pode ser facilmente usada em C/C++, Visual Basic, .NET, Delphi, Java ou qualquer ferramenta de desenvolvimento que suporte componentes COM. O Engine pode ser adaptado para uso em linguagens de script como VBS, JS e Perl.

O ABBYY FineReader Engine 12 for Linux foi projetado para a versão da glibc 2.11 ou superior. Se você precisar do ABBYY FineReader Engine para versões mais antigas da glibc, contate o escritório da ABBYY. Para a biblioteca dinâmica do FineReader Engine, as bibliotecas padrão libstdc++.so.6, libgcc_s.so.1 e libgomp.so.1 libraries devem ser usadas.

Hardware

PC com processador de compatibilidade x86 (1 GHz ou mais) que suporta conjuntos de instruções SSE e SSE2

Sistema operacional

  • Fedora 31, 30, 29
  • Red Hat Enterprise Linux 8.1, 7.7, 6.10
  • SUSE Linux Enterprise Server 15SP1, 12 SP4, 11 SP4
  • Debian GNU/Linux 10.2, 9.11, 8.11
  • Ubuntu 10.10, 19.04, 18.04.3 LTS, 16.04.6 LTS, 14.04.6 LTS
  • CentOS 8.0, 7.7, 6.10
  • ALT Linux 9.0, 8.2 (no compatible con llaves de Wibu)
  • Amazon Linux AMI 2018.03

Além disso, a ABBYY oferece serviços profissionais para adaptar o software a outras plataformas.

Ambientes virtuais e em nuvem testados:

  • Microsoft Azure Virtual Machines
  • Amazon EC2
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0
  • Linux KVM

O ABBYY FineReader Engine também pode ser executado em um contêiner do Docker em plataformas suportadas.

O ABBYYY FineReader Engine Java wrapper foi testado nos seguintes Kits de desenvolvimento Java:

  • OpenJDK 13 x64
  • OpenJDK 14 Early-Access (build 21) x64
  • Oracle Java SE Development Kit 8u231 x64
  • Oracle Java SE Development Kit 11.0.5 (LTS) x64
  • Oracle Java SE Development Kit 13.0.1 x64

Memória

  • para processamento de documentos de uma página — mínimo de 400 MB de RAM, recomendado 1 GB de RAM
  • para processamento de documentos com várias páginas — mínimo de 1 GB de RAM, recomendado 1,5 GB de RAM
  • para processamento paralelo — 450 MB de RAM + 350 MB de RAM para cada núcleo
  • para processamento paralelo de documentos em árabe, chinês, japonês ou coreano — 750 MB de RAM + 850 MB de RAM para cada núcleo

Espaço no disco rígido

  • 2.150 MB para a instalação da biblioteca
  • 100 MB para o funcionamento do programa
  • mais 15 MB adicionais para cada página de processamento de um documento de várias páginas.

Outros requisitos

  • tamanho da tmpfs — 4GB + 1GB*(número de núcleos)
  • Tamanho de swap — 4GB + 1GB*(número de núcleos)
  • O ABBYY FineReader Engine suporta o sistema init systemd
  • Para a detecção correta de fontes, as fontes contidas nos documentos devem ser instaladas.

Ferramentas de desenvolvimento

O ABBYY FineReader Engine for Linux fornece uma API nativa C/C++ e um wrapper Java, portanto, os aplicativos precisam ser escritos em C/C++ ou Java.

Hardware

PC com processador Intel (x86) 1 GHz ou mais

Sistema operacional

  • macOS 10.13.x High Sierra
  • macOS 10.14.x Mojave
  • macOS 10.15.x Catalina

Memória

  • para processamento de documentos de uma página — mínimo de 400 MB de RAM, recomendado 1 GB de RAM
  • para processamento de documentos com várias páginas — mínimo de 1 GB de RAM, recomendado 1,5 GB de RAM

Espaço no disco rígido

2150 MB para a instalação da biblioteca e 100 MB para o funcionamento do programa, mais 15 Mb adicionais para cada página de processamento de um documento de várias páginas.

Para a detecção correta de fontes, as fontes contidas nos documentos devem ser instaladas.

Ferramentas de desenvolvimento

A versão Mac fornece apenas API nativa C/C++, portanto, os aplicativos precisam ser escritos em C/C++.

Idiomas de reconhecimento suportados

O ABBYY FineReader Engine 12 fornece suporte para o maior número de idiomas de reconhecimento no mercado. Ele oferece reconhecimento de idiomas com caracteres latinos, cirílicos, gregos ou armênios, bem como árabe, birmanês (pré-visualização técnica), farsi, hebraico, chinês, japonês, coreano, russo, tailandês e outros idiomas. Para aumentar ainda mais a precisão do reconhecimento, dicionários integrados são fornecidos para vários idiomas. Para aumentar o reconhecimento de palavras incomuns e fontes não típicas, um pequeno utilitário integrado pode ser usado para implementar os próprios dicionários e criar padrões de caracteres próprios.

Além disso, o SDK fornece reconhecimento de documentos históricos impressos entre os séculos 17 e 19 em inglês, francês, alemão, italiano e espanhol, reconhecimento de linguagens artificiais (Esperanto, Interlíngua, Ido e Occidenal), reconhecimento de linguagens de programação (Basic, C/C++, COBOL, Fortran, JAVA e Pascal), fórmulas químicas simples e dígitos padrão.

× Com suporte de dicionário

Abkhaz
Adyghe
Afrikaans
Agul
Albanian
Altaic
Arabic (Saudi Arabia)×
Armenian (Eastern)×
Armenian (Grabar)×
Armenian (Western)×
Avar
Aymara
Azerbaijani (Cyrillic)
Azerbaijani (Latin)×
Bashkir×
Basic programming language
Basque
Belarussian
Bemba
Blackfoot
Breton
Bugotu
Bulgarian×
Burmese (technical preview)
Buryat
C/C++ programming language
Catalan×
Chamorro
Chechen
Simple chemical formulas
Chinese Simplified
Chinese Traditional
Chukcha
Chuvash
For MICR (CMC-7) text type
Cobol programming language
Corsican
Crimean Tatar
Croatian×
Crow
Czech×
Danish×
Dargwa
Numbers
Dungan
Dutch (Netherlands)×
Dutch (Belgium)×
For MICR (E-13B) text type
English×
Eskimo (Cyrillic)
Eskimo (Latin)
Esperanto
Estonian×
Even
Evenki
Faeroese
Farsi×
Fijian
Finnish×
Fortran programming language
French×
Frisian
Friulian
Scottish Gaelic
Gagauz
Galician
Ganda
Georgian
German×
German (Luxembourg)
German (new spelling)×
Greek×
Guarani
Hani
Hausa
Hawaiian
Hebrew×
Hungarian×
Icelandic
Ido
Indonesian×
Ingush
Interlingua
Irish
Italian×
Japanese×
Japanese (Modern)×
Java programming language
Kabardian
Kalmyk
Karachay-Balkar
Karakalpak
Kasub
Kawa
Kazakh
Khakas
Khanty
Kikuyu
Kirghiz
Kongo
Korean×
Korean (Hangul)×
Koryak
Kpelle
Kumyk
Kurdish
Lak
Sami (Lappish)
Latin×
Latvian×
Latvian language written in Gothic script
Lezgin
Lithuanian×
Luba
Macedonian
Malagasy
Malay
Malinke
Maltese
Mansi
Maori
Mari
Maya
Miao
Minangkabau
Mohawk
Mongol
Mordvin
Nahuatl
Nenets
Nivkh
Nogay
NorwegianNynorsk and NorwegianBokmal×
Norwegian (Bokmal)×
Norwegian (Nynorsk)×
Nyanja
Occidental
For OCR-A text type
For OCR-B text type
Ojibway
Old English×
Old French×
Old German×
Old Italian×
Old Slavonic
Old Spanish×
Ossetian
Papiamento
Pascal programming language
Tok Pisin
Polish×
Portuguese (Brazil)×
Portuguese (Portugal)×
Provencal
Quechua
Rhaeto-Romanic
Romanian×
Romanian (Moldavia)
Romany
Ruanda
Rundi
Russian (old spelling)×
Russian×
Russian (with accents marking stress position)×
Samoan
Selkup
Serbian (Cyrillic)
Serbian (Latin)
Shona
Sioux (Dakota)
Simple mathematical formulas
Slovak×
Slovenian×
Somali
Sorbian
Sotho
Spanish×
Sunda
Swahili
Swazi
Swedish×
Tabassaran
Tagalog
Tahitian
Tajik
Tatar×
Thai×
Jingpo
Tongan
Tswana
Tun
Turkish×
Turkmen
Turkmen (Latin)
Tuvan
Udmurt
Uighur (Cyrillic)
Uighur (Latin)
Ukrainian×
Uzbek (Cyrillic)
Uzbek (Latin)
Vietnamese×
Cebuano
Welsh
Wolof
Xhosa
Yakut
Yiddish
Zapotec
Zulu
Afrikaans
Albanian
Arabic (Saudi Arabia)*
Aymara
Azerbaijani (Latin)
Basque
Bemba
Blackfoot
Breton
Bugotu
Bulgarian
Buryat
Chamorro
Corsican
Crimean Tatar
Croatian
Crow
Czech
Danish
Numbers
Dutch (Netherlands)
Dutch (Belgium)
English
Estonian
Even
Evenki
Fijian
Finnish
French
Frisian
Friulian
Scottish Gaelic
Galician
Ganda
German
German (Luxembourg)
German (new spelling)
Greek
Guarani
Hani
Hawaiian
Hungarian
Ido
Indonesian
Interlingua
Irish
Italian
Karachay-Balkar
Kasub
Kawa
Kazakh
Kirghiz
Kongo
Kpelle
Kumyk
Kurdish
Sami (Lappish)
Latin
Latvian
Lithuanian
Luba
Malagasy
Malinke
Maori
Maya
Miao
Minangkabau
Mohawk
Mongol
Mordvin
Nahuatl
Nenets
Nivkh
Nogay
NorwegianNynorsk and NorwegianBokmal
Norwegian (Bokmal)
Norwegian (Nynorsk)
Nyanja
Ojibway
Old English
Old French
Old German
Old Italian
Old Spanish
Papiamento
Tok Pisin
Polish
Portuguese (Brazil)
Portuguese (Portugal)
Quechua
Rhaeto-Romanic
Romanian
Romanian (Moldavia)
Romany
Ruanda
Rundi
Russian
Samoan
Selkup
Serbian (Cyrillic)
Serbian (Latin)
Sioux (Dakota)
Slovak
Slovenian
Somali
Sotho
Spanish
Swahili
Swazi
Swedish
Tagalog
Tahitian
Tajik
Jingpo
Tongan
Tswana
Tun
Turkish
Turkmen (Latin)
Tuvan
Uighur (Latin)
Ukrainian
Uzbek (Latin)
Cebuano
Wolof
Xhosa
Zapotec

* Arabic ICR is not supported. However, hand-printed Arabic digits can be recognized.

Chinese Simplified
Chinese Traditional
Czech
Danish
Dutch (Netherlands)
English
Estonian
Finnish
French
German
Greek
Hungarian
Indonesian
Italian
Japanese
Korean
NorwegianNynorsk and NorwegianBokmal
Norwegian (Bokmal)
Norwegian (Nynorsk)
Polish
Portuguese (Brazil)
Portuguese (Portugal)
Russian
Spanish
Swedish
Turkish
Ukrainian

Idiomas para interação com o usuário

Caixas de mensagem, como mensagens de erro, dicas e avisos estão disponíveis em inglês, búlgaro, tcheco, chinês (PRC e Taiwan), dinamarquês, holandês, estoniano, francês, alemão, grego, húngaro, italiano, japonês, coreano, polonês, português (Brasil), russo, eslovaco, espanhol, sueco, turco e ucraniano.

Formatos de entrada do Office suportados

O ABBYY FineReader Engine pode abrir documentos criados nos seguintes formatos:

  • Formatos de texto: formats .doc, .docx, .rtf, .htm / .html, .txt, .odt
  • Formatos de tabela: .xls, .xlsx, .ods
  • Formatos de apresentação: .ppt, .pptx, .odp
  • PDFs de origem digital: .pdf

Formatos de imagem suportados (abertura, salvamento)

O ABBYY FineReader Engine pode abrir arquivos de imagem em vários formatos. Além disso, o SDK de OCR é capaz de salvar resultados em vários formatos de imagem.

Lista de formatos de imagem suportados:

 
Formato Extensão Abrir Salvar
BMP
uncompressed black and white
4- and 8-bit — uncompressed Palette
16-bit — uncompressed, uncompressed Mask
24-bit — uncompressed
32-bit — uncompressed, uncompressed Mask
bmp    
BMP
4- and 8-bit — RLE compressed Palette
bmp    
DCX
black and white
2-, 4- and 8-bit palette
24-bit color
dcx    
DjVu (only in Windows version)
black and white, gray, color
djvu, djv    
GIF
black and white — LZW-compressed
2-, 3-, 4-, 5-, 6-, 7-, 8-bit palette — LZW-compressed
gif    
JBIG2
black and white
jb2    
JPEG
gray, color
jpg, jpeg, jfif    
JPEG 2000
gray — Part 1
color — Part 1
jp2, jpc, j2k    
PCX
black and white
2-, 4- and 8-bit palette
24-bit color
pcx    
Image PDF (scanned PDF) pdf    
Digitally created PDF (Version 1.7 or earlier) pdf    
PNG
black and white, gray, color
png    
TIFF
black and white — uncompressed, CCITT3, CCITT4, Packbits, ZIP, LZW
gray — uncompressed, Packbits, JPEG, ZIP, LZW
24-bit color — uncompressed, JPEG, ZIP, LZW
1-, 4-, 8-bit palette — uncompressed, Packbits, ZIP, LZW
(including multi-page TIFF)
tif, tiff    
TIFF
black and white — CCITT3FAX
tif, tiff    
WDP (only in Windows version)
black and white, gray, color
(WIC or Microsoft .NET Framework 3.0 required)
Wdp    
WIC-compatible (only in Windows version)
(WIC or Microsoft .NET Framework 3.0 required)
     

O ABBYY FineReader Engine não abrirá imagens maiores que 32512*32512 pixels.

Formatos suportados de salvamento de documentos

ABBYY FineReader Engine pode salvar o texto reconhecido nos seguintes formatos:

  • RTF
  • DOCX
  • XLSX e XLS (somente na versão do Windows)

    O FineReader Engine suporta os formatos MS Excel 5 e 8 para salvar no formato XLS.

  • PPTX
  • PDF, PDF 2.0, PDF/UA
  • PDF/A-1(a,b), PDF/A-2(a,b,u), PDF/A-3(a,b,u)

    O FineReader Engine suporta compactação MRC para todos os formatos PDF.

  • HTML, HTML 5

    O FineReader Engine suporta várias codificações de páginas (Windows, DOS, Mac, ISO) e codificação Unicode (UTF-16, UTF-8).

  • TXT

    O FineReader Engine suporta várias codificações de páginas (Windows, DOS, Mac, ISO) e codificação Unicode (UTF-16, UTF-8).

  • CSV
  • XML — formato de arquivo contém texto reconhecido cuja estrutura é descrita com a ajuda de tags XML.
  • ALTO 3.1
  • XPS (somente na versão do Windows)
  • FB2
  • EPUB
  • ODT
  • vCard — somente para exportação de cartões de visita

Tipos de códigos de barras suportados

O ABBYY FineReader Engine reconhece os seguintes tipos de códigos de barras:

  • 1D: Codabar, Code 128, Code 39, Code 93, Code 32, EAN 8 and 13, Full ASCII Code 39, GS1-128, IATA 2 of 5, Industrial 2 of 5, Interleaved 2 of 5, Intelligent Mail (a.k.a USPS 4-CB), Matrix 2 of 5, Patch, PostNet, UPC-A, UPC-E.
  • 2D: Aztec, Data Matrix, MaxiCode, PDF 417, QR Code.

Extração de dados de zona de leitura ótica (MRZ)

O ABBYY FineReader Engine pode detectar uma zona de leitura ótica na imagem de uma ID ou documento de viagem e extrair dados codificados de acordo com o documento ICAO 9303.

O FineReader Engine extrairá dados de ambos os tipos de campos MRZ:

  • 2 linhas
  • 3 linhas

Informações adicionais que podem ser extraídas:

  • Número de linhas no MRZ
  • Todos os caracteres de cada linha
  • Dados opcionais de cada linha
  • Tipo e subtipo do documento de identificação
  • Número do documento de identificação
  • Código do estado emissor
  • Data de expiração
  • Sobrenome e nomes adicionais
  • Nacionalidade
  • Data de nascimento e sexo
  • Número pessoal

Sempre que possível, o Engine extrai os dígitos de verificação de cada valor. Para fornecer informações sobre a qualidade da extração de dados, ele usa um valor booleano que especifica se a soma de verificação sobre o valor individual corresponde ao dígito de verificação.

Reconhecimento de marcas óticas

O ABBYY FineReader Engine reconhece marcas de seleção simples, agrupadas, de modelo e corrigidas manualmente:

  • Marcas de seleção em um quadro quadrado
  • Marcas de seleção contra o fundo vazio
  • Marcas de seleção não padrão (esse tipo requer treinamento prévio)

Para informações técnicas adicionais, consulte ABBYY.technology ou o arquivo de ajuda do ABBYY FineReader Engine.

Pronto para testar? Precisa de mais informações?

Por favor, preencha o formulário abaixo e retornaremos em breve.

Eu estou ciente de que posso revogar meu consentimento, parcial ou integralmente, a qualquer momento e com efeitos no futuro.

Para revogar seu consentimento, visite a página “cancelar inscrição” ou envie um e-mail para dataprotection@abbyy.com.

Eu dou consentimento ao uso de meus dados pessoais para os propósitos descritos na Notificação de Privacidade.

ABBYY agradece pelo seu interesse nos nossos produtos!

Em breve entraremos em contato com você.

Cordialmente,
A equipe da ABBYY