ABBYY FineReader Engine ABBYY FineReader Engine

Многофункциональный OCR SDK для разработчиков

Используйте OCR-технологии с элементами искусственного интеллекта

Спецификации

ABBYY FineReader Engine 12 доступен в трех версиях:

  • ABBYY FineReader Engine 12 для Windows
  • ABBYY FineReader Engine 12 для Linux
  • ABBYY FineReader Engine 12 для Mac

Системные требования

Компьютер

ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше).

Операцион­ная система

  • Windows Server 2019, Windows Server 2016, Windows Server 2012, Windows Server 2012 R2 with the April 2014 update rollup (KB2919355), Windows Server 2008 R2 SP1
  • Windows 10, Windows 8.1 with the April 2014 update rollup (KB2919355), Windows 8, Windows 7 SP1

Протестиро­ванные платформы облачных вычислений и виртуальные среды

  • Azure App Services
  • Azure Cloud Services
  • Azure Service Fabric
  • Azure Virtual Machines
  • Amazon EC2
  • Microsoft Hyper-V Server 2008
  • Microsoft Hyper-V Server 2008 R2 SP1
  • Microsoft Hyper-V Server 2012
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • Parallels Desktop for Mac 13.0.1
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0

Протестированные среды разработки Java

Решение ABBYY FineReader Engine было протестировано на следующих наборах разработчика Java:

  • для 32-битных операционных систем:
    • Oracle Java SE Development Kit 8u201 i586
    • Oracle Java SE Development Kit 8u202 i586
  • для 64-битных операционных систем:
    • OpenJDK 11.0.2 x64
    • OpenJDK 12.0.2 x64
    • OpenJDK 13 x64
    • Oracle Java SE Development Kit 8u201 x64
    • Oracle Java SE Development Kit 8u202 x64
    • Oracle Java SE Development Kit 12.0.2 x64
    • Oracle Java SE Development Kit 13 x64

ABBYY FineReader Engine также может использоваться в Docker-контейнерах на поддерживаемых платформах.

Память

  • для обработки одностраничных документов: минимум 400 МБ ОЗУ, рекомендуется 1 ГБ;
  • для обработки многостраничных документов: минимум 1 ГБ ОЗУ, рекомендуется 1,5 ГБ;
  • для параллельной обработки: 350 МБ * (количество ядер) + 450 МБ ОЗУ;
  • для параллельной обработки документов на арабском или CJK языках: 850 МБ * (количество ядер) + 750 МБ ОЗУ.

Место на жестком диске

  • 1.600 МБ для установки библиотек (функционал ядра)
  • Дополнительные 400 МБ для установки библиотеки модулей OfficeConverters
  • 100 МБ для работы программы
  • Дополнительные 15 МБ на каждую страницу при обработке многостраничного документа

Другие требования

  • Полностью TWAIN-совместимый сканер, цифровая фотокамера или факс-модем – только для функции сканирования.
  • Видеокарта и монитор с минимальным разрешением 1024x768 — для обучения шаблонов, редактирования словарей и сканирования при помощи графического пользовательского интерфейса).
  • Microsoft Internet Explorer 8.0 или выше. Для правильного детектирования содержащихся в документах шрифтов, они должны быть установлены на компьютере.

ABBYY SDK 12 Licensing Service (системные требования)

Компьютер

ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше).

Операцион­ная система

  • Windows Server 2016, Windows Server 2012 R2, Windows Server 2012, Windows Server 2008 R2
  • Windows 10, Windows 8.1, Windows 8, Windows 7 SP1

Протестиро­ванные платформы облачных вычислений и виртуальные среды

  • Microsoft Hyper-V Server 2008
  • Microsoft Hyper-V Server 2008 R2 SP1
  • Microsoft Hyper-V Server 2012
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • Parallels Desktop for Mac 13.0.1
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0

Поддерживаемые среды разработки

ABBYY FineReader Engine для Windows предоставляет API, который соответствует COM-стандарту и может легко использоваться из C/C++, Visual Basic, .NET, Delphi, Java, а также из любых других средах разработки с поддержкой компонент COM. Engine может быть адаптирован для использования со скриптовыми языками, например, VBS, JS, или Perl.

ABBYY FineReader Engine требует наличия библиотеки glibc версии 2.11 и выше. Если необходим ABBYY FineReader Engine для более ранних версий glibc, свяжитесь с офисом ABBYY.

Для использования динамической библиотеки ABBYY FineReader Engine необходимы стандартные библиотеки libstdc++.so.6, libgcc_s.so.1 и libgomp.so.1

Компьютер

ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше) и с поддержкой SSE и SSE 2.

Операцион­ная система

  • Fedora 31, 30, 29
  • Red Hat Enterprise Linux 8.1, 7.7, 6.10
  • SUSE Linux Enterprise Server 15 SP1, 12 SP4, 11 SP4
  • Debian GNU/Linux 10.2, 9.11, 8.11
  • Ubuntu 19.10, 19.04, 18.04.3 LTS, 16.04.6 LTS, 14.04.6 LTS
  • CentOS 8.0, 7.7, 6.10
  • ALT Linux 9.0, 8.2 (no support for Wibu dongles)
  • Amazon Linux AMI 2018.03

Компания ABBYY также предоставляет услугу профессиональной адаптации ПО для других платформ.

Протестиро­ванные платформы облачных вычислений и виртуальные среды

  • Microsoft Azure Virtual Machines
  • Amazon EC2
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0
  • Linux KVM

ABBYY FineReader Engine также может использоваться в Docker-контейнерах на поддерживаемых платформах.

ABBYY FineReader Engine Java wrapper был протестирован в следующих Java Development Kits:

  • OpenJDK 13 x64
  • OpenJDK 14 Early-Access (build 21) x64
  • Oracle Java SE Development Kit 8u231 x64
  • Oracle Java SE Development Kit 11.0.5 (LTS) x64
  • Oracle Java SE Development Kit 13.0.1 x64

Память

  • для обработки одностраничных документов: минимум 400 МБ ОЗУ, рекомендуется 1 ГБ
  • для обработки многостраничных документов: минимум 1 ГБ ОЗУ, рекомендуется 1,5 ГБ
  • для параллельной обработки: 350 МБ * (количество ядер) + 450 МБ ОЗУ
  • для параллельной обработки документов на арабском или CJK языках: 850 МБ * (количество ядер) + 750 МБ ОЗУ

Место на жестком диске

2150 МБ для установки библиотек и 100 МБ для работы программы, а также дополнительно 15 МБ для каждой обрабатываемой страницы многостраничного документа.

Другие требования

  • Объем tmpfs: 1ГБ*(количество ядер) + 4ГБ
  • Объем swap: 1ГБ*(количество ядер) + 4ГБ
  • ABBYY FineReader Engine совместим с системой инициализации systemd.
  • Для правильного детектирования содержащихся в документах шрифтов, они должны быть установлены на компьютере.

Поддерживаемые среды разработки

ABBYY FineReader Engine для Linux предоставляет нативный C/C++ API и Java-обертку для него, поэтому приложения должны быть написаны на C/C++ или Java.

Компьютер

ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше).

Операцион­ная система

  • macOS 10.13.x High Sierra
  • macOS 10.14.x Mojave
  • macOS 10.15.x Catalina

Память

  • для обработки одностраничных документов: минимум 400 МБ ОЗУ, рекомендуется 1 ГБ
  • для обработки многостраничных документов: минимум 1 ГБ ОЗУ, рекомендуется 1,5 ГБ

Место на жестком диске

2500 МБ для установки библиотек и 100 МБ для работы программы, а также дополнительно 15 МБ для каждой обрабатываемой страницы многостраничного документа.

Для правильного детектирования содержащихся в документах шрифтов, они должны быть установлены на компьютере.

Поддерживаемые среды разработки

ABBYY FineReader Engine для Mac предоставляет только нативный C/C++ API, поэтому приложения должны быть написаны на C/C++.

Языки распознавания

ABBYY FineReader Engine 12 поддерживает самое большое количество языков распознавания на рынке. С его помощью можно распознавать языки, в письменности которых используются латиница, кириллица, греческие и армянские символы, а также арабский, бирманский (техническое превью), персидский (фарси), иврит, китайский, японский, корейский, русский языки и много других. Также доступна встроенная утилита для создания пользовательских словарей и шаблонов, что позволяет улучшить распознавания необычных слов или нетипичных шрифтов.

Кроме того, SDK подерживает обработку документов XVII-XIX столетий на английском, испанском, итальянском, немецком и французском языках, текстов на искусственных языках (эсперанто, интерлингва, идо и окциденталь), а также позволяет распознавать языки программирования (Basic, C/C++, COBOL, Fortran, JAVA и Pascal), простые химические формулы и цифры. В общей сложности, в ABBYY FineReader Engine поддержано 210 OCR и 126 ICR языков.

× Со словарной поддержкой

Абхазский
Аварский
Агульский
Адыгейский
Азербайджанский (кириллица)
Азербайджанский (латиница)×
Аймара
Албанский
Алтайский
Английский×
Арабский (Саудовская Аравия)×
Армянский (восточный)×
Армянский (грабарь)×
Армянский (западный)×
Африкаанс
Базовый язык программирования
Баскский
Башкирский×
Белорусский
Бемба
Бирманский (технический превью)
Блэкфут
Болгарский×
Бретонский
Буготу
Бурятский
Валлийский
Венгерский×
Волоф
Вьетнамский×
Гавайский
Гагаузский
Галисийский
Ганда
Голландский (Бельгия)×
Голландский (Нидерланды)×
Греческий×
Грузинский
Гуарани
Дакота (сиу)
Даргинский
Датский×
Дунганский
Зулу
Иврит×
Идиш
Идо
Ингушский
Индонезийский×
Интерлингва
Ирландский
Исландский
Испанский×
Итальянский×
Кабардинский
Казахский
Калмыцкий
Каракалпакский
Карачаево-балкарский
Каталонский×
Кашубский
Кечуа
Кикуйю
Киргизский
Китайский традиционный
Китайский упрощенный
Конго
Корейский (хангыль)×
Корейский×
Корсиканский
Корякский
Коса
Кпелле
Кроу
Крымскотатарский
Кумыкский
Курдский
Лакский
Латинский×
Латышский×
Латышский отический
Лезгинский
Литовский×
Луба
Лужицкий
Майя
Македонский
Малагасийский
Малайский (малазийский)
Малинке
Мальтийский
Мансийский
Маори
Марийский
Минангкабау
Могавк
Монгольский
Мордовский
Мяо
Науатль
Немецкий (Люксембург)
Немецкий (новая орфография)×
Немецкий×
Ненецкий
Нивхский
Ногайский
Норвежский (букмол)×
Норвежский (нюнорск)×
Норвежский×
Ньянджа
Оджибве
Окциденталь
Осетинский
Папьяменто
Польский×
Португальский (Бразилия)×
Португальский (Португалия)×
Провансальский
Простые математические формулы
Простые химические формулы
Ретороманский
Руанда
Румынский (Молдавия)
Румынский×
Рунди
Русский (старая орфография)×
Русский×
Русский (с ударениями)×
Саамский
Самоа
Сапотекский
Свази
Себуанский
Селькупски
Сербский (кириллица)
Сербский (латинский)
Сесото
Словацкий×
Словенский×
Сомалийский
Староанглийский×
Староиспанский×
Староитальянский×
Старонемецкий×
Старославянский
Старофранцузский×
Суахили
Сунданский
Табасаранский
Тагальский
Таджикский
Таитянский
Тайский×
Татарский×
Текст типа ocr-a
Текст типа ocr-b
Ток писин
Тонга
Тсвана
Тувинский
Тунисский
Турецкий×
Туркменский
Туркменский (латинский)
Удмуртский
Узбекский (кириллица)
Узбекский (латинский)
Уйгурский (кириллица)
Уйгурский (латинский)
Украинский×
Фарерский
Фарси×
Фиджийский
Финский×
Французский×
Фризский
Фриульский
Хакасский
Хани
Хантыйский
Хауса
Хорватский×
Цзинпо
Цыганский
Чаморро
Чеченский
Чешский×
Числовые символы
Чувашский
Чукотский
Шведский×
Шона
Шотландский гэльский
Шрифт micr (cmc-7)
Шрифт micr (e-13b)
Эвенкийский
Эвенский
Эскимосский (кириллица)
Эскимосский (латинский)
Эсперанто
Эстонский×
Язык программирования c / c ++
Язык программирования Cobol
Язык программирования Fortran
Язык программирования Java
Язык программирования Kawa
Язык программирования Pascal
Якутский
Японский (современный)×
Японский×
Азербайджанский (латиница)
Аймара
Албанский
Английский
Арабский (Cаудовская Аравия)*
Африкаанс
Баскский
Бемба
Блэкфут
Болгарский
Бретонский
Буготу
Бурятский
Венгерский
Волоф
Гавайский
Галисийский
Ганда
Голландский (Бельгия)
Голландский (Нидерланды)
Греческий
Гуарани
Дакота (сиу)
Датский
Идо
Индонезийский
Интерлингва
Ирландский
Испанский
Итальянский
Казахский
Карачаево-балкарский
Качинский
Кашубский
Кечуа
Киргизский
Конго
Корсиканский
Коса
Кпелле
Кроу
Крымскотатарский
Кумыкский
Курдский
Латинский
Латышский
Литовский
Луба
Майя
Малагасийский
Малинке
Маори
Минангкабау
Могаукский
Монгольский
Мордовский
Мяо
Науатль
Немецкий
Немецкий (Люксембург)
Немецкий (новая орфография)
Ненецкий
Нивхский
Ногайский
Норвежский
Норвежский (букмол)
Норвежский (нюнорск)
Ньянджа
Оджибве
Папьяменто
Польский
Португальский (Бразилия)
Португальский (Португалия)
Ретороманский
Руанда
Румынский
Румынский (Молдавия)
Рунди
Русский
Саамский
Самоа
Сапотекский
Свази
Себуанский
Селькупский
Сербский (кириллица)
Сербский (латинский)
Сесото
Словацкий
Словенский
Сомалийский
Староанглийский
Староиспанский
Староитальянский
Старонемецкий
Старофранцузский
Суахили
Тагальский
Таджикский
Таитянский
Ток писин
Тонга
Тсвана
Тувинский
Тунисский
Турецкий
Туркменский (латинский)
Узбекский (латинский)
Уйгурский (латинский)
Украинский
Фиджи
Финский
Французский
Фризский
Фриульский
Хани
Хорватский
Цыганский
Чаморро
Чешский
Числовые символы
Шведский
Шотландский (гэльский)
Эвенкийский
Эвенский
Эстонский
Язык программирования kawa

* Арабский ICR не поддерживается. Но распознаются арабские цифры, отпечатанные вручную.

Английский
Венгерский
Голландский (Нидерланды)
Греческий
Датский
Индонезийский
Испанский
Итальянский
Китайский традиционный
Китайский упрощенный
Корейский
Немецкий
Норвежский
Норвежский (букмол)
Норвежский (нюнорск)
Польский
Португальский (Бразилия)
Португальский (Португалия)
Русский
Турецкий
Украинский
Финский
Французский
Чешский
Шведский
Эстонский
Японский

Языки сообщений

Заголовки и тексты диалогов, сообщения об ошибках и другие сообщения программы могут выводиться на английском, болгарском, чешском, китайском (КНР и Тайвань), датском, голландском, эстонском, французском, немецком, греческом, венгерском, итальянском, японском, корейском, польском, португальском (Бразилия), русском, словацком, испанском, шведском, турецком, и украинском.

Поддерживаемые форматы офисных документов*

ABBYY FineReader Engine может открывать документы нескольких форматов:

  • Текстовые форматы: .doc, .docx, .rtf, .htm / .html, .txt, .odt
  • Форматы таблиц: .xls, .xlsx, .ods
  • Форматы презентаций: .ppt, .pptx, .odp
  • Цифровые PDF: .pdf

Поддерживаемые форматы изображений

ABBYY FineReader Engine может открывать файлы изображений нескольких форматов. Кроме того, OCR SDK позволяет сохранить результаты в виде изображений нескольких форматов.

Список поддерживаемых форматов изображений:

Формат Расширение Поддерживает открытие Поддерживает сохранение
BMP
несжатый чёрно-белый
4- и 8-битный — несжатый Palette
16-битный — несжатый, несжатый Mask
24-битный — несжатый
32-битный — несжатый, несжатый Mask
bmp    
BMP
4- и 8- битный — RLE сжатый Palette
bmp    
DCX
чёрно-белый
2-, 4- и 8- битный Palette
24- битный цветной
dcx    
DjVu (только для Windows)
чёрно-белый, серый, цветной
djvu, djv    
GIF
чёрно-белый — LZW-сжатый
2-, 3-, 4-, 5-, 6-, 7-, 8-битный Palette — LZW-сжатый
gif    
JBIG2
чёрно-белый
jb2    
JPEG
серый, цветной
jpg, jpeg, jfif    
JPEG 2000
серый — Part 1
цветной — Part 1
jp2, jpc, j2k    
PCX
чёрно-белый
2-, 4- и 8-битный Palette
24- битный цветной
pcx    
Изображение PDF (скан PDF) pdf    
Созданный в цифровом виде PDF (Версия 1.7 или ранее) pdf    
PNG
чёрно-белый, серый, цветной
png    
TIFF
чёрно-белый — несжатый, CCITT3, CCITT4, Packbits, ZIP, LZW
серый — несжатый, Packbits, JPEG, ZIP, LZW
24-битный цветной — несжатый, JPEG, ZIP, LZW
1-, 4-, 8-битный Palette — несжатый, Packbits, ZIP, LZW
(включая многостраничный TIFF)
tif, tiff    
TIFF
чёрно-белый — CCITT3FAX
tif, tiff    
WDP (только для Windows)
чёрно-белый, серый, цветной
(требуется WIC или Microsoft .NET Framework 3.0)
Wdp    
WIC-compatible (только для Windows)
(требуется WIC или Microsoft .NET Framework 3.0)
     

Примечание: ABBYY FineReader Engine не открывает изображения размером более 32512*32512 пикселей.

Форматы сохранения документов

ABBYY FineReader Engine позволяет сохранить распознанный текст в следующих форматах:

  • RTF
  • DOCX
  • XLSX and XLS (только в версии для Windows)

    FineReader Engine поддерживает форматы MS Excel 5 и 8 для сохранения резултатов в формате XLS.

  • PPTX
  • PDF, PDF 2.0, PDF/UA
  • PDF/A-1(a,b), PDF/A-2(a,b,u), PDF/A-3(a,b,u)

    FineReader Engine поддерживает MRC-компрессию для всех PDF-форматов.

  • HTML, HTML 5

    ABBYY FineReader Engine поддерживает различные кодовые страницы (Windows, DOS, Mac, ISO) и кодовые страницы Unicode (UTF-16, UTF-8).

  • TXT

    ABBYY FineReader Engine поддерживает различные кодовые страницы (Windows, DOS, Mac, ISO) и кодовые страницы Unicode (UTF-16, UTF-8).

  • CSV
  • XML — структура распознанного текста описана с помощью XML.
  • ALTO 3.1
  • XPS (только в версии для Windows)
  • FB2
  • EPUB
  • ODT
  • vCard — только для экспорта визитных карточек

Поддерживаемые типы штрихкодов

ABBYY FineReader Engine распознает следующие типы штрихкодов:

  • Одномерные: Codabar, Code 128, Code 39, Code 93, Code 32, EAN 8 and 13, Full ASCII Code 39, GS1-128, IATA 2 of 5, Industrial 2 of 5, Interleaved 2 of 5, Intelligent Mail (a.k.a USPS 4-CB), Matrix 2 of 5, Patch, PostNet, UPC-A, UPC-E (в дополнение к приведенному списку в версии для Windows доступны следующие одномерные штрихкоды: KIX, Royal Mail 4-State (RM4SCC), Australia Post 4-State).
  • Двумерные: Aztec, Data Matrix, MaxiCode, PDF 417, QR Code

Извлечение данных из MRZ-строки (машиночитаемой зоны)*

ABBYY FineReader Engine позволяет определить и извлечь данные на изображении паспортно-визовых документов из машиночитаемой зоны, выполненной в соответствии со стандартами ICAO 9303.

FineReader Engine обрабатывает информацию из машиночитаемой зоны нескольких типов:

  • 2-строчная
  • 3-строчная

FineReader Engine позволяет извлечь дополнительную информацию из паспортно-визовых документов:

  • Количество строк в MRZ
  • Все символы из каждой строки
  • Дополнительные данные из каждой строки
  • Тип и подтип документа
  • Номер документа
  • Код страны выдачи
  • Дата истечения срока действия
  • Фамилия, имя, отчество
  • Национальность
  • Дата рождения и пол
  • Личный номер

С помощью ABBYY FineReader Engine можно извлечь контрольные суммы для каждого значения. Для повышения качества данных в документе в продукте используется логический тип данных, который проверяет соответствие финальной контрольной суммы индивидуальным значениям контрольных сумм.

Распознавание меток (OMR)

В ABBYY FineReader Engine поддержано распознавание одиночных меток и групп меток. При распознавании корректно обрабатываются как ошибочно выбранные метки, так и полностью закрашенные метки в самых различных вариациях:

  • Символьные метки в индивидуальных квадратах.
  • Квадраты на сером фоне.
  • Индивидуальная посимвольная разметка (требует ручного обучения).

Дополнительную техническую информацию можно найти в файле справки ABBYY FineReader Engine.

Закажите эффективное решение задачи

Наши специалисты готовы подробно рассказать о технологиях и решениях компании ABBYY. Опишите задачи, которые вы хотите решить, и получите индивидуальное предложение с примерными сроками и ожидаемыми результатами.

Я проинформирован о том, что я имею право в любое время полностью или частично отозвать вышеуказанное согласие.

Отозвать согласие также можно на странице отмены подписки на сообщения или отправив письмо с отказом от подписки по адресу dataprotection@abbyy.com.

Я даю согласие на использование моих персональных данных для целей, описанных в правовой политике.

Спасибо за интерес к продуктам компании ABBYY!

Ваш запрос находится в обработке. Наши специалисты свяжутся с вами в самое ближайшее время.

С уважением,
команда ABBYY