ABBYY FineReader Engine ABBYY FineReader Engine

Многофункциональный OCR SDK для разработчиков

Используйте OCR-технологии с элементами искусственного интеллекта

Спецификации

ABBYY FineReader Engine 12 доступен в трех версиях:

  • ABBYY FineReader Engine 12 для Windows
  • ABBYY FineReader Engine 12 для Linux
  • ABBYY FineReader Engine 12 для Mac

Системные требования

Компьютер

ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше).

Операцион­ная система

  • Windows Server 2016, Windows Server 2012, Windows Server 2012 R2 with the April 2014 update rollup (KB2919355), Windows Server 2008 R2 SP1
  • Windows 10, Windows 8.1 with the April 2014 update rollup (KB2919355), Windows 8, Windows 7 SP1

Протестиро­ванные платформы облачных вычислений и виртуальные среды

  • Azure Cloud Services
  • Azure Service Fabric
  • Azure Virtual Machines
  • Amazon EC2
  • Microsoft Hyper-V Server 2008
  • Microsoft Hyper-V Server 2008 R2 SP1
  • Microsoft Hyper-V Server 2012
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • Parallels Desktop for Mac 13.0.1
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0

ABBYY FineReader Engine также может использоваться в Docker-контейнерах на поддерживаемых платформах.

Память

  • для обработки одностраничных документов: минимум 400 МБ ОЗУ, рекомендуется 1 ГБ;
  • для обработки многостраничных документов: минимум 1 ГБ ОЗУ, рекомендуется 1,5 ГБ;
  • для параллельной обработки: 350 МБ * (количество ядер) + 450 МБ ОЗУ;
  • для параллельной обработки документов на арабском или CJK языках: 850 МБ * (количество ядер) + 750 МБ ОЗУ.

Место на жестком диске

1400 МБ для установки библиотек и 100 МБ для работы программы, а также дополнительно 15 МБ для каждой обрабатываемой страницы многостраничного документа.

Другие требования

  • Полностью TWAIN-совместимый сканер, цифровая фотокамера или факс-модем – только для функции сканирования.
  • Видеокарта и монитор с минимальным разрешением 1024x768 — для обучения шаблонов, редактирования словарей и сканирования при помощи графического пользовательского интерфейса).
  • Microsoft Internet Explorer 8.0 или выше. Для правильного детектирования содержащихся в документах шрифтов, они должны быть установлены на компьютере.

ABBYY SDK 12 Licensing Service (системные требования)

Компьютер

ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше).

Операцион­ная система

  • Windows Server 2016, Windows Server 2012 R2, Windows Server 2012, Windows Server 2008 R2
  • Windows 10, Windows 8.1, Windows 8, Windows 7 SP1

Протестиро­ванные платформы облачных вычислений и виртуальные среды

  • Microsoft Hyper-V Server 2008
  • Microsoft Hyper-V Server 2008 R2 SP1
  • Microsoft Hyper-V Server 2012
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • Parallels Desktop for Mac 13.0.1
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0

Поддерживаемые среды разработки

ABBYY FineReader Engine для Windows предоставляет API, который соответствует COM-стандарту и может легко использоваться из C/C++, Visual Basic, .NET, Delphi, Java, а также из любых других средах разработки с поддержкой компонент COM. Engine может быть адаптирован для использования со скриптовыми языками, например, VBS, JS, или Perl.

ABBYY FineReader Engine требует наличия библиотеки glibc версии 2.11 и выше. Если необходим ABBYY FineReader Engine для более ранних версий glibc, свяжитесь с офисом ABBYY.

Для использования динамической библиотеки ABBYY FineReader Engine необходимы стандартные библиотеки libstdc++.so.6 и libgcc_s.so.1.

Компьютер

ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше) и с поддержкой SSE и SSE 2.

Операцион­ная система

  • Fedora 27, 26, 25
  • Red Hat Enterprise Linux 7.4, 6.9
  • Debian GNU/Linux 9.2, 8.8
  • Ubuntu 17.10, 16.04.1 LTS, 14.04.5 LTS
  • CentOS 7.3, 6.9
  • ALT Linux 7 SPT, 8 SP/Education/Workstation/Server

Компания ABBYY также предоставляет услугу профессиональной адаптации ПО для других платформ.

Протестиро­ванные платформы облачных вычислений и виртуальные среды

  • Microsoft Azure Virtual Machines
  • Amazon EC2
  • Microsoft Hyper-V Server 2012 R2
  • Microsoft Hyper-V Server 2016
  • Oracle VM VirtualBox 5.2
  • VMware ESXi 6.5
  • VMware Workstation Player 12.5
  • VMware Workstation Pro 14.0.0
  • Linux KVM

ABBYY FineReader Engine также может использоваться в Docker-контейнерах на поддерживаемых платформах.

Память

  • для обработки одностраничных документов: минимум 400 МБ ОЗУ, рекомендуется 1 ГБ
  • для обработки многостраничных документов: минимум 1 ГБ ОЗУ, рекомендуется 1,5 ГБ
  • для параллельной обработки: 350 МБ * (количество ядер) + 450 МБ ОЗУ
  • для параллельной обработки документов на арабском или CJK языках: 850 МБ * (количество ядер) + 750 МБ ОЗУ

Место на жестком диске

1400 МБ для установки библиотек и 100 МБ для работы программы, а также дополнительно 15 МБ для каждой обрабатываемой страницы многостраничного документа.

Другие требования

  • Объем tmpfs: 1ГБ*(количество ядер) + 4ГБ
  • Объем swap: 1ГБ*(количество ядер) + 4ГБ
  • ABBYY FineReader Engine совместим с системой инициализации systemd.
  • Для правильного детектирования содержащихся в документах шрифтов, они должны быть установлены на компьютере.

Поддерживаемые среды разработки

ABBYY FineReader Engine для Linux предоставляет нативный C/C++ API и Java-обертку для него, поэтому приложения должны быть написаны на C/C++ или Java.

Компьютер

ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше).

Операцион­ная система

Mac OS X (10.12.x, 10.13.x).

Память

  • для обработки одностраничных документов: минимум 400 МБ ОЗУ, рекомендуется 1 ГБ
  • для обработки многостраничных документов: минимум 1 ГБ ОЗУ, рекомендуется 1,5 ГБ

Место на жестком диске

1400 МБ для установки библиотек и 100 МБ для работы программы, а также дополнительно 15 МБ для каждой обрабатываемой страницы многостраничного документа.

Для правильного детектирования содержащихся в документах шрифтов, они должны быть установлены на компьютере.

Поддерживаемые среды разработки

ABBYY FineReader Engine для Mac предоставляет только нативный C/C++ API, поэтому приложения должны быть написаны на C/C++.

Языки распознавания

ABBYY FineReader Engine 12 поддерживает самое большое количество языков распознавания на рынке. С его помощью можно распознавать языки, в письменности которых используются латиница, кириллица, греческие и армянские символы, а также арабский, бирманский (техническое превью), персидский (фарси), иврит, китайский, японский, корейский, русский языки и много других. Также доступна встроенная утилита для создания пользовательских словарей и шаблонов, что позволяет улучшить распознавания необычных слов или нетипичных шрифтов.

Кроме того, SDK подерживает обработку документов XVII-XIX столетий на английском, испанском, итальянском, немецком и французском языках, текстов на искусственных языках (эсперанто, интерлингва, идо и окциденталь), а также позволяет распознавать языки программирования (Basic, C/C++, COBOL, Fortran, JAVA и Pascal), простые химические формулы и цифры. В общей сложности, в ABBYY FineReader Engine поддержано 208 OCR и 126 ICR языков.

  • 47 основных языков с Латинскими, Кириллическими, Греческими или Армянскими символами, для которых FineReader Engine предоставляет словарную поддержку: Армянский (Западный, Восточный, Грабар), Башкирский, Болгарский, Каталанский, Хорватский, Чешский, Датский, Нидерландский (Нидерланды и Бельгия), Английский, Эстонский, Финский, Французский, Немецкий (новая и старая орфография), Греческий, Венгерский, Итальянский, Индонезийский, Латвийский, Литовский, Норвежский (Нюнорск и Букмол), Польский, Португальский (Португалия и Бразилия), Румынский, Русский, Словацкий, Словенский, Испанский, Шведский, Татарский, Турецкий и Украинский.
  • Японский, Корейский и Хангыль со словарной поддержкой.
  • Тайский язык со словарной поддержкой.
  • Иврит со словарной поддержкой, Идиш.
  • Арабский со словарной поддержкой.
  • Персидский язык со словарной поддержкой.
  • Латинский, Азербайджанский (латиница), Русский (старая орфография) со словарной поддержкой
  • 5 FineReader XIX языки со словарной поддержкой, для распознавания старых европейских документов 17-19 веков: Английский, Французский, Немецкий, Итальянский и Испанский языки.
  • 136 дополнительных языков с Латинскими, Кириллическими и Греческими символами: Абхазский, Аварский, Агульский, Адыгейский, Азербайджанский (Кириллица), Азербайджанский (Латиница), Аймара, Албанский, Алтайский, Африкаанс, Баскский, Белорусский, Бемба, Блэкфут, Бретонский, Буготу, Бурятский, Волоф, Гавайский, Гагаузский, Галисийский, Ганда, Гуарани, Гэльский (Шотландия), Дакота, Даргинский, Дунганский, Зулу, Ингушский, Ирландский, Исландский, Кабардинский, Казахский, Калмыцкий, Каракалпакский, Карачаево-Балкарский, Кашубский, Кечуа, Кикуйю, Киргизский, Конго, Корсиканский, Корякский, Коса, Кпелле, Кроу, Крымскотатарский, Кумыкский, Курдский, Лакский, Латвийский (Готический шрифт), Латинский, Лезгинский, Луба, Лужицкий, Майя, Македонский, Малагасийский, Малайский, Малинке, Мальтийский, Мансийский, Маори, Марийский, Минангкабау, Могавк, Молдавский, Монгольский, Мордовский, Мяо, Науатль, Немецкий (Люксембург), Ненецкий, Нивхский, Ногайский, Ньянджа, Оджибве, Окситанский (Провансальский), Осетинский, Папьяменто, Ретороманский, Руанда, Рунди, Саамский, Самоа, Сапотек, Свази, Себуанский, Селькупский, Сербский (Кириллица, Латиница), Славянский, Сомали, Суахили, Сунданский, Суто, Табасаранский, Тагальский, Таджикский, Таити, Ток-Писин, Тонга, Тсвана, Тувинский, Туркменский (Кириллица, Латиница), Удмурский, Узбекский (Кириллица, Латиница), Уйгурский (Кириллица, Латиница), Уэльский, Фарерский, Фиджи, Фризский, Фриульский, Хакасский, Хани, Хантыйский, Хауса, Цзингпо, Цыганский, Чаморро, Чеченский, Чувашский, Чукотский, Шона, Эвенкийский, Эвенский, Эскимосский (Кириллица), Эскимосский (Латиница), Якутский
  • Китайский традиционный и упрощенный.
  • Урду и пушту.
  • Бирманский язык (техническое превью).
  • 4 искусственных языка: Эсперанто, Интерлингва, Идо и Окциденталь.
  • 6 языков программирования: Basic, C/C++, COBOL, Fortran, JAVA и Pascal.
  • Простые химические формулы.
  • Цифры.
  • Инструменты для создания языков, определяемых пользователями.

ABBYY FineReader Engine 12 для Windows предоставляет ICR технологию — распознавание рукопечатных символов для боле чем 125 языков, включая:

  • 39 языков с морфологической/словарной поддержкой (языки с Латинскими символами, Кириллические языки и Греческий).
  • 86 языков без словарной поддержки.
  • ICR арабских цифр.

ABBYY FineReader Engine 12 предоставляет BCR технологию — распознавание визитных карточек для 26 языков:

  • Английский, Венгерский, Греческий, Датский, Индонезийский, Итальянский, Испанский, Немецкий, Нидерландский (Нидерланды), Норвежский, Норвежский (Нюнорск), Норвежский (Букмол), Польский, Португальский (Португалия и Бразилия), Русский, Турецкий, Украинский, Финский, Французский, Чешский, Шведский, Эстонский.
  • Китайский (традиционный и упрощенный), Японский и Корейский.

Языки сообщений

Заголовки и тексты диалогов, сообщения об ошибках и другие сообщения программы могут выводиться на английском, немецком, итальянском, французском, испанском, нидерландском, португальском, русском, эстонском, польском, чешском, словацком, венгерском, болгарском, датском, украинском, шведском, греческом, литовском, латышском, корейском, японском и китайcком (традиционном и упрощенном) языках.

Поддерживаемые форматы изображений

ABBYY FineReader Engine может открывать файлы изображений нескольких форматов. Кроме того, OCR SDK позволяет сохранить результаты в виде изображений нескольких форматов.

Список поддерживаемых форматов изображений:

  • PDF: файлы PDF формата (версия 1.7 или более ранние), включая архивный формат PDF/A
  • BMP: чёрно-белый, серый, цветной
  • PCX, DCX: чёрно-белый, серый, цветной
  • JPEG: серый, цветной
  • JPEG 2000, part1: серый, цветной
  • PNG: чёрно-белый, серый, цветной
  • TIFF: чёрно-белый, серый, цветной. Способы сжатия: несжатый, CCITT Group 3, CCITT Group 3 FAX (только открытие), CCITT Group 4, PackBits, JPEG, ZIP, LZW. Многостраничные TIFF-изображения.
  • GIF (только открытие): чёрно-белый, серый, цветной
  • DjVu (только открытие): чёрно-белый, серый, цветной
  • JBIG2: черно-белый
  • WDP, WIC-совместимый (только открытие): чёрно-белый, серый, цветной (требуется WIC или Microsoft .NET Framework 3.0).

Важно: ABBYY FineReader Engine не сможет открыть изображение, чьи размеры превышают 32512*32512 пикселей.

Форматы сохранения документов

ABBYY FineReader Engine позволяет сохранить распознанный текст в следующих форматах:

  • RTF
  • DOCX
  • XLSX and XLS (только в версии для Windows)

    FineReader Engine поддерживает форматы MS Excel 5 и 8 для сохранения резултатов в формате XLS.

  • PPTX
  • PDF, PDF 2.0, PDF/UA
  • PDF/A-1(a,b), PDF/A-2(a,b,u), PDF/A-3(a,b,u)

    FineReader Engine поддерживает MRC-компрессию для всех PDF-форматов.

  • HTML, HTML 5

    ABBYY FineReader Engine поддерживает различные кодовые страницы (Windows, DOS, Mac, ISO) и кодовые страницы Unicode (UTF-16, UTF-8).

  • TXT

    ABBYY FineReader Engine поддерживает различные кодовые страницы (Windows, DOS, Mac, ISO) и кодовые страницы Unicode (UTF-16, UTF-8).

  • CSV
  • XML — структура распознанного текста описана с помощью XML.
  • ALTO 3.1
  • XPS (только в версии для Windows)
  • FB2
  • EPUB
  • ODT
  • vCard — только для экспорта визитных карточек

Поддерживаемые типы штрихкодов

ABBYY FineReader Engine распознает следующие типы штрихкодов:

  • Одномерные: Codabar, Code 128, Code 39, Code 93, Code 32, EAN 8 and 13, Full ASCII Code 39, GS1-128, IATA 2 of 5, Industrial 2 of 5, Interleaved 2 of 5, Intelligent Mail (a.k.a USPS 4-CB), Matrix 2 of 5, Patch, PostNet, UPC-A, UPC-E
  • Двумерные: Aztec, Data Matrix, MaxiCode, PDF 417, QR Code

Распознавание меток (OMR)

В ABBYY FineReader Engine поддержано распознавание одиночных меток и групп меток. При распознавании корректно обрабатываются как ошибочно выбранные метки, так и полностью закрашенные метки в самых различных вариациях:

  • Символьные метки в индивидуальных квадратах.
  • Квадраты на сером фоне.
  • Индивидуальная посимвольная разметка (требует ручного обучения).

Важно: эта функциональность доступна только в ABBYY FineReader Engine 12 для Windows. В версиях для Linux и Mac она недоступна.

Дополнительную техническую информацию можно найти на странице ABBYY.technology или в файле справки ABBYY FineReader Engine.

Закажите эффективное решение задачи

Наши специалисты готовы подробно рассказать о технологиях и решениях компании ABBYY. Опишите задачи, которые вы хотите решить, и получите индивидуальное предложение с примерными сроками и ожидаемыми результатами.

Я проинформирован о том, что я имею право в любое время полностью или частично отозвать вышеуказанное согласие.

Отозвать согласие также можно на странице отмены подписки на сообщения или отправив письмо с отказом от подписки по адресу dataprotection@abbyy.com.

Я даю согласие на использование моих персональных данных для целей, описанных в правовой политике.

Спасибо за интерес к продуктам компании ABBYY!

Ваш запрос находится в обработке. Наши специалисты свяжутся с вами в самое ближайшее время.

С уважением,
команда ABBYY