ABBYY FineReader Engine ABBYY FineReader Engine

Многофункциональный OCR SDK для разработчиков

Используйте OCR-технологии с элементами искусственного интеллекта

Многоядерные процессоры и параллельная обработка

Гибкая и масштабируемая архитектура ABBYY FineReader Engine позволяет использовать многоядерные процессоры для обработки изображений в параллельных потоках, что значительно повышает скорость распознавания.

По умолчанию ABBYY FineReader Engine определяет, использовать ли параллельную обработку автоматически в зависимости от нескольких факторов, таких как, число доступных физических и логических ядер процессора, число ядер в параметрах лицензии и числа страниц в документе. При необходимости настройки параллельной обработки можно изменить и выбрать необходимое число активных процессов.

ABBYY FineReader Engine поддерживает два разных объекта, за счет которых обеспечивается параллельная обработка — FRDocument и BatchProcessor. Выбирайте объекты в зависимости от сценария использования.

Конвертация многостраничных документов с большим числом страниц

Данный сценарий подразумевает обработку больших документов и книг. В этом случае можно распараллелить распознавание страниц документа, а затем выполнить этапы синтеза и экспорта в главном процессе. Кроме того, можно организовать одновременную обработку нескольких многостраничных документов с использованием нескольких экземпляров SDK (pool of Engines), но при этом нужно быть готовым к тому, что возможны существенные утечки памяти, которые могут привести к сбоям программы.

Для параллельной обработки многостраничных документов ABBYY рекомендует использовать объект FRDocument. Использование данного объекта наименее трудозатратно, поскольку разработчику не нужно реализовывать никаких дополнительных интерфейсов.

В этом случае параллельно производятся только предобработка, анализ и распознавание, а синтез и экспорт выполняются последовательно в главном процессе.

Конвертация большого числа одностраничных документов

Используется, когда необходимо обрабатывать большое количество одностраничных документов. В этом случае применить распараллеливание легко, поскольку все страницы не зависят друг от друга и не требуют одновременного выделения большого количества памяти.

ABBYY FineReader Engine позволяет решить данную задачу двумя способами:

  • Использование BatchProcessor

    Преимущества этого метода заключаются в том, что его можно использовать для любого числа и типа документов, которые необходимо обработать прямо при поступлении. Этот метод, однако, требует больше усилий: пользователям понадобится реализовать интерфейсы файлового адаптера и пользовательского источника изображений. Документы открываются, предварительно обрабатываются, анализируются и распознаются параллельно.

  • Использование нескольких экземпляров SDK (a pool of Engines), загруженных в качестве out-of-process COM-сервера

    Это наиболее эффективный метод, который позволяет обеспечить высокую скорость и автоматически устраняет трудности, связанные с использованием многопоточности: все операции с объектами ABBYY FineReader Engine сериализуются при помощи COM.

Закажите эффективное решение задачи

Наши специалисты готовы подробно рассказать о технологиях и решениях компании ABBYY. Опишите задачи, которые вы хотите решить, и получите индивидуальное предложение с примерными сроками и ожидаемыми результатами.

Я проинформирован о том, что я имею право в любое время полностью или частично отозвать вышеуказанное согласие.

Отозвать согласие также можно на странице отмены подписки на сообщения или отправив письмо с отказом от подписки по адресу dataprotection@abbyy.com.

Я даю согласие на использование моих персональных данных для целей, описанных в правовой политике.

Спасибо за интерес к продуктам компании ABBYY!

Ваш запрос находится в обработке. Наши специалисты свяжутся с вами в самое ближайшее время.

С уважением,
команда ABBYY