ABBYY FineReader Engine ABBYY FineReader Engine

Многофункциональный OCR SDK для разработчиков

Используйте OCR-технологии с элементами искусственного интеллекта

Анализ структуры документов

Анализ структуры документов — самая значимая часть в процессе распознавания. ABBYY FineReader Engine использует передовые алгоритмы с элементами искусственного интеллекта и технологию ABBYY ADRT®.

На этом этапе определяется логическая структура документа: первая и последняя страница и элементы форматирования, например, сноски, колонтитулы и содержание. Кроме того, анализируется оформление каждой страницы и происходит ее разделение на текстовые блоки, изображения, таблицы и ячейки, штрихкоды и разделители, а также определяются ориентация страницы, сдвоенные страницы, вертикальный текст и области, не подлежащие распознаванию.

Благодаря этим функциям ABBYY FineReader Engine определяет текстовые области и блоки, которые следует распознать, а также фрагменты документа, которые должны сохраниться в исходном виде - например, изображения или диаграммы. В то же время ABBYY FineReader Engine получает информацию о логической структуре документа, которая используется на итоговой стадии OCR-процесса, в ходе воссоздания исходного вида документа.

Вы можете выбирать области для распознавания вручную — просто введите координаты и тип данных для распознавания. Используйте этот метод для повышения точности распознавания данных на предварительно определенных областях – Field-Level Recognition.

Режимы анализа документов

ABBYY FineReader Engine позволяет анализировать документы в трех автоматических и одном ручном режиме:

Общий анализ документов

Базовый режим анализа документов, в рамках которого программа определяет все объекты: блоки текста, изображения, таблицы, штрихкоды и разделители. Результаты анализа используются для восстановления структуры и оформления документа, в случае, когда необходимо повторно использовать документ и точно его воссоздать. Все изображения и диаграммы сохраняют исходный вид — без распознавания текста на изображениях и логотипах.

Анализ счетов

Режим для анализа и конвертации структурированных и слабоструктурированных документов, например, счетов, чеков, накладных, визитных карточек, больничных бланков и т. д. В этом случае программа точно определяет расположение всего текста на документе, включая символы и цифры — даже если информация находится внутри штампов, изображений, логотипов или напечатана мелким шрифтом.

В этом режиме вся напечатанная на документах информация имеет значение: программа убеждается, что текст не ошибочно определен как графический элемент, например, в случае с логотипами и штампами. В результате другим системам, которые выполняют пошаговый анализ, обработку и разбор документов, становится доступен максимум информации о тексте и его координатах.

Анализ документа для полнотекстовой индексации

Режим анализа документов, который автоматически определяет и распознает весь текст документа, в том числе текст на изображениях, графиках и диаграммах. Это позволяет извлекать максимум информации о тексте для построения индекса в ECM, DLP, ERP системах и системах архивирования.

Ручное выделение блоков для зонального распознавания

Области распознавания можно выделить вручную. В этом случае пользователь указывает область документа, которую необходимо распознать, что исключает необходимость автоматизированного анализа документа. Программа получает координаты и свойства запрошенных полей и распознает только выделенные области.

Закажите эффективное решение задачи

Наши специалисты готовы подробно рассказать о технологиях и решениях компании ABBYY. Опишите задачи, которые вы хотите решить, и получите индивидуальное предложение с примерными сроками и ожидаемыми результатами.

Я проинформирован о том, что я имею право в любое время полностью или частично отозвать вышеуказанное согласие. Для этого нажмите на ссылку «Отписаться» внутри любого письма, полученного от ABBYY, или заполните форму Права доступа ABBYY к персональным данным.

Я даю согласие на использование моих персональных данных для целей, описанных в правовой политике.

Спасибо за интерес к продуктам компании ABBYY!

Ваш запрос находится в обработке. Наши специалисты свяжутся с вами в самое ближайшее время.

С уважением,
команда ABBYY