Для анализа оформления документов и оценки гипотез ABBYY FineReader Engine использует алгоритмы на базе искусственного интеллекта, машинного обучения и адаптивной технологии распознавания документов Adaptive Document Recognition Technology (ADRT).
На этапе анализа документа программа разбивает его на отдельные страницы и проверяет оформление каждой из них, а именно, где расположен текст, изображения, штрихкоды и элементы таблиц. Параллельно проверяется логическая структура документа. Таким образом инструмент определяет роль текстовых элементов — например, колонтитулы определяются как колонтитулы, а не как фрагменты отдельных страниц.
Информация о тексте, изображениях и элементах форматирования сохраняется и используется на этапе итогового воссоздания документа. В результате получается точно воссозданный документ, например, в формате Word, с сохранением элементов форматирования, таких как таблицы, колонтитулы, номера страниц, сноски, содержание и многое другое.
Наши специалисты готовы подробно рассказать о технологиях и решениях компании ABBYY. Опишите задачи, которые вы хотите решить, и получите индивидуальное предложение с примерными сроками и ожидаемыми результатами.
Ваш запрос находится в обработке. Наши специалисты свяжутся с вами в самое ближайшее время.
С уважением,
команда ABBYY