ABBYY FineReader Engine ABBYY FineReader Engine

Многофункциональный OCR SDK для разработчиков

Используйте OCR-технологии с элементами искусственного интеллекта

Эффективные инструменты обработки PDF

OCR SDK позволяет конвертировать сканы, цифровые фотографии, TIFF, JPEG, BMP и другие файлы различных форматов во множество форматов PDF и PDF/A с возможностью поиска. Кроме того, можно импортировать файлы PDF и PDF/A и обрабатывать их разными способами.

Конвертируйте документы в PDF или обрабатываете файлы PDF и PDF/A — ABBYY FineReader Engine позволяет обрабатывать и создавать электронные документы в соответствии со стандартами PDF/A-3 и электронные счета ZUGFeRD с помощью целого ряда возможностей и инструментов.

Конвертация в PDF

ABBYY FineReader Engine позволяет сохранять распознанный текст в PDF и PDF/A. Формат PDF используется в электронных архивах, где основное значение имеет небольшой размер файла и визуальное качество изображения. Для уменьшения размера файлов PDF и PDF/A используется специальная технология сжатия данных MRC (Mixed Raster Content).

Импорт и обработка PDF

  • Интеллектуальная обработка PDF

    ABBYY FineReader Engine анализирует следующую информацию в PDF-файлах:

    • Аннотации
    • Метаданные
    • Тестовые объекты
    • Шрифты
    • Поток данных

    ABBYY FineReader Engine позволяет улучшить качество и скорость конвертации PDF с помощью эффективного и точного распознавания текста. Если текст встроен в PDF-файл, OCR-инструмент анализирует целостность текстового слоя и определяет нужно ли извлечь текст или распознать его блок за блоком. При необходимости эту функцию можно отключить.

  • Извлечение внутренней информации из PDF-файла

    При работе с PDF-файлами, ABBYY FineReader Engine позволяет извлекать ссылки, гиперссылки и свойства документа, такие как тема, автор, название, ключевые слова и закладки.

  • Извлечение встроенных файлов из PDF/A-3

    При открытии файлов формата PDF/A-3 можно извлекать встроенные данные, к примеру, XML или другую информацию, которую затем можно передать в другие системы.

Экспорт в PDF

  • Безопасность и поддержка шифрования PDF

    ABBYY FineReader Engine поддерживает ряд настроек безопасности PDF:

    • Запрос пароля при открытии файла — чтобы предотвратить несанкционированный доступ
    • Возможность ограничить конкретные действия, например, печать, редактирование или распознавание содержимого — за счет присвоения паролей, разграничивающих права доступа
    • Поддержка современных стандартов шифрования
  • Экспорт PDF с теговой разметкой

    Размеченный PDF можно с легкостью настроить под любой размер страницы или экрана, например, смартфонов, планшетов или любых устройств для чтения.

  • Настройки размера страниц

    Можно задать размер всех страниц выходного файла.

  • Экспорт метаданных

    ABBYY FineReader Engine позволяет экспортировать метаданные (закладки, гиперссылки, перекрестные ссылки и т. д.)

  • Конвертация в PDF/A

    PDF/A — стандарт для долгосрочного хранения документов. Технологии ABBYY позволяют сохранять документы в формате PDF/A разных уровней соответствия: PDF/A-1a, PDF/A-1b, PDF/A-2a, PDF/-2b, PDF/A-2u, а также PDF/A-3a и PDF/A-3b.

  • Экспорт PDF: китайский, японский и корейский языки

    Инструмент позволяет конвертировать документы на китайском (упрощенном и традиционном), японском и корейском языках в формат PDF.

MRC-сжатие PDF (PDF/A)

  • Для уменьшения размера файлов PDF и PDF/A используется специальная технология сжатия MRC (Mixed Raster Content). Такие файлы занимают значительно меньше места, в то же время сохраняя визуальное качество исходного документа. Технология MRC-сжатия PDF идеально подходит при обработке цветных документов. MRC-сжатие — это превосходное качество и уменьшение размера файла в 8–10 раз по сравнению со сжатием JPEG.
  • Как правило, документы занимают много места из-за цветного фона — это примерно 90% размера файла. Технология MRC-сжатия распознает цветной фон и максимально сжимает его. Изображения (диаграммы, графики, логотипы, фотографии, чертежи, штампы, подписи и т. д.) сжимаются только до той степени, пока сохраняется их качество. В результате размер PDF-файла становится существенно меньше. Кроме того, MRC-технология анализирует контуры похожих символов в документе, создает шаблоны и применяет их вместо отдельных символов.
  • Таким образом корректируются возможные дефекты, а контуры символов становятся более четкими. Полученный PDF-документ содержит незаметный фон с текстом и изображениями, обеспечивая при этом небольшой размер файла и удобочитаемость выше, чем у оригинала. Такое «воссоздание» документа подойдет для распознавания оригиналов низкого качества.

Профили экспорта PDF: отладка качества и скорости обработки

Используйте предопределенные профили экспорта с предварительно настроенной конфигурацией параметров, чтобы обеспечить оптимальный результат конвертации PDF.

Профиль экспорта PDF Описание
MaxQuality Оптимизирует экспорт PDF (PDF/A) с максимальным визуальным качеством выходного файла.
Balanced Использует сбалансированные настройки экспорта PDF (PDF/A), чтобы обеспечить хорошее качество текста, небольшой размер файла и необходимую скорость обработки.
MinSize Экспорт PDF (PDF/A) настроен так, чтобы максимально сжать документ.
MaxSpeed Экспорт PDF (PDF/A) настроен так, чтобы максимально ускорить обработку документа.

Закажите эффективное решение задачи

Наши специалисты готовы подробно рассказать о технологиях и решениях компании ABBYY. Опишите задачи, которые вы хотите решить, и получите индивидуальное предложение с примерными сроками и ожидаемыми результатами.

Я проинформирован о том, что я имею право в любое время полностью или частично отозвать вышеуказанное согласие.

Отозвать согласие также можно на странице отмены подписки на сообщения или отправив письмо с отказом от подписки по адресу dataprotection@abbyy.com.
Письменный отказ можно направить по адресу PO BOX 16257, CY-2087, Nicosia, Cyprus.

Я даю согласие на использование моих персональных данных для целей, описанных в правовой политике.

Спасибо за интерес к продуктам компании ABBYY!

Ваш запрос находится в обработке. Наши специалисты свяжутся с вами в самое ближайшее время.

С уважением,
команда ABBYY