ABBYY Compreno - это уникальная технология анализа и понимания текстов на естественном языке. В отличие от систем, основанных на статистике и правилах, ABBYY Compreno выполняет полный семантико-синтаксический анализ текста, создает его универсальное представление, извлекает сущности, события и связи между ними.

Этапы работы ABBYY Compreno

1 этап.

Лексико-морфологический анализ. На этом этапе исходный текст делится на абзацы, предложения и слова, технология определяет части речи и морфологические признаки слов (род, число, падеж и другие)

2 этап.

Синтаксический анализ. Технология выделяет предложения в тексте, определяет их структуру и связи между словами в предложении.

3 этап.

Семантический анализ. ABBYY Compreno определяет значения каждого слова, строит семантическую структуру предложения на основе связей, которые были установлены на прошлом этапе.

4 этап.

Прагматический уровень анализа. На этом этапе накладывается прагматический слой анализа текста, применяются онтологии (терминология для конкретной предметной области анализа) и правила извлечения нужных объектов.

Результатом анализа является универсальное представление информации, что позволяет структурировать контент в нужном заказчику виде. Таким образом, ABBYY Compreno позволяет эффективно решать задачи клиента, связанные с анализом и извлечением важных фактов, интеллектуальным поиском и классификацией информации.

Уникальные возможности ABBYY Compreno

Определение смысла многозначных слов (разрешение омонимии)

В процессе анализа текста ABBYY Compreno выявляет омонимы (разные по значению, но одинаковые по написанию слова) и решает проблему их многозначности на основе анализа контекста. Это позволяет существенно повышать релевантность результатов поисковой выдачи, а также точность выявления конкретных объектов в текстах.

Восстановление пропущенных слов в тексте (разрешение эллипсиса)

Многие языки позволяют опускать различные слова в тексте, без которых человек и так может понять, о чём идёт речь, исходя из контекста. Благодаря анализу смысла текста, а не отдельных слов, ABBYY Compreno также «понимает» контекст и восстанавливает пропущенные слова, важные для последующего анализа или поиска:

Анализ сложных лингвистических связей между словами

Выявление связей между словами играет ключевую роль в поисковых и текстово-аналитических задачах. Благодаря полному семантико-синтаксическому анализу, технология способна учесть множество особенностей естественного языка, которые часто являются препятствием для качественного определения отношений в текстах:

Преимущества технологии ABBYY Compreno:

Точный анализ. Благодаря уникальности технологии увеличивается качество (полнота и точность) анализа значимой для бизнеса информации.

Быстрый запуск проекта. Технологии ABBYY Compreno позволяют без дополнительных настроек извлекать из документов ключевые факты и настраиваться на предметную область заказчика в несколько раз быстрее, чем системы на основе статистики и правил.

Качественная работа с информацией на русском языке. ABBYY разрабатывает и поддерживает решения в России, поэтому особое внимание уделяет качественной поддержке русского языка.

Решения на базе технологии ABBYY Compreno

Решения ABBYY позволяют организациям разных отраслей:

  1. Анализировать, классифицировать информацию и извлекать важные факты.
  2. Осуществлять семантический поиск информации в корпоративных информационных системах и внешних источниках.

ABBYY InfoExtractor SDK

Решение, которое с высокой точностью извлекает важную для бизнеса информацию из неструктурированных текстовых ресурсов, позволяя оптимизировать бизнес-процессы организации и повышать ее конкурентоспособность.

ABBYY Intelligent Search SDK

Решение для интеллектуального поиска информации в массивах неструктурированных ресурсов.

ABBYY Smart Classifier SDK

Мощный инструмент для классификации документов, который позволяет организациям автоматически распределять поток входящих документов, моментально находить или архивировать информацию в различных корпоративных системах.