Наука в ABBYY

ABBYY тесно взаимодействует с наукой: изучает и применяет новейшие научные достижения, проводит собственные научные исследования, является участником и организатором многих научных событий.

Компьютерное зрение и анализ документов

Компьютерное зрение (Computer Vision) – динамично развивающаяся область искусственного интеллекта. Приоритетная область наших научных интересов в CV – поиск, структурирование, анализ текстов на изображениях.

Многообразие документов различных форматов с различными по структуре данными на разных языках, часто с серьезными искажениями и/или невысокого качества – первое, с чем приходится иметь дело при попытке решения задач направления Intelligent Document Analysis.

Постановка исследовательской задачи, для которой требуется найти решение, сочетающее высокое качество, скорость, эффективное использование вычислительных ресурсов – одна из основных целей группы исследований в области компьютерного зрения. Центральное место в технологиях занимают сегодня нейросетевые подходы, однако, их использование в реальных задачах IDA требует серьезного учета специфики этих задач и анализируемых данных.

Направления исследований

Features 145G3 55X55

Разработка методов многоязычного анализа различных документов; печатных, рукопечатных, рукописных.

Features-103lb2-55x55

Поиск и распознавание текста на сложных и деформированных изображениях (Text in the Wild).

Features 120Lb3 55X55

Разработка методов машинного обучения, работающих при недостатке обучающих данных. Например:

  • методы обучения по нескольким примерам (Few-shot Learning, One-Shot Learning)
  • применение для аугментации данных генеративных моделей (GAN);

Features 160G3 55X55

Методы векторизации растровых данных (Vectorization).