Компьютерное зрение (Computer Vision) – динамично развивающаяся область искусственного интеллекта. Приоритетная область наших научных интересов в CV – поиск, структурирование, анализ текстов на изображениях.
Многообразие документов различных форматов с различными по структуре данными на разных языках, часто с серьезными искажениями и/или невысокого качества – первое, с чем приходится иметь дело при попытке решения задач направления Intelligent Document Analysis.
Постановка исследовательской задачи, для которой требуется найти решение, сочетающее высокое качество, скорость, эффективное использование вычислительных ресурсов – одна из основных целей группы исследований в области компьютерного зрения. Центральное место в технологиях занимают сегодня нейросетевые подходы, однако, их использование в реальных задачах IDA требует серьезного учета специфики этих задач и анализируемых данных.
Разработка методов многоязычного анализа различных документов; печатных, рукопечатных, рукописных.
Поиск и распознавание текста на сложных и деформированных изображениях (Text in the Wild).
Разработка методов машинного обучения, работающих при недостатке обучающих данных. Например:
Методы векторизации растровых данных (Vectorization).
Читайте об исследованиях группы в блоге ABBYY на Хабре: