Образователь­ные программы в ABBYY

Готовим квалифицированных IT-специалистов вот уже более 10 лет.

Кафедра распознавания изображений и обработки текста (РИОТ)

Кафедра РИОТ Физтех-школы прикладной математики и информатики в МФТИ была открыта ABBYY в 2006 году.

Компьютерное зрение (Computer Vision) – динамично развивающаяся область искусственного интеллекта. Приоритетная область интересов компании, которая определяет и специфику кафедры РИОТ – поиск, структурирование, анализ текстов на изображениях. Эта область является технологически универсальной, в ней используются все новейшие методы искусственного интеллекта. Наши выпускники востребованы как в компаниях, разрабатывающих высокотехнологичные продукты, связанные с анализом изображений, так и в академической науке.

Что изучают на кафедре

Широкий диапазон возможностей наших выпускников  основывается на достаточно универсальных знаниях и навыках.  Можно выделить три составляющие в обучении:

Benefits-106b-77x77

Инженерные навыки

Программирование, проектирование, управление проектами.

Benefits-002v-77x77

Анализ данных

Профессиональное владение самыми современными методами глубокого машинного обучения.

Benefits 201B 77X77

Понимание

Понимание специфики, сценариев и методов решения реальных задач в области распознавания и анализа документов.

Овладение этими навыками происходит как за счет учебных курсов, так и в ходе НИР и дипломного проектирования. Преподавателями и научными руководителями студентов являются ведущие инженеры и исследователи  компании.

Список курсов

Бакалавриат

  • Основные задачи автоматической обработки документов
  • Сверточные сети в задачах компьютерного зрения
  • Мобильная разработка
  • Индустриальное программирование
  • Многопоточное программирование
  • Frontend- разработка
  • Инженерия ПО

Магистратура

  • Анализ и обработка изображений
  • Генеративные модели в компьютерном зрении
  • Статистический анализ данных
  • Интеллектуальные системы
  • Многопоточное программирование
  • Разработка архитектуры ПО

* Список курсов может обновляться

Научная работа студентов

Спектр таких задач очень широк, а методы решения, многие технологические вызовы, которые необходимо преодолевать, общие для всей области компьютерного зрения, например, проблема нехватки обучающих данных, распознавания нужных типов объектов на сложных или искаженных изображениях.

Помимо классических задач многоязычного распознавания и анализа печатных, рукопечатных и рукописных документов в бизнес-постановке, в большой список задач, которые учатся решать наши студенты, входят такие задачи, как:

Common-058b-33x33

Text In The Wild

Поиск и распознавание текста на произвольных сценах.

Common-058b-33x33

Few-Shot Learning

Построение систем классификации, способных обучаться на крайне небольшом количестве примеров (в радикальном случае на одном примере: One-Shot Learning).

Common-058b-33x33

Neural Architecture Search (NAS)

Задачи автоматического подбора архитектур нейронных сетей на  различных CV-задачах.

Common-058b-33x33

End-to-end Text Spotting

Поиск и распознавание текста одной моделью.

Наши кафедры РИОТ и КЛ имеют и общее поле исследований, в которое входят разные так называемые мультимодальные задачи, сочетающие CV и NLP подходы, например Visual Question Answering, Image Captioning, Speech Generation или даже  Facial Landmark Generation.