Новости

ABBYY объявляет итоги волонтерского проекта «Открой историю Большого»

В электронной базе музея Большого театра собраны ценные данные о более чем 28 тысячах опер, 18 тысячах балетов и 5 тысячах концертов

Москва, 10 июня 2020 года. – Большой театр и компания ABBYY (при участии КАМИС) завершили масштабный волонтерский проект «Открой историю Большого» (openbolshoi.ru). В практике российских музыкальных театров и музеев проект такого масштаба реализован впервые. Искусственный интеллект ABBYY и более 7800 волонтеров помогли оцифровать, извлечь и систематизировать информацию из 48 000 афиш, 120 000 программок и 100 000 фотографий коллекции музея Большого театра. Ценные данные уже загружены в электронную базу музея Большого театра, разработанную компанией КАМИС. Сотрудникам музея предстоит проанализировать весь массив данных и опубликовать на сайте электронного архива театра, чтобы уникальная информация стала доступна каждому.

Целью проекта «Открой историю Большого» было оцифровать и упорядочить информацию из коллекции бумажных программок и фотографий для электронной базы данных театра. Сначала все исторические документы были отсканированы и распознаны программой ABBYY FineReader. Затем интеллектуальные технологии ABBYY извлекли из документов данные: названия спектаклей, имена артистов, дирижеров и пр.

Своим успехом проект обязан волонтерам. «Открой историю Большого» объединил неравнодушных людей из более 60 стран мира: США, Австралии, Бразилии, Индии, Китая, многих стран Европы и, конечно, России. Именно они тщательно проверяли и дополняли информацию на каждом этапе проекта, чтобы исключить возможные ошибки и максимально приблизить электронные версии документов к оригиналу. Также волонтерам был полностью отдан третий этап проекта – рубрикация исторических фотографий. Участники внесли в электронную базу рукописные тексты, написанные на оборотах изображений. Благодаря усилиям волонтеров, люди со всего мира смогут увидеть самые яркие моменты выступлений Майи Плисецкой, Галины Улановой, Федора Шаляпина и еще более 5 тыс. артистов театра.

В заключительной части проекта специалисты ABBYY систематизировали данные в соответствии с требованиями сотрудников музея. Они настроили автоматический перевод текстов с дореволюционной орфографией на современный русский язык, заполнили пропущенные поля, исправили опечатки, привели цифры и тексты к единому формату. Вся информация из архивов театра о 54 тысячах спектаклей и 75 тысячах персон была загружена в базу данных, разработанную компанией КАМИС. По мере проверки специалистами музея Большого театра, данные публикуются на специально разработанном поисковом разделе театрального сайта.

«Проделана огромная работа, которую едва ли удалось бы осуществить в столь сжатый срок без новейших технологических разработок компании ABBYY и без человеческого фактора – без любви к Большому театру тысяч волонтеров из самых разных стран, – отмечает Владимир Урин, генеральный директор Большого театра. – В эти летние дни, когда мир как будто замер, и Большой театр вынуждено не показывает спектакли уже несколько месяцев, мне особенно приятно поблагодарить наших партнёров – компанию ABBYY и наших верных зрителей, потративших три года на то, чтобы осуществить уникальный проект по оцифровке архивов Большого театра. Тысячи фотографий, афиш, ежедневных программ наших спектаклей в самое ближайшее время станут доступными не только специалистам, историкам театра, которые приходят работать в музей».

«ABBYY создает технологии искусственного интеллекта, которые помогают превращать разрозненные данные в полезную информацию. Мы особенно ценим проекты, в которых компания не только решает повседневные задачи людей, но и помогает расширять кругозор, сохранять культуру и историю страны, получать вдохновение и новые идеи для работы и жизни. Проектов, подобных «Открой историю Большого», в мире пока немного. Но я уверен, что с развитием технологий обработки естественного языка мы сможем решать все более сложные и масштабные задачи в разных странах мира», – комментирует Дмитрий Шушкин, генеральный директор ABBYY Россия.

«Команда ABBYY и волонтеров проделала огромную и очень важную работу. Были отсканированы несколько тысяч программ спектаклей Большого театра с 1901 года, а затем обработаны таким образом, что в настоящий момент мы можем среди тысяч образов найти нужную программку любого спектакля и концерта, проходящих на нашей сцене, посмотреть, когда и с какими партнерами выступал тот или иной артист, какие дирижеры, режиссеры, художники участвовали в постановке спектаклей. Кроме программок были обработаны и несколько тысяч афиш спектаклей, отсканированных ранее, причем временной промежуток здесь был еще больше: с 1858 года, – говорит Лидия Харина, директор музея Большого театра. – Это огромный и очень интересный архив, который теперь доступен в электронном виде. В настоящий момент им активно пользуются все сотрудники Музея и Большого театра, а также исследователи, приходящие к нам работать. Мы надеемся, что вскоре он будет доступен и широкой аудитории, сотрудники Музея проверяют весь массив внесенной информации, систематизируют его определенным образом, добавляют иллюстративный материал».

В ходе проекта «Открой историю Большого» волонтеры помогли собрать интересную статистику об истории главного театра страны. Так, в XIX веке на сцене около 450 раз ставили оперу «Жизнь за царя». В ХХ веке почти 60 лет одной из наиболее популярных постановок театра оставалась опера «Евгений Онегин». Неподражаемая Майя Плисецкая исполняла роли Одетты и Одиллии в балете «Лебединое озеро» 175 раз, а знаменитый лирический тенор Леонид Собинов пел арию Ленского не менее 86 раз. Были и другие находки, связанные с жизнью театра и его зрителей. Например, участники обнаружили на страницах программок необычные постановки, такие как опера, написанная императрицей Екатериной II, водевиль, переведенный поэтом Николаем Некрасовым, экспериментальные балеты 30-х годов XX века. В программках публиковали не только информацию об артистах, но и рекламу и даже объявления о забытых вещах.

О проекте «Открой историю Большого»

В коллекции музея Большого театра – более 48 000 афиш, 120 000 программок и 100 000 фотографий. Сотрудники музея начали вручную вводить информацию из них в базу данных, но стало понятно, что эта работа может занять долгое время. При помощи технологий ABBYY и участии волонтеров ее можно было сделать гораздо быстрее.

В октябре 2016 года стартовал волонтерский проект «Открой историю Большого». Все документы были отсканированы, программа ABBYY FineReader оцифровала их текст, а 4000 участников проверили результаты, чтобы исключить возможные ошибки.

В 2017 году ABBYY и волонтеры приступили к одной из самых ответственных частей проекта. Нужно было извлечь и систематизировать разрозненные данные из афиш и программ, чтобы наполнить электронный архив Большого театра. На этом этапе использовали комплекс интеллектуальных технологий ABBYY. Искусственный интеллект нашел в текстах документов важную информацию, определил, какую роль играл каждый участник постановки (исполнитель, автор либретто, композитор и т.д.), и занес эти данные в конкретные поля базы электронного архива. Более 7800 волонтеров из 60 стран проверяли и дополняли полученные результаты через онлайн-интерфейс универсальной платформы для интеллектуальной обработки информации ABBYY FlexiCapture.

Эти данные были переданы компании «КАМИС» для финальной обработки и загрузки в базу данных музея Большого театра. За время проекта сотрудники музея наполнили ее важнейшей информацией по истории Большого театра – каталогом опер (с 1770 года), балетов (с 1830) и их постановок с начала XIX века. В музейную систему КАМИС были внесены также программки оперных спектаклей с 1990 по 2018 и балетных – с 2003 по 2018 годы. По мере проверки данных все эти спектакли будут проиллюстрированы сканами программок и афиш.

Третий, заключительный этап проекта стартовал в декабре 2018 года. Его участники помогли в рубрикации 100 000 фотографий музея. Ценные снимки с Федором Шаляпиным, Галиной Улановой, Леонидом Собиновым и другими знаменитыми артистами уже были оцифрованы при поддержке компании ABBYY. Волонтеры изучали ценные данные, написанные от руки на обороте каждого снимка: имена артистов и фотографа, дату, название постановки и другую информацию. Все эти данные были переданы в электронный архив Большого театра.

Сотрудникам музея предстоит еще серьезная научная работа: проанализировать данные, сверить их с каталогами опер, балетов, спектаклей и персоналий – уточнить и расширить их. По мере проверки сотрудники музея будут обновлять информацию на сайте Большого театра в разделе «Электронный архив» с удобной поисковой системой, разработанной компанией КАМИС. В результате каждый сможет увидеть программы, афиши, фотографии, эскизы декораций и костюмов и узнать об операх и балетах, а также людях, чьи судьбы тесно связаны с историей театра, — композиторах, дирижерах, артистах, музыкантах и режиссерах.

Информационные партнеры проекта: МИА «Россия Сегодня», телеканал Россия 24, радио «Маяк».

О компании ABBYY

Компания ABBYY – ведущий мировой разработчик решений в области интеллектуальной обработки информации и лингвистики. Более 50 миллионов пользователей и десятки тысяч организаций свыше чем в 200 странах мира используют решения ABBYY для автоматизации трудоемких задач, экономя время, повышая эффективность бизнес-процессов и конкурентоспособность. На корпоративном рынке России ABBYY – признанный лидер в области потокового ввода документов и данных1.

Стратегия ABBYY – разработка лидирующих технологий искусственного интеллекта для задач бизнеса. На базе технологий компании созданы решения, которые позволяют на качественно новом уровне распознавать тексты, работать с бумажными и PDF документами, вводить данные в информационные системы предприятий, анализировать информацию, осуществлять поиск по всем корпоративным системам, находить переводы незнакомых слов и фраз и другое.

Технологии и решения ABBYY признаны и используются во всем мире. Их лицензируют крупнейшие международные ИТ-компании, вендоры решений для потокового ввода документов, производители сканеров и МФУ-устройств. Среди них: Fujitsu, Epson, Hewlett Packard Enterprise, RICOH, Xerox и многие другие.

Заказчиками ABBYY являются российские и международные компании из банковской, энергетической, нефтегазовой, телекоммуникационной и других отраслей. Среди них: Сбербанк, Альфа-Банк, Райффайзенбанк, ВТБ, банк «Открытие», «Точка», Модульбанк, Газпромбанк, PwC, «Транснефть», «Роснефть», ПАО «МОЭК», АО «Татэнергосбыт», СИБУР, МТС, Tele-2, Триколор ТВ и другие.

Более подробная информация доступна на сайте компании: www.ABBYY.ru.

ABBYY, ABBYY FineReader, ABBYY Lingvo, ADRT, Compreno, FlexiCapture, Lingvo, FormReader, FineReader и DOCFLOW являются зарегистрированными товарными знаками либо товарными знаками ABBYY Software Ltd. Остальные упомянутые товарные знаки являются товарными знаками или зарегистрированными товарными знаками своих законных владельцев.

1 По данным исследования IDC «Российский рынок программного обеспечения управления контентом: итоги 2016 года и прогноз на 2017 год», а также рейтинга CNews «Ведущие поставщики решений для потокового ввода данных на рынке России», 2013 год.