Студенты РЖД расшифровали Петра Первого. В ходе выигранного онлайн-турнира российская команда узнала, о чём писал первый русский Император

Опубликовано 23 декабря 2020

Рукописи российского императора Петра I удалось расшифровать с помощью анализа данных и искусственного интеллекта. Добилась такого результата команда из Сочинского филиала Отраслевого центра разработки и внедрения информационных систем (ОЦРВ) ОАО «РЖД». Она участвовала в международном онлайн-соревновании по анализу данных и искусственному интеллекту AIJ Contest, в котором триумфально заняла первое место.

В AIJ Contest, соревновании специалистов по анализу данных и AI (искусственному интеллекту), в этом году участвовало рекордное количество команд — около 1000 DataScience-профи из 43 государств. В этот раз IT-спортсменам предложили три варианта задач: с историческим уклоном, по разработке алгоритма решения социально значимой ситуации и генерирование сложных осмысленных текстов на различных языках программирования. В общей сложности участники представили более 2700 решений.

Первым этапом шёл «Digital Петр». Он проводился на базе нескольких технологий искусственного интеллекта: компьютерное зрение, обработка естественного языка и графы знаний. Участникам конкурса предлагалось побороться за приз, решив образовательную задачу с историческим уклоном: им предстояло создать алгоритм по построчному распознаванию рукописей Петра I.

Именно этот этап выиграла команда Сочинского филиала ОЦРВ. Первое место заняли Алексей Шоненков, Илья Смолин, Денис Карачёв и Максим Новопольцев, которые и заработали один миллион рублей. Их решение позволило расшифровать рукописную книгу объёмом 700 страниц за 20 минут и распознать 97,6% символов.


Для сравнения, простой человек без ИИ сможет распознать 40%. 

Это событие прекрасно сочетается с 350-летним юбилеем со дня рождения Петра I, считает председатель правления Российского исторического общества Константин Могилевский.

«Пётр I оставил после себя много документов. Он писал много, писал быстро, плохим почерком, с сокращениями, с использованием иностранных слов. Сейчас большая научная проблема — разобрать рукописное наследие Петра. Эта работа идёт не так быстро, потому что на протяжении 150 последних лет в нашей стране только несколько историков были в состоянии разобрать, что Пётр написал. Так бы прошло ещё 150 лет, если бы не вся замечательная команда, которая предложила решение и вынесла его на хакатон», — сказал господин Могилевский.


Победителям от 24 до 27 лет. Работают они в Центре исследований и разработок на базе филиала ОЦРВ в Сочи. Около двух лет они занимаются распознаванием рукописного текста и изображений. Исследования, проводимые в лаборатории, используются для решения различных задач РЖД — от интеллектуального поиска и анализа нормативной и организационно-распорядительной документации до распознавания рукописного текста для ввода данных в учётные системы.

«Мы разработали несколько подходов, которых не было ни у кого из участников. Например, подход с разбиением данных — использовали различные комбинации, а затем превращали их в уникальную рукопись, которая имитирует рукописный почерк. И ещё как пример слаженной работы в команде — нам удалось организовать работу таким образом, что даже сейчас сможем воспроизвести абсолютно любую проверенную ранее гипотезу», — рассказал участник соревнования Алексей Шоненков.


Уже известно, на что пойдёт заработанный миллион.


«Планируем собрать две мощные вычислительные станции, что позволит решать более сложные задачи для центра, а также поможет саморазвиваться нам и нашим коллегам», — отметил Алексей Шоненков.

Справка. Архивное наследие Петра Первого насчитывает около 200 млн страниц. Рукописи издаются на протяжении более чем 100 лет, к концу июня 2021 года будет готов только 13-й том — это меньше половины от общего массива информационного наследства императора. 

Транспортные новости российских мегаполисов и мировых столиц ищите в нашем разделе ГОРОД, лучший фото- и видеоконтент на нашей странице в Instagram

Иван Афанасьев