Ученых проверят искусственным интеллектом

Государство в рамках нацпроекта «Цифровая экономика» выделило 180 млн руб. на систему по борьбе с плагиатом в научных статьях. Планируется направить эти средства в том числе на разработку технологии, позволяющей находить заимствования из текстов на других языках. Эксперты надеются, что это позволит бороться с волной некачественных публикаций в зарубежных журналах, за которые российские вузы получают гранты на миллиарды рублей в год.

Компания «Антиплагиат», разрабатывающая систему поиска заимствований в русскоязычных текстах, получила грант Российской венчурной компании (РВК) в рамках направления «Искусственный интеллект» (ИИ) нацпроекта «Цифровая экономика» в размере 180 млн руб., сообщили «Коммерсанту» в РВК. Средства будут направлены на создание промышленного решения, которое позволит находить в текстах переводные заимствованные фрагменты независимо от языка первоисточника. Для финансирования проекта компания также выделила собственные средства в размере 50% от суммы гранта, уточнил исполнительный директор «Антиплагиата» Юрий Чехович.

В рамках тестирования технологии «Антиплагиат» уже обнаружил 20 тыс. российских научных статей, содержащих заимствования из англоязычных источников, утверждают в компании. Сейчас система распознает заимствования из источников на русском, английском и казахском и планирует выйти с новым продуктом на зарубежные рынки — в Латинскую Америку, арабские страны, Индию и Восточную Европу. «Мы видим тенденцию, что если раньше заимствования были в основном в рамках русского языка, то с развитием технологий машинного перевода случаи перевода текстов, например, с английского на русский участились», — отметил Ю. Чехович.

Технология распознавания переводного плагиата в декабре 2019 года также появилась в системе «Диссернет», которая организована на волонтерских началах сообществом профессиональных ученых. Проект занимается проверкой диссертаций и научных статей на наличие плагиата и не планирует привлекать инвестиции. «Мы не продаем свои услуги, работаем на бесплатной основе, сейчас планируем сбор средств с помощью краудфандинга для обновления сайта», — отметил сооснователь проекта Андрей Ростовцев.

Проблема переводного плагиата в научных статьях сейчас стоит очень остро, уверен А. Ростовцев. По его словам, «Диссернет» фиксирует десятки тысяч статей, которые засылаются в иностранные журналы, входящие в престижные базы данных — SCOPUS или WoS. «Волна таких публикаций началась после майских указов президента, в числе которых было увеличение доли публикаций российских ученых в иностранных научных изданиях. После этого начали активно расти компании, которые предлагают услуги по подготовке научных статей на иностранном языке, к услугам которых начали прибегать вузы», — поясняет Андрей Ростовцев. При выполнении нормы по публикациям в зарубежных журналах вузы получают гранты, уточняет он, оценивая потери федерального бюджета от такой деятельности примерно в 10 млрд руб. ежегодно.

Применение ИИ в анализе текста и обработки естественного языка интересует и крупный бизнес. Так, 2 марта МТС сообщила, что совместно со «Сколтехом» открыла лабораторию ИИ, деятельность которой направлена на создание новых моделей анализа текстов на русском языке. Представитель МТС отмечает, что работа с текстами «стала одним из самых важных направлений развития технологий, а полное понимание смысла текста сейчас является ключевым направлением для научных исследований».

Рубрики и ключевые слова