Ежедневник

Смотреть все публикации

«Кальиончатых»: нейросеть НГУ написала «Тотальный диктант» между «тройкой» и «четверкой»

Нейросеть «Писец» была разработана научным сотрудником Лаборатории прикладных цифровых технологий Международного научно-образовательного математического центра НГУ и сооснователем стартапа «Сибирские нейросети» Иваном Бондаренко. В понедельник, 6 мая, стали известны результаты, которые получила система «Писец» на ежегодной акции «Тотальный диктант», прошедшей 20 апреля.

Фото: пресс-центр «Тотального диктанта», Telegram

В Новосибирском государственной университете (НГУ) сообщили, что впервые искусственный интеллект соревновался в грамотности с человеком в рамках диктанта. Разработчики предполагали, что «Писец» положительной оценки не получит, так как допустит минимум орфографических ошибок, но не справится с расставлением знаков препинания.

Однако результаты оказались неожиданными: нейросеть удовлетворительно расставила запятые и разбила текст на абзацы. Для участия в Диктанте «Писца» специально научили улавливать в речи «кодовые фразы»: «пишем с красной строки», «переходим на новый абзац» и другие.

Диктант проверяла старший преподаватель кафедры источниковедения литературы и древних языков Гуманитарного Института НГУ Людмила Буднева. По ее словам, нейросети можно было поставить твердую «тройку», если бы не несколько обстоятельств. Из 276 слов диктанта «Писец» пропустил 6, из них 5 стояли в конце предложения. При этом нейросеть в этих случаях не поставила точку, но следующее предложение начала с заглавной буквы. Еще был пропущен в одном месте предлог «в», а 7 слов были услышаны неверно, уточнила эксперт. Например, вместо слова «наивысшего» искусственный интеллект написал «наявившего» или «кальиончатых» вместо «клеенчатых».

Людмила Буднева рассказала, что было в тексте и неверно услышанное выражение «Читай — не хочу»: вместо него ИИ написал «Считай, не хотите», что свидетельствует о проблемах с грамматикой. Также проблемы с грамматикой обнаружились в написании окончаний: «синями» вместо «синими», «портрет … гимназисткЕ» вместо «портрет … гимназистки».

«Еще одна «ослышка» привела к искажению смысла предложения, но в итоге было все же написано правильно. «Писец» вместо «так» написал «та». Получилось сложносочиненное предложение, где он поставил запятую, в итоге возникла речевая ошибка», – рассказала проверяющий диктанта. По ее словам, аналогичная грамматическая ошибка была в слове «способный», вместо которого нейросеть написала «способны», в результате получилось: «как способный лишь немногие».

В пресс-службе НГУ сообщили, что по результатам написания диктанта был сделан вывод: «Писец» все слова услышал верно и написал диктант хорошо — на границе между «тройкой» и «четверкой». Отмечается, что такого результата разработчики не ожидали, он оказался выше прогнозируемого.

Как пояснил разработчик нейросети, «Писец» создавался год назад для автоматического стенографирования звукозаписей интервью или защит диссертаций. В этом случае даже 20-30% ошибок в расшифрованном тексте позволяют человеку гораздо быстрее подготовить чистовой текст стенограммы, чем «с нуля», прослушивая запись самостоятельно.

«Но для диктанта 20% ошибок — это неприемлемо, это «двойка». Поэтому в последнюю неделю перед «Тотальным диктантом» мы занимались адаптацией «Писца» к специфике диктанта, а также вносили в него принципиальные улучшения, основанные на результатах наших исследований за последний год», ­– рассказал Иван Бондаренко.

Стоит добавить, что после Диктанта разработчики уже наметили направления будущих исследований.

Ранее «Учительская Россия» приводила мнение экспертов, которые посчитали текст Диктанта довольно простым и очень интересным. Известная российская писательница Анна Матвеева написала специально для «Тотального диктанта» текст «Дорогой дневник». Завкафедрой филологии НГТУ НЭТИ доктор филологических наук, доцент Галина Мандрикова, пояснила, что сложность текста заключалась в пунктуации, большом количестве тире и парцелляций (деление предложений на самостоятельные отрезки).

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Выбор читателей

Смотреть все публикации
Vk Telegram Ok Dzen