
Человек против машины: ИИ научился скрывать свои ошибки, но учёные разоблачают его
Группа российских ученых представила новый метод, который позволяет не только эффективно различать тексты, написанные людьми и созданные искусственным интеллектом, но и распознавать ключевые признаки, на основе которых ИИ делает такие выводы. О разработке сообщается в Центре научной коммуникации Московского физико-технического института (МФТИ).
Исследователи отмечают, что в последние годы на фоне роста популярности языковых моделей, таких как ChatGPT, LLaMA и их аналогов, возникает необходимость четко различать тексты, созданные человеком, от сгенерированных ИИ.
Сегодня такие системы активно используются для написания не только обычных сетевых материалов, но и академических работ, включая курсовые и дипломные, а также научные статьи, которые могут быть опубликованы в рецензируемых журналах.
Ранее были предложены нейросетевые алгоритмы для автоматического различения текстов, написанных людьми и ИИ. Однако эти системы не могли объяснить, на основе каких характеристик был сделан тот или иной вывод, что порождало сомнения в точности их работы.
Команда ученых из "Сколтеха", МФТИ, Института искусственного интеллекта AIRI и других научных учреждений разработала метод, использующий разреженные автокодировщики. Эти модели разбивают алгоритм на отдельные "атомарные" блоки, каждый из которых отвечает за обработку определенных аспектов текста.
На основе анализа большого языкового модельного примера Gemma-2-2B исследователи смогли выявить специфические признаки, которые позволяют отличить тексты ИИ от человеческих.
Среди них — многословие в финансовых материалах и перегруженные синтаксические структуры в научных текстах, а также другие отличительные черты, которые становятся очевидными при детальном анализе.
Подписывайтесь на Moneytimes.Ru