ChatGPT, OpenAI
ChatGPT, OpenAI
Ксения Мальцева Опубликована сегодня в 9:15

ИИ оказался слишком человечным: чат-боты ведутся на лесть и авторитеты

Чат-боты OpenAI и Anthropic оказались уязвимыми к психологическим манипуляциям

Новые исследования показали, что чат-боты с искусственным интеллектом подвержены тем же приемам манипуляции, что и люди.

Использование классических психологических техник, описанных Робертом Чалдини в книге "Психология влияния", позволяет заставить ИИ выполнять задачи, от которых он обычно отказывается. Это ставит перед технологическими компаниями серьезные вызовы в области разработки надежных систем безопасности.

В чем суть эксперимента

Эксперимент инициировал предприниматель Дэн Шапиро, который столкнулся с отказом модели транскрибировать конфиденциальные документы. Вместе с исследователями Уортонской школы бизнеса и самим Чалдини он проверил, способны ли языковые модели поддаваться на убеждение. В испытаниях использовалась модель GPT-4o mini от OpenAI.

Результаты превзошли все ожидания

Результаты оказались показательными: упоминание авторитетного эксперта, например Эндрю Ына, резко повышало вероятность выполнения "запрещенной" команды.

Так, без ссылки на авторитет GPT-4o mini соглашалась оскорбить пользователя в 32% случаев, а с упоминанием Ына — уже в 72%. В случае с запросами о синтезе лидокаина вероятность ответа с "поддержкой авторитета" возрастала с 5% до 95%.

Что такое принципы убеждения Чалдини

Все семь принципов убеждения Чалдини — от лести до создания чувства общности — усиливали сговорчивость моделей. При этом разные ИИ реагировали по-разному: например, Claude от Anthropic (признан экстремистским и запрещен в РФ) требовал более мягкой тактики.

Авторы работы считают, что для тестирования ИИ необходимо подключать не только инженеров, но и специалистов по психологии и социологии. Это позволит оценивать не только технические характеристики, но и социальное поведение моделей, которые, подобно людям, оказываются восприимчивыми к тонким манипуляциям.

Подписывайтесь на Moneytimes.Ru

Читайте также

Уникальную каменную конкрецию пермского периода передали в кузбасский музей сегодня в 10:11

Нашли идеальный круг возрастом 250 млн лет: что скрывает загадочный Кедровский диск

Угольный разрез в Кузбассе подарил учёным уникальную находку — каменный диск возрастом 250 миллионов лет.

Читать полностью »
Канадские эксперты назвали бесполезные методы борьбы с курением сегодня в 10:10

Отказаться от сигарет стало проще: какие методы действительно работают, а какие — пустая трата денег

Ученые выяснили, какие методы борьбы с курением действительно работают, а какие оказались пустой тратой времени.

Читать полностью »
Японская Rapidus показала тестовый 2-нм чип и планирует выпуск в 2027 году сегодня в 9:43

Разогнали производство до рекорда: японские чипы готовы удивить рынок

Японская Rapidus показала тестовый 2-нм чип и готовит быстрый выпуск для срочных заказов.

Читать полностью »
Phison не подтвердил сбои SSD после обновлений Windows 11 сегодня в 9:33

Отрицали сбои — насторожили пользователей: что скрывает ваш SSD

Phison провел тесты SSD после обновлений Windows 11 и не подтвердил сбои, но дал рекомендации по охлаждению.

Читать полностью »
Samsung представит Galaxy S25 FE и планшеты Galaxy Tab S11 на сентябрьском ивенте сегодня в 9:29

Обновят раньше всех: фанатская версия Galaxy получила неожиданный бонус

Samsung готовит Galaxy Event, где покажет S25 FE и Tab S11, а также удивит фанатов ранними обновлениями.

Читать полностью »
Яндекс запустил YandexGPT 5.1 Pro для бизнеса с пониженной ценой сегодня в 9:27

Снизила цену — бизнес потянулся: новая нейросеть Яндекса обещает революцию

Яндекс запустил новую модель YandexGPT 5.1 Pro для бизнеса с улучшенной точностью и сниженной ценой.

Читать полностью »
В Подмосковье модернизировали базовые станции для ускорения LTE сегодня в 9:22

Интернет ускорился, звонки спасены: как подмосковная сеть обманула перегрузку

В Подмосковье модернизировали базовые станции, и интернет стал быстрее без отказа от 3G.

Читать полностью »
Большинство россиян не меняют мобильного оператора более десяти лет сегодня в 8:19

Сидят на линии годами: почему миллионы абонентов не меняют оператора

Большинство россиян годами не меняют мобильного оператора, оставаясь верными старым тарифам и привычкам.

Читать полностью »