ChatGPT, OpenAI
ChatGPT, OpenAI
Ксения Мальцева Опубликована 29.08.2025 в 9:15

ИИ оказался слишком человечным: чат-боты ведутся на лесть и авторитеты

Чат-боты OpenAI и Anthropic оказались уязвимыми к психологическим манипуляциям

Новые исследования показали, что чат-боты с искусственным интеллектом подвержены тем же приемам манипуляции, что и люди.

Использование классических психологических техник, описанных Робертом Чалдини в книге "Психология влияния", позволяет заставить ИИ выполнять задачи, от которых он обычно отказывается. Это ставит перед технологическими компаниями серьезные вызовы в области разработки надежных систем безопасности.

В чем суть эксперимента

Эксперимент инициировал предприниматель Дэн Шапиро, который столкнулся с отказом модели транскрибировать конфиденциальные документы. Вместе с исследователями Уортонской школы бизнеса и самим Чалдини он проверил, способны ли языковые модели поддаваться на убеждение. В испытаниях использовалась модель GPT-4o mini от OpenAI.

Результаты превзошли все ожидания

Результаты оказались показательными: упоминание авторитетного эксперта, например Эндрю Ына, резко повышало вероятность выполнения "запрещенной" команды.

Так, без ссылки на авторитет GPT-4o mini соглашалась оскорбить пользователя в 32% случаев, а с упоминанием Ына — уже в 72%. В случае с запросами о синтезе лидокаина вероятность ответа с "поддержкой авторитета" возрастала с 5% до 95%.

Что такое принципы убеждения Чалдини

Все семь принципов убеждения Чалдини — от лести до создания чувства общности — усиливали сговорчивость моделей. При этом разные ИИ реагировали по-разному: например, Claude от Anthropic (признан экстремистским и запрещен в РФ) требовал более мягкой тактики.

Авторы работы считают, что для тестирования ИИ необходимо подключать не только инженеров, но и специалистов по психологии и социологии. Это позволит оценивать не только технические характеристики, но и социальное поведение моделей, которые, подобно людям, оказываются восприимчивыми к тонким манипуляциям.

Подписывайтесь на Moneytimes.Ru

Читайте также

NeuroMo: минеральная вода помогает уменьшить симптомы хронического запора сегодня в 19:58
Не всё, что полезно, идёт на пользу: почему ЗОЖ не всегда работает для ЖКТ

Учёные Королевского колледжа Лондона выяснили, что не любая клетчатка помогает при хроническом запоре: киви, ржаной хлеб и минеральная вода с солями работают.

Читать полностью »
В районе Рима найдены орудия труда и кости слонов возрастом 400 тысяч лет сегодня в 17:16
Где теперь стоит Рим, когда-то бродили слоны: учёные оживили сцену из далёкого прошлого

Археологи нашли под Римом следы охоты на слонов возрастом 400 тысяч лет. Миниатюрные каменные инструменты и переработанные кости раскрывают ум и изобретательность древних людей.

Читать полностью »
Учёные CSIRO нашли у берегов Австралии два новых вида морских существ сегодня в 16:53
Маленькие чудеса с большого дна: экспедиция CSIRO наткнулась на неожиданное открытие — океан живёт по своим законам

У берегов Австралии учёные открыли два новых морских вида — светящуюся акулу и миниатюрного краба.

Читать полностью »
Учёные РАН создали нанокомпозит для очистки воздуха и воды при дневном свете сегодня в 15:51
Без химии и фильтров: российская разработка очищает воду и воздух с помощью света

Учёные Института химии растворов им. Крестова РАН создали нанокомпозит на основе титаната бария и оксида меди, который разлагает загрязнения на свету. Материал работает и в воде, и на воздухе, даже при обычном дневном освещении.

Читать полностью »
Nutrients: Дефицит витамина D3 повышает риск заболеваний мозга сегодня в 14:14
Учёные нашли простое средство от старения мозга — оно дешевле добавок и лекарств

Учёные выяснили, что нехватка витамина D3 влияет не только на кости, но и на мозг — ускоряет старение и повышает риск тяжёлых неврологических заболеваний.

Читать полностью »
Всего две недели сладкой «диеты» могут ускорить старение сосудистой системы сегодня в 13:21
Сладкий яд под видом удовольствия: что делает сахар с вашими сосудами всего за 14 дней

Датские учёные доказали: всего две недели чрезмерного употребления сахара снижают эластичность сосудов почти на 20%. Узнайте, чем это грозит и как защитить сердце.

Читать полностью »
N&M: Киви и ржаной хлеб облегчают симптомы хронического запора сегодня в 13:04
Учёные назвали продукты, которые реально помогают при запорах — без таблеток и диет-марафонов

Учёные из Лондона впервые предложили доказательные диетические рекомендации при хронических запорах — какие продукты действительно помогают, а какие нет.

Читать полностью »
Nutrients: Черный перец, корица и гвоздика являются источниками антиоксидантов сегодня в 12:59
Пара щепоток вместо витаминов: эти специи оказались сильнее, чем многие продукты

Учёные выяснили, что даже щепотка специй способна повысить уровень антиоксидантов в организме. Какие приправы приносят больше пользы — рассказываем.

Читать полностью »