ChatGPT, OpenAI
ChatGPT, OpenAI
Ксения Мальцева Опубликована 29.08.2025 в 9:15

ИИ оказался слишком человечным: чат-боты ведутся на лесть и авторитеты

Чат-боты OpenAI и Anthropic оказались уязвимыми к психологическим манипуляциям

Новые исследования показали, что чат-боты с искусственным интеллектом подвержены тем же приемам манипуляции, что и люди.

Использование классических психологических техник, описанных Робертом Чалдини в книге "Психология влияния", позволяет заставить ИИ выполнять задачи, от которых он обычно отказывается. Это ставит перед технологическими компаниями серьезные вызовы в области разработки надежных систем безопасности.

В чем суть эксперимента

Эксперимент инициировал предприниматель Дэн Шапиро, который столкнулся с отказом модели транскрибировать конфиденциальные документы. Вместе с исследователями Уортонской школы бизнеса и самим Чалдини он проверил, способны ли языковые модели поддаваться на убеждение. В испытаниях использовалась модель GPT-4o mini от OpenAI.

Результаты превзошли все ожидания

Результаты оказались показательными: упоминание авторитетного эксперта, например Эндрю Ына, резко повышало вероятность выполнения "запрещенной" команды.

Так, без ссылки на авторитет GPT-4o mini соглашалась оскорбить пользователя в 32% случаев, а с упоминанием Ына — уже в 72%. В случае с запросами о синтезе лидокаина вероятность ответа с "поддержкой авторитета" возрастала с 5% до 95%.

Что такое принципы убеждения Чалдини

Все семь принципов убеждения Чалдини — от лести до создания чувства общности — усиливали сговорчивость моделей. При этом разные ИИ реагировали по-разному: например, Claude от Anthropic (признан экстремистским и запрещен в РФ) требовал более мягкой тактики.

Авторы работы считают, что для тестирования ИИ необходимо подключать не только инженеров, но и специалистов по психологии и социологии. Это позволит оценивать не только технические характеристики, но и социальное поведение моделей, которые, подобно людям, оказываются восприимчивыми к тонким манипуляциям.

Автор Ксения Мальцева
Ксения Мальцева - журналист, корреспондент-медиахолдинга Правда.Ру

Подписывайтесь на Moneytimes.Ru

Читайте также

Магнитный кокон под ударом гиганта: на далекой луне нашли структуры света идентичные нашим сегодня в 1:27

Зонд Juno обнаружил на Ганимеде уникальное явление — «жемчужные нити» в атмосфере, которые до этого считались характерной чертой только земных полярных бурь.

Читать полностью »
Глубокий сон смартфона: секреты реанимации и сохранения данных, которые вам нужно знать сегодня в 0:20

Даже "непросыпающийся" смартфон поддается восстановлению. Данные извлекаются из флеш-памяти, а устройство часто оживает после перепрошивки.

Читать полностью »
Сердце планеты бьётся неритмично: горячие пузыри в мантии управляют магнитным щитом Земли вчера в 20:25

Ученые обнаружили, что стабильность магнитного щита Земли зависит от гигантских горячих структур на глубине 2900 километров, действующих как тепловые якоря.

Читать полностью »
Захлопнули ноутбук и ушли: скрытая угроза открытых аккаунтов вчера в 18:49

Эксперт по IT-безопасности Никита Николаев рассказал MoneyTimes о рисках постоянной авторизации на электронных устройствах. 

Читать полностью »
Аромат вечности вместо запаха тлена: мумии пахнут дорогим парфюмом из смол и воска вчера в 15:26

Учёные из Бристоля применили технологию «цифрового носа», чтобы определить состав бальзамов, не прикасаясь к телам фараонов. Результат удивил даже опытных химиков.

Читать полностью »
Одиночество родителей — зеркало прошлых ошибок: как гиперопека превращается в отчуждение вчера в 11:59

Разбираемся в причинах отчуждения между родителями и взрослыми детьми и предлагаем научные методы восстановления.

Читать полностью »
Океан им не преграда: древние зауроподы ходили из Европы в Америку по невидимым ныне мостам вчера в 9:27

В штате Токантинс нашли останки Dasosaurus, чьё анатомическое сходство с испанскими видами открыло палеонтологам глаза на тайные маршруты мелового периода.

Читать полностью »
Эпителиальный паспорт прошлого: уникальная находка в Германии раскрыла облик первых рептилий вчера в 0:27

В Тюрингском лесу обнаружены сенсационные отпечатки кожи рептилий Cabarzichnus pulchrus, сохранившие даже мельчайшие детали репродуктивной системы.

Читать полностью »

Новости

Эффект фитнес-зала за копейки: обычная резинка за 100 рублей меняет форму ягодиц до неузнаваемости
Рак раскрывает скрытые гормональные коды, незаметно управляющие желанием обладать недвижимостью
Холод побеждает духовку: творожный десерт сохраняет максимум пользы без лишнего жара
Тарелка против аптеки: продукты-биохакеры научились чистить артерии без агрессивной химии
Скорпион и 28 февраля: день, в котором проявляется невидимая формула влияния и трансформации
Дофамин против кортизола: невидимая битва, определяющая судьбу проектов и денег Близнецов
Двадцать минут вместо часа на дорожке: биохимический рычаг запускает жиросжигание
Металл гниёт в тишине: коварная ловушка для влаги в салоне авто, которую не видят даже эксперты