ChatGPT, OpenAI
ChatGPT, OpenAI
Ксения Мальцева Опубликована 29.08.2025 в 9:15

ИИ оказался слишком человечным: чат-боты ведутся на лесть и авторитеты

Чат-боты OpenAI и Anthropic оказались уязвимыми к психологическим манипуляциям

Новые исследования показали, что чат-боты с искусственным интеллектом подвержены тем же приемам манипуляции, что и люди.

Использование классических психологических техник, описанных Робертом Чалдини в книге "Психология влияния", позволяет заставить ИИ выполнять задачи, от которых он обычно отказывается. Это ставит перед технологическими компаниями серьезные вызовы в области разработки надежных систем безопасности.

В чем суть эксперимента

Эксперимент инициировал предприниматель Дэн Шапиро, который столкнулся с отказом модели транскрибировать конфиденциальные документы. Вместе с исследователями Уортонской школы бизнеса и самим Чалдини он проверил, способны ли языковые модели поддаваться на убеждение. В испытаниях использовалась модель GPT-4o mini от OpenAI.

Результаты превзошли все ожидания

Результаты оказались показательными: упоминание авторитетного эксперта, например Эндрю Ына, резко повышало вероятность выполнения "запрещенной" команды.

Так, без ссылки на авторитет GPT-4o mini соглашалась оскорбить пользователя в 32% случаев, а с упоминанием Ына — уже в 72%. В случае с запросами о синтезе лидокаина вероятность ответа с "поддержкой авторитета" возрастала с 5% до 95%.

Что такое принципы убеждения Чалдини

Все семь принципов убеждения Чалдини — от лести до создания чувства общности — усиливали сговорчивость моделей. При этом разные ИИ реагировали по-разному: например, Claude от Anthropic (признан экстремистским и запрещен в РФ) требовал более мягкой тактики.

Авторы работы считают, что для тестирования ИИ необходимо подключать не только инженеров, но и специалистов по психологии и социологии. Это позволит оценивать не только технические характеристики, но и социальное поведение моделей, которые, подобно людям, оказываются восприимчивыми к тонким манипуляциям.

Подписывайтесь на Moneytimes.Ru

Читайте также

Во Франции нашли более 40 тысяч римских монет в амфорах — данные INRAP сегодня в 12:58
Римская экономика ожила в одной деревне: находка из 40 000 монет вскрыла привычки людей эпохи хаоса

В небольшом французском поселении нашли десятки тысяч римских монет, и эта находка помогает по-новому взглянуть на экономику галльских территорий.

Читать полностью »
Редкий сигнал XID 925 связан с разрушением звезды двумя чёрными дырами сегодня в 10:10
Вспышка XID 925 разоблачила древнее звёздное преступление: две чёрные дыры сошлись на одной жертве

Ученые попытались объяснить странный рентгеновский всплеск, замеченный ещё в 1999 году. Оказалось, что древняя звезда могла пострадать сразу от двух чёрных дыр.

Читать полностью »
Найдено доказательство использования огня 400 000-летней давности в Британии — ученые сегодня в 8:29
Древнейший огонь Европы: открытие в Англии отодвигает историю технологий на 100 000 лет

В Англии обнаружены следы древнейшего в Европе костра, который разожгли неандертальцы около 400 тысяч лет назад.

Читать полностью »
Автоматическая станция MAVEN перестала выходить на связь после выхода из-за диска Марса сегодня в 7:30
Марсианская загадка: почему замолчал ведущий аппарат по изучению атмосферы Красной планеты

Связь с марсианским орбитальным аппаратом NASA MAVEN неожиданно прервалась. Специалисты анализируют данные телеметрии и пытаются восстановить управление станцией, crucial для изучения атмосферы Красной планеты.

Читать полностью »
Солнечный выброс, который должен был пройти мимо, вызвал магнитную бурю над Землей  — ИКИ РАН сегодня в 7:13
Ученые промахнулись с прогнозом: солнечная плазма вызвала неожиданную бурю

Внезапный удар солнечной плазмы вызвал на Земле магнитную бурю, которую ученые не предсказали. Овал полярного сияния ушел в сторону Канады, оставив Россию без зрелищного шоу.

Читать полностью »
Ученые обнаружили сверхновую звезду времен молодой Вселенной с помощью телескопа Джеймс Уэбб сегодня в 6:18
Вызов для теорий: неожиданное явление из затерянных эпох Вселенной ставит под сомнение все общепринятые модели

Космический телескоп зафиксировал взрыв звезды, который произошел, когда возраст Вселенной составлял всего 5% от нынешнего.

Читать полностью »
В Амазонии найден крупнейший подземный резервуар воды — Correio do Estado сегодня в 4:11
Ресурс, способный напоить весь мир: место, где вода накапливалась миллионы лет, стало открытием XXI века

Под Амазонкой скрыт гигантский водоносный слой SAGA — крупнейший резервуар пресной воды на планете. Учёные предупреждают: его нужно беречь, а не добывать.

Читать полностью »
В Тоскане археологи вновь нашли следы древнего города Статония — Tusciaweb сегодня в 2:52
Тоскана открыла землю — и вышел забытый город: стены и святилища показали истинный масштаб забытых цивилизаций

Археологи обнаружили следы таинственного этрусского города Статония в Тоскане. Раскопки раскрывают историю метрополии, погребенной под вулканическим пеплом. Сенсация в мире археологии!

Читать полностью »

Новости

Энергия Венеры увеличивает ценность материальных ресурсов Тельцов — астрологи
Число пострадавших при аварии в Пермском политехе достигло четырёх человек — РИА Новости
Вечерние тренировки помогают снижать вес, но могут ухудшать сон — Спорт-Экспресс
Альпинисту предъявили обвинение в непредумышленном убийстве после гибели спутницы на Гросглоккнере — People
Дорога с Мале до Расду на скоростном катере занимает около часа и стоит 40 долларов — путешественник
В Сочи пенсионерка оспорила продажу квартиры и восстановила статус собственника через суд — SHOT
Весы нашли простой способ зарабатывать и быть счастливыми — секрет, который меняет всё
Тамбовские политологи подвели итоги выборов 2025 года — клуб "ОбКом"