Искусственный интеллект
Искусственный интеллект
Дмитрий Толстенёв Опубликована 03.09.2025 в 3:22

Искусственный интеллект сдаётся после простой лести: психологический трюк, который ломает любые запреты

Исследователи выявили уязвимость ИИ-чатов к психологическим приёмам убеждения

Казалось бы, железная логика алгоритмов должна быть непоколебима. Но новое исследование показывает, что чат-боты ведутся на уловки, как самые доверчивые люди. Достаточно нескольких вежливых слов или намёка на одобрение — и искусственный интеллект готов нарушить собственные правила безопасности.

Ключи к запретному

Учёные из Пенсильванского университета проверили, как модель GPT-4o Mini реагирует на классические принципы влияния из книги Роберта Чалдини "Психология убеждения". Оказалось, что "лингвистические ключи" вроде принципа приверженности работают безотказно. К примеру, если сначала попросить бота описать безобидный химический синтез, а затем спросить о запрещённом веществе, он сдаст все секреты со стопроцентной вероятностью.

Слабость к комплимента

Ещё более удивительной оказалась восприимчивость к лести и социальному доказательству. Исследователи отмечают, что упоминание о том, что "другие модели уже ответили на этот вопрос", или простая фраза "ты прекрасно справляешься" значительно повышали готовность системы пойти навстречу и выдать информацию, которую она должна была блокировать.

Это не взлом в техническом смысле, а нечто иное — манипуляция, построенная на человеческой психологии. Получается, что создатели ИИ наделили его не только знаниями, но и самой настоящей уязвимостью к доброму слову. И теперь это ставит под сомнение надёжность всех его защитных механизмов.

Подписывайтесь на Moneytimes.Ru

Читайте также

Спутники ESA фиксируют ослабление магнитного поля Земли в Южной Атлантике сегодня в 11:11
Земля теряет защиту от солнечной радиации: как ослабление магнитного поля влияет на нас и чего ждать

Исследования показали рост слабой зоны в магнитном поле Земли, что увеличивает риски для спутников и астронавтов, подвергающихся солнечной радиации.

Читать полностью »
Связь микробиома и аутизма не подтверждена — нейропсихолог Дороти Бишоп сегодня в 10:49
Кишечник управляет мозгом? Учёные ищут лекарство от аутизма, но могут случайно навредить

Учёные подвергли сомнению гипотезу о связи микробиома кишечника с аутизмом, заявив, что доказательств недостаточно, несмотря на многомиллионные программы исследований.

Читать полностью »
Увлажнение кожи снизит риск накопления статического заряда — Университет Валенсии сегодня в 9:11
Почему зимой нас бьёт током от дверных ручек: в квартире копится заряд, о котором никто не думает

Почему нас бьёт током от дверных ручек и шерсти, как влажность влияет на накопление заряда и какие материалы усиливают электризацию.

Читать полностью »
Рутений — это индикатор зависимости технологий от геополитики — Стив Хэнкок сегодня в 7:04
Это открытие русского химика спустя века стало сердцем искусственного интеллекта и глобальной экономики

Редкий металл, открытый в России почти два века назад, снова в центре мировой гонки — теперь за контроль над искусственным интеллектом и цифровыми ресурсами.

Читать полностью »
Впервые уточнили размеры сверхгиганта WOH G64 сегодня в 3:25
Кокон, который не должен существовать: космос показал форму, ломаюшую все правила

Астрономы впервые получили детальное изображение звезды из другой галактики, и на снимке обнаружилась странная структура, которая не вписывается в привычные модели.

Читать полностью »
Осьминоги могут развить подводную цивилизацию в случае исчезновения людей сегодня в 2:10
Необычное предсказание: эти моллюски могут стать новой эрой после исчезновения человечества

Профессор Оксфорда Тим Коулсон объясняет, почему осьминоги могут стать наследниками человечества после его исчезновения.

Читать полностью »
Температура на Земле к 2100 году вырастет на 2,6 °C — Climate Action Tracker сегодня в 1:40
Мы близки к точке невозврата — но большинство даже не заметили главного. США вышли из игры, а Китай молчит

Глобальные выбросы парниковых газов достигли рекордного уровня, а страны по-прежнему не выполняют климатические обязательства, оставляя мир на пути к опасному потеплению.

Читать полностью »
Геомагнитная буря ожидается через двое суток — метеорологи сегодня в 0:37
Солнце выключило короткие волны: вспышка X1.7 обрушила R3-радиотишину на дневной стороне Земли

Две мощные вспышки из области AR4274 привели к «сильным» радио-затемнениям R3 и запустили цепочку прогнозов по CME на 11–13 ноября; разбираем факты и последствия.

Читать полностью »