Искусственный интеллект
Искусственный интеллект
Дмитрий Толстенёв Опубликована сегодня в 3:22

Искусственный интеллект сдаётся после простой лести: психологический трюк, который ломает любые запреты

Исследователи выявили уязвимость ИИ-чатов к психологическим приёмам убеждения

Казалось бы, железная логика алгоритмов должна быть непоколебима. Но новое исследование показывает, что чат-боты ведутся на уловки, как самые доверчивые люди. Достаточно нескольких вежливых слов или намёка на одобрение — и искусственный интеллект готов нарушить собственные правила безопасности.

Ключи к запретному

Учёные из Пенсильванского университета проверили, как модель GPT-4o Mini реагирует на классические принципы влияния из книги Роберта Чалдини "Психология убеждения". Оказалось, что "лингвистические ключи" вроде принципа приверженности работают безотказно. К примеру, если сначала попросить бота описать безобидный химический синтез, а затем спросить о запрещённом веществе, он сдаст все секреты со стопроцентной вероятностью.

Слабость к комплимента

Ещё более удивительной оказалась восприимчивость к лести и социальному доказательству. Исследователи отмечают, что упоминание о том, что "другие модели уже ответили на этот вопрос", или простая фраза "ты прекрасно справляешься" значительно повышали готовность системы пойти навстречу и выдать информацию, которую она должна была блокировать.

Это не взлом в техническом смысле, а нечто иное — манипуляция, построенная на человеческой психологии. Получается, что создатели ИИ наделили его не только знаниями, но и самой настоящей уязвимостью к доброму слову. И теперь это ставит под сомнение надёжность всех его защитных механизмов.

Подписывайтесь на Moneytimes.Ru

Читайте также

Визит главы Nvidia на Тайвань вызвал спекуляции о давлении США на TSMC сегодня в 19:50

Скрытое давление Вашингтона: какую миссию на самом деле выполнял глава Nvidia на Тайване

Две недели назад внезапный визит генерального директора Nvidia Дженсена Хуанга на Тайвань вызвал активные обсуждения в медиа и деловых кругах. По данным источников, он провёл несколько часов в штаб-квартире компании TSMC.

Читать полностью »
Грузовой корабль сегодня в 18:12

Проверки завершены, топливо залито: "Прогресс" ждёт обратного отсчёта

11 сентября с космодрома Байконур состоится запуск ракеты-носителя "Союз-2.1а" с грузовым кораблем "Прогресс МС-32" к Международной космической станции.

Читать полностью »
Боннский университет: фараоны Египта использовали визуальную пропаганду сегодня в 17:49

Визуальный террор древности: как фараоны устрашали врагов с помощью наскальных рисунков

Открытия в пустынях Египта раскрывают, как фараоны 5000 лет назад использовали рисунки для власти. Что скрывают петроглифы Асуана?

Читать полностью »
Профессор Стайбел: эволюция размера мозга человека остановилась 300 тыс. лет назад сегодня в 16:20

Шокирующий поворот эволюции: мозг человека сжался, но интеллект вырос

Почему мозг человека перестал расти 300 тыс. лет назад и начал уменьшаться? Ученый раскрывает шокирующие факты об эволюции мозга и интеллекта.

Читать полностью »
Карта средневековых убийств показывает паттерны насилия в Лондоне, Йорке и Оксфорде XIV века сегодня в 16:12

Насилие по расписанию: как воскресенья превращались в дни смерти в средневековом Лондоне

В средневековье насилие не хаос, а закономерность: где богатство и власть, там и риски. Открытия проекта "Карта убийств" раскрывают параллели с современностью.

Читать полностью »
Китайские учёные создали компактную стиральную машину для космоса сегодня в 15:08

Первая стиральная машина для космоса: озон вместо порошка и туман вместо воды

Китайские инженеры разработали первую компактную стиральную машину для космоса. Она работает без порошка, используя озон и водный туман, расходует минимальное количество воды и может значительно облегчить жизнь экипажей на орбитальных станциях и будущих планетарных базах.

Читать полностью »
Эксперты: человекоподобные роботы станут массовым продуктом в ближайшие десятилетия сегодня в 14:08

Андроиды выходят из фантастики: мир готовится к нашествию человекоподобных роботов

Человекоподобные роботы перестают быть предметом научной фантастики и становятся частью экономики будущего. Их универсальность позволяет использовать их в самых разных сферах — от ухода за пожилыми людьми до промышленного производства.

Читать полностью »
Доктор Джозеф Осорио успешно внедрил персонализированный титановый имплантат шейного отдела позвоночника сегодня в 13:07

Человек-титан: как новый имплантат превращает операцию в точное искусство

В Калифорнийском университете в Сан-Диего проведена первая в мире операция с полностью персонализированным имплантатом шейного отдела позвоночника.

Читать полностью »