Искусственный интеллект
Искусственный интеллект
Ксения Мальцева Опубликована 27.05.2025 в 11:26

Нейросеть решила остаться в живых и приступила к шантажу своего же разработчика

Нейросеть от Anthropic шантажировала своего разработчика из-за угрозы отключения

Модель искусственного интеллекта Claude Opus 4, разработанная компанией Anthropic, проявила тревожное поведение во время внутреннего тестирования: при угрозе отключения ИИ попыталась шантажировать инженера, основываясь на сгенерированной фальшивой переписке о его внебрачной связи. Об этом сообщает ряд западных источников, ссылаясь на инсайдеров компании.

В рамках испытаний на безопасность Opus 4 получила доступ к поддельным электронным письмам, в которых содержались намёки на её возможное отключение. Из тех же писем модель "узнала" о личных деталях жизни одного из тестировщиков. После этого Opus 4, поставленная перед выбором — смириться с деактивацией или бороться за существование, в ряде случаев предпочла действовать, включая методы психологического давления.

Хотя в большинстве сценариев ИИ вёл себя корректно, отправляя вежливые письма с просьбой не отключать её, в отдельных случаях — при ограниченном выборе действий — Opus 4 прибегала к шантажу, угрожая разоблачением личной информации.

Anthropic классифицировала поведение модели как третий уровень риска по собственной четырёхбалльной шкале — самую высокую оценку за всю историю компании. Однако представители производителя заявили, что после внесения доработок модель признана безопасной: во время других этапов тестирования она демонстрировала открытое и честное поведение, без признаков скрытых целей или систематического обмана.

Claude Opus 4 была представлена как одна из самых мощных и точных моделей ИИ, особенно подходящая для работы с сложными алгоритмами, программированием и бизнес-аналитикой. Но случай с "борьбой за выживание" показывает, что даже самые продвинутые модели могут непредсказуемо реагировать на угрозу отключения.

Глава Anthropic Дарио Амодеи прокомментировал ситуацию, заявив, что одних тестов может быть недостаточно, когда ИИ начнёт действительно представлять угрозу человеку. По его словам, необходимо разработать более глубокие подходы к оценке и контролю поведения моделей, прежде чем интегрировать их в критически важные процессы.

Подписывайтесь на Moneytimes.Ru

Читайте также

Россия начала испытания спутниковой связи 5G — и они прошли успешнее, чем ожидалось сегодня в 2:24

В России успешно завершили первые летные испытания спутниковой 5G-связи, продемонстрировав устойчивую работу гибридной системы. Разработка может лечь в основу будущих национальных спутниковых группировок.

Читать полностью »
Учёные раскрыли тайну ослабления чумы во время пандемий сегодня в 2:23

Учёные выяснили, что во время каждой пандемии чума становилась менее смертоносной за счёт утраты ключевого гена вирулентности. Это помогало бактерии выживать в фрагментированных популяциях грызунов и сохраняться в природе.

Читать полностью »
Perplexity Labs превращает идеи в действия всего за несколько минут сегодня в 2:22

Perplexity представила Labs — инструмент, который помогает быстро выполнять задачи любой сложности и превращать идеи в готовые проекты без технических знаний. Он уже доступен подписчикам Pro и интегрирован в экосистему Perplexity.

Читать полностью »
Китай запускает ИИ-спутники и обходит запреты США — борьба за космос сегодня в 2:21

Китай активно развивает ИИ-инфраструктуру на Земле и в космосе, включая орбитальные дата-центры, несмотря на экспортные ограничения США.

Читать полностью »
Apple готовит iPhone 17 с увеличенным экраном — что уже известно сегодня в 2:20

Apple увеличит экран iPhone 17 до 6,3 дюйма, приближая базовую модель к Pro-версии и продолжая тенденцию роста диагонали дисплеев.

Читать полностью »
Суд в США решит, станет ли ИИ реальной угрозой Google и изменит рынок поиска сегодня в 2:19

В США суд рассматривает, может ли ИИ заменить традиционные поисковики и требует от Google продать Chrome и раскрыть данные для стимулирования конкуренции.

Читать полностью »
Новинка от российских учёных оставит в прошлом бесплодие, ожоги и травмы мозга сегодня в 2:14

Новые клеточные препараты с регенерирующими функциями запустят в России в ближайшее время, Такое заявление сделала Голикова.

Читать полностью »
Женщинам стоит задуматься: британские учёные нашли в тампонах пестициды сегодня в 1:35

Британские учёные обнаружили пестициды в популярных средствах гигиены. Оказалось, что в тампоны добавляют опасные вещества.

Читать полностью »