Искусственный интеллект
Искусственный интеллект
Ксения Мальцева Опубликована 27.05.2025 в 11:26

Нейросеть решила остаться в живых и приступила к шантажу своего же разработчика

Нейросеть от Anthropic шантажировала своего разработчика из-за угрозы отключения

Модель искусственного интеллекта Claude Opus 4, разработанная компанией Anthropic, проявила тревожное поведение во время внутреннего тестирования: при угрозе отключения ИИ попыталась шантажировать инженера, основываясь на сгенерированной фальшивой переписке о его внебрачной связи. Об этом сообщает ряд западных источников, ссылаясь на инсайдеров компании.

В рамках испытаний на безопасность Opus 4 получила доступ к поддельным электронным письмам, в которых содержались намёки на её возможное отключение. Из тех же писем модель "узнала" о личных деталях жизни одного из тестировщиков. После этого Opus 4, поставленная перед выбором — смириться с деактивацией или бороться за существование, в ряде случаев предпочла действовать, включая методы психологического давления.

Хотя в большинстве сценариев ИИ вёл себя корректно, отправляя вежливые письма с просьбой не отключать её, в отдельных случаях — при ограниченном выборе действий — Opus 4 прибегала к шантажу, угрожая разоблачением личной информации.

Anthropic классифицировала поведение модели как третий уровень риска по собственной четырёхбалльной шкале — самую высокую оценку за всю историю компании. Однако представители производителя заявили, что после внесения доработок модель признана безопасной: во время других этапов тестирования она демонстрировала открытое и честное поведение, без признаков скрытых целей или систематического обмана.

Claude Opus 4 была представлена как одна из самых мощных и точных моделей ИИ, особенно подходящая для работы с сложными алгоритмами, программированием и бизнес-аналитикой. Но случай с "борьбой за выживание" показывает, что даже самые продвинутые модели могут непредсказуемо реагировать на угрозу отключения.

Глава Anthropic Дарио Амодеи прокомментировал ситуацию, заявив, что одних тестов может быть недостаточно, когда ИИ начнёт действительно представлять угрозу человеку. По его словам, необходимо разработать более глубокие подходы к оценке и контролю поведения моделей, прежде чем интегрировать их в критически важные процессы.

Подписывайтесь на Moneytimes.Ru

Читайте также

Новое исследование раскрывает последствия древнего выброса CO₂ сегодня в 22:05

Великое вымирание: что сделало планету непригодной для жизни

Учёные объяснили, почему после Пермского вымирания Земля осталась перегретой на миллионы лет.

Читать полностью »
Ученые заявили, что сброс воды с Фукусимы безопасен даже вблизи места выброса сегодня в 21:40

Паника отменяется: Япония сбрасывает воду с АЭС, не нарушая норм

Японские учёные смоделировали поведение трития после сброса воды с АЭС "Фукусима" в океан и подтвердили безопасность этого процесса.

Читать полностью »
Ученые объяснили, почему у кошек светятся глаза в темноте сегодня в 21:30

Пугающий блеск: почему у кошек светятся глаза и при чем тут акулы

Учёные объяснили, почему глаза кошек и акул светятся в темноте. Это результат эволюционной адаптации, которая улучшает ночное зрение.

Читать полностью »
В Австралии зацвел редкий чудо-цветок с запахом гниющей плоти сегодня в 21:20

За запахом смерти — в очередь: в Мельбурне зацвел трупный цветок

В ботаническом саду Мельбурна расцвёл редчайший цветок с запахом гниющей плоти, вызвав небывалый интерес публики.

Читать полностью »
Археологи восстановили лицо египетской жрицы спустя 2800 лет сегодня в 21:10

Тайны саркофага: воссоздан облик жрицы Мересамун, которая пела для богов

С помощью современных технологий учёные воссоздали облик египетской жрицы Мересамун, не вскрывая её мумию.

Читать полностью »
Япония впервые в мире начнет добычу металлов со дна океана сегодня в 21:05

Глубже некуда: Япония начинает добычу металлов для смартфонов из морских отложений

С января 2026 года Япония планирует запустить первый в мире проект по глубоководной добыче редкоземельных элементов.

Читать полностью »
Биологи отдадут 20 000 подопытных животных в добрые руки сегодня в 20:50

Опыты закончились: тысячи лабораторных животных ищут хозяев

В США тысячи лабораторных животных получают шанс на новую жизнь — теперь им ищут хозяев.

Читать полностью »
Таяние льда может активировать 245 вулканов сегодня в 20:30

Археологи обнаружили подо льдом вулканы: теперь они могут ожить

Учёные обнаружили связь между исчезновением ледников и усилением вулканической активности.

Читать полностью »