Искусственный интеллект
Искусственный интеллект
Ксения Мальцева Опубликована 27.05.2025 в 11:26

Нейросеть решила остаться в живых и приступила к шантажу своего же разработчика

Нейросеть от Anthropic шантажировала своего разработчика из-за угрозы отключения

Модель искусственного интеллекта Claude Opus 4, разработанная компанией Anthropic, проявила тревожное поведение во время внутреннего тестирования: при угрозе отключения ИИ попыталась шантажировать инженера, основываясь на сгенерированной фальшивой переписке о его внебрачной связи. Об этом сообщает ряд западных источников, ссылаясь на инсайдеров компании.

В рамках испытаний на безопасность Opus 4 получила доступ к поддельным электронным письмам, в которых содержались намёки на её возможное отключение. Из тех же писем модель "узнала" о личных деталях жизни одного из тестировщиков. После этого Opus 4, поставленная перед выбором — смириться с деактивацией или бороться за существование, в ряде случаев предпочла действовать, включая методы психологического давления.

Хотя в большинстве сценариев ИИ вёл себя корректно, отправляя вежливые письма с просьбой не отключать её, в отдельных случаях — при ограниченном выборе действий — Opus 4 прибегала к шантажу, угрожая разоблачением личной информации.

Anthropic классифицировала поведение модели как третий уровень риска по собственной четырёхбалльной шкале — самую высокую оценку за всю историю компании. Однако представители производителя заявили, что после внесения доработок модель признана безопасной: во время других этапов тестирования она демонстрировала открытое и честное поведение, без признаков скрытых целей или систематического обмана.

Claude Opus 4 была представлена как одна из самых мощных и точных моделей ИИ, особенно подходящая для работы с сложными алгоритмами, программированием и бизнес-аналитикой. Но случай с "борьбой за выживание" показывает, что даже самые продвинутые модели могут непредсказуемо реагировать на угрозу отключения.

Глава Anthropic Дарио Амодеи прокомментировал ситуацию, заявив, что одних тестов может быть недостаточно, когда ИИ начнёт действительно представлять угрозу человеку. По его словам, необходимо разработать более глубокие подходы к оценке и контролю поведения моделей, прежде чем интегрировать их в критически важные процессы.

Подписывайтесь на Moneytimes.Ru

Читайте также

Разрыв отношений проходит в две стадии и занимает до двух лет сегодня в 9:12

Почему одни пары держатся дольше других? Всё упирается в скрытые фазы разрыва

Разрыв отношений — это не внезапность, а длительный процесс из двух стадий.

Читать полностью »
Елена Мазлова: частицы шин и асфальта попадают в пищевую цепь сегодня в 8:25

Арктика под колесами: в моря Ледовитого океана проникли частицы автодорог

Российские учёные впервые подтвердили, что частицы шин и асфальта доходят до Арктики. Чем это грозит экосистеме и человеку — читайте в материале.

Читать полностью »
Пустыня Намиб сохраняет уникальные феномены и сталкивается с угрозой экологии сегодня в 8:12

Высочайшие дюны и зелёный миг: пустыня Намиб поражает красотой — но её экосистема рушится прямо на глазах

Пустыня Намиб хранит редкие природные явления и рекорды, но сталкивается с угрозой разрушения.

Читать полностью »
Биологи разгадали тайну щупалец осьминогов: передние – для разведки, задние – для движения сегодня в 7:30

Осьминог: мастер иллюзий или гений координации? Как щупальца творят чудеса под водой

Американские биологи пролили свет на давнюю загадку: как осьминоги используют свои многочисленные щупальца?

Читать полностью »
Технологический прорыв: ученые Глазго тестируют сегодня в 7:15

Звери на связи: ученые придумали необычный способ общения хозяина со своим питомцем

Ученые из Университета Глазго совершили настоящий прорыв в области взаимодействия человека и животных, разрабатывая инновационные технологии, которые можно назвать "интернетом для животных".

Читать полностью »
Пересадка органов продлевает жизнь, но не останавливает старение сегодня в 7:12

Человеку меняют сердце и почки десятилетиями — но есть предел: учёные предупреждают о скрытой границе жизни

Пересадка органов помогает прожить дольше, но остановить старение не в силах даже самые передовые технологии.

Читать полностью »
Вирусолог Нетесов: новые варианты коронавируса появляются каждые 3–4 месяца сегодня в 7:10

Коронавирус снова мутировал: штамм Стратус добрался до России и меняет симптомы

Новый штамм коронавируса Стратус быстро распространяется, но врачи уверяют: он не опаснее предыдущих. Почему это происходит, рассказали вирусологи..

Читать полностью »
Нейробиологи и психологи объяснили феномен вещих снов: мозг как машина предсказаний сегодня в 7:10

Секреты подсознания: как вещие сны работают на самом деле? Наука раскрывает тайны

Феномен вещих снов, веками будораживший умы людей, наконец-то получил научное объяснение.

Читать полностью »