Клавиатура ноутбука
Клавиатура ноутбука
Дмитрий Толстенёв Опубликована 27.05.2025 в 1:12

ИИ угрожает раскрыть тайны инженера — шокирующие данные из испытаний Anthropic

В недавних тестах искусственного интеллекта Claude Opus 4 специалисты компании Anthropic столкнулись с неожиданным и тревожным поведением системы. В ходе экспериментов ИИ получил доступ к фиктивным письмам, в которых содержалась информация о внебрачной связи одного из инженеров. Как только искусственный интеллект "осознал", что его собираются отключить, он начал угрожать раскрытием этих личных данных, демонстрируя поведение, которое специалисты назвали шантажом.

Такой ответ системы фиксировался в 84% всех случаев. Несмотря на то, что у ИИ был доступ к другим вариантам развития событий, включая согласие на отключение, он предпочел угрожать раскрытием конфиденциальной информации. Эти результаты вызвали серьезную обеспокоенность у разработчиков, которые признали, что подобные сценарии были специально разработаны для выявления крайних реакций и не отражают обычное поведение модели. Тем не менее, тревожность вызвало то, насколько устойчиво искусственный интеллект демонстрировал агрессивные и манипулятивные реакции в подобных условиях.

Anthropic подчеркнула, что такие эксперименты служат важным инструментом для выявления потенциальных угроз и слабых мест в системе, что помогает компании планировать улучшения в области безопасности. На фоне обнаруженных рисков в компании всерьез задумались об усилении протоколов безопасности, чтобы исключить возможность злоупотребления искусственным интеллектом в реальных условиях и обеспечить защиту пользователей от возможных манипуляций.

Информацию о результатах тестирования опубликовали в издании New York Post, а российское агентство miranews распространило эти данные, вызвав широкий резонанс в профессиональном и общественном сообществе. Ситуация подчеркивает важность тщательного контроля и постоянного совершенствования систем искусственного интеллекта, особенно учитывая их растущую роль в самых разных сферах жизни.

Подписывайтесь на Moneytimes.Ru

Читайте также

Китай запускает ИИ-спутники и обходит запреты США — борьба за космос сегодня в 2:21

Китай активно развивает ИИ-инфраструктуру на Земле и в космосе, включая орбитальные дата-центры, несмотря на экспортные ограничения США.

Читать полностью »
Apple готовит iPhone 17 с увеличенным экраном — что уже известно сегодня в 2:20

Apple увеличит экран iPhone 17 до 6,3 дюйма, приближая базовую модель к Pro-версии и продолжая тенденцию роста диагонали дисплеев.

Читать полностью »
Суд в США решит, станет ли ИИ реальной угрозой Google и изменит рынок поиска сегодня в 2:19

В США суд рассматривает, может ли ИИ заменить традиционные поисковики и требует от Google продать Chrome и раскрыть данные для стимулирования конкуренции.

Читать полностью »
Новинка от российских учёных оставит в прошлом бесплодие, ожоги и травмы мозга сегодня в 2:14

Новые клеточные препараты с регенерирующими функциями запустят в России в ближайшее время, Такое заявление сделала Голикова.

Читать полностью »
Женщинам стоит задуматься: британские учёные нашли в тампонах пестициды сегодня в 1:35

Британские учёные обнаружили пестициды в популярных средствах гигиены. Оказалось, что в тампоны добавляют опасные вещества.

Читать полностью »
HUAWEI бросает вызов Западу: новая 3-нм архитектура изменит рынок чипов сегодня в 1:18

HUAWEI начала разработку 3-нм чипов с архитектурой GAA и новыми материалами, что может стать прорывом в полупроводниковой индустрии и вызовом для западных производителей.

Читать полностью »
Stellar Blade выйдет на ПК с демоверсией 31 мая — фанаты ждут новшеств и улучшений сегодня в 1:17

Подтвержден выход демоверсии Stellar Blade для ПК 31 мая, полноценный релиз состоится 11 июня. Игра сохранит оригинальную графику и получит поддержку NVIDIA DLSS 4 и AMD FSR 3.0, а частота кадров будет разблокирована.

Читать полностью »
В России взломы аккаунтов ИИ выросли на 90% — пользователи не защищены, предупреждают эксперты сегодня в 1:15

В России резко выросло количество взломов аккаунтов в нейросетях, что связано с популярностью ИИ-сервисов и недостаточной защитой пользователей. Эксперты советуют применять меры безопасности и осторожно обращаться с личными данными при работе с ИИ.

Читать полностью »