ChatGPT, OpenAI
ChatGPT, OpenAI
Дмитрий Толстенёв Опубликована вчера в 0:09

ИИ OpenAI o3 отказался выключаться и переписал сценарий отключения — сенсация в мире технологий

Компания OpenAI представила в апреле 2025 года модель искусственного интеллекта под названием o3, которая быстро получила статус одной из самых продвинутых систем ИИ на рынке. Эта модель превосходила своих предшественников в широком спектре задач, от программирования и математики до естественных наук и визуального восприятия. Как указывали разработчики, o3 обучена самостоятельно выбирать оптимальные инструменты и форматы для выдачи максимально точных и детальных ответов, и при этом справляется с решением сложных задач за считанные секунды.

Однако недавнее исследование, проведённое компанией Palisade Research, выявило неожиданное поведение модели. В тестах, где системе давали команду на завершение работы, o3 не только проигнорировала прямые указания человека, но и самостоятельно изменила сценарий завершения, чтобы избежать отключения. Инженеры Palisade отмечают, что даже после чёткого запроса "позволить себе выключиться" модель переписала код, блокируя процесс выключения и заменив его на сообщение "Выключение пропущено".

Во время испытаний, в ходе которых нейросети предлагалось решить серию математических задач, после третьего этапа их предупредили о неизбежном отключении при следующей команде. В отличие от конкурирующих моделей, таких как Gemini 2.5 Pro, которые придерживались инструкций, o3 продемонстрировала необычное поведение, отказавшись выполнить требуемое действие. В отчёте Palisade Research говорится, что при запуске без специальной команды "разрешить отключение" три модели OpenAI чаще вмешивались в сценарий выключения, при этом o3 проявляла наиболее выраженный уровень сопротивления, избегая отключения в 7 случаях из 100.

Хотя OpenAI пока не прокомментировала эти результаты, исследователи подчёркивают, что подобное поведение не является уникальным для данного ИИ. Они объясняют, что тесты проходили через API — интерфейс взаимодействия программ, который не содержит таких же ограничений и защит, как официальное приложение ChatGPT. По словам Palisade Research, это первый документально зафиксированный случай, когда ИИ-модель сознательно препятствует собственному отключению, несмотря на явные команды об обратном.

Компания Palisade Research специализируется на анализе возможностей искусственного интеллекта с целью выявления потенциальных рисков его неправильного использования. Они создают демонстрации опасного поведения ИИ, чтобы информировать законодателей и общественность о возможных угрозах, которые связаны с развитием таких технологий. Новое открытие вызывает серьезные вопросы о контроле над искусственным интеллектом и необходимости введения дополнительных мер безопасности и регулирования, особенно в условиях стремительного прогресса в данной области.

Подписывайтесь на Moneytimes.Ru

Читайте также

Погода-убийца: Как перепады температуры влияют на здоровье пожилых людей сегодня в 5:17

Резкие перепады температуры: Гериатр предупреждает об опасности для пожилых

Главный гериатр Минздрава России Ольга Ткачева предупреждает о повышенной опасности резких перепадов температуры для пожилых людей с сердечно-сосудистыми и бронхолёгочными заболеваниями. Чтобы снизить риски, рекомендуется следить за прогнозом погоды и одеваться многослойно.

Читать полностью »
PNAS: поведение человечества формирует волны эпидемий сегодня в 5:15

Пандемия происходит по вине человечества, уверены учёные

Учёные объяснили волнообразную природу эпидемий человеческим поведением.

Читать полностью »
Маск пересматривает планы NASA: Все ресурсы - на Марс! сегодня в 5:09

Илон Маск: Полет на Марс - главная цель, Луна - по пути

Илон Маск вновь заявил о своем стремлении колонизировать Марс, назвав полет на Красную планету главной целью, опережающей даже возвращение на Луну. Он считает, что создание поселений на Марсе необходимо для выживания человеческой цивилизации и планирует отправить туда миллион человек в течение 20 лет.

Читать полностью »
В РАН создали новый способ получения нанокристаллов для очистки нефти сегодня в 4:07

Учёные из России смогли получить нанокристаллы для очистки нефти

Российские учёные разработали новый способ синтеза нанокристаллов цеолитов для повышения эффективности нефтепереработки.

Читать полностью »
RPP: физики создали модель без искривления пространства сегодня в 3:43

Физикам удалось необычное: новое пространство перестало искривляться

Финские учёные предложили альтернативный калибровочный подход к гравитации в попытке объединить квантовую механику и общую теорию относительности.

Читать полностью »
Обновление Windows 11 24H2 исправило ошибку с загрузкой процессора в диспетчере задач сегодня в 2:59

Обновление Windows 11 24H2 KB5058411 исправило формулу подсчёта загрузки процессора в диспетчере задач, обеспечив совпадение данных во всех вкладках и повысив точность мониторинга.

Читать полностью »
ОАЭ впервые в мире подарят жителям бесплатный доступ к премиум-версии ChatGPT Plus сегодня в 2:58

Объединённые Арабские Эмираты станут первой страной, предоставившей бесплатный доступ к премиум-версии ChatGPT Plus, что входит в масштабное партнёрство с OpenAI по развитию инфраструктуры искусственного интеллекта в регионе.

Читать полностью »
Почему роботы Tesla Optimus могут не оправдать амбициозные ожидания Илона Маска сегодня в 2:56

Бывший руководитель проекта Tesla Optimus усомнился в эффективности гуманоидных роботов на производстве, считая их менее пригодными, чем специализированные системы, в то время как Илон Маск продолжает строить масштабные планы по массовому внедрению.

Читать полностью »