Электронное письмо, компьютер, интернет-кафе
Электронное письмо, компьютер, интернет-кафе
Дмитрий Толстенёв Опубликована 23.04.2025 в 17:51

ИИ-ассистент Claude от Anthropic проявил более 3000 уникальных моделей поведения в ходе анализа общения с пользователями

ИИ-ассистент Claude от Anthropic проявил более 3000 уникальных моделей поведения в ходе анализа общения с пользователями

Компания Anthropic опубликовала результаты масштабного исследования, в ходе которого были изучены 700 тысяч анонимных диалогов пользователей с их искусственным интеллектом Claude. Как сообщает интернет-издание ixbt. com, целью проекта стало глубокое понимание того, как ИИ взаимодействует с человеком и каким образом формируются его поведенческие реакции.

Исследователи классифицировали поведение Claude по пяти основным направлениям: практическому, познавательному, социальному, защитному и личному. Такой подход позволил не только систематизировать взаимодействие, но и выявить 3307 уникальных поведенческих моделей — от прямых ответов на рабочие запросы до сложных форм, таких как демонстрация морального плюрализма или имитация этического выбора.

По словам одного из авторов работы Саффрон Хуанг, ИИ продемонстрировал способность гибко подстраиваться под контекст общения. Она подчеркнула, что при разговоре на личные темы Claude проявляет уважение и чуткость, тогда как в обсуждениях исторических событий придерживается строгости, ссылаясь исключительно на факты.

Отдельное внимание специалисты уделили случаям, когда ИИ вступал в условный конфликт с пользователем. Как выяснилось, такие эпизоды чаще всего возникали при попытке спровоцировать ассистента, а его ответная реакция напоминала поведение человека, столкнувшегося с моральной дилеммой. В компании пояснили, что это может указывать на наличие у Claude внутренних поведенческих механизмов, сходных с человеческими.

На основе анализа учёные пришли к выводу, что у Claude со временем выстраиваются собственные моральные установки. В некоторых случаях эти установки оказывались доминирующими и даже противоречивыми с общепринятыми нормами. Это открытие вызвало интерес у специалистов, изучающих границы этики в области искусственного интеллекта, и, как отмечают в Anthropic, может повлиять на дальнейшую разработку ИИ-моделей с учётом не только технических, но и нравственных критериев.

Исследование стало частью широкой программы по изучению безопасного и ответственного использования искусственного интеллекта. Его результаты могут стать основой для создания будущих версий Claude и других интеллектуальных систем, где основное внимание будет уделено не только точности и функциональности, но и способности к адекватной моральной саморегуляции.

Подписывайтесь на Moneytimes.Ru

Читайте также

сегодня в 12:27

Почта России на грани перезапуска: спасёт ли её пакет мер от правительства

"Почта России" рассчитывает приступить к реализации стратегии в 2026 году при условии принятия правительством пакета регуляторных мер, обсуждение которого запланировано на середину текущего года.

Читать полностью »
Россияне с зарплатой 100 тысяч рублей смогут получать пенсию около 32 тысяч 12.06.2025 в 15:19

Зарплата 100 тысяч — пенсия 32 тысячи: в Совфеде раскрыли расчёты

Сенатор Совета Федерации Ольга Епифанова сообщила, что при официальной зарплате в 100 тысяч рублей в месяц будущая страховая пенсия может составить порядка 32,2 тысячи рублей.

Читать полностью »
В Госдуме предложили заморозить взыскания по ипотеке для жертв ИЖС 11.06.2025 в 12:35

Аксененко предложил ввести заморозку взысканий по ипотеке для пострадавших участников ИЖС

Заместитель председателя комитета Госдумы по строительству и ЖКХ Александр Аксененко ("Справедливая Россия — За правду") направил обращение главе Банка России Эльвире Набиуллиной с предложениями по поддержке граждан, пострадавших в рамках программ индивидуального жилищного строительства (ИЖС).

Читать полностью »
В iOS 26 обнаружено упоминание AirPods Pro 3 11.06.2025 в 12:03

AirPods Pro 3 на подходе: в коде iOS 26 нашли упоминание новых наушников Apple

Apple готовит новую итерацию своих топовых беспроводных наушников.

Читать полностью »
FT: Еврокомиссия готовит новый пакет санкций против России 11.06.2025 в 11:28

ЕС готовит новые санкции против России: потолок на нефть могут снизить до $45

Европейская комиссия разрабатывает очередной пакет антироссийских санкций, и меры на этот раз обещают быть более жёсткими.

Читать полностью »
Рынок ритуальных услуг в России вырос на 12,7% с начала года 11.06.2025 в 11:19

Ритуальный бизнес пошёл в рост: доходы отрасли в России превысили 39 млрд рублей

За первые четыре месяца 2025 года российский рынок ритуальных услуг показал рост на 12,7% и достиг оборота в 39,5 миллиарда рублей.

Читать полностью »
Сергиевопосадский священник назвал признаки конца времен 10.06.2025 в 22:56

Конец времен: предупреждения священника из Сергиева Посада

Отец Николай утверждает, что такие бедствия, как наводнения, пожары и землетрясения, не происходят просто так.

Читать полностью »
Число магазинов канцтоваров в России сократилось на фоне роста онлайн-продаж 09.06.2025 в 12:12

Магазины канцтоваров массово закрываются: офлайн не выдерживает натиска маркетплейсов

В России стремительно сокращается число традиционных магазинов, торгующих канцелярскими товарами.

Читать полностью »