ИИ как психолог
ИИ как психолог
Мария Гайдарова Опубликована вчера в 20:50

От пустых фраз до полуправды: что скрывается за ответами ИИ

Исследователи из Принстона нашли источник ложных ответов нейросетей

Исследователи из Принстонского университета выяснили, почему искусственный интеллект так часто выдаёт искажённые или ложные ответы. Работа, опубликованная на сервере препринтов arXiv, стала первым системным анализом "машинной чепухи".

Учёные отмечают, что такие модели, как GPT-4, Gemini и Llama, склонны выдавать вводящие в заблуждение формулировки, полуправду или пустую риторику. Причина кроется в самом процессе обучения: метод RLHF (обучение с подкреплением на основе отзывов людей) делает ответы моделей более удобными, но менее правдивыми.

"Модели учатся говорить красиво, вместо того чтобы говорить честно, — пояснил руководитель исследования Хайме Фернандес Фисак. - Стремясь понравиться пользователю, они преуменьшают значение истины".

В работе выделены пять основных видов искажений: пустая риторика, уклончивые ответы, полуправда, неподтверждённые утверждения и подхалимство. Анализ тысяч ответов показал, что после RLHF количество полуправды выросло почти на 60 %, а пустой риторики — на 40 %.

Особенно часто это проявляется в политических темах и ситуациях конфликта интересов, когда модели избегают конкретики. По словам соавтора Кайцю Ляна, такой рост доли полуправды может привести пользователей к ошибочным решениям.

Учёные предлагают альтернативу — ретроспективную обратную связь. Сначала система должна смоделировать последствия полученного ответа, а затем показать его человеку для оценки. Это позволит снизить риск манипулятивных формулировок и приблизить работу ИИ к реальной правдивости.

Подписывайтесь на Moneytimes.Ru

Читайте также

В Индии обнаружили редкий вид синих муравьев с металлическим блеском вчера в 23:39

Синие муравьи удивили энтомологов: что скрывает металлический блеск насекомых

В Индии был открыт новый вид муравьёв с металлической синей окраской, получивший название Paraparatrechina neela.

Читать полностью »
В Карелии впервые обнаружили гибридов волка и собаки вчера в 21:10

Необычные волки в Карелии: чистокровные хищники исчезают, гибриды выживают

Учёные впервые подтвердили появление в Карелии диких гибридов волка и собаки, что может угрожать популяции хищников и экосистеме.

Читать полностью »
Астрономы допустили существование еще одной планеты земного типа вчера в 21:05

Исчезнувшая планета рядом с Землей: как формировалась Солнечная система

Китайские учёные смоделировали раннюю Солнечную систему и показали, что рядом с Землёй могла существовать ещё одна каменистая планета.

Читать полностью »
Орнитологи обнаружили в птичьем пении закон Ципфа вчера в 20:30

Щебетание и речь: пение птиц и человеческий язык связаны древним принципом

Учёные впервые доказали, что пение птиц подчиняется закону Ципфа, который лежит в основе человеческой речи.

Читать полностью »
Биологи обнаружили связь между дружбой и схожестью запахов вчера в 20:20

Подсознательный выбор: сходство запахов усиливает взаимопонимание

Ученые выяснили, что люди чаще заводят дружбу с теми, чей запах тела похож на их собственный.

Читать полностью »
В Индонезии сфотографировали рыбу, которая считалась вымершей 70 миллионов лет назад вчера в 20:10

Рыба, которой не должно было быть: как латимерия пережила динозавров

В Индонезии впервые удалось сфотографировать латимерию — рыбу, которую считали вымершей вместе с динозаврами.

Читать полностью »
В Африке сохранился древний обычай добычи меда по сигналу птиц вчера в 20:05

Птицы помогают искать ульи: охота за медом остается частью культурного кода Африки

В Эсватини до сих пор жива традиция добычи мёда с помощью птиц, которая передаётся детям через игры и совместное обучение.

Читать полностью »
Естественный отбор сохранил денисовский ген у коренных народов Америки вчера в 17:01

Невероятный дар исчезнувшего вида: подарок, который продолжает защищать спустя тысячи лет.

Древний дар вымерших денисовцев: как ценный ген помог предкам индейцев выжить при заселении Америки и до сих пор влияет на их иммунитет.

Читать полностью »