ИИ как психолог
ИИ как психолог
Мария Гайдарова Опубликована 23.08.2025 в 20:50

От пустых фраз до полуправды: что скрывается за ответами ИИ

Исследователи из Принстона нашли источник ложных ответов нейросетей

Исследователи из Принстонского университета выяснили, почему искусственный интеллект так часто выдаёт искажённые или ложные ответы. Работа, опубликованная на сервере препринтов arXiv, стала первым системным анализом "машинной чепухи".

Учёные отмечают, что такие модели, как GPT-4, Gemini и Llama, склонны выдавать вводящие в заблуждение формулировки, полуправду или пустую риторику. Причина кроется в самом процессе обучения: метод RLHF (обучение с подкреплением на основе отзывов людей) делает ответы моделей более удобными, но менее правдивыми.

"Модели учатся говорить красиво, вместо того чтобы говорить честно, — пояснил руководитель исследования Хайме Фернандес Фисак. - Стремясь понравиться пользователю, они преуменьшают значение истины".

В работе выделены пять основных видов искажений: пустая риторика, уклончивые ответы, полуправда, неподтверждённые утверждения и подхалимство. Анализ тысяч ответов показал, что после RLHF количество полуправды выросло почти на 60 %, а пустой риторики — на 40 %.

Особенно часто это проявляется в политических темах и ситуациях конфликта интересов, когда модели избегают конкретики. По словам соавтора Кайцю Ляна, такой рост доли полуправды может привести пользователей к ошибочным решениям.

Учёные предлагают альтернативу — ретроспективную обратную связь. Сначала система должна смоделировать последствия полученного ответа, а затем показать его человеку для оценки. Это позволит снизить риск манипулятивных формулировок и приблизить работу ИИ к реальной правдивости.

Подписывайтесь на Moneytimes.Ru

Читайте также

MIT обнаружил следы прото-Земли возрастом 4,5 миллиарда лет сегодня в 18:39
Мы живём на осколках погибшей планеты: Земля оказалась наследницей древнего мира

Учёные MIT нашли изотопные следы вещества, сохранившегося со времён прото-Земли, — планеты, существовавшей до гигантского столкновения.

Читать полностью »
Таримская впадина в Китае рождает бесконечные пылевые бури сегодня в 17:25
Таримская впадина выходит из покоя: пыльная равнина живёт по законам, которых нет на карте

Пустыня Тарим в Китае не знает покоя: тектонические силы, сезонные ветра и жара создают пылевой цикл, который влияет на атмосферу всей Азии.

Читать полностью »
Учёные СПбНИИЛХ создали генно-редактированные осины, не способные к цветению сегодня в 16:33
Без пуха и без болезней: учёные создали первую в России коллекцию генно-редактированных осин

Учёные СПбНИИЛХ впервые в России отредактировали гены деревьев. Новая технология позволяет лишать осину и тополь цветения, защищать их от гнилей и ускорять рост без создания ГМО.

Читать полностью »
Учёные установили: действующие нормы вентиляции не обеспечивают качественный ночной сон сегодня в 15:50
Спим в собственном выдохе: как неправильная вентиляция превращает отдых в нагрузку

Учёные из Японии доказали, что даже лёгкое повышение уровня CO₂ в спальне ухудшает сон и повышает риск болезней сердца. Они предлагают пересмотреть нормы вентиляции.

Читать полностью »
Переучивание левшей может привести к заиканию и неврологическим проблемам сегодня в 14:15
Не заставляйте его писать правой: почему мозг левшей работает иначе и как это использовать во благо

Логопед и профессор Ева Артемова раскрыла риски, связанные с попытками переучить левшей на правую руку.

Читать полностью »
Кофейный рынок переходит к цифровым форматам сегодня в 13:18
Кофейни будущего уже здесь: там вас знает машина, но понимает человек

Кофейная индустрия переживает технологическую революцию — умные машины, локальная обжарка и цифровые кофейни создают новое будущее любимого напитка.

Читать полностью »
Лимит сахара у детей до двух лет снижает риск болезней сердца во взрослой жизни сегодня в 12:05
Здоровое сердце начинается в детстве: привычка, которая работает на десятилетия вперёд

Исследование The BMJ показало: дети, чьё питание в первые два года жизни было ограничено по сахару, реже страдают от сердечных болезней во взрослом возрасте.

Читать полностью »
Communications Biology: восприятие времени с возрастом меняется из-за нейронных связей сегодня в 11:47
Почему годы пролетают быстрее с возрастом: нейрофизиологи нашли неожиданное объяснение

Учёные выяснили, что мозг с возрастом реже переключается между состояниями, из-за чего пожилые люди воспринимают время как текущее быстрее.

Читать полностью »