Девушка за компьютером
Девушка за компьютером
Дмитрий Толстенёв Опубликована 02.04.2025 в 0:24

Исследование показало, что удаление знаков препинания и артиклей снижает точность языковых моделей

Исследование показало, что удаление знаков препинания и артиклей снижает точность языковых моделей

Ученые Института AIRI провели исследование, которое показало, что удаление знаков препинания и артиклей из текста снижает точность работы языковых моделей почти на 20%. Результаты работы были опубликованы в интервью с "Снобом", где исследователи подробно рассказали о своих выводах.

В ходе исследования ученые выяснили, что чат-боты и виртуальные ассистенты воспринимают текст как последовательность символов, извлекая из них ключевые токены. Для того чтобы понять, как отсутствие знаков препинания влияет на восприятие текста, ученые провели несколько экспериментов, в том числе с использованием специально разработанных языковых моделей. Первая часть тестов заключалась в том, чтобы обучить систему восстанавливать исходный текст, включая знаки препинания и артикли. Оказалось, что стоп-слова, к которым относятся артикли и некоторые другие слова, играют ключевую роль в понимании контекста. Удаление этих слов приводит к тому, что модель теряет важные элементы информации, что ухудшает ее работу.

В дальнейшем исследователи использовали наборы задач MMLU и BABILong для оценки языковых моделей. Эти тесты включают в себя задачи, где от моделей требуется выполнить действия, которые человек обычно считает незначительными, например, удаление элементов текста, которые могут показаться лишними. После того как из текстов были удалены элементы, которые кажутся ненужными для человека, качество работы языковых моделей значительно снизилось. Например, ChatGPT, который принимал участие в тестировании, продемонстрировал слабые результаты на задачах, где были удалены артикли и знаки препинания.

Антон Разжигаев, руководитель группы "Интерпретируемый ИИ" лаборатории FusionBrain Института AIRI, отметил, что его команда уже два года изучает принципы работы языковых моделей. Он подчеркнул, что исследование показало, как важны даже те элементы текста, которые на первый взгляд могут показаться несущественными. Понимание этих аспектов работы виртуальных ассистентов поможет повысить их эффективность, безопасность и упростить процесс обучения таких систем.

Подписывайтесь на Moneytimes.Ru

Читайте также

Российские кибергруппы заявили о координированных атаках со стороны Hacken и Anonymous 31.07.2025 в 23:33

Интернет под атакой: масштабный DDoS-флешмоб от украинских хакеров — что скрывается за этой волной

В конце июля несколько российских интернет-ресурсов стали жертвами масштабных DDoS-атак от украинских хакеров. Узнайте, как западные разведки помогали в киберконфликте.

Читать полностью »
Артемий Лебедев призвал создавать оригинальные продукты вместо копий западных аналогов 31.07.2025 в 23:31

Дизайнер Артемий Лебедев раскрыл секрет национальной болезни: почему российские проекты повторяют западные

Артемий Лебедев назвал стремление российских проектов подражать западным инициативам "национальной болезнью". Он призывает к созданию уникального контента.

Читать полностью »
С 1 сентября в России повысятся госпошлины для автомобилистов и мигрантов 31.07.2025 в 23:26

Повышение пошлин: с 2025 года на оформление авто документов придётся платить больше

С 1 сентября 2025 года в России вступит в силу закон, который значительно подорожает оформление документов для водителей и мигрантов — узнайте все детали.

Читать полностью »
Раскрыта шокирующая мотивация исполнителей теракта в «Крокус Сити Холл» 31.07.2025 в 5:28

Теракт ради денег: что скрывают исполнители страшной трагедии в «Крокусе»?

Эксперты, изучившие материалы уголовного дела, пришли к выводу, что исполнители теракта в концертном зале «Крокус Сити Холл» действовали не из религиозного фанатизма, а под влиянием кураторов ради обещанного вознаграждения.

Читать полностью »
Отец оставил детей в раскаленной машине на час ради визита в секс-шоп в Финиксе 30.07.2025 в 7:28

Жажда наслаждений или смертельный риск? Что заставило отца бросить четверых детей в адской жаре, когда счет шел на минуты!

Шокирующий случай произошел в американском городе Финикс, штат Аризона: 38-летний Асенсио Ларго оставил четверых малолетних детей в припаркованном автомобиле в условиях экстремальной жары, превышающей 40°C, чтобы провести около часа в секс-шопе.

Читать полностью »
Ольга Зарубина призвала ограничить доступ детей на концерты Сергея Лазарева из-за эротики на сцене 29.07.2025 в 18:47

Почему звезда 90-х считает, что Лазарев разрушает психику детей своими танцами?

Певица Ольга Зарубина, известная в 90-х, выразила обеспокоенность по поводу выступления Сергея Лазарева в Сочи, которое, по ее мнению, содержит слишком много эротических элементов и может негативно повлиять на детей.

Читать полностью »
В Екатеринбурге курьер-мошенник приговорен к восьми годам колонии за обман пенсионеров на 20 миллионов рублей 29.07.2025 в 18:43

Как курьер обманул пенсионеров на миллионы: разоблачение преступной схемы

В Свердловской области вынесен приговор пособнику телефонных мошенников, который помог украсть у пожилых людей свыше 20 миллионов рублей. Об этом сообщает областная прокуратура.

Читать полностью »
ЕС может приостановить финансирование Украине из-за давления на антикоррупционные органы 29.07.2025 в 8:22

Помощь под угрозой: ЕС грозит Украине заморозкой выплат из-за скандального закона

Еврокомиссия рассматривает возможность приостановки финансовой помощи Украине.

Читать полностью »