Человек на работе
Человек на работе
Дмитрий Толстенёв Опубликована 11.04.2025 в 16:39

Революционный метод сжатия языковых моделей: как "Яндекс" и ученые из НИУ ВШЭ и MIT упростили использование нейросетей

Революционный метод сжатия языковых моделей: как "Яндекс" и ученые из НИУ ВШЭ и MIT упростили использование нейросетей

Сотрудники компании "Яндекс" в сотрудничестве с учеными из НИУ ВШЭ, MIT, KAUST и ISTA разработали метод сжатия языковых моделей, который позволяет значительно улучшить их производительность, не теряя качества. Новая технология, получившая название HIGGS (Hadamard Incoherence with Gaussian MSE-optimal GridS), делает возможным запуск сложных нейросетей на обычных устройствах, таких как ноутбуки и смартфоны, без необходимости использования дорогих серверов с мощными графическими процессорами. Ранее, для работы с большими языковыми моделями требовалась квантизация на специализированных серверах, что занимало от нескольких часов до недель, но с HIGGS этот процесс теперь можно завершить всего за несколько минут, даже на устройствах с ограниченными вычислительными возможностями.

Важнейшим аспектом метода является его способность эффективно работать с гигантскими моделями, такими как DeepSeek-R1 с 671 миллиардом параметров и Llama 4 Maverick с 400 миллиардов параметров. Эти модели, которые ранее не помещались на специализированных AI-серверах, теперь можно использовать на более доступных устройствах. Эксперименты, проведенные в рамках исследования, показали, что технология HIGGS значительно превосходит существующие методы квантизации, такие как NF4 и HQQ, по соотношению качества и размера модели. Учёные подтвердили, что новая методика сжатия обеспечивала отличные результаты при применении к моделям Llama 3 и Qwen2.5.

Особенностью HIGGS является отсутствие необходимости в дополнительных данных для обучения и в сложной оптимизации параметров, что значительно упрощает процесс работы с нейросетями. Этот прогресс открывает новые возможности для использования языковых моделей на устройствах с ограниченными вычислительными ресурсами, снижая требования к аппаратному обеспечению и делая передовые нейросетевые технологии более доступными для широкого круга пользователей.

Подписывайтесь на newsinfo

Читайте также

Жители Финляндии потеряли доверие к НАТО после заявлений Трампа сегодня в 10:45

Жители Финляндии потеряли доверие к НАТО после заявлений Трампа

Социологи констатировали, что показатели на самом низком уровне с весны 2022 года.

Читать полностью »
SHOT: Латвия запретила въезд Кристине Орбакайте сегодня в 10:43

SHOT: Латвия запретила въезд Кристине Орбакайте

Кристина Орбакайте была внесена в перечень персон нон грата из-за её концертов в Крыму и участия в событиях, которые расцениваются как часть российской пропагандистской кампании. До этого возникла неопределённость с проведением её концерта в Вильнюсе.

Читать полностью »
Президент Санду: Украина и Молдавия укрепят ЕС сегодня в 10:19

Президент Санду: Украина и Молдавия укрепят ЕС

Президент Молдавии Майя Санду уверена, что вступление Украины и Молдавии в ЕС усилит его безопасность и единство.

Читать полностью »
Тюремную надзирательницу обвинили в сексе с заключенными в Британии сегодня в 10:05

Тюремную надзирательницу обвинили в сексе с заключенными в Британии

Следствие считает, что женщина имела романы с двумя арестантами.

Читать полностью »