Учёные «Яндекса», ВШЭ и MIT разработали метод сжатия LLM без потери качества •

Квантировать модели теперь можно прямо на смартфоне или ноутбуке.

Специалисты Yandex Research, НИУ ВШЭ, Массачусетского технологического института и других ведущих вузов разработали метод быстрого сжатия больших языковых моделей (LLM) без потери качества. Технология называется HIGGS (Hadamard Incoherence with Gaussian MSE-optimal GridS).

Метод позволяет сжимать нейросети без дообучения и вычислительно сложной оптимизации параметров. Как уточняют авторы разработки, теперь квантизацию (то есть сжатие) модели можно выполнить прямо на смартфоне или ноутбуке — раньше процедура требовала мощностей серверного уровня.

С помощью метода уже удалось сжать DeepSeek-R1 на 671 млрд параметров и Llama 4 Maverick на 400 млрд параметров. Эксперименты показали, что HIGGS дал лучшие результаты среди других способов квантизации без использования данных.

Разработку опубликовали в открытый доступ — ознакомиться с HIGGS можно на Hugging Face и GitHub, а научную статью про него можно прочитать на arXiv. Авторы исследования расскажут о методе на одной из крупнейших в мире конференций по искусственному интеллекту — NAACL, которая пройдёт в США с 29 апреля по 4 мая.

Источник

Подписывайтесь на наши соц. сети и получайте больше новостей!

Breachbase

11 апреля

Содержание

В начало

Комментарии

Учёные «Яндекса», ВШЭ и MIT разработали метод сжатия LLM без потери качества

Комментарии

Содержание

Telegram представил глобальный поиск постов, альбомы историй и рейтинг профиля

Как победить Дутанга - людоеда в Wuchang: Fallen Feathers

Comic Con Игромир 2025: Эсад Рибич и другие звезды на фестивале

Видеокарты RTX Super поступят в продажу раньше, чем ожидалось.

Shopify Rebellion завершает сотрудничество с составом Dota 2

Новые детали о Bloodlines 2 от The Chinese Room

В Сеть слили кусок нового трейлера Battlefield 6 с предстоящей презентации

Владимир Путин подписал закон о штрафах за поиск экстремистского контента в интернете

Как решить головоломки врат Wuchang: Fallen Feathers для достижения "Премудрость

Борис Добродеев возглавил игровую студию "Леста"

Ремейк Gothic 1 выйдет в начале 2026 года

Steam позволит менять обложки и названия игр прямо в настройках