Учёные «Яндекса», ВШЭ и MIT разработали метод сжатия LLM без потери качества

Учёные «Яндекса», ВШЭ и MIT разработали метод сжатия LLM без потери качества

11 апреля

Квантировать модели теперь можно прямо на смартфоне или ноутбуке.

Специалисты Yandex Research, НИУ ВШЭ, Массачусетского технологического института и других ведущих вузов разработали метод быстрого сжатия больших языковых моделей (LLM) без потери качества. Технология называется HIGGS (Hadamard Incoherence with Gaussian MSE-optimal GridS).

Метод позволяет сжимать нейросети без дообучения и вычислительно сложной оптимизации параметров. Как уточняют авторы разработки, теперь квантизацию (то есть сжатие) модели можно выполнить прямо на смартфоне или ноутбуке — раньше процедура требовала мощностей серверного уровня.

С помощью метода уже удалось сжать DeepSeek-R1 на 671 млрд параметров и Llama 4 Maverick на 400 млрд параметров. Эксперименты показали, что HIGGS дал лучшие результаты среди других способов квантизации без использования данных.

Разработку опубликовали в открытый доступ — ознакомиться с HIGGS можно на Hugging Face и GitHub, а научную статью про него можно прочитать на arXiv. Авторы исследования расскажут о методе на одной из крупнейших в мире конференций по искусственному интеллекту — NAACL, которая пройдёт в США с 29 апреля по 4 мая.

Источник

Подписывайтесь на наши соц. сети и получайте больше новостей!

Комментарии

Содержание

В начало
Комментарии

Tung Tung Tung Sahur в Укради Брейнрот (Steal a Brainrot): как получить брейнрота и сколько стоит

Avowed: Осеннее обновление переносится на февраль 2026 года

Коды Битва NFT (Roblox) на Декабрь 2025 года — халявные звезды и НФТ

На ПК и консолях вышла Marvel Cosmic Invasion — 2D-битемап с героями комиксов

Один из разрабов Baldur's Gate 3 перешел в CD Projekt Red для работы над The Witcher 4

Актуальные коды Pets GO (Петс Го) на декабрь 2025 года

Обновление «Мира Танков»: Сергей Бурунов в образе Деда Мороза, праздничные контейнеры и бонусы

PlayStation 5 получила обновление ПО 08-12.40.00, весом около 1,3 ГБ


Сайт может использовать файлы cookie для работы, улучшения сервиса и показа персональных предложений. Подробнее об этом в Политике конфиденциальности.
Продолжая использовать сайт, Вы соглашаетесь с Условиями использования и Политикой cookie.
Закрыть
licnt20A2