Больше не нужно искать — необходимые
обучающие материалы и подсказки всегда под рукой

Исследователи Google представили алгоритм TurboQuant для сжатия памяти в системах искусственного интеллекта. Пользователи в шутку сравнили эту разработку с технологией вымышленного стартапа Pied Piper из сериала «Кремниевая долина».
Новый алгоритм значительно сокращает объем памяти, необходимый для работы больших языковых моделей и систем векторного поиска. ИИ часто работает с большими массивами данных, которые занимают много места и замедляют обработку. Обычные методы сжатия не всегда эффективны, так как требуют хранения дополнительной информации.
TurboQuant решает эту проблему с помощью двух механизмов. Первый сжимает основные данные, переводя их в полярную систему координат. Второй, используя всего один бит памяти, корректирует возможные ошибки сжатия.
Генеральный директор Cloudflare Мэттью Принс отметил, что эта инновация напоминает ему эффективность китайской модели DeepSeek, которая также известна работой на маломощном оборудовании.
Технологию протестировали на моделях Llama, Gemma и Mistral. В результате кэш удалось сжать до трёх бит без потери качества, потребление памяти снизилось минимум в шесть раз, а скорость вычислений на ускорителях H100 выросла в восемь раз.
Для использования TurboQuant не нужно дообучать нейросети. Google планирует внедрить алгоритм в свои поисковые системы и ИИ-продукты, включая Gemini. Подробности о проекте представят на конференциях ICLR и AISTATS в 2026 году.
Напомним, в тот же день Google также анонсировала планы по переходу на постквантовую криптографию.
Популярные лонгриды: