Google представляє TurboQuant - новий алгоритм стиснення пам'яті штучного інтелекту

Дмитро Сизов

Якби дослідники штучного інтелекту Google мали почуття гумору, вони б назвали TurboQuant , новий, надефективний алгоритм стиснення пам'яті штучного інтелекту, анонсований у вівторок, «Щолосуном» — або , принаймні , так думає інтернет .

Цей жарт є посиланням на вигаданий стартап Pied Piper, який був у центрі уваги телесеріалу HBO «Кремнієва долина», що виходив з 2014 по 2019 рік.

Шоу розповідало про засновників стартапу, які орієнтувалися в технологічній екосистемі, стикаючись з такими викликами, як конкуренція з боку більших компаній, залучення коштів, проблеми з технологіями та продуктами, і навіть ( на нашу велику радість) вразили суддів вигаданою версією TechCrunch Disrupt .

Проривною технологією Pied Piper у телешоу став алгоритм стиснення, який значно зменшував розміри файлів майже без втрат. Новий TurboQuant від Google Research також забезпечує екстремальне стиснення без втрати якості, але застосовується до основного вузького місця в системах штучного інтелекту. Звідси й порівняння.

Google Research описав цю технологію як новий спосіб скорочення робочої пам'яті штучного інтелекту без впливу на продуктивність. Метод стиснення, який використовує форму векторного квантування для усунення вузьких місць кешу в обробці ШІ, по суті дозволить ШІ запам'ятовувати більше інформації, займаючи менше місця та зберігаючи точність, за словами дослідників.

Вони планують представити свої висновки на конференції ICLR 2026 наступного місяця разом із двома методами, які роблять це стиснення можливим: методом квантування PolarQuant та методом навчання та оптимізації під назвою QJL .

Розуміння математики, що тут задіяна, можливо, під силу дослідникам та вченим-комп'ютерникам, але результати вражають всю технологічну галузь.

Якщо TurboQuant буде успішно впроваджено в реальному світі, він може зробити штучний інтелект дешевшим в експлуатації, зменшивши його робочу пам'ять, відому як кеш KV, «принаймні в 6 разів».

Дехто, як-от генеральний директор Cloudflare Метью Прінс, навіть називає це моментом DeepSeek від Google — посиланням на підвищення ефективності, зумовлене китайською моделлю штучного інтелекту, яка була навчена за значно меншу вартість, ніж її конкуренти на гірших чіпах, залишаючись при цьому конкурентоспроможною за результатами.

Однак варто зазначити, що TurboQuant ще не отримав широкого розгортання; наразі це все ще прорив у лабораторії.

Це ускладнює порівняння з чимось на кшталт DeepSeek або навіть вигаданого Pied Piper. На телебаченні технологія Pied Piper мала радикально змінити правила обчислень. Тим часом TurboQuant може призвести до підвищення ефективності та створення систем, які потребують менше пам'яті під час логічного висновку. Але це не обов'язково вирішить ширшу проблему дефіциту оперативної пам'яті, спричинену штучним інтелектом, враховуючи, що він спрямований лише на пам'ять для логічного висновку, а не на навчання, яке продовжує вимагати величезної кількості оперативної пам'яті.