
谷歌发布论文引发内存股暴跌!KV缓存压缩技术突破六倍,网友惊叹科技预言成真
最近,谷歌的一项研究导致内存相关股票大跌,其KV cache压缩技术将内存使用量减少了6倍。 梦晨 2026-03-26 11:03:26 量子位
AI1 阅读
共找到 2 篇相关文章

最近,谷歌的一项研究导致内存相关股票大跌,其KV cache压缩技术将内存使用量减少了6倍。 梦晨 2026-03-26 11:03:26 量子位

快科技3月22日消息,NVIDIA研究人员推出一项全新技术KVTC(KV快取转换编码),能把大型语言模型(LLM)追踪对话历史的内存用量,最高缩减20倍,而且不用修改模型本身。这一突破有望解决大型语言模型长对话推理时的内存不够用问题,大大降低企业使用AI的硬件成本,同时还能把模型首次生成回应的时间,最高提速8倍。简单来说,KVTC技术的核心就是压缩大型语言模型背后的KV缓存——它相当于AI模型的“