搜索: "KV缓存"

共找到 3 篇相关文章

揭秘：DeepSeek V4暗藏中国万亿级开源模型驚喜发现！DeepSeek V4内含重磅中国开源项目万亿规模开源模型悄然入驻DeepSeek V4

新智元报道DeepSeek V4 引人注目，其参数量达到惊人的1.6万亿，并且在Codeforces竞赛中排名人类选手第二十三位，KV缓存仅前代的十分之一。在同一周内，Kimi K2.6也宣布开源，支持数百万token的上下文和300个子Agent协同工作，模型参数量更是达到了2.6万亿。两家公司在中国AI领域中的地位显赫，它们的技术进步与发布时间高度契合，似乎有意为之。回顾过去一年半的时间线，D

科技2026/4/254 阅读

谷歌发布论文引发内存股暴跌！KV缓存压缩技术突破六倍，网友惊叹科技预言成真

最近，谷歌的一项研究导致内存相关股票大跌，其KV cache压缩技术将内存使用量减少了6倍。梦晨 2026-03-26 11:03:26 量子位

AI2026/3/272 阅读

颠覆！NVIDIA发明新技术KVTC：内存使用量缩减20倍

快科技3月22日消息，NVIDIA研究人员推出一项全新技术KVTC（KV快取转换编码），能把大型语言模型（LLM）追踪对话历史的内存用量，最高缩减20倍，而且不用修改模型本身。这一突破有望解决大型语言模型长对话推理时的内存不够用问题，大大降低企业使用AI的硬件成本，同时还能把模型首次生成回应的时间，最高提速8倍。简单来说，KVTC技术的核心就是压缩大型语言模型背后的KV缓存——它相当于AI模型的“

科技2026/3/223 阅读