搜索: "KV缓存"

共找到 3 篇相关文章

揭秘:DeepSeek V4暗藏中国万亿级开源模型驚喜发现!DeepSeek V4内含重磅中国开源项目万亿规模开源模型悄然入驻DeepSeek V4

揭秘:DeepSeek V4暗藏中国万亿级开源模型驚喜发现!DeepSeek V4内含重磅中国开源项目万亿规模开源模型悄然入驻DeepSeek V4

新智元报道DeepSeek V4 引人注目,其参数量达到惊人的1.6万亿,并且在Codeforces竞赛中排名人类选手第二十三位,KV缓存仅前代的十分之一。在同一周内,Kimi K2.6也宣布开源,支持数百万token的上下文和300个子Agent协同工作,模型参数量更是达到了2.6万亿。两家公司在中国AI领域中的地位显赫,它们的技术进步与发布时间高度契合,似乎有意为之。回顾过去一年半的时间线,D

科技4 阅读
颠覆!NVIDIA发明新技术KVTC:内存使用量缩减20倍

颠覆!NVIDIA发明新技术KVTC:内存使用量缩减20倍

快科技3月22日消息,NVIDIA研究人员推出一项全新技术KVTC(KV快取转换编码),能把大型语言模型(LLM)追踪对话历史的内存用量,最高缩减20倍,而且不用修改模型本身。这一突破有望解决大型语言模型长对话推理时的内存不够用问题,大大降低企业使用AI的硬件成本,同时还能把模型首次生成回应的时间,最高提速8倍。简单来说,KVTC技术的核心就是压缩大型语言模型背后的KV缓存——它相当于AI模型的“

科技3 阅读