搜索: "KV缓存"

共找到 2 篇相关文章

颠覆!NVIDIA发明新技术KVTC:内存使用量缩减20倍

颠覆!NVIDIA发明新技术KVTC:内存使用量缩减20倍

快科技3月22日消息,NVIDIA研究人员推出一项全新技术KVTC(KV快取转换编码),能把大型语言模型(LLM)追踪对话历史的内存用量,最高缩减20倍,而且不用修改模型本身。这一突破有望解决大型语言模型长对话推理时的内存不够用问题,大大降低企业使用AI的硬件成本,同时还能把模型首次生成回应的时间,最高提速8倍。简单来说,KVTC技术的核心就是压缩大型语言模型背后的KV缓存——它相当于AI模型的“

科技1 阅读