搜索: "文本推理"

共找到 1 篇相关文章

DeepSeek发布V4框架预览论文:利用闲置网卡提升智能体推理效率

DeepSeek发布V4框架预览论文:利用闲置网卡提升智能体推理效率

DeepSeek团队最近在ArXiv上低调发布了一篇论文,介绍了一个新的智能体推理框架DualPath。该研究针对Agent长文本推理场景中的I/O瓶颈问题,提出了解决方案:通过优化KV-Cache的加载速度来减少计算资源被存储读取拖累的情况。DualPath打破了传统的从外部存储直接加载到预填充引擎(Storage-to-Prefill)模式,引入了第二条路径——从外部存储加载至解码引擎再传输给

科技10 阅读