搜索: "DeepSeek算法"

共找到 2 篇相关文章

北大团队革新DeepSeek算法,提速四倍不失精准度

北大团队革新DeepSeek算法,提速四倍不失精准度

近日,一篇关于新稀疏注意力机制的研究论文引起广泛关注。论文提出了一种名为HISA(Hierarchical Indexing Sparse Attention)的新方法,成功解决了大模型中的索引瓶颈问题,并提高了计算效率。相较于现有的DeepSeek Sparse Attention (DSA) 方法,HISA不仅速度提升了2至4倍,而且无需额外的微调步骤便能实现即插即用的效果。研究团队在多种大模

科技0 阅读