搜索: "长文本处理"

共找到 5 篇相关文章

DeepSeek V4报告内容丰富详实！揭秘484天迭代历程

DeepSeek的V4版本发布了，它在长文本处理效率方面取得了重大突破。为了实现极致的长文性能，V4采取了激进的方法，在未来的研究中将会更加全面地探索简化路径的可能性。V4论文详细介绍了其架构和优化措施，包括百万token处理能力的关键改进。这些成果表明DeepSeek在追求高效的同时保持了稳定的进步节奏。论文强调，尽管V4实现了显著的性能提升，但在未来还有进一步精简的空间，并指出几个研究方向如新

科技2026/4/262 阅读

DeepSeek V4亮相！全力支持本土计算力国产AI芯片股价攀升

今日，DeepSeek的最新模型DeepSeek-V4预览版正式对外发布，并且同步开放源代码。受到这一消息的影响，国内人工智能芯片股集体上涨。海光信息股价攀升6.77%，寒武纪涨幅为1.28%；上证科创板芯片指数强势上升2.72%，科创芯片ETF易方达也增长了2.87%。DeepSeek-V4具备百万级长文本处理能力，在代理功能、知识库和推理性能方面均处于国内及开源领域的领先地位。该模型提供两个版

科技2026/4/252 阅读

华为昇腾超节点助力DeepSeek-V4发布迈向百万级上下文处理新时代

今日，DeepSeek-V4 的预览版本正式上线，并同步开放了源代码。该模型将上下文处理长度从原先的128K大幅扩展至1M，支持百万字级别的超长文本处理。同时，输出的最大长度可达384Ktokens，还首次引入了KV Cache滑窗和压缩算法以减少Attention计算的成本。国内多家芯片制造商，包括华为昇腾、天数智芯以及寒武纪等公司已经成功支持DeepSeek-V4的新模型，并且它们的产品全面兼

科技2026/4/2518 阅读

谷歌突破内存限制，融合Transformer与RNN技术，开启超长文本处理新时代

最近，谷歌与内存技术展开了新的较量。上个月，谷歌的研究项目 TurboQuant 曾引发行业震动，该研究声称能够大幅度压缩大模型中最消耗显存的 KV Cache，这一消息使得市场对内存需求产生担忧，并导致相关股票价格下滑。此后的学术界对此也进行了广泛的讨论和辩论。本周，谷歌又发布了一篇论文，在 AI 社区中引起了关注。这篇论文提出的方法解决了长文本处理中的“内存瓶颈”问题，但采用了与之前完全不同的

科技2026/4/181 阅读

小米VisionGT超跑惊艳登场；DeepSeekV4或将下周发布；宝可梦三十周年纪念公仔热销不断 | 科技早讯

据报道，DeepSeek V4 或将于下周正式发布，该产品将原生支持图片、视频与文本的生成功能。国内知名 AI 大模型企业杭州深度求索（DeepSeek）计划于近期推出其最新旗舰大模型 DeepSeek V4。据悉，这款新模型具有多模态交互、编程能力提升、长文本处理优化及国产算力适配等多项改进。在长文本处理方面，DeepSeek V4 的上下文窗口被扩展至超过 100 万个 Token，是上一代产

科技2026/3/22 阅读