
经过多次延期传言之后,备受期待的DeepSeek V4终于要发布了。
《创智记》从多位内部人士那里了解到,梁文锋近日在公司内部会议中宣布,预计将于四月下旬正式推出新一代旗舰大模型DeepSeek V4。
据此前消息透露,这款新版本将拥有超过万亿参数规模以及百万级的上下文窗口,并且首次实现了与国产芯片如华为昇腾等的深度兼容,标志着中国AI产业在摆脱对CUDA依赖方面取得了重要进展。
令人注目的是,在3月29日晚经历长达13小时的服务中断之后,许多开发者发现模型输出逻辑显著改变:代码结构更加清晰,逻辑严谨度有了飞跃式的提升,并且SVG图形生成能力也得到了明显增强。
这次事件被外界广泛猜测为V4版本的灰度测试或全面部署阶段。
据悉,DeepSeek V4将采用Apache 2.0开源协议,允许企业自行部署。据最新报道显示,为了迎接该新模型的到来,包括阿里巴巴、字节跳动和腾讯在内的多家国内科技巨头已经预订了大量的新一代AI算力芯片,并计划通过云服务提供DeepSeek的新产品并将其整合到自家的AI解决方案中。
由于国产计算资源深度适应性调整、架构重新设计以及稳定性的优化等原因,原本定于春节前后发布的大型参数版本被数次推迟。
梁文锋先生从量化投资领域转向人工智能行业以来,正在经历一段重要的转型期。
根据《晚点》的报道,在过去的一年中,尽管DeepSeek团队失去了几名核心成员(包括R1的核心作者郭达雅),但整体队伍结构并未受到严重冲击,“有人离开的同时也有更多的人加入”。
自2025年下半年以来,梁文锋开始更加注重产品的市场推广和商业化运营,组建专门的产品开发小组,并招聘了多名专注于Agent方向的“模型策略产品经理”,同时将研发重点从纯技术层面转向应用层面。他正在为公司进行估值以明确员工期权的价值,给予团队更清晰的发展预期。
在面对众多竞争对手如豆包、千问、智谱、Kimi和MiniMax等的强大挑战下,延迟发布的V4版本承担着巨大的期望压力——梁文锋能否再次引领全球开源大模型的创新潮流?
据悉,DeepSeek V4最重要的技术突破在于其长期记忆能力(LTM)方面的显著改进。
然而一些与DeepSeek有深入合作经历的人士向《创智记》表示,业界应该对V4保持合理的期待水平,很难期望它能够复制去年DeepSeek-V3所取得的巨大影响力。
除了即将推出的DeepSeek V4之外,腾讯计划在四月份发布其最新版本的混元大模型。这是自2025年下半年完成团队重组并任命姚顺雨为首席AI科学家后,腾讯发布的首个重量级的大规模语言模型产品。
