
深度求索公司近期发布了其备受关注的新一代旗舰AI产品——DeepSeek-V4的试用版本。尽管这款新模型在功能上与国际同行的顶尖产品存在一定差距,但在国产化替代方面却有显著优势,尤其是在适配华为昇腾芯片上。
该公司的社交媒体平台于本周五(4月24日)宣布,最新系列DeepSeek-V4已开放预览并免费开源。官方消息显示,V4版本能够处理超过一百万字的长文本,并在智能体能力、知识储备和推理性能方面位居国内及国际开源领域的前列。
根据模型大小的不同,DeepSeek-V4分为“Pro”与“Flash”两个版本,分别对应专业模式和快速模式。其中,“Pro”版在世界知识测试中表现出色,超越了许多其他开源模型,但在某些领域仍落后于谷歌的闭源产品Gemini-Pro-3.1。
在公布两款型号的价格时,DeepSeek透露由于高端计算资源有限,当前“Pro”版本的服务能力十分受限。预计到下半年华为昇腾950超节点大量上市后,“Pro”版价格将大幅下调。
华为当天发文表示,其昇腾产品一直支持深度求索系列模型的发展,并通过与DeepSeek的技术合作,实现了V4全系列产品对昇腾超节点的全面兼容性。
同日,中国芯片股股价普遍上涨。作为华为的主要芯片供应商之一,中芯国际和华虹半导体分别录得10%及超过15%的涨幅,而其他国内竞争对手智普AI与MiniMax则下跌了9%。
《财经》杂志分析指出,DeepSeek的新模型能否在未来的开发过程中使用包括华为昇腾950在内的国产AI芯片进行训练和推理成为市场关注焦点。目前可以确定的是,V4将支持华为昇腾950并利用该平台完成推理任务,但不一定基于此芯片完成前期训练。
大部分主流的AI模型都是在英伟达的硬件上开发出来的。美国外交关系协会中国与新兴技术高级研究员麦奎尔撰文指出,深度求索此次没有像以往那样公开提及V4的具体成本或所使用的芯片数量,可能是因为该产品依赖于已被美国政府禁止向华出口的英伟达最新Blackwell芯片。
在美国白宫批评中国企业大规模窃取其AI技术并誓言采取行动之际,深度求索发布了新的旗舰模型。自2022年起,华盛顿开始限制中国获取先进的人工智能芯片后,北京加快了自主研发的步伐。
中国天使投资人、人工智能专家郭涛在接受《联合早报》采访时评价道:“这款新版本使用了英伟达和华为昇腾的组合芯片,并且昇腾的比例可能相对较高。这在一定程度上打破了英伟达主导算力市场的局面,国产化的大规模落地是一个亮点。”
麦奎尔认为,虽然DeepSeek-V4可能是目前中国最好的模型之一,但它与美国顶尖产品相比仍有明显差距;它也没有改变中美之间AI竞争格局的看法:“美国在技术上领先大约七个月,而中国的顶尖模型仍依赖于美国的技术。”
DeepSeek去年初曾凭借低成本模型R1震惊世界,被称为“DeepSeek时刻”。郭涛认为,V4此次带来的冲击力有限,“综合技术方面来说,跟国外的大模型还是有一些差距”。
麦奎尔也说,V4或许是中国目前最好的模型,但优势并不明显;它也无法与美国顶尖模型相媲美,未能动摇关于中美AI竞争现状的共识:“美国模型领先约七个月,而中国领先的模型仍依赖美国技术。”
