最近,阿里巴巴的千问模型在LMArena榜单上以Qwen3.5-Max-Preview的预览版形式首次亮相,迅速成为中国最强的模型之一。
阿里千问位列全球前五
在3月20日发布的最新一期LMArena榜单中,阿里巴巴的Qwen3.5-Max-Preview预览版模型以1464分的成绩,超越了包括GPT5.4、Claude4.5、Grok4.1等在内的众多海外顶尖模型,以及豆包2.0、GLM5、Kimi2.5等所有国产模型,确立了其在中国市场的领先地位。同时,LMArena对全球大模型公司的排名中,五家中国企业进入了前十名,其中阿里巴巴在全球排名第五,在中国排名第一,而字节跳动、智谱、月之暗面和百度也跻身前十。
阿里巴巴凭借Qwen3.5-Max-Preview的出色表现,成功跻身全球前五大模型公司之列。
LMArena是由国际开源机构LMSYS组织的第三方大模型测评榜单,其通过模型厂商自主提交模型并由全球开发者在盲测条件下进行两两比较,最终根据投票结果确定模型的分数和排名。因此,它被认为是AI领域最公正和权威的全球大模型性能榜单。阿里巴巴的千问模型多次在LMArena榜单中代表中国模型取得优异成绩。
千问3.5是阿里巴巴在今年春节期间推出的新一代大模型,拥有总计3970亿参数和激活170亿的小型模型,尽管参数量较小,但性能表现超越了其两倍甚至三倍的竞争对手。目前,阿里巴巴已经开源了8款不同规模的Qwen3.5模型,每一款都获得了其尺寸下的最佳性能记录,受到了全球AI开发者和企业的广泛欢迎。旗舰版Qwen3.5-Max也因此备受期待。

最新一期LMArena榜单中,Qwen3.5-Max-Preview旗舰模型预览版在全球总榜中排名第六,展现了其在模型绝对胜率上的卓越表现。
在最新的LMArena榜单中,Qwen3.5-Max-Preview预览版以显著的优势超越了包括GPT5.4、Claude sonnet-4.6、Grok4.1等在内的顶尖模型,以及所有国产模型,如豆包2.0、GLM5、Kimi2.5。在数学能力子榜单中,该模型排名全球第五,中国第一;在专家级文本能力子榜单中,它位列全球第十,中国第一。业内有消息称,Qwen3.5-Max的正式版本预计将在不久后发布,性能还将进一步提升。

从千问2.5、3到3.5三代模型在Arena上的得分对比来看,每一代都取得了显著的进步。
以阿里千问为代表的中国大模型正在迅速崛起。根据LMArena的排名,全球前十名中,中美两国各占据一半的位置。具体排名为:Anthropic、谷歌、xAI、OpenAI、阿里位居全球前五,字节跳动、智谱、月之暗面、百度、亚马逊则排在第六至第十位。
(完)

量子位的朋友们