最新的全球权威大模型盲测榜单已经揭晓,阿里千问3.6荣登中国最强编程模型之首。
阿里巴巴近期计划推出一系列新版本的大语言模型。
4月3日,专注于评估AI编程能力的Code Arena在LMArena平台上发布了最新的排名结果。阿里巴巴的新一代大语言模型Qwen 3.6-Plus在全球榜单上名列第二,超越了包括OpenAI、Google和xAI在内的多家国际巨头,在中国同类产品中排名第一。
LMArena作为当前最公正的大模型评测平台之一,采用真实用户的盲测机制来评估各大模型的性能。随着Agent时代的到来,编程能力已经成为衡量大语言模型综合表现的关键指标,因此该榜单受到了广泛关注。此次Qwen3.6-Plus在React专项榜单上的出色表现,证明了它在复杂的Web开发环境下的自主编码能力。
Qwen3.6-Plus是阿里巴巴于4月2日推出的新一代大语言模型,具备多模态理解和推理功能,并且在代码生成和Agent方面表现出色。在多项权威编程测试中,千问3.6以更少的参数超越了参数量为两倍甚至三倍的GLM-5、Kimi-K2.5等竞争对手,在国产大语言模型中树立了新的标杆。该新版本自发布以来,就在全球开发者社区引起了巨大反响,并在次日登上了React榜单第二的位置。
目前的榜单数据显示,千问3.6以1452分的成绩排名第二,仅次于Claude-Opus-4.6-Thinking(1540分),领先于OpenAI最新发布的GPT-5.0-High(1448分)以及Google的Gemini 1440分。这表明在最具挑战性的AI编程任务中,千问3.6与全球顶级大模型相比毫不逊色甚至更加出色。此外,在Code Arena榜单上,Qwen3.6-Plus也占据了国产模型中的首位。
据内部消息透露,Qwen3.6-Plus是阿里千问3.6系列的第一款产品,未来还将陆续开源该系列的其他版本,并计划在近期发布性能更强的旗舰版Qwen3.6-Max。

量子位的朋友们