近日,国产开源模型在硅谷大放异彩,性价比远超同类产品。
中国的时间已经到来,开源模型领域迎来了新的时代。
硅谷科技巨头们对中国的开源模型表现出浓厚兴趣,纷纷引入使用。
Yann LeCun也在社交媒体上点赞,表示赞同这一趋势。
近期,初代AI编程项目Cursor和Devin被曝出其自研模型实际上基于中国开源技术。

最近,Cursor公司旗下的Composer 2模型在基准测试中表现出色,但随后承认是套用了Kimi K2.5的成果。

同样地,Cognition公司的SWE-1.6模型也被质疑是在GLM基础上进行后训练的结果。
这种现象日益增多,中国开源模型在硅谷受到了前所未有的欢迎。
例如,Shopify因切换至Qwen而每年节省了500万美元;爱彼迎的联合创始人Brian Chesky也表示Qwen性能优异且价格实惠。
智谱公司最新发布的GLM-5.1模型,在部分指标上超越了Opus 4.6,性价比颇高。
国外开发者选择使用中国开源模型进行蒸馏或后训练的做法已屡见不鲜。
国产开源模型横扫硅谷
Cursor的Composer 2在基准测试中一度领先于Opus 4.6,但之后被曝光套用了Kimi K2.5的技术。
尽管双方最终达成和解,此事仍令人唏嘘不已。

Cognition公司的SWE-1.6模型也被曝疑似是基于GLM进行后训练而来。
早在前一代产品中,Cognition就曾有类似的套壳行为。
去年,SWE-1.5就被发现是在GLM-4.6上进行后训练得到的。

这些初创公司虽然名气不小,但出现这样的情况也让人无奈。
然而巨头企业也开始效仿这一做法。

去年十二月,Meta的“牛油果”项目被曝出使用了Qwen模型进行蒸馏训练。
之前,Llama一直是开源领域的主导者,但如今面对东方模型的强大竞争力,Meta做出了改变。

Brian Chesky早早就被阿里巴巴的Qwen模型所吸引,认为其性能优异且成本低廉。
当然,他们也会使用OpenAI的新模型,但在实际应用中更倾向于选择性价比更高的中国开源技术。
在学术界,斯坦福大学李飞飞团队和艾伦人工智能研究所等顶尖机构也采用了Qwen的技术方案进行研究。
艾伦人工智能研究所也基于Qwen技术开发了其多模态系统。
Thinking Machines Lab也将Qwen作为默认的微调选项之一。
这些迹象表明,中国开源模型在硅谷正迅速崛起。

为何硅谷企业如此热衷于中国开源模型?
据Peter Yang分析,在许多基准测试中,中美同等质量的模型价格相差10-20倍。
例如,最新发布的几款国产模型:
Kimi K2.5:每百万token输入4元/输出21元;
MiniMax M2.7:每百万token输入2.1元/输出8.4元;
他曾经公开表态:
GLM-5.1:每百万token输入6元/输出24元;

这些模型在基准测试中的表现,几乎可以媲美或甚至超越Opus 4.6和GPT-5.4等顶尖闭源产品。
而Opus 4.6的价格是每百万token输入5美元/输出25美元,GPT-5.4则是输入2.5美元/输出15美元。
相比之下,使用中国开源模型无疑能大幅节省成本,还能获得出色性能。
更重要的是,开源模型并不总是输给闭源产品。
早在Kimi K2推出时,Vercel CEO Guillermo Rauch就曾指出,在真实场景测试中,Kimi K2的表现优于GPT-5和Claude Sonnet 4.5。
其准确率甚至高出50%。
Chamath也曾表示,Kimi K2性能出色且价格亲民。
自从艾伦人工智能研究所减少开源AI研发资金后,美国在这一领域的领先地位逐渐丧失。
随着中国模型的崛起,开源领域迎来了新的时代。

性价比压倒一切
为啥硅谷这么热衷于中国开源模型?
当然是因为量大便宜。
Peter Yang算了一笔账:在许多基准测试中,中美同等质量的模型价格相差10-20倍。
就拿最新发布的几款国产模型来说:
- Kimi K2.5:每百万token输入4元/输出21元;
- MiniMax M2.7:每百万token输入2.1元/输出8.4元;
- GLM-5.1:每百万token输入6元/输出24元;
- Qwen3.6-Plus:每百万token输入2元/输出12元。


这几款模型在基准测试上的表现,都接近甚至部分反超了Opus 4.6、GPT-5.4等顶尖闭源模型。
但Opus 4.6的价格是每百万token输入5美元/输出25美元,GPT-5.4则是输入2.5美元/输出15美元。
这性价比,一目了然。
节省超10倍价格,拿到一个还不错的模型表现,岂不是美滋滋??

而且开源模型也并非完全打不过闭源。
早在Kimi还只出了K2的时候,Vercel CEO Guillermo Rauch就曾提到:
在内部智能体真实场景基准测试中,Kimi K2在运行速度和准确率上优于GPT-5和Claude Sonnet 4.5。
其中准确率更是高出50%。
硅谷投资人Chamath也曾表示,Kimi K2性能够强,且比OpenAI和Anthropic便宜太多。
而且自从艾伦人工智能研究所宣布削减开源模型研发资金,转向AI应用后,美国开源AI的旗帜就真倒了。

开源模型,已经来到了中国时间。
参考链接:
[1]https://x.com/petergyang/status/2042248752157839793?s=20
[2]The All-You-Can-Use AI Subscription Won’t Last Forever

听雨