搜索: "Kimi K2.5"

共找到 7 篇相关文章

月之暗面Kimi融资获国资加持 国智投等多家基金入场

月之暗面Kimi融资获国资加持 国智投等多家基金入场

《科创板日报》19日讯,《科创板日报》记者独家获悉,多家国资机构和央企巨头已出现在Kimi最新股东名单中,除此前已有的互联网大厂与产业基金外,已加入国智投、北京人工智能基金等多家国资机构及中国移动等央企巨头。与此同时,月之暗面近期正在进行的20亿美元融资已进入收尾阶段。多家国资背景机构的入局,标志着Kimi在资本结构上完成了整合。产品层面,基于Kimi K2.5模型打造的Composer 2.5

科技5 阅读
中科大与上海AILab揭秘2026年ACL大会上的强化学习后训练规律

中科大与上海AILab揭秘2026年ACL大会上的强化学习后训练规律

从 DeepSeek-R1 到 Kimi K2.5,利用强化学习(RL)来优化大型模型的推理性能已成为关键方法。然而,在 RL 后训练过程中存在一个重要问题:这种训练方式是否遵循特定规律?能否通过给定参数量、计算资源和数据规模,准确预测出 RL 训练所能达到的效果?中国科学技术大学与上海人工智能实验室等机构的研究团队对此进行了系统性的研究。他们使用 Qwen2.5 系列密集模型(从0.5B到72B

科技1 阅读
美国网友质疑Cursor效仿中国设计,甚至马斯克也感到不满

美国网友质疑Cursor效仿中国设计,甚至马斯克也感到不满

曾经广受欢迎的编程工具Cursor近期发布了一款名为Composer 2的新模型。官方声明中特别提到,这款模型是通过“持续预训练”和“强化学习”来提升性能的。然而,就在发布不到24小时后,一名开发者在调试API时发现模型的ID为“kimi-k2p5-rl-0317-s515-fast”。这意味着,Cursor发布的Composer 2实际上是基于Kimi K2.5,并添加了强化学习的元素。预训练负

科技3 阅读
杨植麟亮相美国GTC大会,首次披露Kimi大模型技术蓝图

杨植麟亮相美国GTC大会,首次披露Kimi大模型技术蓝图

江宇撰写,云鹏编辑3月18日,智东西报道,英伟达GTC大会于今日凌晨召开,月之暗面创始人杨植麟作为唯一受邀现场演讲的中国独立大模型公司创始人,发表了题为《How We Scaled Kimi K2.5》的演讲,首次完整披露了Kimi K2.5背后的技术路线图。3月16日,月之暗面刚刚发布了一篇论文,预告了下一代模型的关键模块——注意力残差(Attention Residuals,简称AttnRes

科技19 阅读
国产模型助力养虾人创新高!4.19万亿Token日调用猛涨34.9%,中国反超美国

国产模型助力养虾人创新高!4.19万亿Token日调用猛涨34.9%,中国反超美国

中国的龙虾爱好者们真是独领风骚。 养虾热潮推动国产大模型在黄金周期间取得了显著成就。 据OpenRouter最新统计,上周中国大模型的调用量激增至4.19万亿Token。 这是中国大模型继今年二月首度超越美国后再次占据榜首位置。 在热门应用榜单上,OpenClaw依旧稳居第一;本月最受欢迎的大模型中,国产产品依然领先。 排名前三的分别是Kimi K2.5、Step 3.5 Flash和Mi

AI9 阅读
马年四大热门模型齐聚阿里云Coding Plan启动!海量Token任你用

马年四大热门模型齐聚阿里云Coding Plan启动!海量Token任你用

近日,国内领先的AI云计算服务提供商阿里云推出了一系列重要更新。一哥就有一哥样。刚刚复工之际,阿里云一口气发布了Qwen3.5、GLM-5、MiniMax M2.5和Kimi K2.5四款顶尖开源模型。这些新上线的模型无疑具有重要意义:Qwen3.5作为阿里自主研发的新一代旗舰级大模型,在算力消耗极低的情况下,其性能已超越当前多个顶级闭源模型,并在Hugging Face榜单上占据榜首位置。Min

科技15 阅读