
混元大模型重建的第一步是Hy3 preview。
作者|连冉
姚顺雨在加入腾讯后,推出了首个重要的语言模型项目。
4月23日,腾讯正式发布了混元 Hy3 preview 语言模型,并将其开源。这款模型采用快慢思考融合的MoE架构设计,总参数量达295B,激活参数为21B,支持的最大上下文长度达到256K,官方宣称其整体性能处于同尺寸模型中的领先水平。
按照研发进度来看,Hy3 preview 从今年年初启动训练至上线发布仅耗时约三个月。腾讯内部将其视为混元大模型迈向实际应用的关键一步。
这个备受瞩目的项目是由新加入的首席AI科学家姚顺雨主导完成的第一代产品。
腾讯对姚顺雨寄予厚望,希望通过他来提升公司在人工智能领域的竞争力,并弥补当前在大型语言模型研发上的不足。
姚顺雨表示,“Hy3 preview 是混元大模型重建的开端。我们希望借助开源社区和用户的反馈,进一步优化 Hy3 的性能并增强其实用性。同时,我们将继续扩大预训练规模,提高模型智能上限,并通过与腾讯产品的深度融合提升其在实际环境中的表现。”
01
对Hy3 preview 进行了详尽的测试。
根据官方资料,Hy3 preview 在设计之初就特别针对智能体场景进行了优化,这使其区别于之前的混元系列模型。
在训练前,姚顺雨完成了对混元预训练和强化学习基础设施的整体重建,并确立了三大核心原则,即能力体系化、评测真实性及性价比追求,以指导 Hy3 preview 的研发工作。
能力体系化的理念认为单一应用也需要多方面技能的协同;真实性的测试方法避免了单纯依赖公开排行榜来评估模型性能;而成本效益则是通过创新架构设计降低成本,提高模型的实际使用价值。
据了解,Hy3 preview 采用了具有 295B 总参数量和仅 21B 的激活参数的 MoE 架构,并集成了“快慢思考”机制。
小规模的激活参数为 Agent 调用提供了高效的运行平台;而融合的“快慢思考”设计则提升了模型处理复杂逻辑推理与多步工具调用的能力,符合姚顺雨提出的 ReAct 循环理念。
实测中,Hy3 preview 首先尝试完成了一个涉及数据抓取、数值计算和可视化生成等步骤的任务,并要求输出一段关于市场资产配置的分析报告。
视频
在执行过程中,模型遇到接口认证失败等问题,导致任务多次中断并使用模拟数据替代缺失的真实信息。
尽管最终完成了热力图的绘制,但由于部分使用的不是实际采集的数据,所以图像的真实性受到了质疑。
关键性文本生成环节表现不佳——尽管明确要求输出详细的分析报告,但 Hy3 preview 只给出了简单的配置比例,并未提供完整的文档内容。
接下来进行了一次更为复杂的长链路 Agent 测试,包括在 SkillHub 平台上的全链路抓取和认证流程解析。
视频
在这次测试中,Hy3 preview 展现了其作为代理执行程序的能力:它能够自主搜索信息、规划步骤并在不同工具间切换,顺利完成了整个任务的闭环过程。
这一结果与官方提供的产品性能数据一致,表明 Hy3 preview 能够在实际使用场景中有效驱动长链路工作流程,并且已经在多个办公应用领域实现了落地。
从这两轮测试来看,Hy3 preview 显示出了一种“过渡性”特征。
尽管模型能够处理复杂任务并具有一定的自主执行路径规划能力,但其在数据获取阶段的稳定性及最终交付物的质量方面仍有提升空间。
在实际应用中,“最后一公里”的问题仍需解决,包括减少数据抓取过程中的错误和提高生成文档的完整性。
目前 Hy3 preview 已经部署到腾讯云、元宝等平台,并且可以与 OpenClaw 和 OpenCode 等开源智能体产品集成。其价格政策为每百万 token 输入最低1.2元,缓存命中则为0.4元;输出费用起价为4元/百万 tokens。
02
姚顺雨作为“天才少年”,在腾讯的首份报告是 Hy3 preview。
该模型由姚顺雨自加入腾讯以来主导研发的第一代大语言模型。
自2025年底入职后,姚顺雨迅速成为了腾讯重要的首席AI科学家,并着手改进公司的AI基础设施和大型语言模型的研发策略。
姚顺雨于去年底加入腾讯,直接向公司总裁刘炽平汇报工作,负责统筹混元大模型的开发项目。
在入职后不久,他便重组了AI Infra团队,并建立了一套完整的研发流程以支持后续的工作进展。
此前马化腾承认公司在人工智能领域动作迟缓,而刘炽平宣布正在进行内部测试的混元 3.0 计划于四月对外发布。正是在同一时间,Hy3 preview 的训练工作启动,并在不到三个月内完成上线。
姚顺雨(出生于1998年)因其卓越的技术背景被腾讯看中,这正好满足了公司对于新一代语言模型的需求。
在学术界和业界,姚顺雨都是顶尖的语言智能体研究者之一。他提出的 ReAct 框架以及 Tree of Thoughts 方法为后续的模型研发奠定了基础。
他在一篇名为《The Second Half》的文章中提出,未来的AI竞争将更多地集中在对真实世界任务的理解和评估上,而不是单纯追求更大的模型规模。
Hy3 preview 的设计体现了这种理念——它采用了一种具有较小激活参数的MoE架构,并且在内部融合了快慢思考机制以支持复杂的逻辑推理与工具调用(如ReAct循环)。
从测试结果来看,Hy3 preview 更像是一个技术方向验证的产品。对于腾讯而言,在经历了全面的AI组织结构调整之后推出这样一个初步版本是有一定道理的。
当前国内大型语言模型的竞争已进入白热化阶段,仅凭 Hy3 preview 的发布还无法帮助腾讯在这一领域取得领先优势。
*头图
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
极客一问
你认为混元大模型未来的发展前景如何?
