
姚顺雨今日完成DeepSeek V4挑战
智东西编辑团队发布了一篇关于腾讯新一代混合专家架构的大规模语言模型Hy3 preview的文章。该文章详细介绍了姚顺雨领导的混元团队首次对外展示的新一代大模型。Hy3 preview是迄今最智能的模型,采用了快慢思考融合的设计理念,并具备支持最长256K上下文的能力。它拥有总计295B的参数量和激活参数数量为21B。从测评结果来看,Hy3 preview在复杂推理、指令遵循、代码生成与智能体能力等
共找到 8 篇相关文章

智东西编辑团队发布了一篇关于腾讯新一代混合专家架构的大规模语言模型Hy3 preview的文章。该文章详细介绍了姚顺雨领导的混元团队首次对外展示的新一代大模型。Hy3 preview是迄今最智能的模型,采用了快慢思考融合的设计理念,并具备支持最长256K上下文的能力。它拥有总计295B的参数量和激活参数数量为21B。从测评结果来看,Hy3 preview在复杂推理、指令遵循、代码生成与智能体能力等

混元大模型重建的第一步是Hy3 preview。作者|连冉姚顺雨在加入腾讯后,推出了首个重要的语言模型项目。4月23日,腾讯正式发布了混元 Hy3 preview 语言模型,并将其开源。这款模型采用快慢思考融合的MoE架构设计,总参数量达295B,激活参数为21B,支持的最大上下文长度达到256K,官方宣称其整体性能处于同尺寸模型中的领先水平。按照研发进度来看,Hy3 preview 从今年年初启

混元新模型能否助腾讯后来居上?作者|刘杨楠近期发布的混元系列最新版本——Hy3 Preview,标志着腾讯在AI领域的重大突破。在这次更新中,混元系列的性能和用户体验有了显著提升。尤其是代码生成与智能体应用方面,性价比极高。Hy3 Preview不仅具备高效的任务处理能力,还通过快慢思考融合技术实现了自动调节模型深度的功能,无需用户手动切换版本。这一设计灵感源自姚顺雨在OpenAI的工作经验,他主

最近,一款名为混元的大规模语言模型在腾讯内部正式亮相。这款AI工具体现了公司对前沿技术的持续投入与研发能力。这款新产品的发布恰逢腾讯业绩报告中关于人工智能和机器学习领域的积极进展的披露。根据财报数据,公司在第四季度显著增加了科研投资,以支持其人工智能业务的发展。腾讯管理层在上个月举行的电话会议期间强调了持续创新的重要性,并分享了有关AI技术应用及未来战略规划的具体信息。马化腾特别指出,公司拥有充足

今日,腾讯发布了新一代的大规模语言模型混元Hy3 preview,并将其源代码公开,这是该团队自重组以来推出的首个重要产品版本。Hy3 preview是目前混元系列中最先进的一个版本,采用了混合专家架构来实现快速和深入的思考过程。其参数总量达到2950亿个,激活参数为210亿,并能支持长达256K的内容上下文处理。从测试结果来看,Hy3 preview在复杂推理、指令执行以及代码生成等方面的性能得

腾讯近日发布并开源了新一代大语言模型混元Hy3 preview,填补了4月在AI领域的关键空白。作为混元3.0的早期版本,这款混合专家模型结合了快慢思考模式,拥有总计295B个参数和21B个激活参数,并能支持长达256K的上下文长度。据腾讯介绍,这是迄今为止最智能的混元模型,在复杂推理、指令遵循、代码处理及智能体功能等方面实现了显著提升。上月,腾讯在其2025年度业绩公告中首次提及“混元3.0”,

机器之心编辑部近日,腾讯 TEG 技术工程事业群内部进行了结构调整,其中 AI Lab 被撤销,原负责人蒋杰不再担任该职位,不过他的其他管理工作依然保持不变。在此次变动之后,原 AI Lab 的部分员工加入了由姚顺雨领导的混元团队。此外,产学研合作中心得以保留,多模态部的负责人则向 TEG 总裁卢山汇报。去年十二月,原 OpenAI 研究员姚顺雨,年仅二十七岁,加入腾讯并担任「CEO / 总裁办公

该论文的第一作者为北京大学硕士生安睿川,他是在张文涛教授和鄂维南院士的共同指导下完成的研究工作。研究重点在于统一生成理解模型以及以数据为中心的人工智能领域。安睿川已发表过4篇关于一作或共一作者身份的论文,并曾在微软亚洲研究院实习。该项目的通讯作者由北京大学的张文涛教授担任。在AGI-Next前沿峰会上,姚顺雨提出了一个极具争议的观点:大模型实现高价值应用的关键在于能否有效利用上下文信息。近期Ope