
阿里云峰会的几个隐秘信号
还记得五月初,AI评测里出现了两款神秘国模A和B吗?这是开发者toyama nao发布的测试结果。这款极限分数超越了Gemini 3.1 Pro和Claude Opus 4.6的国模A,一时间众说纷纭。如今,随着2026年阿里云峰会主论坛的开幕,国模A的真实身份也得以浮出水面:阿里云正式发布了新一代旗舰模型Qwen3.7-Max。不过,这次峰会与以往最大的区别在于,主角不再是参数规模、上下文长度和
共找到 5 篇相关文章

还记得五月初,AI评测里出现了两款神秘国模A和B吗?这是开发者toyama nao发布的测试结果。这款极限分数超越了Gemini 3.1 Pro和Claude Opus 4.6的国模A,一时间众说纷纭。如今,随着2026年阿里云峰会主论坛的开幕,国模A的真实身份也得以浮出水面:阿里云正式发布了新一代旗舰模型Qwen3.7-Max。不过,这次峰会与以往最大的区别在于,主角不再是参数规模、上下文长度和

新智元报道最近,中国科学院的一支团队发布了名为「瞬悉2.0」的类脑大模型,该模型在优化架构和编码路径方面取得了显著进展,特别是在长序列处理效率与低功耗部署方面表现出色。当前的大规模模型上下文长度迅速增长,导致代码仓库理解、智能体以及多模态交互等场景对长序列处理能力提出了更高要求。传统Transformer在推理时的计算成本和显存占用会随着输入序列长度的增长而增加,这对实际部署构成了挑战。近期,中国

混元大模型重建的第一步是Hy3 preview。作者|连冉姚顺雨在加入腾讯后,推出了首个重要的语言模型项目。4月23日,腾讯正式发布了混元 Hy3 preview 语言模型,并将其开源。这款模型采用快慢思考融合的MoE架构设计,总参数量达295B,激活参数为21B,支持的最大上下文长度达到256K,官方宣称其整体性能处于同尺寸模型中的领先水平。按照研发进度来看,Hy3 preview 从今年年初启

4月23日,腾讯发布了混元 Hy3 preview 语言模型,并宣布将其开源。该模型结合了快慢思考的特点,拥有总计2950亿参数和激活参数210亿,能够处理长达256K的上下文长度。腾讯官方透露,在今年二月,腾讯对预训练及强化学习的基础架构进行了重建,并确立了三个追求实用性的准则:能力系统化、评估真实性以及性价比。Hy3 preview 是在此次基础建设改进之后生成的第一个模型,也是迄今为止混元系

腾讯近日发布并开源了新一代大语言模型混元Hy3 preview,填补了4月在AI领域的关键空白。作为混元3.0的早期版本,这款混合专家模型结合了快慢思考模式,拥有总计295B个参数和21B个激活参数,并能支持长达256K的上下文长度。据腾讯介绍,这是迄今为止最智能的混元模型,在复杂推理、指令遵循、代码处理及智能体功能等方面实现了显著提升。上月,腾讯在其2025年度业绩公告中首次提及“混元3.0”,