搜索: "上下文长度"

共找到 5 篇相关文章

阿里云峰会的几个隐秘信号

还记得五月初，AI评测里出现了两款神秘国模A和B吗？这是开发者toyama nao发布的测试结果。这款极限分数超越了Gemini 3.1 Pro和Claude Opus 4.6的国模A，一时间众说纷纭。如今，随着2026年阿里云峰会主论坛的开幕，国模A的真实身份也得以浮出水面：阿里云正式发布了新一代旗舰模型Qwen3.7-Max。不过，这次峰会与以往最大的区别在于，主角不再是参数规模、上下文长度和

科技2026/5/222 阅读

中科院发布瞬悉2.0：破解长序列处理与低能耗部署难题

新智元报道最近，中国科学院的一支团队发布了名为「瞬悉2.0」的类脑大模型，该模型在优化架构和编码路径方面取得了显著进展，特别是在长序列处理效率与低功耗部署方面表现出色。当前的大规模模型上下文长度迅速增长，导致代码仓库理解、智能体以及多模态交互等场景对长序列处理能力提出了更高要求。传统Transformer在推理时的计算成本和显存占用会随着输入序列长度的增长而增加，这对实际部署构成了挑战。近期，中国

科技2026/5/32 阅读

混元系统历经三月革新，Hy3 Preview版本震撼登场姚顺雨团队主导

混元大模型重建的第一步是Hy3 preview。作者｜连冉姚顺雨在加入腾讯后，推出了首个重要的语言模型项目。4月23日，腾讯正式发布了混元 Hy3 preview 语言模型，并将其开源。这款模型采用快慢思考融合的MoE架构设计，总参数量达295B，激活参数为21B，支持的最大上下文长度达到256K，官方宣称其整体性能处于同尺寸模型中的领先水平。按照研发进度来看，Hy3 preview 从今年年初启

科技2026/4/245 阅读

腾讯推出并开放源代码：Hy3 Preview——迄今为止最先进的语言模型

4月23日，腾讯发布了混元 Hy3 preview 语言模型，并宣布将其开源。该模型结合了快慢思考的特点，拥有总计2950亿参数和激活参数210亿，能够处理长达256K的上下文长度。腾讯官方透露，在今年二月，腾讯对预训练及强化学习的基础架构进行了重建，并确立了三个追求实用性的准则：能力系统化、评估真实性以及性价比。Hy3 preview 是在此次基础建设改进之后生成的第一个模型，也是迄今为止混元系

科技2026/4/2330 阅读

姚顺雨初试锋芒，腾讯AI迎来全新基石

腾讯近日发布并开源了新一代大语言模型混元Hy3 preview，填补了4月在AI领域的关键空白。作为混元3.0的早期版本，这款混合专家模型结合了快慢思考模式，拥有总计295B个参数和21B个激活参数，并能支持长达256K的上下文长度。据腾讯介绍，这是迄今为止最智能的混元模型，在复杂推理、指令遵循、代码处理及智能体功能等方面实现了显著提升。上月，腾讯在其2025年度业绩公告中首次提及“混元3.0”，

科技2026/4/233 阅读