
突破摩尔定律限制!英伟达软件让性能激增2.8倍无需更换GPU
新智元报道MoE模型的稀疏激活原本是一项显著的优势,但往往面临通信瓶颈的问题。NVIDIA通过软件创新,在三个月内成功将GB200单GPU吞吐量提升了2.8倍,充分发挥了Blackwell硬件的实力。2026年1月8日,NVIDIA再次以硬核数据刷新了AI推理的性能上限。英伟达官网透露:基于Blackwell架构的推理软件栈升级,使混合专家模型(MoE)在效率上实现了突破性进展——单GPU吞吐量显
科技2 阅读
共找到 3 篇相关文章

新智元报道MoE模型的稀疏激活原本是一项显著的优势,但往往面临通信瓶颈的问题。NVIDIA通过软件创新,在三个月内成功将GB200单GPU吞吐量提升了2.8倍,充分发挥了Blackwell硬件的实力。2026年1月8日,NVIDIA再次以硬核数据刷新了AI推理的性能上限。英伟达官网透露:基于Blackwell架构的推理软件栈升级,使混合专家模型(MoE)在效率上实现了突破性进展——单GPU吞吐量显

英伟达携其“最强开源龙虾模型”正式进入养殖业。 近日,英伟达发布了拥有120B参数的MoE模型Nemotron 3 Super,并宣布将其代码完全开放给公众使用。 在OpenClaw智能体控制能力测试PinchBench中,该模型表现优异,取得了85.6%的成绩,一举登上同类开源模型榜首的位置。 此外,在Artificial Intelligence Index的评估中,Nemotron 3 S

智东西作者程茜编辑云鹏2月25日,据彭博社报道,知情人士透露上海大模型企业阶跃星辰正在考虑在香港交易所进行首次公开募股(IPO),计划筹集约5亿美元(约合人民币34亿元)。据了解,阶跃星辰已与潜在顾问就股权出售事宜进行了沟通,最早可能在今年上市。其发行规模和上市时间等具体细节可能会有所调整。对于IPO的传闻,阶跃星辰尚未作出回应。2月2日,阶跃星辰最新发布的MoE模型Step 3.5 Flash在