华为云现已推出智谱GLM-5.1,用户可以通过多种产品进行体验。
4月8日,新一代旗舰模型GLM-5.1正式发布,并迅速部署于华为云平台,成功与多款产品集成。此版本在各方面的能力均有显著提升,成为当前全球最强的开源模型之一,在编码测试中取得了卓越的成绩。此外,它还在长程任务处理方面实现了重大突破,能够连续自主工作长达8小时,交付完整的工程级成果。

智谱GLM-5.1于“Day0”上线华为云,多款产品支持体验。
在昇腾算力的支持下,智谱GLM-5.1实现了Layer级别的MOE绝对均衡,并通过框架能力优化让专家高效产出Token。结合昇腾Attention算子的特点,该模型还针对推理框架和硬件进行了定向优化,极大提升了计算资源的利用效率及HBM访存平衡性。华为云借助系统级优化技术,进一步加快了推理速度,整体吞吐量提高了30%。
目前,开发者可以通过华为云MaaS平台免部署、一键调用智谱GLM-5.1 API的Tokens服务,在线体验其功能。同时,企业也可以利用华为云魔坊(ModelArts)模型训推平台轻松完成推理服务的上线操作,支持公共池和专属池两种资源配置方式,满足不同算力需求下的连续性和稳定性要求。

智谱GLM-5.1在SWE-Bench Pro基准测试中取得全球领先的成绩
在编码能力方面,智谱GLM-5.1在最接近实际软件开发环境的SWE-bench Pro基准测试中刷新了记录。华为云码道(CodeArts)代码智能平台已集成该模型,显著提升了复杂工程任务处理能力和专业软件开发效率,并向所有用户提供免费服务。
华为云AgentArts智能体开发平台在智谱GLM-5.1的助力下,工具调用精度和任务执行效率均得到明显改善。这使得构建复杂的场景智能体与多智能体协同系统更为便捷,全面提升了AI智能体的研发及应用体验。
用户还可以通过华为云Flexus部署OpenClaw来访问智谱GLM-5.1,在多个连续的任务中保持一致性,并降低日常使用过程中的失败率。给它一个复杂的任务,它可以独立工作长达8小时,人机交互将进入一个新的阶段。
—本文系量子位授权转载—

量子位的朋友们