
智谱推出GLM-5.1高速版:400 tokens/s 30秒生存成复杂网页代码
凤凰网科技讯 5月22日,智谱宣布面向部分企业客户推出GLM-5.1高速版API“GLM-5.1-highspeed”,模型输出速度达到400 tokens/s。智谱称,这一速度刷新了当前全球大模型厂商API的速度上限。该模型基于旗舰级GLM-5.1能力开发,打破了此前“高速模型几乎总是轻量级模型”的行业惯例,首次在国产大模型中实现旗舰级能力与极致低延迟的兼顾。高速版由智谱GLM团队与TileRT
共找到 19 篇相关文章

凤凰网科技讯 5月22日,智谱宣布面向部分企业客户推出GLM-5.1高速版API“GLM-5.1-highspeed”,模型输出速度达到400 tokens/s。智谱称,这一速度刷新了当前全球大模型厂商API的速度上限。该模型基于旗舰级GLM-5.1能力开发,打破了此前“高速模型几乎总是轻量级模型”的行业惯例,首次在国产大模型中实现旗舰级能力与极致低延迟的兼顾。高速版由智谱GLM团队与TileRT

鹭羽 发自 凹非寺量子位公众号QbitAI发布了一篇关于智谱技术发展的博客文章。智谱团队在近期的工作中,面对大规模的挑战感到十分困扰和压力重重。最新发表的技术博客与以往不同,这次没有硬核的技术细节分享,而是详细描述了自GLM-5以来遇到的各种问题及解决方案。在这篇名为「Scaling Pain」的文章里,团队披露了推理基础设施正面临前所未有的挑战,每日需处理数亿次Coding Agent的请求。最

智谱在发布GLM-5.1并提高Token价格后,其股价连续三天上涨,市值突破4000亿港元。然而,在当前形势下,讲好一个完美的Anthropic故事对智谱来说仍有许多工作要做。在科技新兴公司的竞争中,“不卷”已成为一种比“卷”更为昂贵的特权。4月8日,即财报发布一周后,智谱推出了新一代旗舰模型GLM-5.1,并将Token价格提高了10%。这次调价之后,其编码场景定价已经接近Anthropic的C


据快科技4月10日的消息,在3月底智谱公司发布了GLM-5.1大模型,该模型在编程能力方面的评分达到了45.3分,并声称仅比全球领先的Opus 4.6低2.6分。不久前,GLM-5.1大模型正式向公众开放源代码,受到了开发者的广泛欢迎。最近,权威的人工智能评估平台LMArena(由百万用户参与盲测)更新了Code Arena的专项排名表,显示GLM-5.1在开源模型中位居第一,在全球所有模型中的排

开源模型首超Opus4.6!智谱GLM-5.1登场,14小时后CUDA专家被冲了 十三 2026-04-08 14:29:23 量子位


近日,GLM-5V-Turbo正式上线,这是一款基于视觉的编程工具。 听雨 2026-04-02 14:28:33 量子位 它采用

梦瑶 发自 凹非寺量子位 | 公众号 QbitAI智谱GLM-5.1,突然上线!官方公告只有寥寥两句:GLM-5.1现已面向GLM Coding Plan全部用户(Lite/Pro/Max)开放。ModelKey:GLM-5.1别的没再多说,只是默默甩出Coding Evaluation评测结果——在编程能力上相比上一代GLM-5直接飙升近10分。甚至嘛,距全球最强编程模型Claude Opus

GLM-5.1上线,编程表现贴Opus 4.6开大,Coding plan瞬间断货 梦瑶 2026-03-28 14:06:38 量子位

IT之家 3 月 27 日消息,在今日的 2026 中关村论坛年会《OpenClaw 与 AI 开源圆桌会议》上,月之暗面创始人杨植麟担任主持,并与智谱华章 CEO 张鹏、小米 MiMo 大模型负责人罗福莉等人进行对话。杨植麟提及智谱最近发布的 GLM-5-Turbo 模型,并问张鹏为何进行提价。张鹏答道:“现在已经不是简单地问一个问题,模型给出一个回答了,它背后的思考和推理链路会变得很长,还会通

IT之家 3 月 27 日消息,智谱官方现已公布 GLM-5.1 模型,所有 Coding Plan 用户(Max、Pro 和 Lite)均可调用。IT之家附 Claude Code、OpenClaw 启用 GLM-5.1 方法如下:Claude Code:前置工作:默认情况下,Claude Code 的模型环境变量如下:ANTHROPIC_DEFAULT_OPUS_MODEL:GLM-4.7AN

凤凰网科技讯 3月16日,智谱发布首个专为龙虾场景深度优化的通用大模型GLM-5-Turbo,并在发布时同步上调了GLM-5-Turbo的API价格,幅度为20%。根据端到端龙虾评测基准ZClawBench评测结果,GLM-5-Turbo在OpenClaw场景中的表现相比GLM-5提升显著,在多项关键任务上整体领先于多家主流模型。据介绍,GLM-5-Turbo重点增强了对外部工具与各类Skills

中国人工智能企业智谱自上市以来股价持续上涨,因发布新一代旗舰大模型GLM-5时出现三个错误而公开道歉,并导致其股价急剧下跌。智谱于今年一月在香港交易所挂牌交易,在星期一(2月23日)的开盘价即下跌13.8%,收盘时跌幅扩大至22.76%。同属港股大模型领域的一家竞争对手MiniMax,当日也下跌了13.35%。据报道,智谱和另一家公司MiniMax在上周五(20日)的总市值曾一度超过六百亿港元(

作者 | Yoky邮箱 | [email protected]春节刚过,互联网圈最熟悉的“价格战”和“百亿补贴”战火,终于烧到了AI Coding领域。在这个曾经被海外巨头和明星独角兽统治的赛道里,阿里以一种最具互联网大厂特色的方式强势入局:用极其夸张的底价,请所有开发者“几乎0成本”尝鲜。2月25日,阿里云Coding Plan订阅服务全面上线Qwen3.5、GLM-5、MiniMax

近日,国内领先的AI云计算服务提供商阿里云推出了一系列重要更新。一哥就有一哥样。刚刚复工之际,阿里云一口气发布了Qwen3.5、GLM-5、MiniMax M2.5和Kimi K2.5四款顶尖开源模型。这些新上线的模型无疑具有重要意义:Qwen3.5作为阿里自主研发的新一代旗舰级大模型,在算力消耗极低的情况下,其性能已超越当前多个顶级闭源模型,并在Hugging Face榜单上占据榜首位置。Min

强大编码计划现已推出!阿里云发布Qwen3.5、GLM-5、MiniMax M2.5和Kimi K2.5四大开源模型 2月25日,阿里云百炼平台推出了包含Qwen3.5、GLM-5、MiniMax M2.5及Kimi K2.5这四款顶尖开源模型的API服务。这一

马年四大热门模型齐聚阿里云Coding Plan!海量Token供应,自由切换体验佳。 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 一哥就有一哥样。 国内AI云领头羊阿里云近期动作频频——一口气推出了Qwen3.5、GLM-5、MiniMax M2

2026.02.22智谱发布面向开发者的致歉信 资料图本文字数:1274,阅读时长大约2分钟2月21日晚,智谱发布面向开发者的致歉信,承认在GLM Coding Plan上线中存在三大问题:规则透明度不足、GLM-5灰度节奏过慢、老用户升级机制粗糙,并同步公布处理和补偿方案。GLM Coding Plan是智谱专门为AI编程场景推出的付费订阅套餐服务,开发