
智谱推出GLM-5.1高速版:400 tokens/s 30秒生存成复杂网页代码
凤凰网科技讯 5月22日,智谱宣布面向部分企业客户推出GLM-5.1高速版API“GLM-5.1-highspeed”,模型输出速度达到400 tokens/s。智谱称,这一速度刷新了当前全球大模型厂商API的速度上限。该模型基于旗舰级GLM-5.1能力开发,打破了此前“高速模型几乎总是轻量级模型”的行业惯例,首次在国产大模型中实现旗舰级能力与极致低延迟的兼顾。高速版由智谱GLM团队与TileRT
科技2 阅读
共找到 1 篇相关文章

凤凰网科技讯 5月22日,智谱宣布面向部分企业客户推出GLM-5.1高速版API“GLM-5.1-highspeed”,模型输出速度达到400 tokens/s。智谱称,这一速度刷新了当前全球大模型厂商API的速度上限。该模型基于旗舰级GLM-5.1能力开发,打破了此前“高速模型几乎总是轻量级模型”的行业惯例,首次在国产大模型中实现旗舰级能力与极致低延迟的兼顾。高速版由智谱GLM团队与TileRT