搜索: 轻量级模型

搜索: "轻量级模型"

共找到 2 篇相关文章

智谱推出GLM-5.1高速版：400 tokens/s 30秒生存成复杂网页代码

凤凰网科技讯 5月22日，智谱宣布面向部分企业客户推出GLM-5.1高速版API“GLM-5.1-highspeed”，模型输出速度达到400 tokens/s。智谱称，这一速度刷新了当前全球大模型厂商API的速度上限。该模型基于旗舰级GLM-5.1能力开发，打破了此前“高速模型几乎总是轻量级模型”的行业惯例，首次在国产大模型中实现旗舰级能力与极致低延迟的兼顾。高速版由智谱GLM团队与TileRT

科技2026/5/222 阅读

北大系创业团队推出4B模型，推理速度提升15倍，成本锐减95%，挑战DeepSeek-V3.2

头图由AI生成近日，一家由北京大学背景的团队创立的人工智能编程初创公司——硅心科技，发布了其最新研发的轻量级模型aiX-apply-4B。这款模型仅需4B的参数量和256K的上下文支持，能够在消费级显卡上进行部署。该模型专为企业级代码修改任务设计，能够自动识别修改意图，精确定位目标代码区域，并保持原有代码格式和上下文结构的完整，将修改后的代码无缝融入原始文件。在基准测试中，aiX-apply模型在

科技2026/3/2618 阅读