搜索: "轻量级模型"

共找到 2 篇相关文章

智谱推出GLM-5.1高速版:400 tokens/s 30秒生存成复杂网页代码

智谱推出GLM-5.1高速版:400 tokens/s 30秒生存成复杂网页代码

凤凰网科技讯 5月22日,智谱宣布面向部分企业客户推出GLM-5.1高速版API“GLM-5.1-highspeed”,模型输出速度达到400 tokens/s。智谱称,这一速度刷新了当前全球大模型厂商API的速度上限。该模型基于旗舰级GLM-5.1能力开发,打破了此前“高速模型几乎总是轻量级模型”的行业惯例,首次在国产大模型中实现旗舰级能力与极致低延迟的兼顾。高速版由智谱GLM团队与TileRT

科技2 阅读
北大系创业团队推出4B模型,推理速度提升15倍,成本锐减95%,挑战DeepSeek-V3.2

北大系创业团队推出4B模型,推理速度提升15倍,成本锐减95%,挑战DeepSeek-V3.2

头图由AI生成近日,一家由北京大学背景的团队创立的人工智能编程初创公司——硅心科技,发布了其最新研发的轻量级模型aiX-apply-4B。这款模型仅需4B的参数量和256K的上下文支持,能够在消费级显卡上进行部署。该模型专为企业级代码修改任务设计,能够自动识别修改意图,精确定位目标代码区域,并保持原有代码格式和上下文结构的完整,将修改后的代码无缝融入原始文件。在基准测试中,aiX-apply模型在

科技18 阅读