
OpenAI发布GPT-5.4 mini和nano版本,性能媲美旗舰产品,成本却低了三分之二
3月18日,OpenAI发布了两款新的AI模型:GPT-5.4 mini和GPT-5.4 nano。这两款产品旨在满足快速、大规模的AI工作负载需求,同时保持较低的成本。这些小型模型适用于多种AI工作流程。为了达到最佳性能,高效的模型往往需要在响应速度、工具调用能力和性能之间取得平衡。OpenAI强调,这些模型特别适合那些对延迟敏感的应用场景。例如,它们可以用于需要快速响应的编程助手、执行辅助任务
共找到 4 篇相关文章

3月18日,OpenAI发布了两款新的AI模型:GPT-5.4 mini和GPT-5.4 nano。这两款产品旨在满足快速、大规模的AI工作负载需求,同时保持较低的成本。这些小型模型适用于多种AI工作流程。为了达到最佳性能,高效的模型往往需要在响应速度、工具调用能力和性能之间取得平衡。OpenAI强调,这些模型特别适合那些对延迟敏感的应用场景。例如,它们可以用于需要快速响应的编程助手、执行辅助任务

吴嘉赟博士就读于卡内基梅隆大学(CMU)机器学习系,专注于大语言模型评估和后训练技术的研究。大语言模型在关键领域的应用受到幻觉问题的困扰。最近一项研究提出了一种新的行为校准强化学习方法,旨在解决这一难题。该论文详细探讨了如何通过调整奖励函数来改进LLM的表现。经过特定训练后,一个参数量仅为40亿的小型模型在幻觉抑制方面超越了GPT-5等顶级大模型。图1展示了模型回答数学问题时置信度标注的实例。每一

最近,阿里巴巴更新了其开源项目,发布了Qwen 3.5系列中的四款小型模型。这些新模型中最小的是0.8B和2B版本,它们体积小巧,推理速度非常快,非常适合在移动设备、物联网边缘计算环境中以及需要低延迟实时交互的应用场景中使用。另一款4B的模型则性能强劲,适合作为轻量级代理的核心大脑,能够在保证高性能的同时减少资源消耗。9B版本的这款模型,在智力需求较高但内存有限制的情况下表现优异,适用于服务器端部

3月4日凌晨,阿里千问的核心负责人林俊旸在个人社交平台上宣布了他即将卸任的消息,并深情地向团队致意。在此之前,即3月2日夜晚,阿里巴巴刚刚发布了四款Qwen3.5的小型模型版本(0.8B、2B、4B和9B),这些模型一经推出便在社交媒体上引发了广泛关注,尤其是得到了埃隆·马斯克的点赞。对此,林俊旸表达了对马斯克的认可与感谢。林俊旸曾是阿里巴巴最年轻的P10级技术专家之一同时,在最近的一次内部公告中