OpenAI发布GPT-5.4 mini和nano版本，性能媲美旗舰产品，成本却低了三分之二

作者：世界网2026年3月18日科技3 阅读

3月18日，OpenAI发布了两款新的AI模型：GPT-5.4 mini和GPT-5.4 nano。这两款产品旨在满足快速、大规模的AI工作负载需求，同时保持较低的成本。

这些小型模型适用于多种AI工作流程。

为了达到最佳性能，高效的模型往往需要在响应速度、工具调用能力和性能之间取得平衡。

OpenAI强调，这些模型特别适合那些对延迟敏感的应用场景。例如，它们可以用于需要快速响应的编程助手、执行辅助任务的子智能体、监控和解读屏幕内容的计算机操作系统，以及能够进行实时图像推理的多模态应用。

公司指出，在上述应用中，通常不是参数规模最大的模型表现最佳，而是那些响应迅速、工具调用稳定且在专业任务中表现良好的模型。

与前一代GPT-5 mini相比，GPT-5.4 mini在编程、推理、多模态理解和工具使用方面都有所提升，其运行速度是前者的两倍。

GPT-5.4 nano则是一款体积更小、速度更快的版本，主要针对分类、数据提取、排序和简单编程辅助任务。

性能表现

当评估较小、成本较低的模型时，性能和成本效益是主要考虑因素。OpenAI提供了新模型与旧模型的对比数据：

在SWE-bench Pro测试中，GPT-5.4 mini的得分是53.40%，而GPT-5 mini为45.69%。

在Terminal-Bench 2.0测试中，GPT-5.4 mini的得分是59.30%，而GPT-5 mini为38.20%。

在GPQA Diamond测试中，GPT-5.4 mini的得分是85.48%，接近于GPT-5.4的93.00%。

OSWorld-Verified测试结果表明，GPT-5.4 mini的得分为70.60%，高于GPT-5 mini的42%。

从测试结果来看，GPT-5.4 mini的通过率接近于GPT-5.4的水平，同时执行速度更快。在衡量模型解决问题能力的基准测试中，轻量级的GPT-5.4 mini与全功能版GPT-5.4表现相似。

GPT-5.4 nano的性能介于两者之间。例如，它在SWE-bench Pro上的得分为52.39%，在Terminal Bench 2.0上的得分为46.30%。这些数据表明它在某些方面优于GPT-5 mini，但在其他方面不及GPT-5.4 mini。

子智能体与多模态任务

在智能体生态系统中，AI架构可以模仿现实世界的协作模式。例如，结合使用能力较强的AI模型（如GPT-5.4 Thinking）和速度较快、成本较低的模型（如GPT-5.4 mini），类似于资深工程师和初级工程师的协同工作。

智能体系统能够结合不同规模的模型，大型模型负责任务规划，小型模型执行子任务。在这一场景中，GPT-5.4 mini可以作为子智能体，执行如搜索代码库、审查文件和处理文档等任务。

OpenAI提到，GPT-5.4 mini具备多模态任务处理能力，适用于涉及计算机操作的任务。该模型能解读密集型用户界面的截图，以帮助完成计算机操作任务。

可用性与定价

目前，GPT-5.4 mini可通过API、Codex和ChatGPT的多个版本使用。免费版和Go级用户可以通过附加菜单中的“Thinking”选项调用GPT-5.4 mini。对于其他用户，GPT-5.4 mini将在GPT-5.4 Thinking触发速率限制后作为备选模型。

OpenAI表示，对于程序员来说，GPT-5.4 mini 已经在Codex应用、命令行界面(CLI)、集成开发环境(IDE)扩展和网页端中得到应用。这款mini模型“仅消耗GPT-5.4配额的30%，使开发者可以在Codex中以大约三分之一的成本处理简单的编程任务。”此外，Codex还可以将任务分配给GPT-5.4 mini子智能体，以在低成本模型上运行推理强度较低的工作。

成本对比数据如下：

GPT-5.4 mini的定价为每百万输入Token 0.75美元，每百万输出Token 4.50美元，提供40万词的上下文窗口。

GPT-5.4 nano仅通过API提供，价格为每百万输入Token 0.20美元，每百万输出Token 1.25美元。

相比之下，GPT-5.4的定价为每百万输入Token 2.50美元，每百万输出Token 15.00美元。

客户测试反馈

科技公司Hebbia致力于开发帮助专业人士利用自然语言处理文档库的工具。其产品主要应用于金融、法律和科研等领域，这些领域需要同时分析多份文档。

Hebbia首席技术官Aabhas Sharma表示，GPT-5.4 mini在同类模型中提供了较为稳定的端到端性能。在他们的评估中，该模型在部分输出任务和引用召回率上的表现达到了预期水平，且成本有所降低。此外，其端到端通过率和来源归因能力在某些测试中优于较大的GPT-5.4模型。

Notion是一款常用的生产力工具，用户可以在其中构建零代码的信息管理微应用，用于追踪文章创作、内部项目等。

Notion AI工程负责人Abhisek Modi表示，GPT-5.4 mini在处理定义明确的任务时表现出较高的精确度。在页面编辑方面，它的复杂格式处理能力接近于GPT-5.2，而计算资源消耗较低。

Modi补充说，此前只有旗舰模型才能稳定处理智能体工具调用。现在，像GPT-5.4 mini和nano这样的小型模型也具备了相关能力。这将使用户在Notion上构建自定义智能体时有更多的选择。

（本文由AI翻译，网易编辑负责校对）

“”

免责声明：由于无法甄别是否为投稿用户创作以及文章的准确性,本站尊重并保护知识产权，根据《信息网络传播权保护条例》，如我们转载的作品侵犯了您的权利,请您通知我们，请将本侵权页面网址发送邮件到[email protected]，深感抱歉，我们会做删除处理。

OpenAI发布GPT-5.4 mini和nano版本，性能媲美旗舰产品，成本却低了三分之二

作者：世界网2026年3月18日科技3 阅读

3月18日，OpenAI发布了两款新的AI模型：GPT-5.4 mini和GPT-5.4 nano。这两款产品旨在满足快速、大规模的AI工作负载需求，同时保持较低的成本。

这些小型模型适用于多种AI工作流程。

为了达到最佳性能，高效的模型往往需要在响应速度、工具调用能力和性能之间取得平衡。

公司指出，在上述应用中，通常不是参数规模最大的模型表现最佳，而是那些响应迅速、工具调用稳定且在专业任务中表现良好的模型。

与前一代GPT-5 mini相比，GPT-5.4 mini在编程、推理、多模态理解和工具使用方面都有所提升，其运行速度是前者的两倍。

GPT-5.4 nano则是一款体积更小、速度更快的版本，主要针对分类、数据提取、排序和简单编程辅助任务。

性能表现

当评估较小、成本较低的模型时，性能和成本效益是主要考虑因素。OpenAI提供了新模型与旧模型的对比数据：

在SWE-bench Pro测试中，GPT-5.4 mini的得分是53.40%，而GPT-5 mini为45.69%。

在Terminal-Bench 2.0测试中，GPT-5.4 mini的得分是59.30%，而GPT-5 mini为38.20%。

在GPQA Diamond测试中，GPT-5.4 mini的得分是85.48%，接近于GPT-5.4的93.00%。

OSWorld-Verified测试结果表明，GPT-5.4 mini的得分为70.60%，高于GPT-5 mini的42%。

子智能体与多模态任务

OpenAI提到，GPT-5.4 mini具备多模态任务处理能力，适用于涉及计算机操作的任务。该模型能解读密集型用户界面的截图，以帮助完成计算机操作任务。

可用性与定价

成本对比数据如下：

GPT-5.4 mini的定价为每百万输入Token 0.75美元，每百万输出Token 4.50美元，提供40万词的上下文窗口。

GPT-5.4 nano仅通过API提供，价格为每百万输入Token 0.20美元，每百万输出Token 1.25美元。

相比之下，GPT-5.4的定价为每百万输入Token 2.50美元，每百万输出Token 15.00美元。

客户测试反馈

Notion是一款常用的生产力工具，用户可以在其中构建零代码的信息管理微应用，用于追踪文章创作、内部项目等。

（本文由AI翻译，网易编辑负责校对）

“”

OpenAI发布GPT-5.4 mini和nano版本，性能媲美旗舰产品，成本却低了三分之二

OpenAI发布GPT-5.4 mini和nano版本，性能媲美旗舰产品，成本却低了三分之二

相关文章

相关文章