
新智元报道
GPT-5.4的重磅更新终于来了!一夜之间,OpenAI对基础设施进行了彻底改造,并整合了七大沙盒服务,宣告旧时代的聊天工具正式落幕。
OpenAI悄然出手,再次布局深远棋局。
今天凌晨,Agents SDK迎来了全面架构升级。
新版原生控制框架、文件系统工具以及一键接入七家主流沙盒提供商,一应俱全。

在三月初GPT-5.4首次亮相时,开发者们就对计算机使用功能提出了质疑。
尽管模型能够操作电脑,但如何确保Agent在不同设备上顺利运行仍是个难题。
今夜,OpenAI自己解决了这一问题。

简言之,这次升级将Agents SDK从“聊天机器人玩具”变成了“工业级Agent的基础”。
控制框架负责模型调用、工具路由和暂停恢复;沙盒则处理文件读写和代码执行,两者彻底分离。
更进一步的是,此举直接削弱了LangChain、CrewAI等第三方Agent框架的生存空间。
随着OpenAI亲自介入基础设施建设,留给第三方的空间日益缩小。
从玩具到生产级底座
在介绍此次升级之前,有必要先了解原始版本Agents SDK的情况。
自2025年3月推出以来,这款SDK以轻量和易于上手为特点吸引了不少开发者。
然而,它最初的设计初衷是面向聊天机器人应用场景的。
一年多来,模型的能力显著提升,可以连续运行数小时甚至几天、几周时间。
原来的SDK显然无法满足这些新需求了。

此次重写主要集中在两个方面。
首先,为模型提供一个完整的运行环境——控制框架。
这包括配置化记忆、感知沙盒编排、文件系统工具支持、通过MCP调用工具等特性,并全部整合进SDK原生功能中。
对于熟悉Claude Code和Codex的开发者来说,这套新体系非常眼熟。
此次更新实际上将OpenAI过去一年的经验教训及最佳实践封装到了SDK之中。

其次是分离控制框架与计算环境。
控制框架运行在可信赖的基础架构中,处理模型调用、审批和追踪;而计算环境则独立于沙盒负责读写文件等操作。
两者的接口标准化,确保敏感信息不会进入实际执行代码的环境中。

结果是,沙盒内部完全隔离,无须连接网络或保存任何对外流量。
这不仅仅是安全性的提升。它是整个Agent架构模式的根本转变。


完美提取保险文件
Agent如今已承担一半的PR任务
控制框架与计算环境分离后的首个成果便是沙盒供应商生态迅速扩展。
在此次发布中,Blaxel、Cloudflare等七家沙盒提供商同时被纳入官方支持列表。

无缝接入这七大厂商的关键在于OpenAI引入了一个抽象层——描述Agent工作区的配置清单(Manifest)。
这个清单详细说明了挂载本地文件、从云端拉取数据以及产物输出的位置,覆盖AWS S3等多种存储服务。
更重要的是,这份清单与具体的沙盒供应商解耦。
今天使用E2B开发的Agent,明天可以切换到Modal运行,无需重写代码,只需修改配置即可选择最合适的环境。
官方提供了一个最小示例展示如何让一个Agent在本地沙盒中执行财务数据对比任务,仅需不到20行代码。
此外,还有两项特别针对长时运行任务的新特性:检查点恢复和多沙盒并行+子Agent隔离环境。
Agent因此获得了“断线续命”和“分身作战”的原生能力。
Modal的技术团队成员Erik Dunteman透露,Ramp公司已使用Modal构建了一支后台编码Agent大军,超过一半的PR由这些Agent自动生成。
同样,Stripe也在今年早些时候披露了其内部AI Agent每周产出1000个PR的情况。
两家公司在获得成熟的Agent基础设施后,业务团队生产力实现了飞跃式提升。
如今,OpenAI把这些仅头部公司才能拥有的基础设施变成了SDK中开箱即用的默认配置。
进一步地,FurtherAI的技术主管Sashank Gondala分享了他们的Agent成功处理了一份900多页保险理赔记录,并且提取成功率达到了100%。
对于资深从业者而言,这样的成绩意味着巨大的挑战被克服。

Box开发者关系负责人Carter Rabasa通过实验证明,在沙盒环境下运行的Agent能够高效完成复杂的发票对账业务流程。
不仅如此,这些新功能还大幅减少了所需代码量。
Python先行,TypeScript即将跟进

虽然目前还有不尽完善之处,

控制框架和沙盒的新能力首发只支持Python版本;TypeScript版则在后续更新计划中。
但整个发展方向已经非常明确。
GPT-5.4带来了原生计算机使用功能,而Agents SDK为其提供了完整的运行环境。

接下来需要的是更多开发者将业务逻辑构建在这套基础设施之上。
这次升级不仅让做Agent框架的创业公司重新审视自身定位,
做沙盒服务提供商的企业也开始考虑如何对接OpenAI生态系统,而专注于应用层Agent开发团队则在评估迁移的可能性。
LangChain、LangGraph、CrewAI、AutoGen这些第三方Agent框架,过去一年靠什么活着?答案是靠补齐OpenAI原生SDK不够「生产可用」的那块空白。
编排、记忆管理、护栏、追踪、多Agent协作,这些都是第三方框架的主战场。
现在,OpenAI一次性把这些主战场全接管了。
他们要做的就是Agent世界的基础设施层,第三方框架从此要么往更高层走(编排、垂直场景),要么往更低层走(专用沙盒、专用工具),夹在中间的那块地板,已经被OpenAI自己踩实了。
而且,OpenAI口中的「兼容所有沙盒服务商」,本身就是在把沙盒供应商纳入OpenAI的生态位。
今天可能还是OpenAI的合作伙伴,明天的身份很可能就只是OpenAI生态下的「组件供应商」了。
Python先行,TypeScript还在排队
虽然这一切目前还不完美。
harness和sandbox的新能力首发只上了Python,TypeScript版本排在后续更新计划里;SDK至今仍然停留在0.Y.Z版本号。
但方向已经非常清晰了。
GPT-5.4带着原生computer use登台,Agents SDK给它配齐了真正的运行环境。
下一步缺的,只是更多开发者把业务逻辑搭在这个基建之上。
从此,做Agent框架的创业公司会重新审视自己的定位。做沙盒的供应商开始算OpenAI流量能不能接得住。做业务层Agent应用的团队盘算要不要迁移。
GPT-5.4出厂那天被一些人说成是「没有惊喜的例行升级」。
40天后回头看,真正的惊喜今天才发。
参考资料:
https://techcrunch.com/2026/04/15/openai-updates-its-agents-sdk-to-help-enterprises-build-safer-more-capable-agents/
https://modal.com/blog/building-with-modal-and-the-openai-agent-sdk
https://openai.com/index/the-next-evolution-of-the-agents-sdk/
https://x.com/OpenAIDevs/status/2044466699785920937
https://x.com/snsf/status/2044514160034324793
