
新智元报道
GPT-5.4的重大更新终于到来,OpenAI连夜对基础设施进行了全面重构,并整合了七大沙盒平台,彻底关闭了第三方框架的发展空间。
近日,OpenAI悄然推出了一项重大举措。
今天凌晨,Agents SDK迎来了一个全新的架构升级。
新版本原生支持harness、沙箱功能以及Codex级别的文件系统工具,并与七家顶尖沙盒供应商无缝对接。

在今年三月初GPT-5.4首次亮相时,开发者就对计算机使用能力的实现方式提出了质疑。
尽管模型可以操作电脑,但关于如何确保Agent在特定设备上稳定运行的问题仍然没有解决办法。
现在这个问题已经被OpenAI解决了。

一句话总结:OpenAI将Agents SDK从一个仅供聊天机器人使用的工具转变为工业级应用的基础平台。
新版中,harness负责控制流程、模型调用和工具管理;沙盒则专注于文件读写和依赖安装等操作,两者实现了彻底的解耦。
此举无疑对LangChain、CrewAI和其他第三方框架造成了巨大冲击。
OpenAI自己搭建了基础设施层,留给其他厂商的空间越来越小。
从聊天机器人的玩具到生产级底座
在讲解这次升级前,有必要回顾一下最初的Agents SDK是什么样的。
去年三月,OpenAI首次推出了轻量、低抽象的Agents SDK,只需几行Python代码就能运行。
但这个版本本质上是为聊天机器人设计的。
随着模型能力的大幅提升——能够连续工作数小时甚至数周——原有的SDK显然无法适应新的需求。
因此,这次的重大升级主要解决了两个问题。

第一,为模型提供了一个完整的运行框架:harness。
这个新框架集成了配置化记忆、感知沙箱调度、Codex级文件系统工具等多项功能,并通过MCP调用工具进行信息渐进式披露等操作。
对熟悉Claude Code和Codex的开发者来说,这套组合非常直观。
OpenAI这次直接将自家在过去一年中积累的最佳实践融入到了SDK里。
第二,分离了harness与compute的功能。

使harness在可信环境中运行,负责模型调用、审批和状态监控;而独立的沙盒则承担读写文件等具体任务。
这种架构设计使得敏感信息不会进入实际执行代码的环境,进一步提高了安全性。
结果是,沙箱内没有API密钥或任何敏感凭证,并且可以完全隔离运行。

这次更新不仅仅是安全性的改进,更是整个Agent架构范式的转变。
90%的保险单被精准提取


半数PR由AI生成
分离后的harness和compute带来了沙盒供应商生态系统的迅速扩展。
在此次更新中,Blaxel、Cloudflare等七家领先的沙箱厂商得到了官方支持的认可。
允许同时接入多家沙箱服务的关键在于OpenAI提供了一个名为Manifest的配置层。

这个清单描述了Agent的工作区设置,包括挂载本地文件和从云端拉取数据等功能。
Manifest与具体供应商解耦的设计使得用户可以轻松切换不同的沙盒环境。
官方还提供了一个最小示例,展示了如何仅用不到20行代码就能在一个本地沙箱中运行Agent并进行财务指标对比分析。
另外两项新功能则针对长时间任务提供了更强的支持:从检查点恢复以及多沙盒环境下的子Agent隔离。
这使得Agent具备了在断线后继续工作的能力,并且可以同时执行多个任务而不互相干扰。
# pip install "openai-agents>=0.14.0"import asyncioimport tempfilefrom pathlib import Pathfrom agents import Runnerfrom agents.run import RunConfigfrom agents.sandbox import Manifest, SandboxAgent, SandboxRunConfigfrom agents.sandbox.entries import LocalDirfrom agents.sandbox.sandboxes import UnixLocalSandboxClientasync def main() -> None: with tempfile.TemporaryDirectory() as tmp: dataroom = Path(tmp) / "dataroom" dataroom.mkdir() (dataroom / "metrics.md").write_text( """# Annual metrics| Year | Revenue | Operating income | Operating cash flow || --- | ---: | ---: | ---: || FY2025 | $124.3M | $18.6M | $24.1M || FY2024 | $98.7M | $12.4M | $17.9M |""", encoding="utf-8", ) agent = SandboxAgent( name="Dataroom Analyst", model="gpt-5.4", instructions="Answer using only files in data/. Cite source filenames.", default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}), ) result = await Runner.run( agent, "Compare FY2025 revenue, operating income, and operating cash flow with FY2024.", run_config=RunConfig( sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()), ), ) print(result.final_output)if __name__ == "__main__": asyncio.run(main())在一篇技术文章中,Modal的技术团队成员透露了一个细节:
Ramp公司使用Modal构建了一支大规模的后台编码AI团队,这些机器人生成了该公司一半以上的PR内容。
同样,在今年早些时候Stripe也披露了自己的内部Agent每周能产出超过1000个代码更改请求。
对于这两家公司来说,成熟稳定的Agent基础设施大大提升了业务效率和生产力。
而现在OpenAI将这些原本只有头部公司才能掌握的技术转化为SDK中的默认配置选项。
进一步推动了整个行业的进步。
FurtherAI的CTO Sashank Gondala分享了一个案例,他们利用Modal处理了一套900多页的保险理赔文档,并实现了100%的成功率。

对于资深保险从业者而言,这组数据的意义显而易见:这套文档曾被认为是最难处理的一类文件之一。
Box公司的Carter Rabasa也展示了其团队如何使用bash/python脚本在沙箱环境中完成了一整套发票对账流程,并取得了初步的成功。
这一结果表明,Agent现在可以有效地执行复杂任务,而无需复杂的代码支持。

OpenAI的市场布局

第三方平台面临挑战
本次发布对于整个行业的影响已经显现出来。
LangChain、LangGraph和CrewAI等第三方框架在过去的一年中主要靠弥补OpenAI原生SDK不足之处而生存。

现在,随着OpenAI接管了这些关键领域,留给第三方的空间变得越来越小。
他们要么转向更高层次的编排工作或特定场景的应用开发,要么专注于提供专用工具和沙盒服务。
OpenAI声称支持所有沙箱供应商的做法实际上是在将其纳入自己的生态系统之内。
这意味着今天还是合作伙伴的企业明天可能就会成为单纯的组件提供商。
Python优先,TypeScript等待
尽管目前还有一些不足之处。
新的harness和sandbox功能仅支持Python语言,而TypeScript版本则在后续计划中;SDK本身也还处于早期开发阶段。
但是未来的方向已经非常明确:GPT-5.4带来了计算机使用能力的支持,而Agents SDK为其提供了一个真正的运行环境。
下一步需要的是更多开发者将业务逻辑建立在这个新的基础上。
从今天起,构建Agent框架的创业公司必须重新考虑自己的定位;沙盒供应商则要考虑如何应对OpenAI带来的流量变化;使用业务层Agent应用团队也需要做出相应的迁移计划。
GPT-5.4发布时曾被认为是一次常规更新。
但回顾过去的一个多月,真正的革新才刚刚开始。
但方向已经非常清晰了。
GPT-5.4带着原生computer use登台,Agents SDK给它配齐了真正的运行环境。
下一步缺的,只是更多开发者把业务逻辑搭在这个基建之上。
从此,做Agent框架的创业公司会重新审视自己的定位。做沙盒的供应商开始算OpenAI流量能不能接得住。做业务层Agent应用的团队盘算要不要迁移。
GPT-5.4出厂那天被一些人说成是「没有惊喜的例行升级」。
40天后回头看,真正的惊喜今天才发。
参考资料:
https://techcrunch.com/2026/04/15/openai-updates-its-agents-sdk-to-help-enterprises-build-safer-more-capable-agents/
https://modal.com/blog/building-with-modal-and-the-openai-agent-sdk
https://openai.com/index/the-next-evolution-of-the-agents-sdk/
https://x.com/OpenAIDevs/status/2044466699785920937
https://x.com/snsf/status/2044514160034324793
