
机器之心编辑部
近日,OpenAI 宣布了其最新的大模型 GPT-5.4-Cyber 的问世,这款新模型给人们带来了强烈的熟悉感。
新发布的这款产品,在目标群体、应用场景乃至推广策略上都与 Anthropic 几日前推出的 Claude Mythos 非常相似。双方的竞争态势已经毫无保留地展现在了公众面前,《纽约时报》的最新报道标题也明确指出了这一点:“与 Anthropic 类似,OpenAI……”。

这种同质化趋势不仅限于底层的基础模型层面,还体现在这两家公司近期推出的一系列产品的高度一致性上。它们仿佛成为了彼此的镜像。
在资本市场上,两家公司的市值竞争也日益激烈。目前,Anthropic 的股价甚至超过了 OpenAI,并在企业级市场中表现出色。资本市场的敏锐嗅觉表明,这两家独角兽公司正在向着相同的路径前进。

随着底层大模型的同质化加深,上层应用的发展趋势也随之趋同。
今天我们要探讨的是两个代表当今 AI 辅助编程领域最高水平的工具:OpenAI 的 Codex 和 Anthropic 的 Claude Code。从最初各自独立发展到现在逐渐走向一致,它们经历了怎样的演变过程?
双雄演进之路:从分道扬镳到殊途同归
回顾几年前,Codex 与 Claude Code 还是基于截然不同技术理念的产品。
Codex 拥有“速度即是王道”的核心思想。它像是一个紧跟在开发者身后、随时准备提供代码建议的资深程序员。

在 OpenAI 的构想中,Codex 是一款轻量级且互动性强的终端智能体,专注于快速迭代和交互式编程。借助 Cerebras WSE-3 硬件的支持,它可以实现每秒 1000 个 token 的吞吐速度,在实际工作中提供多种模式的选择,如建议、自动编辑及全自动等,让开发者能够保持在循环中持续创新。
相比之下,Claude Code 自诞生之初就带有“架构师”的特质。

Anthropic 给它赋予了处理复杂任务的能力。通过使用高达 100 万 token 的上下文窗口和独特的压缩技术实现无限对话,Claude Code 能够全面掌握代码库的整体脉络,并协调多文件进行一致性修改,在涉及大规模代码迁移的企业级重构任务中表现出色。
随着时间推移以及应用场景的不断扩展,这两个原本风格迥异的产品开始互相借鉴对方的优点。

图片来源:MorphLLM
在处理复杂项目时,单一 AI 模型面临的主要挑战就是上下文污染。为解决这一问题,两家公司都提出了类似的解决方案:将每个子任务分配给独立的上下文窗口。
OpenAI 推出了全新的 macOS 桌面应用,能够按照项目隔离任务,并在云端沙盒中独立运行。而 Anthropic 则推出了智能体团队架构,允许开发者创建多个子智能体并行工作,它们共享任务列表和依赖关系并在各自的独立窗口中运作。
在基准测试的成绩单上,两者也呈现出了一种微妙的平衡状态。Codex 在终端任务 Terminal-Bench 2.0 中得分较高,而 Claude Code 则在 SWE-bench Verified 榜单上的表现更为突出。
开源力量:OpenClaw 的影响
如果说内部战略决定了这两家公司走向同质化的内在原因,那么开源社区的推动则是一个不可忽视的外部因素。这里必须提到的是 OpenClaw 对整个 AI 编程工具领域的深远影响。
作为开源社区推出的工作流框架,OpenClaw 的出现打破了大公司辛苦建立的技术壁垒,并将大模型与本地终端工具链之间的交互过程标准化。
过去,如何优雅地调用本地 Git 提交、安全运行测试脚本以及进行多步推理验证等都是 Codex 和 Claude Code 各自引以为傲的专有技术。但 OpenClaw 的出现将这些流程抽象成了一套通用协议。
开源社区的标准化趋势迫使无论是 OpenAI 还是 Anthropic,都不得不兼容这种开放的标准。随着底层的技术壁垒被拉平,高级特性成为行业标配,Codex 和 Claude Code 便只能在用户体验层面进行无尽的竞争。
Codex 正在追赶 Claude Code
尽管两者的路径越来越趋同,但它们之间仍然存在细微差异。事实上,在某些方面,Codex 已经更受开发者青睐。
前不久,一位拥有 14 年经验且曾在科技巨头公司工作的高级工程师 u/Canamerican726 在 r/ClaudeCode 论坛上分享了他长达 100 小时使用 Claude Code 和仅 20 小时使用 Codex 的对比评测报告。
这种微小的体验差距可能就是决定开发者选择哪种工具的关键因素,而对于中国用户而言,还面临着其他一些特殊的挑战。

冷静分析:同质化背后的技术生态竞争
当然,Codex 和 Claude Code 的优劣取决于使用者的能力和技能水平,正如 u/Canamerican726 所说的那样:“如果你不懂软件工程,那么这两个工具都会产生糟糕的结果。”
这一说法戳破了长期以来人们对 AI 编程工具的一种幻想。人们曾以为只要有足够强大的 AI 助手,即使是没有编程基础的人也能开发出企业级应用。然而事实并非如此。

在工具能力高度同质化的今天,这两家公司的竞争力转移到了财务报表和定价策略上。在同样的任务下,Claude Code 的 token 使用量通常是 Codex 的 3 到 4 倍,使用成本更高。对于企业团队来说,使用 Claude Code 每位开发者每月需要支付的费用是100到200美元。

Anthropic 的目标是在科技巨头的工作流中深度嵌入其产品,而 OpenAI 则通过广泛的生态渗透让 Codex 成为许多普通开发者的首选工具。

这不再是一场单纯的技术竞赛,而是关于生态绑定、定价策略以及用户习惯重塑的长期消耗战。
回顾这一年的技术发展,GPT-5.4-Cyber 的发布只是这场漫长战役中的一个小注脚。随着 Codex 和 Claude Code 越来越相似,AI 编程工具正从早期充满不确定性和探索性的测试阶段步入成熟且常规的工业化生产阶段。
目前,Claude Code 每天自动生成 13.5 万次 GitHub 提交,占到全网公开提交量的 4%。可以预见,在不远的将来,大部分样板代码、基础测试用例以及标准代码重构任务将由这些日益相似的人工智能工具在后台完成。
在面对这两个能力无限接近且体验相互模仿的强大工具时,作为人类开发者的我们还能保留哪些核心价值?随着工具红利期结束的到来,真正决定胜负的不再是谁能更快地写出代码补全速度,而是谁更能定义问题、拥有更广阔的系统架构视野以及在充满 AI 的编程世界中找到那份属于人类独有的不可替代性。
图片来源:MorphLLM

https://www.morphllm.com/comparisons/codex-vs-claude-code
https://www.reddit.com/r/ClaudeCode/comments/1sk7e2k/claude_code_100_hours_vs_codex_20_hours/
https://x.com/arankomatsuzaki/status/2044270102003196007
开发者的十字路口
https://www.nytimes.com/2026/04/14/technology/openai-cybersecurity-gpt54-cyber.html
图片来源:MorphLLM & SemiAnalysis / GitHub Search API

[43] [44] [45] [46] [47] 由于上述网址链接无法直接嵌入文本中,因此请查阅原文以获取相关图片和数据来源。
面对两个在能力上无限趋近、在体验上相互模仿的超级工具,我们作为人类开发者的核心价值还剩下什么?或许,工具红利期即将彻底结束。当每个人手中都握着同样锋利的武器时,真正决定胜负的,将不再是谁拥有更好的代码补全速度,而是谁能更好地定义问题、谁拥有更宏大的系统架构视野,以及谁能在这个被 AI 填满的代码世界里,找到那份属于人类独有的不可替代性。
话说回来,你选哪个?
https://www.morphllm.com/comparisons/codex-vs-claude-code
https://www.reddit.com/r/ClaudeCode/comments/1sk7e2k/claude_code_100_hours_vs_codex_20_hours/
https://x.com/arankomatsuzaki/status/2044270102003196007
https://www.nytimes.com/2026/04/14/technology/openai-cybersecurity-gpt54-cyber.html
