揭开Claude Code面纱：背后关键因素，九成源于技术而非人工智能

作者：世界网2026年5月2日科技1 阅读

新智元报道

当大多数人在研究如何优化AI提示词时，硅谷顶尖实验室已经将人工智能基础设施转变为生产线。

你还在尝试用ChatGPT来反复调整prompt吗？

最近，一位X用户发布了一条推文，指出头部公司正在秘密使用的Claude Code项目模板已意外曝光。

这已经超越了编写提示词的范畴。它涉及到了人工智能工程基础设施。

整套方法以一个名为「CLAUDE.md」的文件为中心，而其核心原则仅包括三条：

每次Claude出现错误→你需要增加一条规则；每次你自己重复工作→你就需要添加一个新的流程；每次遇到bug→你应加入额外的安全措施。

这样的做法旨在将项目经验转化为AI启动时会自动读取的长期上下文和自动化约束条件。

整个架构类似于一家人工智能公司的岗位编制：CLAUDE.md充当入职手册，skills/是操作标准流程，hooks/代表合规部门，docs/相当于公司章程，tools/负责后勤支持，src/则是业务运营的核心部分。

这不再仅仅是与AI进行对话，而是构建了一个能够理解你代码仓库的人工智能助手。

最引人注目的特点是，只需配置一次，Claude就能自动审查代码，并根据指令重构、强制执行架构规则、撰写发布说明以及运行工作流等任务。

而且它会越用越聪明。

大多数人的做法是打开ChatGPT，写提示词，复制粘贴，重复；而在这种方法中，你只需要启动终端并执行一个skill即可完成交付。

实际上，这相当于在你的代码库中养了一队AI同事。

这个推文背后传递的信息是这个时代的转变，大多数人可能还没有意识到这一点。

一张看似没有泄露的重要截图

撕开一个真相

@ai_rohitt分享的这张截图展示了Anthropic官方文档里推荐的标准范式。

CLAUDE.md是在每次对话开始时自动读取项目记忆文件。

.claude/skills/和.claude/hooks/是官方支持的扩展机制。

这些做法已经在社区讨论了几个月，并非什么内部模板。

不过，它之所以能让一些资深开发者主动转发，则是因为它得到了许多日常使用Claude开发者的认同。

其中许多人可能最近才意识到原来它可以这样被利用。

硅谷顶级团队已经将这一步骤优化成了生产线流程。

第一个例子是来自OpenAI Frontier小组的实验。

OpenAI官方透露，Frontier小组的一个从空仓库开始的内部测试项目，在大约五个月内由Codex生成了约100万行代码和近1500个PR；团队规模也扩展到了七人，并且没有一个人直接编写代码。

领导者Ryan Lopopolo在后续访谈中进一步解释，这套工作流程已经接近于“零人工编码、零人工审查”的极限形态。

他认为与其节省token，不如利用模型的极高并发能力和极低成本来代替人类有限且昂贵的同步注意力资源。

第二个案例是Stripe内部自动化代码代理系统Minions的表现。

Stripe公司内部的Minions每周生成并推动超过1300个PR合并，这些代码完全由AI编写，但仍然需要人工审查。

这里还有一组数据：1.6% vs 98.4%，来自Mohamed bin Zayed AI大学VILA-Lab发表的一篇论文。

研究者系统地分析了Claude Code v2.1.88版本51.2万行TypeScript源代码，得出的结论是：只有1.6%是AI决策逻辑，而剩余98.4%是确定性的工程基础设施。

具体来看，这包括权限网关、上下文管理、工具路由以及错误恢复机制等四类内容。

这些数字并不是说模型只贡献了1.6%的能力，而是说明Claude Code产品大量复杂度并不在模型本身上，而在于权限、上下文、工具路由和恢复机制这些确定性工程基础设施方面。

@ai_rohitt图中的CLAUDE.md/skills/hooks结构就是普通开发者也能搭建的“入门版基建”，与OpenAI和Stripe的生产级架构属于同一范式，只是规模较小。

CLAUDE.md揭示的秘密

过去几年间，人们都在询问GPT何时变得更聪明、Claude何时推出新版本。

然而，在实际环境中运行AI编程的团队更关心的是如何让AI记住过去的错误、怎样让AI在动手前了解项目的架构约束，以及如何确保AI犯错时有自动防护机制。

CLAUDE.md正是实现这一切的关键载体。

Anthropic官方对它的定义很简单：

它是一个放置于项目根目录的markdown文件，在每次会话开始时被Claude Code自动读取。

听起来似乎简单，但围绕它构建的各种结构才是其真正强大的地方。

CLAUDE.md扮演着项目大脑的角色。

架构决策、命名规范和测试要求等都存储在此。它是AI了解整个项目的起点。

类似于为一匹马准备的挽具，包括缰绳、马嚼子、鞍具及笼头，以决定它的方向。

在类比到人工智能编程领域：虽然模型本身能力强大，但它不知道在你的代码库中应该如何行动。Harness则为你提供了方向盘、刹车和导航系统。

OpenAI Frontier团队的“100万行无人工干预”的实验即是在极限下实现这一概念的具体实践。

他们的关键工程做法包括以下几点：

从Types到Config，再到Repo和服务端，以及运行时和UI，依赖关系单向流动，并由CI层的linter强制执行。如果代理编写违反层级关系的代码，则直接导致构建失败。

这里的错误信息不只是给人类看的，而是可以给AI理解并修复的指令。

所有架构图、执行计划和设计规范均存储在仓库内部的docs/目录中。Agent无需任何外部知识库，一切都在repo内。

以上这些措施效果如何？

尽管模型没有变化，但LangChain通过调整harness（包括系统提示、工具、中间件及推理模式）将Terminal Bench 2.0分数从52.8提升到了66.5。

给AI构建项目大脑

对于普通开发者来说：当范式已经转变，今天你能做些什么？

第一步，在你最重要的项目的根目录创建一个CLAUDE.md文件。

不需要完美也不需太长。列出团队的架构规则、命名约定、测试要求和反复踩到的坑等信息，10分钟内就能完成一个基本版。

当AI出错时，先不要手动修复错误，而是问自己：CLAUDE.md中缺少什么？

第二步，将日常重复的工作转化为skill。

注意Boris Cherny的重要建议：“如果你每天做某件事超过一次，那就将其转化为skill或命令。”

比如代码审查、生成提交消息、编写发布说明和修复一类的重复bug等任务应该通过技能自动化处理，而非每次手动输入提示词。

第三步，在容易出错的地方添加hook。

Hook是98.4%部分中最有影响力的部分。它不依赖于AI变得更聪明，而是依靠确定性代码进行强制检查。这实际上是将人类工程师的判断力转化为机器可以读取和执行的约束条件的过程。

这个环节的关键在于定义规则而非编写代码。

Karpathy今年一月在推特上广泛传播的话：“我已经从80%手动写代码转变成80%交给AI代理来完成。”

在未来五年内，工程师的能力将转向设计更严格的工作环境，而不是关注他们能写多少行代码。

编码任务正在被Agent接管。

但创造一个让Agent能够编写高质量代码的世界仍然是人的工作。这项工作比以往更加复杂、重要且充满挑战和趣味性。

https://x.com/ai_rohitt/status/2048390767115428016?s=20

层级架构强约束。

https://arxiv.org/pdf/2604.14228

linter错误信息本身是修复指令，这也是最反直觉的细节。

普通项目的lint错误是「violation detected」，给人看的；OpenAI Frontier的lint错误是「use logger.info({event: 'name', ...data}) instead of console.log」，给Agent看的、可以直接读懂并修复的指令。

文档作为单一事实来源。所有架构图、execution plans、设计规范都在仓库内部的docs/目录。Agent不需要任何外部知识库，一切就在repo里。

这套东西效果有多厉害？

模型没有换，但LangChain调整了harness，包括系统提示、工具、中间件和推理模式，最终把Terminal Bench 2.0分数从52.8提到66.5。

你今天就能做的事

是为AI造一个项目大脑

问题回到普通开发者这里：如果范式已经转移，作为一个普通工程师，今天就能做点什么。

第一件事，在你最重要的项目根目录建一个CLAUDE.md。

不需要完美，也不需要很长。写下你团队的架构规则、命名约定、测试要求、那些反复踩过的坑，10分钟能写完一个能用的版本。

下次AI犯错的时候，先不要手动修，而是问自己一句：CLAUDE.md里缺了什么？

第二件事，把每天重复做的事改造成skill。

这里要注意Boris Cherny的金句：「如果你每天做某件事超过一次，把它变成skill或command。」

Code review、生成commit message、写发布说明、修一类重复的bug，这些都该是skill，不该是每天手敲提示词。

第三件事，在容易踩坑的地方加一个hook。

Hook是98.4%里最有杠杆的那部分。它不依赖AI变聪明，它依赖确定性代码做强制检查。这是把人类工程师的判断力翻译成机器可读约束的过程。

这件事的核心不在写代码，而在写规则。

Karpathy今年1月在推特上的那句被广泛转发的话：「我已经从80%手动写代码变成了80%交给Agent写。」

未来五年，工程师的能力曲线正在从「我能写多少行代码」转向「我能为AI设计多严格的工作环境」。

写代码的活儿正在被Agent接管。

但设计那个让Agent能写出好代码的世界，还是人的工作。而且比以前更难、更重要、也更有意思。

参考资料：

https://x.com/ai_rohitt/status/2048390767115428016?s=20

https://arxiv.org/pdf/2604.14228

“”

免责声明：由于无法甄别是否为投稿用户创作以及文章的准确性,本站尊重并保护知识产权，根据《信息网络传播权保护条例》，如我们转载的作品侵犯了您的权利,请您通知我们，请将本侵权页面网址发送邮件到[email protected]，深感抱歉，我们会做删除处理。

揭开Claude Code面纱：背后关键因素，九成源于技术而非人工智能

作者：世界网2026年5月2日科技1 阅读

新智元报道

当大多数人在研究如何优化AI提示词时，硅谷顶尖实验室已经将人工智能基础设施转变为生产线。

你还在尝试用ChatGPT来反复调整prompt吗？

最近，一位X用户发布了一条推文，指出头部公司正在秘密使用的Claude Code项目模板已意外曝光。

这已经超越了编写提示词的范畴。它涉及到了人工智能工程基础设施。

整套方法以一个名为「CLAUDE.md」的文件为中心，而其核心原则仅包括三条：

每次Claude出现错误→你需要增加一条规则；每次你自己重复工作→你就需要添加一个新的流程；每次遇到bug→你应加入额外的安全措施。

这样的做法旨在将项目经验转化为AI启动时会自动读取的长期上下文和自动化约束条件。

这不再仅仅是与AI进行对话，而是构建了一个能够理解你代码仓库的人工智能助手。

最引人注目的特点是，只需配置一次，Claude就能自动审查代码，并根据指令重构、强制执行架构规则、撰写发布说明以及运行工作流等任务。

而且它会越用越聪明。

大多数人的做法是打开ChatGPT，写提示词，复制粘贴，重复；而在这种方法中，你只需要启动终端并执行一个skill即可完成交付。

实际上，这相当于在你的代码库中养了一队AI同事。

这个推文背后传递的信息是这个时代的转变，大多数人可能还没有意识到这一点。

一张看似没有泄露的重要截图

撕开一个真相

@ai_rohitt分享的这张截图展示了Anthropic官方文档里推荐的标准范式。

CLAUDE.md是在每次对话开始时自动读取项目记忆文件。

.claude/skills/和.claude/hooks/是官方支持的扩展机制。

这些做法已经在社区讨论了几个月，并非什么内部模板。

不过，它之所以能让一些资深开发者主动转发，则是因为它得到了许多日常使用Claude开发者的认同。

其中许多人可能最近才意识到原来它可以这样被利用。

硅谷顶级团队已经将这一步骤优化成了生产线流程。

第一个例子是来自OpenAI Frontier小组的实验。

领导者Ryan Lopopolo在后续访谈中进一步解释，这套工作流程已经接近于“零人工编码、零人工审查”的极限形态。

他认为与其节省token，不如利用模型的极高并发能力和极低成本来代替人类有限且昂贵的同步注意力资源。

第二个案例是Stripe内部自动化代码代理系统Minions的表现。

Stripe公司内部的Minions每周生成并推动超过1300个PR合并，这些代码完全由AI编写，但仍然需要人工审查。

这里还有一组数据：1.6% vs 98.4%，来自Mohamed bin Zayed AI大学VILA-Lab发表的一篇论文。

研究者系统地分析了Claude Code v2.1.88版本51.2万行TypeScript源代码，得出的结论是：只有1.6%是AI决策逻辑，而剩余98.4%是确定性的工程基础设施。

具体来看，这包括权限网关、上下文管理、工具路由以及错误恢复机制等四类内容。

@ai_rohitt图中的CLAUDE.md/skills/hooks结构就是普通开发者也能搭建的“入门版基建”，与OpenAI和Stripe的生产级架构属于同一范式，只是规模较小。

CLAUDE.md揭示的秘密

过去几年间，人们都在询问GPT何时变得更聪明、Claude何时推出新版本。

CLAUDE.md正是实现这一切的关键载体。

Anthropic官方对它的定义很简单：

它是一个放置于项目根目录的markdown文件，在每次会话开始时被Claude Code自动读取。

听起来似乎简单，但围绕它构建的各种结构才是其真正强大的地方。

CLAUDE.md扮演着项目大脑的角色。

架构决策、命名规范和测试要求等都存储在此。它是AI了解整个项目的起点。

类似于为一匹马准备的挽具，包括缰绳、马嚼子、鞍具及笼头，以决定它的方向。

在类比到人工智能编程领域：虽然模型本身能力强大，但它不知道在你的代码库中应该如何行动。Harness则为你提供了方向盘、刹车和导航系统。

OpenAI Frontier团队的“100万行无人工干预”的实验即是在极限下实现这一概念的具体实践。

他们的关键工程做法包括以下几点：

这里的错误信息不只是给人类看的，而是可以给AI理解并修复的指令。

所有架构图、执行计划和设计规范均存储在仓库内部的docs/目录中。Agent无需任何外部知识库，一切都在repo内。

以上这些措施效果如何？

尽管模型没有变化，但LangChain通过调整harness（包括系统提示、工具、中间件及推理模式）将Terminal Bench 2.0分数从52.8提升到了66.5。

给AI构建项目大脑

对于普通开发者来说：当范式已经转变，今天你能做些什么？

第一步，在你最重要的项目的根目录创建一个CLAUDE.md文件。

不需要完美也不需太长。列出团队的架构规则、命名约定、测试要求和反复踩到的坑等信息，10分钟内就能完成一个基本版。

当AI出错时，先不要手动修复错误，而是问自己：CLAUDE.md中缺少什么？

第二步，将日常重复的工作转化为skill。

注意Boris Cherny的重要建议：“如果你每天做某件事超过一次，那就将其转化为skill或命令。”

比如代码审查、生成提交消息、编写发布说明和修复一类的重复bug等任务应该通过技能自动化处理，而非每次手动输入提示词。

第三步，在容易出错的地方添加hook。

这个环节的关键在于定义规则而非编写代码。

Karpathy今年一月在推特上广泛传播的话：“我已经从80%手动写代码转变成80%交给AI代理来完成。”

在未来五年内，工程师的能力将转向设计更严格的工作环境，而不是关注他们能写多少行代码。

编码任务正在被Agent接管。

但创造一个让Agent能够编写高质量代码的世界仍然是人的工作。这项工作比以往更加复杂、重要且充满挑战和趣味性。

https://x.com/ai_rohitt/status/2048390767115428016?s=20

层级架构强约束。

https://arxiv.org/pdf/2604.14228

linter错误信息本身是修复指令，这也是最反直觉的细节。

文档作为单一事实来源。所有架构图、execution plans、设计规范都在仓库内部的docs/目录。Agent不需要任何外部知识库，一切就在repo里。

这套东西效果有多厉害？

模型没有换，但LangChain调整了harness，包括系统提示、工具、中间件和推理模式，最终把Terminal Bench 2.0分数从52.8提到66.5。

你今天就能做的事

是为AI造一个项目大脑

问题回到普通开发者这里：如果范式已经转移，作为一个普通工程师，今天就能做点什么。

第一件事，在你最重要的项目根目录建一个CLAUDE.md。

不需要完美，也不需要很长。写下你团队的架构规则、命名约定、测试要求、那些反复踩过的坑，10分钟能写完一个能用的版本。

下次AI犯错的时候，先不要手动修，而是问自己一句：CLAUDE.md里缺了什么？

第二件事，把每天重复做的事改造成skill。

这里要注意Boris Cherny的金句：「如果你每天做某件事超过一次，把它变成skill或command。」

Code review、生成commit message、写发布说明、修一类重复的bug，这些都该是skill，不该是每天手敲提示词。

第三件事，在容易踩坑的地方加一个hook。

Hook是98.4%里最有杠杆的那部分。它不依赖AI变聪明，它依赖确定性代码做强制检查。这是把人类工程师的判断力翻译成机器可读约束的过程。

这件事的核心不在写代码，而在写规则。

Karpathy今年1月在推特上的那句被广泛转发的话：「我已经从80%手动写代码变成了80%交给Agent写。」

未来五年，工程师的能力曲线正在从「我能写多少行代码」转向「我能为AI设计多严格的工作环境」。

写代码的活儿正在被Agent接管。

但设计那个让Agent能写出好代码的世界，还是人的工作。而且比以前更难、更重要、也更有意思。

参考资料：

https://x.com/ai_rohitt/status/2048390767115428016?s=20

https://arxiv.org/pdf/2604.14228

“”

揭开Claude Code面纱：背后关键因素，九成源于技术而非人工智能

揭开Claude Code面纱：背后关键因素，九成源于技术而非人工智能

相关文章

相关文章