
新智元报道
最近,AI领域出现了两种新的现象:Claude的Managed Agents和Hermes智能体,它们在GitHub上大放异彩,分别获得了四万星的关注度,这标志着AI操作系统时代的到来。
小龙虾该升维了!
这两个新工具正在挑战过去流行的OpenClaw的地位,并推动其不断进步。
其中一个是Anthropic最近推出的Managed Agents,它采用OAuth一键接入、云端托管和沙箱隔离等先进功能。
Managed Agents的推出标志着AI从传统操作系统上的辅助角色转变为独立的操作系统核心。
另一个值得关注的是Hermes Agent,在短短时间里已经在GitHub上获得了大量关注。
这款智能体由Nous Research在2月底发布,更新速度超过了大多数商业产品。

Hermes拥有六大特色:实时性、持续学习能力、定时自动化、任务分派与并行处理、沙箱隔离以及网页和浏览器控制功能。
大家纷纷表示Hermes的体验远超OpenClaw,后者似乎已经难以满足用户的需求。

Nous Research的理念是打造一个能够长期陪伴用户的智能体,不仅仅是一次性的工具使用。
在过去几个月中,养龙虾成为了网络上的一股热潮。然而,在这背后隐藏着许多安全问题和架构缺陷。
据多家网络安全机构的报告显示,ClawHub平台上的插件中有36.8%存在严重漏洞或被恶意篡改的情况。

苦小龙虾久矣!
在臭名昭著的“ClawHavoc”事件中,成千上万的恶意插件伪装成办公助手,直接侵入用户的本地目录,窃取了大量敏感信息。
这些问题凸显出OpenClaw在安全性和稳定性方面的不足。用户不得不花费大量的时间和金钱来维护和更新这些插件。
而Anthropic公司趁机推出了Managed Agents产品,进一步削弱了OpenClaw的市场地位。

Managed Agents通过OAuth进行快速接入,并将Agent部署到云端托管环境,彻底打破了传统的AI架构模式。

这一新系统将模型逻辑和执行环境分离,使得大脑不再受限于特定的手部操作工具。用户无需担心Token消耗问题,也不必为插件的安全性担忧。

Anthropic推出的这份工程报告展示了Managed Agents如何通过三个标准组件的设计思路致敬Unix操作系统。
这些组件包括会话层、框架层和沙箱层,每部分都发挥着独立而关键的作用。这种解耦架构让大脑可以自由地运行在任何环境中,不受限制。
Managed Agents还解决了上下文窗口的局限性问题,通过将会话记录作为日志存储在外部来突破这一瓶颈。
此外,Managed Agents还能实现多脑与多手之间的集群效应,大大提高了执行效率和资源利用率。
最后,Hermes智能体的独特之处在于它能够不断学习并提升自身的能力。每一次任务完成后,它都会记录下经验,并将其转化为技能包以备将来使用。
这种机制使得Hermes可以长期积累知识,甚至成为下一代AI模型训练数据的来源之一。

与那些只能完成任务但无法学习的智能体相比,Hermes无疑展现了更强的生命力和适应性。随着技术的进步,小龙虾这类依赖插件支持的传统架构或许将逐渐被淘汰。
在这个全新的时代里,唯有拥抱变革,才能在未来的AI生态系统中占有一席之地。
小龙虾还香吗?
无论是Managed Agents还是Hermes智能体的出现都预示着一个新时代的到来。那些过去被寄予厚望的插件工具可能已经无法满足当前的需求了。
2026年4月,这个全新的产品,让风光无限的OpenClaw顿时黯淡无光,因为它对于龙虾的AI架构逻辑,是一次彻彻底底的降维打击。
在官博上,Anthropic甩出了一份极具计算机科学古典美感的工程报告。
这份报告宣告:AI架构从此进入操作系统化时代!

这份报告的核心就是——把大脑(模型逻辑)和双手(执行环境)彻底分开
OpenClaw的核心痛点,就是Harness和模型能力的深度耦合。Harness往往编码了某些技术假设,而随着模型的不断进步,这些假设会逐渐过时。
当Claude从Sonnet进化到Opus,原本精密的「上下文焦虑重置」逻辑瞬间就变成了冗余的代码垃圾,这就是所有AI开发者面临的最大风险!
但Managed Agents则是围绕一套稳定的接口构建的,即使Harness逻辑发生变化,这些接口依然能够保持稳定。
三个标准组件,致敬Unix
Managed Agents将Agent拆解为三个标准组件,这种设计思路直接致敬了70年代的Unix 操作系统。
Session(会话层):一个「仅追加」的日志。它记录了发生的一切,独立于模型存在。即便系统重启,记忆也不会丢失。
Harness(框架层):这就是Agent的「循环逻辑」。它负责调用Claude,并将指令分发给工具。
Sandbox(沙箱层):一个绝对隔离的计算环境。Claude在这里运行代码、修改文件。
这种解耦,就意味着大脑(模型)不需要知道手(沙箱)是在哪里运行的。

逻辑突变:从「工具嫁接」到「AI 原生系统」
接下来,就是这篇文章最核心的论点:Managed Agents改变了计算的拓扑结构。

不要养宠物
首先,它让我们不再养宠物。
早期方案倾向于将会话、Harness和沙箱封装在单一容器内,这就导致了昂贵的「宠物效应」:服务器变得不可替代且极其娇贵。
另外,这种「全家桶」模式还假设AI处理的所有数据必须与大脑同处一个环境,这导致企业在接入私有云时面临成本。
Managed Agents的出现,就可以将组件「牲畜化」。
解耦革命:让「大脑」回归大脑,「双手」回归工具
为了解决上述问题,Managed Agents 引入了解耦(Decoupling)逻辑。将「大脑」(Claude 及其框架)与「双手」(执行操作的沙箱)以及「记忆」(会话日志)彻底分开。
现在,Harness不再驻留在容器内,它像调用任何工具一样调用容器:execute(name, input) → string。
从此,容器变成了「牲畜」,甚至Harness本身也变成了「牲畜」。

会话即日志:突破上下文窗口的枷锁
长周期任务往往会撑爆AI的上下文窗口。Managed Agents 提出了一个天才的方案:会话不是窗口,而是日志。
通过外部存储、按需interrogation和框架转换,他们成功突破了上下文限制。

众智多谋:多脑与多手的集群效应
这种解耦带来的最终红利是规模化。现在,由于大脑与双手分离,只有在 AI 真正需要执行动作时才会调用execute()分配容器。
结果是惊人的:p50 TTFT 下降了约 60%,p95 下降了 90% 以上。
另外,Claude 现在可以同时对多个执行环境进行推理,决定将任务发送到哪一只「手」。

安全隔离,彻底解决私钥泄露
Managed Agents彻底解决了私钥泄露问题。在耦合设计中,代码运行在敏感信息旁边。
但在Managed Agents中,Token永远保存在沙箱外部的安全保险库中。AI只需要通过智能体发起调用,它自己甚至都看不见那些密钥。
这种结构性的隔离,让Prompt Injection攻击失去了物理目标。、
Hermes爆了
一边干活一边升级自己
如果说大多数AI智能体,还是「做完就忘」的打工人,那Hermes Agent更像一个会复盘、会记笔记、会越用越强的老员工。

最特别的地方,是它把一条真正的学习闭环,直接做进了系统里。
它会记住经验,会把经验写成技能,还会把日常干活留下的轨迹,反过来变成下一代模型的训练数据。
一句话:它不是在完成任务,它是在一边完成任务,一边升级自己。
拆开看,这个闭环一共三层。
第一层:记忆
这是Hermes最基础的一层,也是很多智能体最容易掉链子的地方。
官方给它做了两份长期记忆文件:MEMORY.md和USER.md。
它还支持基于FTS5的跨会话检索,再配合大模型做摘要。
说人话就是,以前聊过的事,它不一定原封不动记住;但它能把旧信息捞出来,再快速压缩成眼前能用的上下文。

这就意味着,Hermes不会像很多智能体那样,开了新会话就「失忆」。
普通智能体做完任务就结束了,Hermes做完任务,会顺手把自己再升级一遍。
第二层:技能
这层才是Hermes真正拉开差距的地方。
当它完成一次复杂任务时,它会回头看,把关键步骤拆出来,把踩的坑记下来,再把验证方法也写进去。
最后,它会把这一整套经验,整理成一个结构化的技能文件。
下次再遇到类似任务,它就不用从头再想一遍了,直接把这份「技能包」调出来干。
更狠的是,这个技能不是写死的,它还会继续改这份技能。

别的智能体在消耗上下文,Hermes在沉淀上下文。
你每天交给它的活,不只是被完成了,还可能变成下一代模型的训练素材。
第三层:训练数据
这一层就更猛了。
Hermes内置了批量轨迹生成能力,也接上了Atropos强化学习环境。
这些轨迹,未来还可以直接拿去训练下一代模型。
换句话说,Hermes 每天做的那些任务,不只是帮你把活干完,还可能顺手给未来的模型攒数据。

这件事的意义很大。因为很多智能体最大的问题,每次都得从零开始,能力很难稳定积累。
Hermes试图打通的,正是这条链路:从一次任务出发,经过记忆、技能沉淀、轨迹回收,最后再流回训练。
相比之下,只会接插件、换大脑的小龙虾显得像上个世纪的产物。
别再沉迷养虾狂欢了,为脆弱架构买单了。
在这个AI原生系统的黎明,唯有赶紧升维,才能在新的生态里活下来。
参考资料:
https://github.com/NousResearch/hermes-agent
https://x.com/OKX_Yuki/status/2042143606321115238
https://platform.claude.com/docs/zh-CN/managed-agents/overview
https://x.com/coreyganim/status/2042330859001245759
https://x.com/claudeai/status/2041927687460024721
