智东西编辑|三北
开年伊始,开源AI代理框架OpenClaw在全球范围内迅速走红。它就像一只不知疲倦的“龙虾”,具备记忆功能、操作能力和低门槛的特点,让许多用户第一次直观地感受到人工智能的实际应用价值。
然而,当企业从最初的小规模尝试转向大规模部署时,问题也随之而来。这些代理能力强却未经充分训练,在企业的基础设施上7×24小时自主运行,带来了失控的风险:记忆丢失、密钥泄露、脚本失控以及预算超标等问题层出不穷。
特斯拉创始人埃隆·马斯克曾将这种情况比喻为把装满子弹的枪交给了猴子使用。

▲马斯克X发文截图
面对代理技术带来的挑战,腾讯云提出了新的解决方案——打造专门为AI代理设计的“数字办公环境”Agent Runtime沙箱方案。这一方案旨在为每个代理提供安全和规则指导,确保企业能在不削弱其能力的前提下实现大规模的安全部署。
目前这项技术已经在多家领先企业中成功应用,例如在知名大模型公司MiniMax的强化学习训练等场景中得到了验证,并支持十万级并发、百万级吞吐量下的零事故运行。
此外,在大规模代理培训环境下,腾讯云的技术帮助MiniMax的Forge框架实现了“环境秒开、用完即删”的特点,提升了训练效率和稳定性,同时降低了成本,为AI技术的企业级落地提供了坚实的基础。
腾讯云已宣布将Agent Runtime底层沙箱技术Cube开源,为企业提供更加灵活的服务部署选项。
一、解决三大难题,确保企业能够安全可靠地管理AI员工
类似OpenClaw的AI代理正在被越来越多的企业员工自发采用。尽管如此,真正让几万甚至几十万个这样的“龙虾”在公司环境中稳定工作并非易事。企业在尝试规模化部署人工智能时面临三个关键挑战。
首先,现有基础设施能否承受大规模的代理运行?这些代理具有状态、能够自主操作,并且7×24小时在线,数以万计的实例共享同一个环境,如何管理和控制它们的状态和行为成为一个问题。此外,密钥和其他敏感信息散布在各个角落,谁来负责管理风险?
其次,在这种环境下,企业的收益是什么?技能、记忆和协作关系都被锁在个人代理实例中,一旦员工离职,这些宝贵的资源就会丢失。新的代理彼此不认识,无法协同工作。
最后,企业能否有效利用这些工具?哪些操作需要审批?流程如何调整?令牌的使用是否划算?这些问题如果不解决,人工智能技术就可能沦为“玩具”。
腾讯云Agent Runtime的企业级治理方案正是为了克服这些挑战而设计。它旨在帮助企业真正地接纳和管理大规模的人工智能代理。
1、让基础设施扛得住
其中一个关键问题是基础设施的兼容性。解决方案包括两方面:状态管理和行为控制。
在状态管理上,由于代理具有上下文依赖、缓存等特性,在运行过程中会产生高昂的成本。为了解决这一问题,Agent Runtime将计算资源和存储分离,并通过快照技术实现任意时间点的状态保存与恢复,从而确保经验可以轻松复制并继承给新的实例。
行为控制方面,每个代理都在独立的虚拟机沙箱中运行,相互隔离。凭证管理严格且安全,在使用后立即销毁;所有外部访问均通过统一网关处理,并可配置审批或拦截机制。整个过程中都有详细的审计记录,确保每一步操作都是可控和可追溯的。
2、数据资产留得下
知识和技术不会因为员工离职而流失,框架更换也不影响积累的经验。
为了实现这一点,腾讯云Agent Runtime将技能、记忆和协作关系作为独立资产进行存储:技能以制品形式入库并由版本控制系统管理;记忆可以跨实例共享,新代理可以直接继承旧代理的知识;通过网关服务发现机制确保不依赖于特定框架的私有协议。
即使老张离职了,他训练出的专业合同审核技能和行业经验仍然可用,新人入职后可直接使用这些资源。这样,知识和技术就成为了企业的资产而非个人或某个项目的专属品。
3、组织接得住用得好
技术可行性是一方面,组织层面的实际应用又是另一挑战。
通过Agent Runtime,企业可以实现对代理的全局管理:平台团队能够封装初始化脚本、镜像和配置作为模板进行统一版本控制;策略设定工具调用权限等行为边界;按实例、用户、组织层级分配Token额度,便于成本追踪与优化。
这只是开始。如何在不同行业场景下实现代理之间的协作、调整工作流程以及匹配预算需求是未来的探索方向。然而,有了Agent Runtime提供的基础架构支持,企业可以先确保“接得住”,之后再逐步实现“用得好”。
通过这三个关键特性,企业有信心让几万只“龙虾”安心上岗——不是削弱它们的能力,而是确保每一步操作都在受控、可追溯的环境中执行。
二、MiniMax验证了大规模吞吐量和并发能力
腾讯云Agent Runtime沙箱产品已在外部头部厂商中获得认可,特别是在知名大模型公司MiniMax的核心训练场景中的成功应用就是明证之一。
自成立以来,MiniMax自主开发了多个多模态大型语言模型,并推出了Forge智能体强化学习框架。在AGI发展的关键阶段,这种框架需要大量的交互式实验以优化性能,这对计算资源的安全性、灵活性和并发处理能力提出了极高的要求。
为此,MiniMax与腾讯云合作,在其Agent Infra中采用了腾讯云的沙箱技术,显著提升了Forge训练过程中的效率和稳定性。

▲ Forge:大规模原生智能体强化学习系统
在实际应用中,“Forge”框架面临极端挑战。为了实现大规模并行模拟环境下的智能体自主进化,需要底层计算资源具备高并发、绝对安全隔离的沙箱环境,这对基础设施提出了前所未有的要求。
▲ 智能体强化学习对基础设施的需求
腾讯云Agent Runtime沙箱产品之所以被MiniMax选中,是因为它在此类场景下表现出色:
1、快速启动:仅需80毫秒即可完成实例交付,99百分位延迟小于1秒,确保训练流程不中断。通过资源池化和镜像预热技术实现这一目标。

▲ 资源池化与快照恢复示意图
2、强大的吞吐量:每分钟可创建六十万个沙箱实例,成功率高达99.99%,满足AGI训练所需的高并发需求。依靠腾讯云百万核资源池的支持,系统能够每分钟扩容超过十万实例。

▲ 大规模沙箱实例生成能力展示
3、全面的环境模拟:支持代码级到浏览器再到操作系统级别的全场景沙箱设置,为模型训练提供接近真实的交互体验。无论是网页操作还是桌面办公,都能在安全隔离环境中进行测试。
4、便捷的工具链:对外开源SDK、API等开发接口,简化了开发者的工作流程,并且能够与各种主流框架无缝集成。
MiniMax首席架构师阿岛表示:“腾讯云提供的沙箱产品是为类似我们的场景量身定制。”
“最初我们在Kubernetes上运行代理时遇到了瓶颈。后来我们转向了腾讯云的解决方案,问题得到了解决。”阿岛补充道,“从M2.7版本开始,我们可以实现大部分智能体驱动过程自主化。任何环节卡住都会极大影响模型迭代速度,而沙箱环境正是最可能成为瓶颈的部分。因此,高性能、稳定性和低延迟对于我们的训练至关重要。”
MiniMax的案例证明了腾讯云Agent Runtime不仅是支持AI代理运行的基础平台,更是推动前沿人工智能技术发展的生产级基础设施。
▲ 多种类型的沙箱和交互方式覆盖主流智能体强化学习场景
不论是在日常工作中成千上万只OpenClaw的使用,还是在极限训练条件下实现百万吞吐量、十万并发量的目标,这些都验证了一个事实:AI代理时代需要一种不同于传统云计算的新一代运行环境。
结语:确保AI代理的安全性和可用性是关键
OpenClaw的成功体现了AI代理的生产力价值,同时也强调了安全控制的重要性。只有当每个“龙虾”都能在规定和保护下正常工作时,企业才能真正从尝试使用人工智能过渡到与之协同工作的阶段。
通过为MiniMax模型训练保驾护航,以及为OpenClaw设立规则,腾讯云正在构建一个安全可控的基础设施,迎接智能体时代的到来。当每一只AI“龙虾”都能在一个受保护的空间内安心工作时,企业大规模采用人工智能的新时代就真正到来了。
