
我对运行 OpenClaw 持相当质疑的态度。整个生态系统感觉像是一片未开垦的荒野,安全性堪忧——这是 Andrej Karpathy 的观点。
这只名为龙虾的技术项目已经走出开发者和科技爱好者的圈子,引起广泛关注。
自 Clawdbot 发布以来,在 GitHub 上获得了 35.2 万颗星的关注,超越了 Linux 和 ReAct,增长速度令人震惊。

目前,包括国内外互联网巨头、手机制造商以及谷歌、英伟达等在内的多家科技企业都发布了与 OpenClaw 相关的产品或解决方案。
各种类似龙虾的智能体项目不仅提供了交互功能,还具备了跨平台的能力,可以无缝地在不同设备上运行。
这些技术的发展标志着人工智能从简单的对话迈向更加复杂的动态互动阶段。智能体强化学习成为通向通用人工智能的重要路径之一。
实际环境中的实践对于培养具有自主灵魂的智能体至关重要,与传统的大规模文本训练有所不同。
强化学习中,智能体需要频繁地与其所在环境中进行交互,这不仅影响了训练的效果也决定了其性能上限。因此,构建高效的沙箱系统显得尤为重要。
在今年英伟达 GTC 大会上,腾讯云的 Agent Runtime 作为最前沿的技术突破之一亮相,吸引了全球开发者的关注。

腾讯云团队在大会上展示了如何通过优化智能体强化学习过程中的训练、推理和环境交互来应对前所未有的挑战,并提出了相应的解决方案。

沙箱技术已经从单一的安全组件演进为支撑智能化发展的关键基础设施,其设计旨在提供一个更安全、高效且易于扩展的平台供全球开发者使用。
MiniMax 是一款拥有十亿参数量的大模型,在多语言任务评估中取得了行业领先地位。它基于腾讯云 Agent Runtime 的强大性能进一步优化了自身的训练流程。
通过腾讯云提供的服务,MiniMax 实现了大规模并发启动沙箱的能力,并且能够在毫秒级别内迅速完成创建与销毁操作,显著提升了模型的迭代效率和稳定性。

腾讯云 Agent Runtime 沙箱在单镜像场景下可以支持每分钟高达 60 万个沙箱实例的同时创建,峰值 QPS 达到 1 万以上,并保持 P99 延迟控制在 1 秒以内。
MiniMax 团队的架构师阿岛表示,在强化学习过程中智能体能够自主驱动大部分训练流程,“然而最关键的环节在于沙箱技术的支持,任何瓶颈都会影响迭代速度”。
腾讯云与 MiniMax 的合作显著提升了模型在大规模并发、快速启动等方面的能力,从而保证了其在全球竞争中的优势地位。
随着越来越多的智能体项目从无序走向有序发展,腾讯云 Agent Runtime 开始成为推动这一转变的关键力量。它不仅为智能体提供了安全可靠的运行环境,还支持高效的学习与进化过程。
OpenClaw 的爆发象征着 AI 技术在开发领域的迅猛崛起,而腾讯云 Agent Runtime 则标志着这场革命开始迈向更加成熟和规范的阶段。
从讨论模型参数量到关注智能体的实际应用能力,“自主执行时代”要求我们重新审视人工智能技术的核心价值。Karpathy 的担忧提醒我们要重视安全边界与性能保障的问题。
腾讯云 Agent Runtime 正在为这些“数字员工”提供一个既能自由探索又严格管控的工作环境,确保它们能够高效地服务于产业需求。
基础设施的进步往往滞后于应用层的爆发式增长,但其重要性在于决定着技术能否实现大规模部署。当冷启动时间缩短至毫秒级、安全隔离达到容器级别时,智能体才具备了进入生产线的能力。
腾讯云 Agent Runtime 正在成为引领智能体时代发展的关键平台之一,在通往高级通用人工智能的道路上扮演着不可或缺的角色。
从技术圈内跳出的龙虾项目,如今正通过腾讯云的强大支持找到了一个稳定而高效的栖息地,并且在这个平台上迅速成长和发展。
这正是各大云服务和 AI Infra 厂商正在考虑的问题,让 AI 拥有一个可控、可管理、高效执行的空间,是智能体「自主执行时代」的兵家必争之地。
我们发现,腾讯不仅在养龙虾这件事上上心,更要在 AI Infra 领域深度拥抱智能体时代。

腾讯云云原生产品副总经理、腾讯云专家工程师 Gary认为「AI agent 的这一次的变化,改变企业的形态、改变社会的形态、改变组织的形态、改变软件的形态、改变用云的角色的形态。」
为此,腾讯云 Agent Runtime 深度洞察企业核心诉求,为企业级 AI 智能体应用打造了全方位的专业支持,助力企业高效构建智能化能力。
腾讯云 Agent Runtime 的解决方案包含浏览器、code 执行、手机、电脑等丰富的沙箱类型,提供全链路安全、Agent 原生资源架构、极致弹性与生态兼容的能力,实现极速启动和十万级实例并发开箱即用的领先特性,让 Agent 在企业应用中具备安全、可靠的执行环境。

作为 AI Agent 走向产业化的核心驱动力,腾讯云 Agent Runtime 已成为支撑腾讯内部及多家国内头部大模型企业的关键基础设施。
目前,该平台已稳健托管数十万个 Agent 实例,能够完美补齐企业级场景所需的可用性、安全性与可治理性,打通了从开源框架到生产力工具的「最后一公里」。
开发者们选择腾讯云 Agent Runtime 很重要的原因,是其开箱即用的省心特性。腾讯云 Agent Runtime 解决了以 OpenClaw 为代表的这类自主智能体,在企业级部署中最令人头疼的两大问题:
Agent 状态管理
我们知道,Agent 和普通服务不一样,会在运行过程中不断留下状态,并且大部分时候处于等待任务的状态。
如果让它常驻运行,高昂的成本让企业难以承受;如果随用随启,Agent 在运行过程中积累的上下文、工具链产物和环境配置就会随着容器的销毁而化为乌有。
Agent Runtime 的核心突破在于实现了状态与算力的解耦。没请求时暂停实例、释放算力;有请求时自动恢复,整个文件系统原样保留。这样一来,Agent 空闲时可以停,干活时又能从上次的状态接着干。
在这个基础上,Agent Checkpoint也就成了自然能力。一个已经调教好的 Agent,可以在任意时刻做快照,后续用来恢复、回滚,或者直接克隆出更多实例,让已经积累下来的经验和能力可以复制、继承。
Agent 行为治理
Agent 拥有编写代码和调用接口的能力,这赋予了它极高的生产力,但也带来了巨大的行为管理难题。企业要让它们运行在可控、可审计的边界里。
Agent Runtime 会对所有 Agent 都进行严格的隔离。每个 Agent 实例都运行在独立的 VM 级安全沙箱里。这样即使某个实例被攻破或者出了异常问题,影响也只会停留在它自己身上,不会影响其他实例或平台。
对外访问及本地敏感操作统一治理。Agent 发起外部请求时,凭证不保存在实例里,而是由 Gateway 按需注入、用完即销毁,做到实例本地零凭证;权限由网关统一控制、统一审计;删除资源、修改权限、发起外部请求这类高危操作,还可以配置审批或拦截规则。
这套方案的本质,是 AI Infra 的能力基础,承托起 Agent 业务的灵活高效。这一架构没有试图通过限制「龙虾」的感知和行动来换取安全,反而为企业补齐了安全、治理与运营的基础设施。
不惧变动的数据资产
Agent 在运行中沉淀三类资产:技能(Skill)、记忆(Memory)、协作关系
三类资产从第一天起就独立于框架存储和管理。Skill 以制品形式入库,版本管理、权限管控,任意实例可引用;Memory 从本地同步上云,跨实例共享,新 Agent 继承老 Agent 的经验;Agent 之间通过 Gateway 做服务发现和路由,协作在平台层编排,不依赖框架私有协议。
Agent 框架可能会更新、会被替代,但 Agent 们积累的数据不会过时。知识与技能永远留在企业内部,不跟着个人走,也不跟着框架走,最终转化为企业的生产资料。
迎接智能生产力
AI 进入企业,发生变化的不会只有技术。流程、分工、权限、成本,都会跟着进行进化。
Agent Runtime 的核心使命,是为企业提供一套全局视角的「AI 员工」管理模式,让组织能够接得住、管得好这股新型生产力。
Agent Runtime 服务于企业对全局 Agent 的技能、行为、权限和成本的管控:平台团队先把 skill、初始化脚本、镜像和配置封装成模板,统一化管理任意开源或自建 Agent 在内部的创建和版本变更;再通过策略管控所有 Agent 的工具调用、数据访问、LLM 调用等行为执行边界;还可以通过 token 额度管理实例、用户和组织三层的成本消耗。
在腾讯云 Agent Runtime 的加持下,龙虾不再难以驯服,能够成为在企业复杂网络环境中纵横驰骋、安全合规的高产工具,成为了企业 AI 转型的第一步
业界最强性能亮相,Minimax 用上也「真香」
随着 AI 演进从简单的「会话」跨越到「动态交互」,Agentic RL(智能体强化学习) 已成为通往 AGI 的必经之路。
如果说大模型的「大脑」是通过海量文本喂养出来的,那么真正具备自主灵魂的智能体,则是通过在真实环境中的「摸爬滚打」练就的。
Agent RL 最大区别就是需要和环境交互,交互好坏影响训练效率和效果。这种交互一般是在沙箱中执行的,因此沙箱是强化学习的「命门」,是决定 Agent 进化速度与天花板的核心基础设施

腾讯云 Agent Runtime 作为最前沿的智能体基础设施技术突破,在今年的英伟达 GTC 大会上亮相。

在 GTC 大会上,腾讯云团队提出,Agent RL 将带给沙箱的挑战推向了极致:需要训练、推理、环境交互与系统复杂性的四重叠加

腾讯云 Agent Runtime 智能体沙箱在 GTC 的亮相,吸引了全球开发者的目光。沙箱已从单纯的安全组件,进化为 Agent 时代的「基础设施一等公民」 。通过 Agent-Native 的设计理念,它正为全球开发者提供一个更安全、更高效、更具扩展性的 Agent 进化摇篮。
毫秒级启动,十万级并发,MiniMax 高性能稳定落地
还记得过年前后,那个温暖打工人钱包的 1 美元时薪大模型 MiniMax M2.5 吗?
一个 10 B 参数量的全能选手,在多语言任务 Multi-SWE-Bench 上拿下了行业第一;在 SWE-Bench Verified 评测集上,基于 Droid 和 OpenCode 的实战测试中,它的通过率(79.7% / 76.1%)双双超越 Opus 4.6。
而鲜为人知的是,MiniMax 与腾讯云在 Agent RL 场景下进行了合作,在腾讯云 Agent Runtime 的强大性能的基础上,突破了现实世界的智能体 RL 的「不可能三角」:平衡系统吞吐量、训练稳定性和智能体灵活性。

MiniMax Forge 架构图
交互环境的并发、弹性和质量直接决定了模型训练的效率和效果。
- 极致性能响应: 实现 80ms 极速启动与 P99 延迟小于 1 秒 ,确保 Agent 在复杂任务中获得近乎实时的交互反馈。
- 海量并发能力: 支持每分钟十万级沙箱实例的并发创建与瞬时销毁,实现 99.99% 的稳健成功率。
- 分发加速架构: 凭借「镜像去重 + 多级缓存 + 加速中心」的三位一体技术,实现数十万镜像的分发加速。
- 全场景环境模拟: 深度覆盖代码、浏览器、手机及桌面端全平台环境,原生适配 SWE-bench 与 OSWorld 等主流 Agent 评测标准。
- 原生开发生态: 提供兼容 E2B 协议的开源 SDK、API 及完整工具链,深度集成主流训练框架以实现无缝迁移。
依托腾讯云提供的 Agent Runtime 沙箱服务,MiniMax 实现了强化学习场景中大规模交互环境的毫秒级拉起、十万级并发、瞬时销毁,大幅提升了并发 Rollout 的训练吞吐量和稳定性,更为模型在系统终端的自主试错构建了安全边界。
在性能方面,腾讯云 Agent Runtime 在单个镜像(如 Code Interpreter)场景下,大规模并发启动沙箱,最大可以支持每分钟 60 万沙箱创建,QPS 可以达到 1 万以上,整体P99 延迟控制在 1 秒左右。因为整体架构没有单点依赖,整体系统仍然可以横向扩展。


在 SWE RL 场景下 Agent Runtime 沙箱的压测效果可以达到16 万 QPM 的吞吐,P99 延迟控制在 1 秒以内,成功率达 99.99%。这仍然不是 Agent Runtime 沙箱的并发上限,系统支持便捷横向扩容。

MiniMax 与腾讯云的深度技术共建,有效突破了传统架构在大规模并发、极速启动上的能力瓶颈。
MiniMax 的 Agent 首席架构师阿岛说,目前 Agent 已经能够自主地驱动很大部分的 agentic RL 过程,但「这里面最有可能卡住的就是沙箱的环节,(如果任意环节卡住)就会极大的影响我的模型的迭代,如果迭代速度慢了,那可能和别的模型相比,我的竞争力就会受到影响。」
在如此白热化的激烈竞争态势下,Minimax 与腾讯云 Agent Runtime 的协作,从轻量级调度、极致存储优化,到全场景的真实环境模拟,这套 Agent Infra 方案,为强化学习框架提供了一个极致弹性、可持续扩展的生产级试验场,对 Minimax 保持强势的竞争力至关重要。
结语:在狂野西部,建立文明的边界
我们获悉,腾讯云 Agent Runtime 底层平台 Cube 将全面开源,企业可直接用于智能体训练和部署。
如果说 OpenClaw 的爆火象征着 AI 开发者们在「狂野西部」的一次集体冲锋,那么腾讯云 Agent Runtime 的出现,则标志着这场运动开始从无序走向秩序与成熟。
过去我们习惯于讨论模型的参数量、推理能力或是多模态性能,但在「自主执行时代」,这些只是智能体的「大脑」。正如 Karpathy 所担忧的那样,没有安全边界和性能保障的智能体,很可能是数字世界混乱的源头。
腾讯云 Agent Runtime,第一次为这群「数字员工」提供了一个既能自由探索、又绝对可控的「数字化工位」。
基础设施的演进往往滞后于应用层爆发,但它决定了应用能走多远。当毫秒级的冷启动、容器级的安全隔离以及标准化的执行协议成为标配,智能体才真正具备了大规模进入产业生产线的资格。
腾讯云 Agent Runtime 正在成为智能体时代的「调度中心」,更是智能体自我学习,通往 AGI 闭环过程中,不可或缺的一块拼图。
这只从圈子里「跳出来」的龙虾,终于在云端找到了它最稳健的栖息地,也找到了它通往自我进化的快车道。
