清华大学THUNLP实验室、中国人民大学和面壁智能联合发布了一款开源工具,名为ClawXRouter,旨在优化AI Agent的成本与性能。
敏感数据不出门
开发者们在使用Agent时常常面临数据安全和成本控制的难题。这款新工具则为他们提供了一个解决方案,在保护隐私的同时还能提升工作效率。
新近的研究表明,利用ClawXRouter可以将成本降低58%,而性能反而提升了6.3%。这一成果打破了以往开发者在选择使用本地模型或云端API时的两难困境。
当前Agent的应用面临三大挑战:云服务中的隐私泄露风险、高昂的成本以及本地运行效率低下等问题。为了解决这些问题,ClawXRouter应运而生。
这款工具具备三级隐私路由机制,能够自动检测并处理敏感信息,从而在不牺牲数据安全性的前提下提高工作效率。
破局者出现了。
在性价比感知路由方面,它通过智能评估任务复杂度来选择最合适的模型进行处理。这种策略大大降低了不必要的资源浪费,并提高了整体性能表现。
除此之外,ClawXRouter还实现了双轨记忆与智能脱敏技术,确保了敏感信息的安全性同时又不牺牲云端模型的强大推理能力。
开发者们可以借助这套工具轻松地实现端云协同工作流程的优化。此外,它还提供了可组合管线和可视化Dashboard等功能,方便用户根据自己的需求进行灵活配置与调整。
该项目将继续保持开源状态,并欢迎更多开发者和技术合作伙伴加入贡献行列,共同推动这一领域的发展进步。
最新测评效果显示:使用ClawXRouter不仅让成本直降58%,性能反而还提升了6.3%。
三大顽疾一招破,端云协同开启Agent落地新范式
事实上,这种“两头堵”的尴尬,正来源于当前Agent使用模式中难以调和的三大顽疾:
- 云端“不敢用”:想让Agent分析一份客户数据表?这个想法很棒,但客户的姓名、手机号、身份证号……这些敏感信息随上下文一起发到了云端第三方服务器。一次数据分析,可能就意味着一次严重的隐私泄露。这个风险,没人能承担。
- 云端“用不起”:只是想用grep查找一个函数调用的位置,或是做个简单的文本摘要,这Agent却二话不说直接调用最昂贵的顶级模型处理。大部分token被花费在了便宜模型即可解决的简单任务上,堪比“杀鸡用牛刀”。
- 本地“用不好”:在本地跑模型安全又便宜,但性能却常常达不到预期,原因是端侧模型算力与参数规模受限。做格式转换、数据汇总还行,一旦涉及多文件交叉分析或复杂的异常检测,模型就“宕机”,难以胜任高难度任务。
而ClawXRouter的出现,正是为了打通端云协同的最后一步:通过一套精妙的路由机制,为每一条请求找到最合适的路径。
这样一来,开发者无需改动一行业务代码,就能让AI Agent自动实现:
- 公开数据上云分析
- 敏感数据脱敏后上云
- 私密数据本地处理

一个插件,丝滑实现端云协同,解决开发者“不敢用、用不起、用不好”的三大难题。
三级隐私路由,解决“不敢用”
即使是Code Review这样的日常任务,也可能一不小心把API Key或数据库密码喂给云端模型。
ClawXRouter通过植入钩子(Hook),像安检一样自动扫描每一条消息、工具调用和Agent输出,并将其分为三级:
- S3(私密):SSH私钥、硬编码密码、工资单。这些数据将被物理隔离,请求完全由本地模型离线处理,云端毫不知情。私密信息,绝不出本机。
- S2(敏感):含内网IP的告警日志、含手机号的联系人列表。ClawXRouter会自动识别并智能脱敏(例如,将“王小二”替换为[REDACTED:NAME]),然后才转发给云端模型。
- S1(安全): 如“HTTP 403和401有什么区别?”这类普通问题,直接发往云端,发挥其最强能力。
这背后是“规则+模型”双检测引擎在保驾护航,既快又准,能确保万无一失。
性价比感知路由,解决“用不起”
“航天级”模型如何干“拧螺丝”的活?
ClawXRouter内置了一个由本地小模型担当的“任务评估师”(LLM-as-Judge)。它会快速判断任务复杂度,然后将请求分发给最合适的模型。

效果如何?在PinchBench(包含23项OpenClaw Agent基准测试)上跑了一下:

结论是:成本节省58%,性能反而提升6.3%。
双轨记忆、智能脱敏,解决“用不好”
当一项任务既包含敏感信息、又需要云端模型的强大推理能力时,怎么办?
这时,ClawXRouter的智能脱敏机制就派上了用场。
对于涉及敏感信息的复杂任务,本地模型能力不足时不必“硬扛”:
ClawXRouter会自动识别敏感信息并智能脱敏后,将脱敏后的任务安全交给云端处理。
同时,ClawXRouter巧妙地维护了双轨记忆与双轨会话机制:云端模型只能看到脱敏后的对话历史(`MEMORY.md`),本地则保留完整信息(`MEMORY-FULL.md`)。
这样既保护了隐私,又没有因为本地模型的瓶颈而卡住工作流,从根本上杜绝隐私数据通过上下文窗口泄露给第三方服务的风险。
可组合管线与可视化Dashboard
每个开发者与团队的需求都不同。为此,ClawXRouter提供了:
- 可组合路由管线:隐私路由和性价比感知路由运行在同一管线中,遵循安全优先原则,隐私路由器高权重先跑,发现敏感数据直接短路处理;安全通过后才启动性价比路由优化成本。整个管线通过10个Hook覆盖从模型选择到会话结束的完整生命周期,无侵入式接管OpenClaw原有流程。
- 可视化Dashboard:支持中英双语,涵盖用量概览、会话记录、检测日志、路由规则配置与模型配置五个面板,所有改动即时生效、无需重启,方便用户按自身需求灵活调整。


快速上手
# 前置条件:已安装 OpenClaw
# 通过 npm 安装(推荐)
pnpm add -w @openbmb/clawxrouter
# 或通过 ClawHub 安装
openclaw plugins install clawhub:clawxrouter
# (可选)安装本地推理后端
ollama pull openbmb/minicpm4.1
ollama serve
# 启动
openclaw gateway
# Dashboard → http://127.0.0.1:18789/plugins/clawxrouter/stats
云侧不敢用、用不起,端侧用不好?
ClawXRouter的答案是:
不必二选一,让端侧和云侧各尽其能。
项目将持续开源迭代,欢迎开发者与行业伙伴参与贡献,共同构建安全高效的端云协同Agent生态。
GitHub开源链接:
https://github.com/Openbmb/ClawXRouter
ClawHub链接:
https://clawhub.ai/plugins/clawxrouter

思邈