赫尔墨斯首次直播回应抄袭争议，迷你-max抢先挺进哈arness决赛圈，哔哩哔哩热议不断

作者：世界网2026年4月19日科技2 阅读

新智元报道

最懂Harness的并不一定是跑分最高的，如今MiniMax已被Hermes、OpenClaw等热门开源Agent项目确立为默认选择，在OpenRouter上的日均Token消耗已突破3000亿。

昨晚在B站上一位外国用户用四个字引发了一场热烈讨论。

不熟，勿Cue。

汤米·伊斯曼，作为全球最流行的开源Agent项目Hermes Agent的业务负责人，对此发表了看法。

他首次来到中国就受到了观众质疑：“你们是不是借鉴了EvoMap？”

对此他的回答是这样的：

Hermes Agent的代码仓库已经存在了一年多的时间。直到那些推文出现之前，我才知道有Evo Map这个名字。

Nous Research团队一直致力于前沿研究，我们是一个以理念驱动的小组，除了推动开源AI外没有其他目标。

我们当然不会抄袭别人的代码库然后据为己有。

与汤米一同出现的是MiniMax Agent首席架构师阿岛和研发工程师择因。

虽然争议只持续了几分钟，但接下来的两小时技术讨论触及了一个长久被忽视的问题。

当模型能力接近极限时，AI竞争的新维度在哪里？

人类成了瓶颈

阿岛的工作方式已经发生了变化。

去年九十月间，他已经很少打开IDE了。他的日常工作是同时运行多个本地Agent，并在云端进行十个左右的实验。

我开始意识到人类成了瓶颈。

以往AI行业以模型参数量和跑分为主要竞争点。

然而到了2026年初，OpenClaw突然走红，老黄也在摩根士丹利论坛上表示这是有史以来最重要的软件之一。

大家这才意识到，即使拥有再强的模型能力，如果不能实际应用工具或完成任务，那它不过是个聊天机器人而已。

一夜之间，整个行业开始关注Harness技术框架。

Harness是Agent运行环境的核心，包括工具调用、记忆管理、技能系统以及沙箱环境等组件。

OpenAI在其广受好评的文章《Harness Engineering》中明确指出：人类掌舵，智能体执行。

阿岛对此做了一个比喻来说明这个问题。

模型是引擎，而Harness则是机甲的外骨骼。只有两者结合才能使机器人的能力最大化。

Claude Code在过去的两个月里一直在进行龙虾化改造。定时任务、即时消息连接、远程控制等新功能不断推出，我初次见到OpenClaw时便被它惊艳到了，团队一开始并不认可这种方向，但后来的事实证明这是正确的选择。

行业正逐渐统一到同一个发展方向上来。

阿岛本人对这一变化有着更深刻的体会。

我觉得自己正在经历AI技术的精炼过程。工程师们在构建Harness时，也在提炼自己的工作方式并将其转化为技能和代码。

他补充说：“这种努力最终是为了让人们能够专注于他们真正热爱的工作。”

在这波浪潮中，MiniMax做出了诸多调整。短短几周内连续发布了三项重大举措：推出了业界首个自我迭代的模型M2.7、云端沙箱MaxHermes和基于OpenClaw架构开发的AI助手MaxClaw。

三者构成了一个闭环。

这些措施不仅提升了产品的智能化程度，也促进了模型本身的进化。

MiniMax CEO闫俊杰在最近的一次业绩电话会议上提出了一个公式：AI平台的价值等于智能密度乘以Token吞吐量。

他认为MiniMax的方法虽然不是唯一的解决方案，但确实证明了模型为Harness而生、Harness反哺模型进化的逻辑是可行的。

当两大家云服务商和四个海外开源项目都选择与之合作时，这一模式至少在现阶段已被验证有效。

接下来的问题只有一个：M3版本何时推出？

对此MiniMax已透露了几个关键方向：

更强大的智能处理能力，在编程和通用办公场景中表现突出；

支持视频及图像输入的原生多模态功能；

价格亲民，目标是让所有人都能负担得起全天候的Agent服务。

总结来说，新产品面世的时间不会太久。

2. 模型能主动迭代Harness本身，自主运行优化循环超过100轮，评测效果提升30%。

3. 模型还有能力迭代机器学习模型本身的效果，在MLE Lite的22道高难度竞赛中取得9金5银1铜，得牌率66.6%，仅次于Opus-4.6和GPT-5.4。

M2.7的核心优化方向始终瞄准Agent场景，工具调用准确度、复杂Skills遵循、Agent Harness适配。

在40个复杂Skills（每个超过2000 Token）的测试中，M2.7仍能保持97%的Skills遵循率。

而最先认可这套能力的，是海外开源圈。

从M2.1开始，Hermes的联合创始人Teknium就在X上多次公开肯定MiniMax模型在工具调用、响应速度与性价比上的表现。

M2.5、M2.7每次发布，Hermes Agent都第一时间接入。而且合作还在层层深入。

如今，MiniMax模型已经是Hermes Agent中使用量最高的模型之一。

Hermes Agent整体日均Token消耗已从20亿飙升至近3000亿，M2.7在Open Router上日均消耗超过250亿Token，占据显著份额。

无独有偶，OpenClaw创始人Peter，也曾连发五条推文公开称赞MiniMax是最好的开源模型。

他表示，M2.1能以其他模型5%的成本运行OpenClaw，效果完全不输顶尖闭源模型。

Notion联合创始人Akshay Kothari则亲自宣布，MiniMax M2.5成为Notion Custom Agents中第一个开源权重模型。

被称为「Cursor最强对手」的AI编程工具Kilo Code，也高调宣布MiniMax是默认首选模型。

Tommy在直播中给了一个判断，「中国在开源模型方面已经领先了。开源和闭源之间从未有过如此接近的差距。」

在这背后，是一套相互反哺的协作模式。

Hermes社区贡献了自进化Agent的架构设计和产品理念，MiniMax贡献了让这套架构真正运转的模型能力和工程基础设施。

Hermes的架构创新为MiniMax的模型优化指明方向，优先级给了工具调用、Skills执行、长上下文一致性这些Agent核心痛点。MiniMax的模型能力提升又拓宽了Hermes架构所能达到的效果边界。

海外头部开源项目选MiniMax做默认模型，说明一件事。

模型跑分最高未必能赢，模型最懂Harness才能赢。

养虾养马，越养越聪明

模型和Harness的闭环要真正转起来，还需要产品层的验证和反馈。

为此，MiniMax同时推了MaxHermes和MaxClaw两条线，分别对应两种Agent进化路径。

MaxHermes基于开源智能体Hermes Agent构建，核心特性是「学习闭环」。

每完成一项复杂任务，Agent自动从中提炼出可复用的Skills，保存为独立文档，下次按需加载并根据反馈持续改进。

加上持久化的跨会话记忆、自然语言定义的定时任务、多个子代理并行运行机制，它是一个能长期运行、持续进化的AI智能体。

在Skills层面，OpenClaw的依赖人工预设与引导，能力在部署那一刻就已固定。

相比之下，MaxHermes的Skills由Agent自主生成、自主迭代，像一个会举一反三的员工。

MaxClaw则是基于OpenClaw架构的云端AI助手，解决的痛点更具体，本地部署门槛高、稳定性不够。上线120小时紧急完成四次扩容，修复了飞书消息无响应等IM问题和进程退出后无法自动恢复等稳定性问题。

功能方面，MaxClaw预置精选专家级Skill，用户获得50G云存储空间。

对原有的图片理解、视频理解、网页提取等Skill做了系统性升级，新增图片生成、视频生成等内置工具，全部不产生额外API费用。

安全方面预置「安全诊断Skill」，能自主诊断修复报错。支持同时部署多个龙虾，移动端（iOS和安卓）已全球上线。

为了方便大家获取和使用，MiniMax还上线了Skillhub，精选上百种Skills供探索安装。最近一次更新他们直接把语音模型和音乐模型也接入了OpenClaw生态，小龙虾能说话、能唱歌。

在平台层面，MiniMax Agent则推出了Expert 2.0。用户用自然语言描述任务目标，Agent自动完成SOP梳理和能力配置，不需要懂Skill、SubAgent、MCP这些概念。上线以来已有1.6万+专家Agent被创建和使用。

值得一提的是，MiniMax自己也在吃自己的狗粮。

据阿岛透露，公司内部有一个数字员工，拥有独立的GitHub账号，每天自动扫描开源项目，发现能用到MiniMax模型的就自己去提PR。

用Agent来推广Agent背后的模型，而海外开源社区的反馈证明，这招确实管用。

这些产品每天产生的真实场景需求，又反过来驱动M2.7在工具调用、Skills遵循等维度上的持续优化。飞轮就是这么转起来的。

但光有模型和产品的互补还不够。要让这套闭环在云端大规模跑起来，还卡在一个更底层的环节。

最容易卡住的就是沙箱

Agent在云端大规模运行，模型推理只是第一步。更难的是给每个Agent一个安全、隔离、可弹性伸缩的执行环境。

在阿岛看来，「最有可能卡住的就是沙箱环节。如果迭代速度慢了，竞争力就会受到影响。」

其中底层Infra（身份认证、支付、沙箱等）创业公司很难做，需要和大厂深度合作。就像移动互联网时代，支付基础设施最终由微信和支付宝解决。

MiniMax的做法，是训练侧和部署侧分别找了两家头部云厂商。

训练侧，MiniMax与腾讯云深度合作，基于腾讯云Agent Runtime沙箱搭建Forge强化学习框架的基础设施。

Forge进行大规模强化学习训练时，需要模拟海量并发交互环境，让Agent在真实、可交互的执行环境中探索和试错。腾讯云提供80ms极速启动、每分钟60万沙箱实例、成功率99.99%的并发能力，支撑M2.7的自主进化训练。

部署侧，MaxClaw和MaxHermes的云端架构基于阿里云ACK/ACS构建。

MiniMax采用控制平面与执行平面分离的模式，阿里云ACK承载统一控制面，ACS Agent Sandbox提供20-40ms极速实例供给，支持每分钟15000个沙箱的弹性扩缩，任务按需创建、结束自动释放。

腾讯云负责训练，阿里云负责部署。

两大云厂商同时首选MiniMax作为核心合作伙伴，本身就是对其技术实力和Agent产品规模的双重背书。

Token的含金量变了

过去几年大家在比参数、比上下文、比跑分。现在比的是另一件事，同等Token能产出多少价值。

MiniMax CEO闫俊杰在3月的业绩电话会上提了一个公式——

AI平台价值 = 智能密度 × Token吞吐量。

MiniMax的解未必是唯一答案，但它踩中了一个正在被验证的逻辑，模型为Harness而生，Harness反哺模型进化。

当两家头部云厂商同时为它修路、四个海外头部开源项目同时选它做默认模型的时候，这个逻辑至少在当下是跑通了的。

接下来的问题只剩一个，M3什么时候来。

对此，MiniMax已经透露了几个关键方向：

更大更智能，尤其在coding和通用办公场景；
原生多模态，支持视频和图像输入；
价格亲民，目标让每个人都负担得起7×24小时的Agent。

总之，时间不会太远了。

参考资料：

https://www.bilibili.com/video/BV155djB5ETY

https://www.minimaxi.com/news/minimax-m27-zh

https://agent.minimax.io/max-claw

https://agent.minimax.io/

https://github.com/nousresearch/hermes-agent

“”

免责声明：由于无法甄别是否为投稿用户创作以及文章的准确性,本站尊重并保护知识产权，根据《信息网络传播权保护条例》，如我们转载的作品侵犯了您的权利,请您通知我们，请将本侵权页面网址发送邮件到[email protected]，深感抱歉，我们会做删除处理。

赫尔墨斯首次直播回应抄袭争议，迷你-max抢先挺进哈arness决赛圈，哔哩哔哩热议不断

作者：世界网2026年4月19日科技2 阅读

新智元报道

最懂Harness的并不一定是跑分最高的，如今MiniMax已被Hermes、OpenClaw等热门开源Agent项目确立为默认选择，在OpenRouter上的日均Token消耗已突破3000亿。

昨晚在B站上一位外国用户用四个字引发了一场热烈讨论。

不熟，勿Cue。

汤米·伊斯曼，作为全球最流行的开源Agent项目Hermes Agent的业务负责人，对此发表了看法。

他首次来到中国就受到了观众质疑：“你们是不是借鉴了EvoMap？”

对此他的回答是这样的：

Hermes Agent的代码仓库已经存在了一年多的时间。直到那些推文出现之前，我才知道有Evo Map这个名字。

Nous Research团队一直致力于前沿研究，我们是一个以理念驱动的小组，除了推动开源AI外没有其他目标。

我们当然不会抄袭别人的代码库然后据为己有。

与汤米一同出现的是MiniMax Agent首席架构师阿岛和研发工程师择因。

虽然争议只持续了几分钟，但接下来的两小时技术讨论触及了一个长久被忽视的问题。

当模型能力接近极限时，AI竞争的新维度在哪里？

人类成了瓶颈

阿岛的工作方式已经发生了变化。

去年九十月间，他已经很少打开IDE了。他的日常工作是同时运行多个本地Agent，并在云端进行十个左右的实验。

我开始意识到人类成了瓶颈。

以往AI行业以模型参数量和跑分为主要竞争点。

然而到了2026年初，OpenClaw突然走红，老黄也在摩根士丹利论坛上表示这是有史以来最重要的软件之一。

大家这才意识到，即使拥有再强的模型能力，如果不能实际应用工具或完成任务，那它不过是个聊天机器人而已。

一夜之间，整个行业开始关注Harness技术框架。

Harness是Agent运行环境的核心，包括工具调用、记忆管理、技能系统以及沙箱环境等组件。

OpenAI在其广受好评的文章《Harness Engineering》中明确指出：人类掌舵，智能体执行。

阿岛对此做了一个比喻来说明这个问题。

模型是引擎，而Harness则是机甲的外骨骼。只有两者结合才能使机器人的能力最大化。

行业正逐渐统一到同一个发展方向上来。

阿岛本人对这一变化有着更深刻的体会。

我觉得自己正在经历AI技术的精炼过程。工程师们在构建Harness时，也在提炼自己的工作方式并将其转化为技能和代码。

他补充说：“这种努力最终是为了让人们能够专注于他们真正热爱的工作。”

三者构成了一个闭环。

这些措施不仅提升了产品的智能化程度，也促进了模型本身的进化。

MiniMax CEO闫俊杰在最近的一次业绩电话会议上提出了一个公式：AI平台的价值等于智能密度乘以Token吞吐量。

他认为MiniMax的方法虽然不是唯一的解决方案，但确实证明了模型为Harness而生、Harness反哺模型进化的逻辑是可行的。

当两大家云服务商和四个海外开源项目都选择与之合作时，这一模式至少在现阶段已被验证有效。

接下来的问题只有一个：M3版本何时推出？

对此MiniMax已透露了几个关键方向：

更强大的智能处理能力，在编程和通用办公场景中表现突出；

支持视频及图像输入的原生多模态功能；

价格亲民，目标是让所有人都能负担得起全天候的Agent服务。

总结来说，新产品面世的时间不会太久。

2. 模型能主动迭代Harness本身，自主运行优化循环超过100轮，评测效果提升30%。

3. 模型还有能力迭代机器学习模型本身的效果，在MLE Lite的22道高难度竞赛中取得9金5银1铜，得牌率66.6%，仅次于Opus-4.6和GPT-5.4。

M2.7的核心优化方向始终瞄准Agent场景，工具调用准确度、复杂Skills遵循、Agent Harness适配。

在40个复杂Skills（每个超过2000 Token）的测试中，M2.7仍能保持97%的Skills遵循率。

而最先认可这套能力的，是海外开源圈。

从M2.1开始，Hermes的联合创始人Teknium就在X上多次公开肯定MiniMax模型在工具调用、响应速度与性价比上的表现。

M2.5、M2.7每次发布，Hermes Agent都第一时间接入。而且合作还在层层深入。

如今，MiniMax模型已经是Hermes Agent中使用量最高的模型之一。

Hermes Agent整体日均Token消耗已从20亿飙升至近3000亿，M2.7在Open Router上日均消耗超过250亿Token，占据显著份额。

无独有偶，OpenClaw创始人Peter，也曾连发五条推文公开称赞MiniMax是最好的开源模型。

他表示，M2.1能以其他模型5%的成本运行OpenClaw，效果完全不输顶尖闭源模型。

Notion联合创始人Akshay Kothari则亲自宣布，MiniMax M2.5成为Notion Custom Agents中第一个开源权重模型。

被称为「Cursor最强对手」的AI编程工具Kilo Code，也高调宣布MiniMax是默认首选模型。

Tommy在直播中给了一个判断，「中国在开源模型方面已经领先了。开源和闭源之间从未有过如此接近的差距。」

在这背后，是一套相互反哺的协作模式。

Hermes社区贡献了自进化Agent的架构设计和产品理念，MiniMax贡献了让这套架构真正运转的模型能力和工程基础设施。

海外头部开源项目选MiniMax做默认模型，说明一件事。

模型跑分最高未必能赢，模型最懂Harness才能赢。

养虾养马，越养越聪明

模型和Harness的闭环要真正转起来，还需要产品层的验证和反馈。

为此，MiniMax同时推了MaxHermes和MaxClaw两条线，分别对应两种Agent进化路径。

MaxHermes基于开源智能体Hermes Agent构建，核心特性是「学习闭环」。

每完成一项复杂任务，Agent自动从中提炼出可复用的Skills，保存为独立文档，下次按需加载并根据反馈持续改进。

加上持久化的跨会话记忆、自然语言定义的定时任务、多个子代理并行运行机制，它是一个能长期运行、持续进化的AI智能体。

在Skills层面，OpenClaw的依赖人工预设与引导，能力在部署那一刻就已固定。

相比之下，MaxHermes的Skills由Agent自主生成、自主迭代，像一个会举一反三的员工。

功能方面，MaxClaw预置精选专家级Skill，用户获得50G云存储空间。

对原有的图片理解、视频理解、网页提取等Skill做了系统性升级，新增图片生成、视频生成等内置工具，全部不产生额外API费用。

安全方面预置「安全诊断Skill」，能自主诊断修复报错。支持同时部署多个龙虾，移动端（iOS和安卓）已全球上线。

值得一提的是，MiniMax自己也在吃自己的狗粮。

据阿岛透露，公司内部有一个数字员工，拥有独立的GitHub账号，每天自动扫描开源项目，发现能用到MiniMax模型的就自己去提PR。

用Agent来推广Agent背后的模型，而海外开源社区的反馈证明，这招确实管用。

这些产品每天产生的真实场景需求，又反过来驱动M2.7在工具调用、Skills遵循等维度上的持续优化。飞轮就是这么转起来的。

但光有模型和产品的互补还不够。要让这套闭环在云端大规模跑起来，还卡在一个更底层的环节。

最容易卡住的就是沙箱

Agent在云端大规模运行，模型推理只是第一步。更难的是给每个Agent一个安全、隔离、可弹性伸缩的执行环境。

在阿岛看来，「最有可能卡住的就是沙箱环节。如果迭代速度慢了，竞争力就会受到影响。」

其中底层Infra（身份认证、支付、沙箱等）创业公司很难做，需要和大厂深度合作。就像移动互联网时代，支付基础设施最终由微信和支付宝解决。

MiniMax的做法，是训练侧和部署侧分别找了两家头部云厂商。

训练侧，MiniMax与腾讯云深度合作，基于腾讯云Agent Runtime沙箱搭建Forge强化学习框架的基础设施。

部署侧，MaxClaw和MaxHermes的云端架构基于阿里云ACK/ACS构建。

腾讯云负责训练，阿里云负责部署。

两大云厂商同时首选MiniMax作为核心合作伙伴，本身就是对其技术实力和Agent产品规模的双重背书。

Token的含金量变了

过去几年大家在比参数、比上下文、比跑分。现在比的是另一件事，同等Token能产出多少价值。

MiniMax CEO闫俊杰在3月的业绩电话会上提了一个公式——

AI平台价值 = 智能密度 × Token吞吐量。

MiniMax的解未必是唯一答案，但它踩中了一个正在被验证的逻辑，模型为Harness而生，Harness反哺模型进化。

当两家头部云厂商同时为它修路、四个海外头部开源项目同时选它做默认模型的时候，这个逻辑至少在当下是跑通了的。

接下来的问题只剩一个，M3什么时候来。

对此，MiniMax已经透露了几个关键方向：

更大更智能，尤其在coding和通用办公场景；
原生多模态，支持视频和图像输入；
价格亲民，目标让每个人都负担得起7×24小时的Agent。

总之，时间不会太远了。

参考资料：

https://www.bilibili.com/video/BV155djB5ETY

https://www.minimaxi.com/news/minimax-m27-zh

https://agent.minimax.io/max-claw

https://agent.minimax.io/

https://github.com/nousresearch/hermes-agent

“”

赫尔墨斯首次直播回应抄袭争议，迷你-max抢先挺进哈arness决赛圈，哔哩哔哩热议不断

赫尔墨斯首次直播回应抄袭争议，迷你-max抢先挺进哈arness决赛圈，哔哩哔哩热议不断

相关文章

相关文章