- 克雷西 发自 凹非寺
量子位 | 公众号 QbitAI
最近,一款机器人新产品的出现让人惊叹不已,它不仅在工作效率上超越了以往的同类产品,还大大提升了整个行业对机器人的期待。
著名的具身智能公司Generalist宣布推出其最新的研究成果——名为Gen-1的新模型。
在处理像包装手机和折叠纸箱这样的精细任务时,Gen-1将成功率从原来的64%提升到了惊人的99%,几乎消除了传统意义上的手工作业缺陷。

过去完成一个标准纸箱的折叠需要34秒时间,而使用Gen-1后,这个过程缩短至仅需12.1秒,效率显著提高。

Gen-1的表现不仅验证了机器人领域的Scaling Law理论,在面对重复性任务时也展现出了非凡的能力和稳定性。
机器人模型卷出新高度
它在执行诸如维护扫地机器人的常规任务上表现得非常稳定,并且即使是在连续进行超过一千八百次的装箱操作中也能保持高效作业。

更重要的是,Gen-1处理突发事件的方式尤为独特。当遇到零件意外偏移的情况时,它能够迅速调整策略并继续完成工作。

这种智能不仅体现在其快速解决问题的能力上,还在于它能像经验丰富的工人一样适应各种不可预见的挑战。
为了使Gen-1具备如此出色的自主学习能力,研发团队采用了全新的训练方法。他们通过低成本的人体动作捕捉设备收集了大量数据,并以此来训练AI模型理解物理世界的规律。

这一创新策略绕过了传统机器人遥操作所需的庞大计算资源限制,使得模型在接触机械臂之前就能具备高度的环境适应能力。
基于这一方法积累的五十年间高质量互动数据集,Gen-1的学习效率得到了显著提升,比其前身提高了十倍之多。
除了高效的训练外,研发团队还开发了两项关键技术来确保机器人操作的流畅性和实时性。其中一项是专门为物理世界优化的分页注意力机制。
此方法通过更有效地调度计算资源解决了大容量数据流处理中的延迟问题,使每个动作指令都能在毫秒级内即时响应。
另一关键技术是一种名为Harmonic Reasoning的新系统。这套系统的引入让模型能够更加灵活地应对复杂任务需求,在执行时展现出超出单一路径预测的性能表现。
研发团队花费了几个月的时间优化了训练过程,并开发了大量的自定义内核来最大限度地利用硬件资源。
这些技术改进使得机器人不仅具备更高的效率,还能在面对全新任务或陌生设备时迅速上手操作。
Gen-1的成功证明了Scaling Law理论同样适用于物理世界的实践应用。通过充足的训练数据和强大的计算能力支持,机器人的智能可以得到显著提升。
这种进步让机器人能够更好地理解和模拟人类的行为模式,在复杂环境中展现出更佳的适应性和创造性解决难题的能力。
它们现在不仅能够按照预设规则执行任务,还能根据实际情况灵活调整策略来解决问题。这种灵活性大大增强了机器人的实用价值和工作效率。
Gen-1所展现的技术突破,得益于其背后团队长期在机器人领域的积累与创新。创始人Pete Florence凭借他在Google DeepMind的工作经验为这一项目奠定了坚实的理论基础。
他曾是DeepMind的核心成员之一,在多个具有里程碑意义的机器人研究项目中发挥了重要作用。
2025年,虽然他已离开谷歌成立了自己的公司Generalist,但其前期研究成果仍然被广泛引用和认可。
研发团队为此投入数月时间优化训练稳定性,并编写了大量自定义内核来压榨硬件算力的极限。
机器人领域的Scaling Law
GEN-1的性能跨越,证明了Scaling Law在物理世界依然有效——只要喂够了数据和算力,机器人的脑子也会产生“开窍”时刻。
通过大规模预训练,机器人不再生硬地模仿动作序列,自己悟出了空间、时间和因果关系的规律,感知到了物体之间的相互影响。
有了直觉之后,机器人干活就开始带点“灵性”。当任务中途出现没见过的阻碍,它会自发尝试一些教学大纲以外的操作,比如发现东西塞不进去时会像人一样晃晃袋子。
这种即兴解题的能力源于它真正理解了“动作会导致后果”的逻辑。
即使现场零件被意外撞歪,它也能凭直觉找回节奏,不需要人类像保姆一样每一步都盯着纠错。
这种在真实世界摔打出来的经验,让原本悬浮在百科全书里的抽象文字变成了实打实的行动力。
研发团队通过对齐技术,给这种即兴天赋装上了“导航仪”,确保机器人“临场发挥”的动作依然会严丝合缝地待在用户设定的规范里。
这种进化,让机器人从一个只能按部就班的机器,变成了一个真正懂物理常识、能独立处理复杂局面的“职场老手”。
DeepMind大牛创业成果
GEN-1的底层逻辑,源于资深团队在机器人领域的长期积累,创始人Pete Florence的技术背景,为这一方案提供了深厚的理论底色。

他曾任Google DeepMind高级研究科学家,通过Dense Object Nets等工作探索了视觉引导下机器人从感知到动作的端到端学习路径。
在谷歌PaLM团队工作期间,他作为核心力量参与并主导了PaLM-E、RT-2等多个具备代际跨越意义的机器人项目。
2024年,Pete Florence离开谷歌并创立了Generalist。
即便在他离职后的2025年3月,DeepMind在发布的Gemini Robotics论文中依然四次引用了他参与合著的研究。
https://generalistai.com/blog/apr-02-2026-GEN-1
