独角兽企业Generalist的新产品Gen-1在短短一个小时之内就能学会新的任务,并且连续重复操作达1800次,成功率更是高达99%。
机器人模型卷出新高度
机器人领域内卷现象愈发明显,而这款名为“Gen-1”的新型号机器人则因其卓越表现成为行业新标杆。
Gen-1在精细工作中展现出了非凡的能力,比如装配手机和折叠纸箱时的效率从64%跃升至99%,几乎完全消除了人为失误的可能性。
这款新产品是Generalist公司最新发布的研究成果之一。Gen-1不仅提高了传统机器人的工作效率,还验证了机器人领域的Scaling Law理论。
以前,一台标准纸箱的折叠需要大约34秒的时间,而现在使用Gen-1则只需短短12.1秒,效率实现了三倍的增长。

即便面对重复性极强的任务如清洁机器人的维护工作,它也能够保持高度稳定的表现。

在连续进行1800次装箱操作时,Gen-1也能轻松应对,展现出其强大的适应性和可靠性。
机器人模型卷出新高度
更令人惊讶的是,当遇到突发事件时,比如零件意外偏移的情况下,Gen-1可以迅速调整策略继续工作。

它能够根据实际情况灵活改变抓取角度或使用双手配合完成任务,显示出类似人类的直觉解决问题的能力。

为了使机器人具备这样的能力,研发团队采用了一种全新的训练方法——基于大量的人类活动记录进行模拟学习。
这一过程摒弃了传统的昂贵且难以扩展的数据采集方式,转而通过穿戴设备捕捉并分析人类的行为模式。

这样的数据处理架构使基础模型在接触机械臂之前就能掌握空间、时间及物理因果关系等关键因素。
该技术借助50万小时的高保真物理交互数据集,显著提高了机器人的学习效率,达到前代产品十倍以上的水平。
即便是在前所未见的任务面前,为Gen-1提供一次演示机会也足以让它迅速上手投入工作。
为了确保机器人动作自然流畅,并实现实时操作控制,研发团队还引入了两项关键技术:分页注意力机制和Harmonic Reasoning系统。
分页注意力机制解决了处理大规模数据流时的计算资源分配问题,保证每个指令都能在毫秒级的时间内得到响应。
而Harmonic Reasoning系统则允许模型通过多尺度动态调节权重来优化复杂任务的表现。
经过数月的努力与大量自定义内核开发,团队成功提升了训练过程的稳定性和硬件性能利用率。
Gen-1的成功表明,在给定充足的数据和计算能力的情况下,机器人也能拥有类似人类的学习能力和创新思维。
通过大规模预训练,机器人的行为不再局限于模仿动作序列,而是开始理解并应用空间、时间和因果关系的规律。
这种基于直觉的理解使机器人能够应对未曾遇到的任务挑战,并表现出超越单一模型性能上限的能力。
即便在零件意外错位的情况下,Gen-1也能凭直觉快速调整状态继续工作,无需人工干预即可解决问题。
通过精确的技术对齐和优化训练程序,机器人的即兴创新能力被进一步激发,并能够按照用户设定的标准执行任务。
这一进步使得机器人从单一指令的机械体转变为具备物理常识、能独立处理复杂情况的职业高手。
Gen-1的背后是创始人Pete Florence及其团队在机器人领域的深厚积累。他曾在Google DeepMind担任高级研究科学家,并参与了多项重要项目的研究工作。
例如,他在Dense Object Nets等项目的贡献对视觉引导下的端到端学习路径进行了探索。
后来又作为核心成员参与并领导了PaLM-E、RT-2等多个具有里程碑意义的机器人开发任务。
自2024年创立Generalist以来,Pete Florence及其团队继续在机器人领域内进行创新性研究和产品开发。
即便在他离职后的两年里,DeepMind仍在其最新发布的Gemini Robotics论文中多次引用了他参与的研究成果。
这种即兴解题的能力源于它真正理解了“动作会导致后果”的逻辑。
即使现场零件被意外撞歪,它也能凭直觉找回节奏,不需要人类像保姆一样每一步都盯着纠错。
这种在真实世界摔打出来的经验,让原本悬浮在百科全书里的抽象文字变成了实打实的行动力。
研发团队通过对齐技术,给这种即兴天赋装上了“导航仪”,确保机器人“临场发挥”的动作依然会严丝合缝地待在用户设定的规范里。
这种进化,让机器人从一个只能按部就班的机器,变成了一个真正懂物理常识、能独立处理复杂局面的“职场老手”。
DeepMind大牛创业成果
GEN-1的底层逻辑,源于资深团队在机器人领域的长期积累,创始人Pete Florence的技术背景,为这一方案提供了深厚的理论底色。

他曾任Google DeepMind高级研究科学家,通过Dense Object Nets等工作探索了视觉引导下机器人从感知到动作的端到端学习路径。
在谷歌PaLM团队工作期间,他作为核心力量参与并主导了PaLM-E、RT-2等多个具备代际跨越意义的机器人项目。
2024年,Pete Florence离开谷歌并创立了Generalist。
即便在他离职后的2025年3月,DeepMind在发布的Gemini Robotics论文中依然四次引用了他参与合著的研究。
参考链接:
https://generalistai.com/blog/apr-02-2026-GEN-1

克雷西