
这家原本默默无闻的硅谷机器人 AI 公司,或许很快就会受到更多关注。
今天,Generalist 正在尝试将大模型技术完全应用于机器人领域,并首次对外公布了其最新一代基础模型 GEN-1。
效果相当惊人:

来自官方账号
比起前代产品 Gen-0 平均仅64%的成功率,GEN-1 在多项任务中已经达到了99%,包括折叠 T 恤和维护吸尘器等操作,能够连续运行数百次而无需人工干预。
先看数据。
现在的机器人不再是大概率成功,而是每次都能可靠地完成任务。这种稳定性尤其对工业场景至关重要。
在效率方面,GEN-1 实现了显著提升。例如,在箱体折叠的任务中,执行时间从34秒缩短至12秒,速度提升了约三倍。



更重要的是,机器人现在展现出了更为“人性化”的特征。

GEN-1 开始具备一种称为“物理常识”的能力,能够处理一些意外情况。
在一个长流程的汽车零件装配任务中,如果垫圈被碰歪,机器人不会直接放弃,而是会自己想办法解决:要么重新抓住垫圈,要么将其先插进缝隙调整姿态,甚至还会换手操作以提高稳定性。
对于那些形状变化大、难以预料的情况,模型同样能自我调节到可操作的状态。
根据公司官方博客的描述,这些应对措施并不在机器人原本训练的数据范围内,然而正是这种“临场发挥”,使机器人能够适应各种意外状况。
对于工程师而言,这意味着机器人的行为不再仅仅是机械执行,而是开始具备了一定的理解能力。
这一突破的背后依然是规模和数据的驱动。
GEN-1 的训练基于超过50万小时的真实操作记录,这些记录来自人类佩戴动捕设备,在各种环境中完成的实际任务。
公司 CEO Pete Florence 曾指出,目前机器人行业正接近类似 ChatGPT 早期快速发展的阶段——当系统规模与数据积累达到某个阈值时,能力会以“涌现”的方式突然释放。他同时也是谷歌基础机器人学论文 PaLM-E 的主要作者。
因此,他们不再将机器人视为高度定制化的机械装置,而是将其看作一个可以持续扩展和训练的模型系统来构建,通过扩大规模、增加数据量和不断迭代来接近通用能力。
然而随之而来的是一个问题:机器人缺乏足够的实际操作数据。
与互联网不同,现实世界中并不存在现成的数据源。没有人会详细记录“如何处理物品卡住”这样的细节经验。
数据本身成为了最大的瓶颈。
Generalist 的解决方法是直接利用人类的行动来生成训练数据。他们设计了一种名为“数据手”的设备,可以记录操作者的视觉和动作信息。
这些数据来自家庭、仓库等真实环境,规模已经超过50万小时,目标明确:不是记住具体任务的操作步骤,而是学会在不同场景下灵活应对。
与另一家热门公司 Physical Intelligence 形成对比的是,后者更倾向于通过远程操作和模拟环境来生成训练数据。

一名机器人训练员使用“数据手”为 Generalist 的 AI 模型生成训练数据。
当然,也有争议。
曾负责亚马逊机器人业务的 Brad Porter 认为,如果没有成熟的底层架构支持,仅仅增加数据量不仅成本高昂,效果也可能不理想。历史证明,规模扩张通常需要与关键的技术突破同时发生。
无论争议如何,资本已经开始行动。Generalist 由 Pete Florence、谷歌同事曾安迪以及波士顿动力的机器人专家安迪・巴里共同创立,并一直保持低调。
Generalist 在2025年完成了1.4亿美元融资,估值达到4.4亿美元,其投资者包括 Spark Capital、英伟达旗下的 NVentures、贝佐斯探险公司 Bezos Expeditions 和 Boldstart Ventures。
另一家热门的 Physical Intelligence 公司也被曝接近百亿美元的估值。与此同时,Jensen Huang 明确表示:机器人正在进入“ChatGPT 时刻”。
长期来看,这一轮具身智能的发展变化本质上是一种范式转变:机器人从被编排执行任务转向通过数据学习如何应对世界。
正如 Generalist 这样的公司所努力证明的那样,当模型、数据与算力达到一定的阈值时,机器人的能力也将迎来飞跃。
https://generalistai.com/blog/apr-02-2026-GEN-1
https://www.forbes.com/sites/annatong/2026/04/02/generalist-is-betting-its-robot-training-gloves-will-usher-in-robotics-chatgpt-moment/
