高精度机器人超越GPT-3：任务完成率达99%，展现灵活应变能力

作者：世界网2026年4月5日科技4 阅读

这家原本默默无闻的硅谷机器人 AI 公司，或许很快就会受到更多关注。

今天，Generalist 正在尝试将大模型技术完全应用于机器人领域，并首次对外公布了其最新一代基础模型 GEN-1。

效果相当惊人：

来自官方账号

比起前代产品 Gen-0 平均仅64%的成功率，GEN-1 在多项任务中已经达到了99%，包括折叠 T 恤和维护吸尘器等操作，能够连续运行数百次而无需人工干预。

先看数据。

现在的机器人不再是大概率成功，而是每次都能可靠地完成任务。这种稳定性尤其对工业场景至关重要。

在效率方面，GEN-1 实现了显著提升。例如，在箱体折叠的任务中，执行时间从34秒缩短至12秒，速度提升了约三倍。

更重要的是，机器人现在展现出了更为“人性化”的特征。

GEN-1 开始具备一种称为“物理常识”的能力，能够处理一些意外情况。

在一个长流程的汽车零件装配任务中，如果垫圈被碰歪，机器人不会直接放弃，而是会自己想办法解决：要么重新抓住垫圈，要么将其先插进缝隙调整姿态，甚至还会换手操作以提高稳定性。

对于那些形状变化大、难以预料的情况，模型同样能自我调节到可操作的状态。

根据公司官方博客的描述，这些应对措施并不在机器人原本训练的数据范围内，然而正是这种“临场发挥”，使机器人能够适应各种意外状况。

对于工程师而言，这意味着机器人的行为不再仅仅是机械执行，而是开始具备了一定的理解能力。

这一突破的背后依然是规模和数据的驱动。

GEN-1 的训练基于超过50万小时的真实操作记录，这些记录来自人类佩戴动捕设备，在各种环境中完成的实际任务。

公司 CEO Pete Florence 曾指出，目前机器人行业正接近类似 ChatGPT 早期快速发展的阶段——当系统规模与数据积累达到某个阈值时，能力会以“涌现”的方式突然释放。他同时也是谷歌基础机器人学论文 PaLM-E 的主要作者。

因此，他们不再将机器人视为高度定制化的机械装置，而是将其看作一个可以持续扩展和训练的模型系统来构建，通过扩大规模、增加数据量和不断迭代来接近通用能力。

然而随之而来的是一个问题：机器人缺乏足够的实际操作数据。

与互联网不同，现实世界中并不存在现成的数据源。没有人会详细记录“如何处理物品卡住”这样的细节经验。

数据本身成为了最大的瓶颈。

Generalist 的解决方法是直接利用人类的行动来生成训练数据。他们设计了一种名为“数据手”的设备，可以记录操作者的视觉和动作信息。

这些数据来自家庭、仓库等真实环境，规模已经超过50万小时，目标明确：不是记住具体任务的操作步骤，而是学会在不同场景下灵活应对。

与另一家热门公司 Physical Intelligence 形成对比的是，后者更倾向于通过远程操作和模拟环境来生成训练数据。

一名机器人训练员使用“数据手”为 Generalist 的 AI 模型生成训练数据。

当然，也有争议。

曾负责亚马逊机器人业务的 Brad Porter 认为，如果没有成熟的底层架构支持，仅仅增加数据量不仅成本高昂，效果也可能不理想。历史证明，规模扩张通常需要与关键的技术突破同时发生。

无论争议如何，资本已经开始行动。Generalist 由 Pete Florence、谷歌同事曾安迪以及波士顿动力的机器人专家安迪・巴里共同创立，并一直保持低调。

Generalist 在2025年完成了1.4亿美元融资，估值达到4.4亿美元，其投资者包括 Spark Capital、英伟达旗下的 NVentures、贝佐斯探险公司 Bezos Expeditions 和 Boldstart Ventures。

另一家热门的 Physical Intelligence 公司也被曝接近百亿美元的估值。与此同时，Jensen Huang 明确表示：机器人正在进入“ChatGPT 时刻”。

长期来看，这一轮具身智能的发展变化本质上是一种范式转变：机器人从被编排执行任务转向通过数据学习如何应对世界。

正如 Generalist 这样的公司所努力证明的那样，当模型、数据与算力达到一定的阈值时，机器人的能力也将迎来飞跃。

https://generalistai.com/blog/apr-02-2026-GEN-1

https://www.forbes.com/sites/annatong/2026/04/02/generalist-is-betting-its-robot-training-gloves-will-usher-in-robotics-chatgpt-moment/

“”

免责声明：由于无法甄别是否为投稿用户创作以及文章的准确性,本站尊重并保护知识产权，根据《信息网络传播权保护条例》，如我们转载的作品侵犯了您的权利,请您通知我们，请将本侵权页面网址发送邮件到[email protected]，深感抱歉，我们会做删除处理。

高精度机器人超越GPT-3：任务完成率达99%，展现灵活应变能力

作者：世界网2026年4月5日科技4 阅读

这家原本默默无闻的硅谷机器人 AI 公司，或许很快就会受到更多关注。

今天，Generalist 正在尝试将大模型技术完全应用于机器人领域，并首次对外公布了其最新一代基础模型 GEN-1。

效果相当惊人：

来自官方账号

比起前代产品 Gen-0 平均仅64%的成功率，GEN-1 在多项任务中已经达到了99%，包括折叠 T 恤和维护吸尘器等操作，能够连续运行数百次而无需人工干预。

先看数据。

现在的机器人不再是大概率成功，而是每次都能可靠地完成任务。这种稳定性尤其对工业场景至关重要。

在效率方面，GEN-1 实现了显著提升。例如，在箱体折叠的任务中，执行时间从34秒缩短至12秒，速度提升了约三倍。

更重要的是，机器人现在展现出了更为“人性化”的特征。

GEN-1 开始具备一种称为“物理常识”的能力，能够处理一些意外情况。

对于那些形状变化大、难以预料的情况，模型同样能自我调节到可操作的状态。

根据公司官方博客的描述，这些应对措施并不在机器人原本训练的数据范围内，然而正是这种“临场发挥”，使机器人能够适应各种意外状况。

对于工程师而言，这意味着机器人的行为不再仅仅是机械执行，而是开始具备了一定的理解能力。

这一突破的背后依然是规模和数据的驱动。

GEN-1 的训练基于超过50万小时的真实操作记录，这些记录来自人类佩戴动捕设备，在各种环境中完成的实际任务。

然而随之而来的是一个问题：机器人缺乏足够的实际操作数据。

与互联网不同，现实世界中并不存在现成的数据源。没有人会详细记录“如何处理物品卡住”这样的细节经验。

数据本身成为了最大的瓶颈。

Generalist 的解决方法是直接利用人类的行动来生成训练数据。他们设计了一种名为“数据手”的设备，可以记录操作者的视觉和动作信息。

这些数据来自家庭、仓库等真实环境，规模已经超过50万小时，目标明确：不是记住具体任务的操作步骤，而是学会在不同场景下灵活应对。

与另一家热门公司 Physical Intelligence 形成对比的是，后者更倾向于通过远程操作和模拟环境来生成训练数据。

一名机器人训练员使用“数据手”为 Generalist 的 AI 模型生成训练数据。

当然，也有争议。

无论争议如何，资本已经开始行动。Generalist 由 Pete Florence、谷歌同事曾安迪以及波士顿动力的机器人专家安迪・巴里共同创立，并一直保持低调。

另一家热门的 Physical Intelligence 公司也被曝接近百亿美元的估值。与此同时，Jensen Huang 明确表示：机器人正在进入“ChatGPT 时刻”。

长期来看，这一轮具身智能的发展变化本质上是一种范式转变：机器人从被编排执行任务转向通过数据学习如何应对世界。

正如 Generalist 这样的公司所努力证明的那样，当模型、数据与算力达到一定的阈值时，机器人的能力也将迎来飞跃。

https://generalistai.com/blog/apr-02-2026-GEN-1

https://www.forbes.com/sites/annatong/2026/04/02/generalist-is-betting-its-robot-training-gloves-will-usher-in-robotics-chatgpt-moment/

“”

高精度机器人超越GPT-3：任务完成率达99%，展现灵活应变能力

高精度机器人超越GPT-3：任务完成率达99%，展现灵活应变能力

相关文章

相关文章