最近,中国具身智能领域迎来了前所未有的巨额融资。
4月16日,一家成立仅一年的企业——它石智航,宣布成功完成了Pre-A轮融资,总额达到惊人的4.55亿美元。
这一消息表明,在过去的一年中,这家公司在激烈的竞争中迅速崛起,并获得了行业内的最高天使轮投资。
据悉,这整个投资方组合是由它石智航主动精心策划的结果,表明公司对未来发展方向有着清晰的认识,并且只选择那些能够带来长期价值的投资伙伴。
公司方面透露,这笔巨资将主要用于两个关键领域:一是全栈大脑的研发;二是全球顶尖人才的引进计划。

在预训练模型方面,它石智航已确立了战略重点。尽管所需计算资源巨大,但公司坚定地朝着这一方向前进。
另一方面,在吸引和培养顶级科技人才方面,它石推出了「TARS STAR」项目,并提供了行业领先的待遇条件。
它石的创始人团队表示,他们已经准备好迎接更大挑战并实现更多的突破性成就。
该公司不仅在技术上展现了卓越的实力,还拥有明确的战略目标和强烈的创新精神。
经过一年专注于具身大脑的研究后,它石智航通过这一轮融资再次刷新了行业记录。
继两轮融资和技术成果的公布之后,它石已经确立了自己在智能机器人领域的领先地位,并成为了国产具身脑赛道中的领头羊。
具身智能领域正经历着一场深刻的变化。
在过去的两年里,市场对能够展示复杂动作能力的机器人的兴趣尤为浓厚。无论是翻跟头还是跳舞,这些技能都能吸引大量关注和赞叹。
30亿,怎么花?
然而,在去年中期以后,一个更为紧迫的问题逐渐浮出水面:机器人何时才能真正进入工厂开始工作?它们到底有何实际价值?
随着这个问题的反复出现,行业的关注点也开始发生不可逆转的变化。
进入2026年年初以来,务实主义成为资本市场的主导风向,这股趋势同样影响了投资界的前沿动态。
在这场变革中,专注于全栈布局和大脑技术的企业被视为最具潜力的赢家。
高瓴创投与红杉中国的联手支持,则是对它石智航未来发展前景最直接的认可。

经过一年多的深入考察和调研后,两家顶级风投机构最终决定共同向它石智航注资,表明了它们对这家公司的坚定信心。
据观察,在具身智能领域中,拥有强大核心技术和全面布局的企业将成为未来的主导力量。
4.55亿美元的融资不仅标志着资本市场的投票支持,也预示着它石智航在未来竞争中的优势地位。
在两轮融资和技术首次交卷后,它石已经不仅仅是稳坐具身智能第一梯队——
更是国产具身大脑赛道的头号玩家。
没有大脑的本体,就只是一具躯壳
具身智能正在经历一场剧变。
过去两年,行业热闹非凡。市场的喜好出奇统一,只要哪家公司的机器人能上台翻个跟头、跳段舞,展台瞬间就会被围得水泄不通。
包括春晚也是一群机器人在上面热热闹闹地跳舞。
本体形态是否酷炫、关节是否灵活、运控是否流畅……这些最「前端」的指标,抢走了所有聚光灯。
然而,自去年年中开始,一个更尖锐的问题开始反复出现:
机器人到底啥时候能进厂干活??到底有什么价值?
风向,开始不可逆地转变了。
到了今年年初,这股「务实主义」的风,同样刮到了资本市场的最前沿。
相比本体和小脑,以Skild AI、Sunday、Generalist等一批专攻智能上限的大脑玩家,开始成为新的资本宠儿。
资本市场的嗅觉永远是最灵敏的。
当顶级基金集体掉头转向,便释放了一个清晰的信号:单纯或重点比拼本体硬件和底层运动控制(小脑)的竞赛,或许已经基本结束了。
下半场的胜负手,是大脑。
而这个大脑要解决的,正是具身智能必须跨越的下一个阶段——
真干活,而不是披着干活外衣的表演。
这同样也是它石对其大脑的期许:能干活的具身通用大模型,
那么,它石的大脑,到底长什么样?
答案是:AWE 3.0,全称AI World Engine,即「AI世界引擎」。

是的,不是VLA,也不是3D资产生成模型。
这是一个从底层架构就统一了感知、决策与行动的原生具身大模型,并搭配了全球首个视触觉世界模型OmniVTA。
视觉、语言、动作,三种模态天然对齐,训练时可以在任意模态之间互相转换——
「视觉」到「视觉」就是视频预测,「视觉-语言」到「动作」就是端到端,「视觉-语言」到「视觉-动作」就是世界模型。
更直观一点来说,这个模型拥有一项叫Faliure Recovery(自我纠错)的能力。
面对柔性操作中层出不穷的突发状况,模型不再简单模仿动作轨迹,而是在隐空间里持续推演未来的多种可能,再据此做出决策。
当插接的力度或角度出现异常,机器人会主动把线拔出来,换个角度再试一次。
正如人类的做法一样。
对于真实工业场景而言,这是一个象征着应用成熟度的关键信号:
「机器人会反思了」。
这大概是2026年具身大脑浮出水面后,为行业送上的第一份厚礼。
更关键的是,这一切的实现没有用到一秒钟的遥操数据。
长期以来,关于具身训练数据,行业有个共识:遥操数据精度最高 。
它石却觉得,这个结论完全站不住脚。
遥操作根本干不了亚毫米级的事。
在此前与量子位的对话中,它石首席科学家丁文超直言,在对精度有极高要求的场景下,人工遥操过程中的犹豫、抖动,反而会变成训练数据中的「噪声」。
这也是它石反复强调Human-centric的真正原因。
线束这个场景实在太恐怖了。孔位极窄,容错性非常低。
但人能完成这个任务。
虽然不能百分百零偏差,但人的纠错能力极强,所以可以在操作中感受阻力并据此迅速调整角度和力度。
从第一性原理出发,丁文超指出,想要习得这种局部微调的能力,唯一的方式就是从真人身上采集数据。
如今,这个想法已完全落地,并且凝练成一整套以人为本的数据采集套件——SenseHub。

仅需一双轻便的数采手套,加上一枚第一视角摄像头,佩戴即开工。劳动者在日常作业中,便能顺手完成数据采集。
回过头来看它石的布局,逻辑就非常清晰了:
数据-本体-模型全栈自研,不是为了生态,而是遵循「第一性原理」设计出来的。
在行业蛮荒期,技术路线尚未收敛,既无标杆案例,亦无成熟的横向分工。
而产业的每个变量又都会直接影响大脑能力。
所以必须有一定程度的完美主义,全栈自研,抓紧每个细节。
这是从第一性原理推导出的必然。
全栈大脑这个概念,最有魅力的地方也在于此。
做大脑的每家公司都在围绕自身的哲学思考,从数据-本体-模型三个维度全线出发,将各自的信念极致化。
这注定是一场极为精彩,同时也极为残酷的淘汰赛。
吉尼斯纪录背后,是落地的领先
具身大脑这条赛道上,所有玩家,无论从哪条路径出发,最终都会不可避免地交叉在一起。
因为这场比赛,大家都是奔着泛化去的。
真实世界是混沌且极度复杂的。如果一个机器人只能像复读机一样执行预设的单一脚本,那它与传统自动化产线上的机械臂并无本质区别。
LLM让人兴奋的原因正是如此,我们第一次拥有了具备泛化可能的智能。
虽然它在特定单一任务上可能不如硬编码的脚本极致,但真实世界中那些无法用脚本逻辑描述的种种长尾任务,必须依靠智能的「涌现」来解决。
但这也意味着——赢家通吃。
具身智能之所以被视为下一个万亿级赛道,其核心前提正是泛化能力、跨场景复制能力以及成本可控的规模化能力。
而它石智航从成立的第一天起,所有的战略重心都在为这个前提做准备,所以他们选择了线束。
线束装配,工业自动化界的「哥德巴赫猜想」。长程操作、柔性操作、亚毫米精度,「不可能三角」全部集齐于此……堪称「地狱」级别的工厂场景。
它石选择这个高价值x高难度场景作为交卷的技术,本身就极具深意。
大多数具身智能公司在选择落地场景时,往往会遵循「易落地、快见效」的路径,比如叠毛巾、搬箱子、摆货架。
这些任务实打实存在着海量需求,同时对精度的要求也没那么恐怖。
但它石,偏要反其道而行之。要打,就打最难的仗。
对此,丁文超曾表示:
没有Plan B。
毕竟,如果连最柔软、最易变形的线束都能实现精准装配,那么工厂里其他那些常规装配任务,则无异于降维打击。
而事实证明,它石不仅做到了,更是直接把这个场景彻底「打爆」——
1小时内,完成百余次亚毫米级柔性线束完整装配任务,一举刷新吉尼斯世界纪录。

甚至,还在高速装配的过程中,保证了拟人的「观赏性」。
在它石发起的业内首个「机器人柔性操作图灵测试」,超过50%的投票者竟然分不清:究竟哪个是机器人。

其中,Human-centric的重要性不言而喻。
这种数据采集方式,天然具备全场景覆盖的基因。因为它捕捉的是人在真实环境中的工作流,不再受限于特定硬件或封闭的数采中心。
这意味着,AWE 3.0从诞生之初,便是具备跨场景迁移潜力的。
在它石看来,模型层的过拟合只是技术瑕疵,但方法论的过拟合是致命的。
因此,从成立第一天开始,它石就拒绝了走捷径,全力押注Human-centric这条路。
一年过去,它石曾经许诺的BP现在正一一化为现实,并且他们仍然在坚持最初的理念。
在AI这个技术日新月异的赛道,敢于「不变」,或许比「求变」需要更大的定力。
如今,这份对初心的坚守终于迎来了回响。它石智航凭借线束场景一战成名。
但事实上,聚光灯之外,它石智航从创立之初便同步启动了工厂、物流、仓储、洗衣房、酒店等多场景的数据采集。
从一开始,它石就是奔着泛化去的。
目前,它石已手握超十万小时Human-centric数据,并正式发起「具身数据星火计划」,并邀请生态伙伴共建产业级数据共享生态,直指1亿小时级别的数据共享。
而基于这些可迁移的训练数据,它石内部已有多个落地场景在并发推进,蓄势待发。
一颗足够优秀的大脑,能够填平从工业到家庭的泛化鸿沟。
这,正是具身智能从实验室走向千行百业的关键。
资本下半场风向标:大脑强,则具身强
具身智能,正在从「百花齐放」的喧嚣,走向百川归海。
踏入2026年,资本不再普降甘霖,而是开始精准滴灌。
而滴灌的靶心,正是全栈布局、大脑为核的公司——这个粮草先行、兵家必争的战略高地。
没有大脑的本体公司,本质上是一具精致的躯壳,只能等待别人来注入灵魂,上限从一开始就被锁死了;
而不做本体的纯算法团队,无法打通数据反馈的商业闭环,最终就会沦为技术外包商。
在残酷的淘汰赛里,技术收敛后,市场只会需要第一名。
这也是垂直整合在这个行业早期的必要性所在。想把技术做到极致,唯一的解法,只有把变量全部握在自己手里。
核心零部件和硬件供应链固然会有专业化分工,但整个产业的定价权与标准制定权,必将向拥有「最强大脑」的全栈企业高度集中。
赢家,一定是全栈大脑公司。
高瓴与红杉的联手押注,正是对这一终局判断最有力的印证。
对于长期主义机构而言,不怕投得晚,但一旦押注,就说明对其已经有了笃定的未来画像。
这也是两家顶级机构经历了对它石超过一年的跟踪深度调研后,最终决定联合出手的原因。
因为具身大脑,就是那个正在逐渐收敛的确定性。
而在这条新赛道上,它石无疑是当下最具竞争力的头号玩家之一。
4.55亿美金,是资本对这个终局判断的抢先投票。
在下半场,全栈大脑会成为具身智能下一阶段竞赛的胜负手。
枪响了。

Jay