近日,一家公司宣布其在空间智能领域的重大进展,标志着该领域进入了一个新的阶段。
该公司成功上市,并因其在这一新兴技术上的突破而备受瞩目。
在这个新时代的背景下,这家公司成为了一个重要的里程碑。
这种技术的发展有望彻底改变我们对物理世界的认知与互动方式。
例如,李飞飞教授近期撰写的一篇文章就详细描绘了空间智能的未来前景。
其中提到的一个方面是创造力的解放。

空间设计软件已经非常成熟,可以将一张照片转化为三维场景,并支持实时修改和调整。

这种能力正迅速扩展到其他行业领域。
今年早些时候,李飞飞教授在文章中概述了空间智能时代的两个令人兴奋的发展方向。
当虚拟与现实之间的鸿沟缩小时,空间智能将为机器人创造一个理想的训练环境。
空间智能。

这意味着数据不再是限制因素,从而推动了具身智能的发展。
通过这种方式,机器人可以迅速进入各种行业,承担起许多重复性和危险性较高的任务。
同样地,在科研、医疗等领域中,空间智能也展现出了巨大的潜力。
在中国,深厚的制造业基础和广泛的应用场景为这一技术提供了丰富的土壤。

这家公司董事长曾表示:“硅谷更倾向于虚拟世界的研究与发展,而中国则更加贴近物理世界的实际需求。”
该公司始终坚持将自身的技术应用于现实生活中,并致力于将其转化为可计算、编辑及复用的实体对象。
在未来,随着空间智能技术的发展,所有终端设备都有可能成为感知入口。
目前,这家公司已经成功开发出了一套强大的三维数据生成系统。
这一系统的建立离不开该公司多年来在物理世界模拟领域的深耕细作。
它们还构建了空间语言模型SpatialLM和空间生成模型SpatialGen两大核心技术平台。
通过这些技术,AI能够更准确地理解并重塑现实世界。
随着市场对其估值的不断提升,该公司已经从简单的软件服务转型为热门的人工智能基础设施提供商之一。
展望未来,空间智能将扮演越来越重要的角色,在物理与数字世界的融合中发挥关键作用。
这正是世界模型爆火的原因——拒绝让AI当一个对现实世界毫无认知能力的天才。
但怎么让AI认知世界?目前主要分两大流派。
第一派:视频生成路线。
以Sora(可惜已经要没了)、Genie为代表,这派不追求物理细节,旨在让AI生成一个「能动起来的世界」。
但这派有个致命的阿喀琉斯之踵:
它画出了世界的「皮囊」,却缺少有血有肉的「骨架」。
你让Sora生成一个客厅的视频,装修和光影可能极其逼真。
但如果你问它:那张茶几离沙发到底多远?能边看电视边吃饭吗?
它答不上来。
因为它只是学到了像素组合的概率分布,从未真正理解:究竟什么是三维空间?
而这,正是第二派——空间智能想做的事。
未来必将是属于具身智能的。
而AI想要从虚拟走向物理,就必须能认知真实世界的空间关系。
物体在哪里?空间几何关系是什么?物体之间如何相互影响?
这些都不是虚拟画面能表述的,必须要对物理世界进行刻画后重建。
举个例子,一个机器人要开门,一般分两步:
- 大脑思考:根据现有输入推演未来,然后规划动作;
- 小脑执行:走到门前,抓住把手,推门而入。
但这有一个前提——
你得先知道那是门,门上有把手,把手是用来开门的。
这也是为什么,李飞飞选择将空间智能作为继ImageNet后的下一个方向:
如果没有空间智能,AGI是不完整的。
空间智能要做的,正是为AI填补上这部分智能板块的空缺。
以李飞飞World Labs为例,旗下世界模型Marble,能做到仅凭一张照片,重建出完整的3D场景结构。
你问它图里沙发的长宽高,它能回答长1.9米×宽0.9米×高0.85米,还能输出3D网格文件。
这些不是像素,而是真正的空间信息。

短短一年半,World Labs估值飙升5倍至50亿美元。
市场的火热,正在印证一项共识:
真正的世界模型,必须建立在物理正确的三维空间之上。
而在这项地基上,有一家公司,已经盖了15年的楼——
群核科技。
事实上,从创业第一天起,他们就在用GPU模拟物理世界。
渲染,本质上是把三维结构化信息变成图像;
而空间智能,恰好是这个过程的逆运算,即把真实的图片和视频变回三维世界的结构化数据。
这意味着什么?
意味着群核15年来积累的一项项技术,突然得到了一个集中爆发的机会。
空间智能,间接决定着AI的下一代形态。
而群核,恰好占据了这条新赛道最有利的出发位置。
为什么是群核科技?
认定空间智能是正确方向的公司不少,但真正跑通商业闭环的,凤毛麟角。
「首个登陆港股的杭州六小龙」,这个头衔能花落群核科技,或许也来自下面这份成绩单:
2025年,全年营收8.20亿元,毛利率高达82.2%。

在普遍烧钱的AI赛道,群核凭什么能交出这样一份财报?
归根结底,群核科技的护城河,建立在三个极难复制的维度上:数据、模型、飞轮。
先说数据。这是空间智能领域最大的卡脖子问题。
如果说坐拥海量文本数据的LLM,是被互联网「祝福」的天选之子;那么世界模型,简直就是天崩开局。
毕竟,互联网上的空间数据,基本是一片荒漠。
即便AR眼镜等穿戴设备普及,也未必能填平这道鸿沟。采集三维数据只是第一步,想要用于训练,还得经过极其复杂的标注过程。
更令人绝望的是,空间智能所需的数据太复杂了。
质量、摩擦力这些只是最低要求。现实世界的变量太多了:线束会变形,塑料遇热会变软、气候潮湿木材会膨胀……
这是个无底洞,几乎穷尽不了。
所以空间智能这个游戏,不是谁都玩得起。纯靠冷启动,非常难。
最好的情况,是你本来就拥有一个足够庞大、精确的三维数据基座。
群核的优势,恰恰就在这里。
公司成立之初并没有想到要为空间智能沉淀资产,却在业务探索过程中,不经意间做成了这件事。
2013年,群核推出了酷家乐,从用户侧来看是个设计软件工具,但它的意义远不止产品功能本身。
它本质上是一套将物理世界数字化的强大工具,包括在家居、商业、工业场景的空间进行模拟。
在这个过程中,它沉淀下了海量「物理正确」的三维数据——
这些,并非互联网上的像素。
每一面墙都有厚度、每一束光都会正确反射、每一种材质都标注了物理参数的结构化三维数据。
十余年过去,围绕酷家乐这一平台,群核已经沉淀了超过5亿个3D场景、4.8亿个3D模型及空间设计元素。
这,是群核在现实世界中,花了15年的时间,一点点堆出来的壁垒。
这些高质量数据,也正是AI理解并走进物理世界的坚实基础。
因此,随着AI时代的浪潮席卷而来,这些沉淀已久的数据资产,自然而然化作了群核科技坚实的两大模型底座:
1、空间语言模型SpatialLM。
致力于推动AI从「理解文本」向「理解空间」的进化,赋予AI读懂三维世界的「空间语言」能力。
一经推出,便与DeepSeek-V3、Qwen2.5-Omni共同登上HuggingFace榜单前三。

2、空间生成模型SpatialGen。
与李飞飞团队的Marble颇为相似,同样是一个3D世界生成模型。可根据文字描述、参考图像和3D空间布局,生成具有时空一致性的多视角图像。
但值得注意的是,关于空间生成这件事,群核与World Labs其实分野还挺大。
相比于LeCun的JEPA(一种隐式世界模型),Marble最大的优势在于其可视化,其世界是看得到、摸得着的。这极大地拓宽了应用场景,因此深受游戏开发从业者的青睐。
但AI是一个智能水平如竹林般参差不齐的「天才国度」,而游戏、动漫这些完全虚拟的「像素游戏」,恰好是LLM最擅长的领域。
这片大陆的水位线正在汹涌上涨,纯虚拟世界的内容,很快会被吞没。
只有物理世界,是AI洪水之中,最坚固的那条诺亚方舟。
而群核在进行空间智能研发时,更侧重于现实世界的重建与模拟,而非执着于虚拟环境的生成。
相比于赏心悦目的虚拟表象,他们更看重结构参数等物理信息的精准与正确。
一张照片,一句Prompt,就能得到一个可漫游的高保真3D小世界。开发者和企业可以通过API和SDK自由调取这些能力,用在具身智能训练、影视制作、电商棚拍等各种场景中。

这一过程的核心,是群核科技所构建的四大空间能力:空间重建、空间生成、空间编辑与空间理解。
这四大能力,正是群核科技得以成为连接物理世界与数字世界的关键桥梁。它们共同构成了群核打造物理世界数字底座的坚实基石。让AI不仅能理解世界,更能重建、生成乃至编辑重构世界。
过程中,这些丰富的应用场景,又会帮助群核摄取到更前沿、更多元的真实世界数据,最终再次推动商业化。
这也是群核能够继大模型厂商之后,再次作为一项热门AI标的,在港股受到追捧的重要原因。
市场对其的估值,早已不是简单SaaS软件的逻辑。
从长远来看,空间智能这项业务,会从简单的「铲子」,成为下一代AI的全新基础设施。
实话说,这条路径,不禁让人联想到英伟达。
事实上,深度学习的火种早在2012年就已点燃,但彼时的英伟达并未因此立刻腾飞。
是游戏玩家对极致画质的追求,为GPU带来了第一批订单;2017年突如其来的算力需求,又意外输入了一笔现金。
正是这些看似「不务正业」的业务,让英伟达在动荡的技术周期中,还能一路All in AI。
直到ChatGPT发布,多年的坚守与投入终于得到回报,铲子提供商蜕变为全球AI的基础设施,市值扶摇直上万亿美元。
今天的群核,某种程度上,正如2012年的英伟达。
耕耘十余年后,他们也终于找到了,那个与自己技术基因完美契合的终局——
空间智能。
空间智能时代,刚刚开始
终局归终局,日子还得一天天过。
当下的空间智能,究竟能干什么?答案是:可能比你想象中丰富得多。
最直观的一层,是对现实世界的重建和改造。
空间设计的应用已经很成熟了。
一张照片丢进去,便能生成完整3D场景,而且支持实时修改。
与此同时,这种能力正在迅速溢出到其他行业。
今年年初,李飞飞曾写过一篇长文,为我们描绘了空间智能时代下的两个兴奋未来。
其一,是创造力的彻底解放。
创作门槛被进一步拉低。不光是剪辑、特效这些后期能自动化,很多以前必须在现实里干的活儿,技术也能覆盖了。
不管是拍电影的、做短剧的,还是做游戏的,都能用空间智能把自己脑子里的世界观搭出来。
随心所欲去创作,再也不用担心预算。
只要故事足够好,人人都能做出像《星际穿越》这样的大作。至少内容的质量,不会再因「资源不够」这种非创作变量受影响。
其二,则是当下炙手可热的具身智能。
当Sim2Real的鸿沟足够小,空间智能赋能世界模型,成为最完美的机器人「训练场」。
届时,被「祝福」的将不再只有LLM,空间智能会为机器人创造出独属于它们的「互联网」,数据量大管饱。
当数据不再成为瓶颈,具身智能便会正式进入Scaling。激烈的竞争,会让机器人以最快速度落地千行百业。
它们将真正代替人类,去完成那些无聊、危险的工作,而不再仅仅是跳舞翻跟头。
除此之外,在科研探索、医疗诊断等更多领域,空间智能无疑也将大显身手。
听起来零散,但李飞飞所描绘的这些未来,其实都在指向同一件事:
空间智能,正在把物理世界变成可以被计算、被编辑、被复用的对象。
而物理世界,一直是中国的优势战场。
群核科技董事长黄晓煌曾说:
硅谷更贴近虚拟世界,中国更贴近物理世界。
中国有庞大的制造业基础、海量应用场景,工程师文化相当浓厚。
很多能力,是从真实需求里长出来的,不是先讲故事再找落地。
群核本身,便是一个鲜活的注脚——
不用世界模型做虚拟内容生成,始终扎根于现实,始终与物理世界站在一起。
物理世界中的真实体验,各种细节至微的context,是AIGC无法直接替代的,只能通过数字化手段去尽可能复刻。
而只要物理世界还存在,只要它仍需被数字化,空间智能会发挥巨大价值。
眼镜、汽车、手表……空间智能正在让所有终端变成感知入口,人和机器的交互不再局限于屏幕。
试想,如果摄像头也拥有智能,当发现人群中有人身体不适,它或许便能自动发送求助。
听起来或许有点扯,但回想十多年前,用GPU做云端渲染,不也被当成天方夜谭吗?
空间智能的时代,才刚刚开始。
而在这条赛道上,深耕物理世界模拟15年的群核科技,已经提前跑出了一段距离。

Jay