
李飞飞再出手,空间智能的ImageNet来了
ImageNet之后,李飞飞再出手!李飞飞团队最新发布ESI-Bench——一个专门用来评测具身空间智能的新基准。过去的空间智能评测默认给模型最优观测,而ESI-Bench第一个把观察者变成行动者,闭合了感知-行动回路。它为具身空间智能领域提供了一个系统性的评测框架,覆盖人类核心空间认知能力的四大维度。论文的核心结论是:现在的AI看图很厉害,但离「会动、会摸、会主动找答案」的空间智能还差得远ESI
共找到 17 篇相关文章

ImageNet之后,李飞飞再出手!李飞飞团队最新发布ESI-Bench——一个专门用来评测具身空间智能的新基准。过去的空间智能评测默认给模型最优观测,而ESI-Bench第一个把观察者变成行动者,闭合了感知-行动回路。它为具身空间智能领域提供了一个系统性的评测框架,覆盖人类核心空间认知能力的四大维度。论文的核心结论是:现在的AI看图很厉害,但离「会动、会摸、会主动找答案」的空间智能还差得远ESI


新智元报道【新智元导读】5 月 19 日,OpenAI 联合创始人、「Vibe Coding」之父 Andrej Karpathy 宣布加入 Anthropic 预训练团队。他将组建新团队,用 Claude 加速预训练研究。一个做过Hinton和李飞飞学生、奥特曼同事、马斯克直属下属的人,为什么甘愿做 Dario Amodei 的「-2」?Anthropic 又为什么非要招他?5 月 19 日晚上


美国的人工智能社交游戏平台Astrocade近日完成了总额达5600万美元的A轮和B轮融资,其中红杉资本领投了B轮融资,而A轮融资则由Sea Capital主导投资,同时英伟达和谷歌AI Futures Fund等机构也参与了此次融资。传统的游戏开发通常需要一个团队来共同完成编程、美术设计及策划工作。相比之下,Astrocade的特点在于其“自然语言生成游戏”的功能——用户只需简单描述想法,比如“

李飞飞最近又获得了一笔巨额投资——5600万美元。这次融资并非来自她与世界模型相关的World Labs项目,而是她的另一项创业成果:一家名为Astrocade的AI游戏公司。对这个名字你或许感到陌生。我的第一反应是:“飞飞老师什么时候还涉足了游戏行业?”经过一番了解后发现,Astrocade的目标其实相当“传统”:用户无需编写任何代码,只需用自然语言描述想要的游戏类型,在几分钟内就能体验到成品。


近期,全球模型领域异常活跃。阿里巴巴紧随其后推出名为「快乐生蚝」的世界模型,而在此之前,李飞飞创立的空间智能独角兽 World Labs 已经发布了他们的新版本 Spark 2.0。同时,Physical Intelligence 公司也推出了具有初步组合式泛化能力和跨机器人平台迁移特性的 π 0.7 模型。这些行动表明,业界的竞争焦点已经从单一动作转向了预测世界和驱动行动的统一模型。在这一关键时

当前的AI领域,“世界模型”是一个炙手可热的话题。无论是李飞飞,还是杨立昆,抑或是英伟达,都在谈论这一概念。然而,尽管它们都使用“世界模型”这个词,所指的内容却大相径庭。英伟达的目标是构建可以批量生成物理环境的模拟基础设施;李飞飞则致力于让机器理解三维空间和物体之间的关系,推动所谓的空间智能的发展;杨立昆追求的是进行因果推理及长期规划的认知架构设计。因此,“世界模型”并非单一的技术路径。如果不了解

复旦大学迎来了一位重要的学者——苏昊,这位曾在美国长期工作的教授回到中国任教。 克雷西 2026-04-17 10:16:36 量子位

近日,一家公司宣布其在空间智能领域的重大进展,标志着该领域进入了一个新的阶段。 Jay 2026-04-17 11:30:27 量子位

量子位公众号QbitAI报道,李飞飞的公司World Labs最近发布了Marble模型的更新版Marble 1.1及Marble 1.1-Plus。在新版本发布后不久,该公司又宣布开源了3D高斯溅射渲染引擎Spark 2.0。Spark 2.0是一个基于Three.js构建的渲染平台,能够实现大规模3D场景流畅加载和跨设备展示。用户可以通过WebGL2技术,在桌面、iOS、Android和VR等

目前,生成一个互动性的三维空间已经不再是新鲜事了,但如何将庞大的虚拟世界嵌入到普通用户的手机浏览器中却是个挑战。最近,李飞飞领导的人工智能公司 World Labs 推出了他们的最新成果 Spark 2.0,并将其开放源代码。这款专门为网页设计的动态三维高斯点云(3DGS)渲染引擎,能够让任何设备上的浏览器流畅运行上亿粒子的大规模三维场景,这在以前是难以想象的。把如此庞大的三维世界塞进手机里为什么

昨日,阿里巴巴内部发布了一封信件,宣布了一系列涉及AI业务的人事调整,其中李飞飞被任命为阿里云的新任CTO。这里的主角并非那位出自斯坦福的知名女性人工智能专家,而是目前担任阿里集团副总裁,并领导着达摩院数据库部门的重要人物。如果提及的是后者,则这篇文章可能会讨论World Lab的最新进展。说句玩笑话,在此次调整中,最引人注目的是原CTO周靖人的职位变动及李飞飞接任这一职务的事实。除此之外,阿里巴

梦瑶 发自 凹非寺李飞飞团队再次推出了世界模型的新成果。这次他们一口气发布了Marble 1.1和Marble 1.1-Plus两个新版本的模型。其中最引人注目的是,只需几分钟就能将真实场景转换成逼真的三维空间。比如说,用户可以拍摄多角度的照片并输入到系统中,便能够生成一个完整的虚拟现实房间环境。即使只有一张普通照片,模型也能扩展出一个广阔的3D世界,效果仿佛佩戴了VR设备一般。除此之外,这两款新

World Labs 又发布了新的模型版本。此次发布的两款新模型分别为 Marble 1.1 和 Marble 1.1-Plus。其中,Marble 1.1 在照明效果、对比度以及整体视觉一致性方面有了显著改善;而 Marble 1.1-Plus 则是专为大规模场景设计的新版本,能够生成更大更复杂的虚拟世界环境。用户可以通过体验链接 marble.worldlabs.ai 进行尝试。李飞飞在社交媒

机器之心编辑部在人工智能时代,我们已经习惯了通过说话来解决各种问题:无论是请求一个表格还是完成复杂的任务,只要用语言说明清楚目标和限制条件,“小龙虾”就可以自动执行。现在,只需掌握语言技能就能操作越来越复杂的技术系统。大模型之所以能够迅速融入各个行业领域,关键在于它们建立在一个成熟且广泛使用的文本接口之上。但是,当问题涉及到空间时情况就变得不那么简单了。例如,如果要修改一个房间的布局或让机器人在新