
李飞飞再出手,空间智能的ImageNet来了
ImageNet之后,李飞飞再出手!李飞飞团队最新发布ESI-Bench——一个专门用来评测具身空间智能的新基准。过去的空间智能评测默认给模型最优观测,而ESI-Bench第一个把观察者变成行动者,闭合了感知-行动回路。它为具身空间智能领域提供了一个系统性的评测框架,覆盖人类核心空间认知能力的四大维度。论文的核心结论是:现在的AI看图很厉害,但离「会动、会摸、会主动找答案」的空间智能还差得远ESI
共找到 15 篇相关文章

ImageNet之后,李飞飞再出手!李飞飞团队最新发布ESI-Bench——一个专门用来评测具身空间智能的新基准。过去的空间智能评测默认给模型最优观测,而ESI-Bench第一个把观察者变成行动者,闭合了感知-行动回路。它为具身空间智能领域提供了一个系统性的评测框架,覆盖人类核心空间认知能力的四大维度。论文的核心结论是:现在的AI看图很厉害,但离「会动、会摸、会主动找答案」的空间智能还差得远ESI


空间智能的“具身化”跃迁,高德ABot体系模型夺冠AGIBot全球挑战赛 量子位的朋友们 2026-05-09 17:37:02 量子位

最近,商汤科技联合创始人兼首席科学家林达华教授荣获了第四届中银香港科技创新奖(人工智能及机器人领域),以表彰他在科研创新和成果转化方面的杰出贡献。林达华教授在计算机视觉与多模态智能领域的系统性创新,在图像视频理解、大规模多模态模型以及空间智能等方面取得了许多突破,促进了关键核心技术的自主创新与开源生态建设,并推动了人工智能研究成果的应用,为中国的人工智能技术进步和产业升级作出了重要贡献。林达华教授

近期,全球模型领域异常活跃。阿里巴巴紧随其后推出名为「快乐生蚝」的世界模型,而在此之前,李飞飞创立的空间智能独角兽 World Labs 已经发布了他们的新版本 Spark 2.0。同时,Physical Intelligence 公司也推出了具有初步组合式泛化能力和跨机器人平台迁移特性的 π 0.7 模型。这些行动表明,业界的竞争焦点已经从单一动作转向了预测世界和驱动行动的统一模型。在这一关键时

4月18日,高德地图宣布推出首款动量机器人“途途”,这是该公司首次涉足机器狗产品领域。根据计划,“途途”将在明天(4月19日)在北京亦庄举办的机器人马拉松大赛上与伙伴们一同亮相,这也是它的首次公开演出。依据官方发布的消息,“途途”被定位为高德动量机器人,并融合了公司在地图、空间智能及定位导航技术方面的专长。这款机器狗很可能在移动感知、自主导航和环境识别等方面展现独特的技能。参加此类比赛的目的是为了

当前的AI领域,“世界模型”是一个炙手可热的话题。无论是李飞飞,还是杨立昆,抑或是英伟达,都在谈论这一概念。然而,尽管它们都使用“世界模型”这个词,所指的内容却大相径庭。英伟达的目标是构建可以批量生成物理环境的模拟基础设施;李飞飞则致力于让机器理解三维空间和物体之间的关系,推动所谓的空间智能的发展;杨立昆追求的是进行因果推理及长期规划的认知架构设计。因此,“世界模型”并非单一的技术路径。如果不了解

近日,一家公司宣布其在空间智能领域的重大进展,标志着该领域进入了一个新的阶段。 Jay 2026-04-17 11:30:27 量子位

摘要:群核科技作为“杭州六小龙”之一,即将在香港上市,并凭借B端订阅业务获得了近5700万元的调整后净利润,在众多AI初创企业中脱颖而出。在过去两年里,人工智能行业的主导趋势是大量投入资金。作者|路春锋无论是大型模型公司还是各种AI应用,它们都处于用户增长和商业变现之间的拉锯战。在所有AI公司都在烧钱的情况下,谁能最先找到盈利路径?答案并不属于那些专注大模型或聊天机器人的公司,而是一家看起来与传统

4月7日,京东探索研究院对外发布了其自主研发的JoyAI-Image-Edit图像处理模型,并宣布将其开源。此款模型是业界首个深度融合“空间智能”的开放源代码解决方案,它使人工智能技术能够理解和编辑三维空间,超越了以往仅限于平面修改的能力。开发者可以直接利用该模型创建各种应用。JoyAI-Image-Edit 模型全面模拟真实世界的空间结构规律,在多个方面进行了建模,包括视角一致性、相机感知和场景


群核科技,进入港股IPO最终冲刺阶段。3月29日,根据港交所信息,群核科技已经顺利通过港交所上市聆讯,来到上市前最后阶段。一旦顺利完成上市,群核科技将成为“空间智能第一股”,同时也将成为“杭州六小龙”中首家完成IPO的企业。群核科技成立于2011年,总部位于杭州,是一家以GPU集群和人工智能技术为核心的空间智能企业。公司由董事长黄晓煌陈航朱皓联合创立,旗下拥有酷家乐、Coohom、群核空间智能平台

香港科技大学HKUST视觉智能实验室的博士生唐家祺是本文的主要作者,他还与严莹莹、王乾宙、夏宇阳、耿博同和陈建民共同担任论文的共同第一作者。通讯作者包括香港科技大学的陈启峰教授和西北工业大学的魏巍教授。在我们日常生活中,比如查看手机地图上的实时交通状况,或是获取准确的台风路径预警,甚至监测农作物病虫害情况时,都离不开遥感技术的支持。然而,传统的遥感数据分析方式更像是单纯的信息采集,缺乏对信息的深入

机器之心编辑部近日,世界模型与空间智能前沿公司魔芯科技已完成 Pre-A + 轮近亿元融资。本轮融资由华为哈勃领投,老股东跟投。成立于 2021 年的魔芯科技从 3D AI 物体建模和制造出发,正逐步走向让 AI 具备对三维物理世界的生成、理解与交互能力。公司正持续推进空间表示学习、动态场景三维建模和基于世界模型的物理、动作模型等关键技术研发,并面向下游行业输出模型能力、平台与解决方案。科研突破:

近日,高德地图发布了全球首个基于大模型的“地标AI领航”系统。这一创新技术将千问大模型与海量地点信息和高清街景图片相结合,赋予导航系统识别视觉信号及理解人类语言的空间智能能力。它不仅提供传统的距离和方向指引,还能利用用户眼前的地标进行更为直观的引导,实现了真正的“见即导行”,有效解决了步行导航中常见的认知难题。 用户在使用传统导航时常常遇到三大问题:出发初期定位不清晰、对剩余路程无明确感知以及接