
香港科技大学(广州)开创单眼开放式词汇占位预测技术 新里程碑
在具身智能的研究领域中,让机器人能够精确理解周围环境的几何结构与开放语义信息始终是一项关键挑战。近年来,研究人员通过三维体素网格整合稠密几何和语义数据来构建3D语义占据地图,为机器人的空间推理、导航及互动提供了重要依据。然而,现有的方法大多基于封闭词汇设定,这限制了模型只能识别预先定义的有限类别。在真实环境中,用户可能会询问关于「鞋子」、「纸巾」或「遥控器」等未定义物体的位置信息。对于这些更细粒度
科技1 阅读
共找到 1 篇相关文章

在具身智能的研究领域中,让机器人能够精确理解周围环境的几何结构与开放语义信息始终是一项关键挑战。近年来,研究人员通过三维体素网格整合稠密几何和语义数据来构建3D语义占据地图,为机器人的空间推理、导航及互动提供了重要依据。然而,现有的方法大多基于封闭词汇设定,这限制了模型只能识别预先定义的有限类别。在真实环境中,用户可能会询问关于「鞋子」、「纸巾」或「遥控器」等未定义物体的位置信息。对于这些更细粒度