
李飞飞再出手,空间智能的ImageNet来了
ImageNet之后,李飞飞再出手!李飞飞团队最新发布ESI-Bench——一个专门用来评测具身空间智能的新基准。过去的空间智能评测默认给模型最优观测,而ESI-Bench第一个把观察者变成行动者,闭合了感知-行动回路。它为具身空间智能领域提供了一个系统性的评测框架,覆盖人类核心空间认知能力的四大维度。论文的核心结论是:现在的AI看图很厉害,但离「会动、会摸、会主动找答案」的空间智能还差得远ESI
共找到 5 篇相关文章

ImageNet之后,李飞飞再出手!李飞飞团队最新发布ESI-Bench——一个专门用来评测具身空间智能的新基准。过去的空间智能评测默认给模型最优观测,而ESI-Bench第一个把观察者变成行动者,闭合了感知-行动回路。它为具身空间智能领域提供了一个系统性的评测框架,覆盖人类核心空间认知能力的四大维度。论文的核心结论是:现在的AI看图很厉害,但离「会动、会摸、会主动找答案」的空间智能还差得远ESI

硅谷一直擅长创造新词汇,并且同样迅速地放弃它们。去年,“vibe coding”这个词还被广泛提及,这是一种近乎即兴的编程方式:通过与模型对话来描述需求并快速生成代码。这种模式降低了软件生产的门槛,象征着一种轻快乐观的技术氛围。然而,在今年的 Sequoia Ascent 峰会上,AI 先驱 Andrej Karpathy(以下简称 AK)却提出了一个更具时代意义的观点:“我从未像现在这样感觉自己

新智元报道自从1946年成立以来,门萨——这个全球最古老的高智商社团——一直以严格的入会标准著称。如今,这一俱乐部即将迎来首个非人类成员:GPT-5.5 Pro。该模型在线文本的IQ测试中得分为130,在视觉IQ方面更是达到了惊人的145分,成功跨越了门萨智商门槛。这一成就标志着AI在认知能力上首次正式突破人类智力界限,打破了过去关于LLM无法达到这一水平的技术共识。一年前还普遍认为智能模型难以逾

新智元报道Anthropic的最新研究引发了一场关于AI与编程效率的大讨论,论文指出程序员依赖AI可能会导致认知能力下降。作为业界领先的编程辅助工具,Anthropic在年初发布了这份备受关注的研究报告,直接挑战了人们对于AI提高工作效率的看法。研究显示,尽管使用AI能略微加快任务完成速度,但其长期影响却令人担忧。论文地址:https://arxiv.org/abs/2601.20245数据表明,

凤凰网科技讯 3月31日,凤凰卫视在香港举办三十周年台庆的庆典,活动发布了多项重要合作。凤凰卫视执行副总裁兼运营总裁李奇与国内AI训练数据领域龙头企业——海天瑞声创始人、董事长贺琳出席仪式并交换文件,双方将携手深入挖掘海量音视频、文本及多语种、多模态内容,建设具备高知识密度和多元文化视角的高质量数据,为训练大模型逻辑推理、跨文化认知能力提供“黄金语料”。凤凰卫视三十周年台庆签约现场据凤凰卫视执行副