
谷歌造出AI数学家,48%碾压全场!牛津教授用它破解60年未解之谜
新智元报道【新智元导读】谷歌DeepMind今日官宣推出「AI co-mathematician」多智能体系统,在FrontierMath Tier 4自主模式下斩获48%正确率。牛津教授借助该系统攻克Kourovka Notebook长期开放问题,AI进化为数学家的真正研究搭档。人类数学家,终于等来了自己的「超级队友」!就在刚刚,谷歌云首席科学家、DeepMind研究副总裁Pushmeet Ko
科技2 阅读
共找到 3 篇相关文章

新智元报道【新智元导读】谷歌DeepMind今日官宣推出「AI co-mathematician」多智能体系统,在FrontierMath Tier 4自主模式下斩获48%正确率。牛津教授借助该系统攻克Kourovka Notebook长期开放问题,AI进化为数学家的真正研究搭档。人类数学家,终于等来了自己的「超级队友」!就在刚刚,谷歌云首席科学家、DeepMind研究副总裁Pushmeet Ko

一篇论文已被 ACL 2026 收录,主要作者来自上海交通大学自动化与感知学院 IWIN 中心团队。该团队的负责人是关新平教授,导师包括陈彩莲教授和乐心怡教授,南洋理工大学陶大程教授亦有参与合作。其他研究人员则分别来自腾讯、上海人工智能实验室以及香港中文大学等机构。论文的第一作者王骥泽为该校博士生,专注于大型模型智能体的研究。在最近几年里,随着大语言模型的进步,从单一模型的性能提升逐渐转向多个模型

近年来,基于大语言模型的多智能体系统(MAS)在复杂推理任务中得到了广泛应用。传统方法通常让多个独立生成决策的代理通过投票或辩论等方式进行聚合,从而提高算术、常识推断及专业问答等领域的准确率。当test-time compute成为常见的性能提升策略时,一个自然而然的问题随之产生:随着agent数量的增加,MAS是否能够持续增强其能力?直观上来看,这种想法似乎是合理的:类似ensemble或sel