
谷歌造出AI数学家,48%碾压全场!牛津教授用它破解60年未解之谜
新智元报道【新智元导读】谷歌DeepMind今日官宣推出「AI co-mathematician」多智能体系统,在FrontierMath Tier 4自主模式下斩获48%正确率。牛津教授借助该系统攻克Kourovka Notebook长期开放问题,AI进化为数学家的真正研究搭档。人类数学家,终于等来了自己的「超级队友」!就在刚刚,谷歌云首席科学家、DeepMind研究副总裁Pushmeet Ko
共找到 7 篇相关文章

新智元报道【新智元导读】谷歌DeepMind今日官宣推出「AI co-mathematician」多智能体系统,在FrontierMath Tier 4自主模式下斩获48%正确率。牛津教授借助该系统攻克Kourovka Notebook长期开放问题,AI进化为数学家的真正研究搭档。人类数学家,终于等来了自己的「超级队友」!就在刚刚,谷歌云首席科学家、DeepMind研究副总裁Pushmeet Ko

据中国网信网消息,国家网信办、国家发展改革委、工业和信息化部近日联合印发《智能体规范应用与创新发展实施意见》(简称《实施意见》)。其中提到要研究智能体数据安全、个人信息保护、密码防护、攻击检测、权限管理、行为控制等安全技术,提升智能体系统安全保障能力,防范数据投毒、隐私泄露、算法篡改、系统漏洞、运行失控等安全风险,探索建立智能体安全评估体系。智能体带来隐私泄露等安全风险智能体是具备自主感知、记忆、

一篇论文已被 ACL 2026 收录,主要作者来自上海交通大学自动化与感知学院 IWIN 中心团队。该团队的负责人是关新平教授,导师包括陈彩莲教授和乐心怡教授,南洋理工大学陶大程教授亦有参与合作。其他研究人员则分别来自腾讯、上海人工智能实验室以及香港中文大学等机构。论文的第一作者王骥泽为该校博士生,专注于大型模型智能体的研究。在最近几年里,随着大语言模型的进步,从单一模型的性能提升逐渐转向多个模型

4月21日,萤石在杭州召开了一场名为“驭智·向前”的新品发布会,在会上发布了多款新产品,并宣布了品牌的使命更新为“运用安全的智能科技来共同创造美好生活”。AI CoreX是萤石首次推出的家用本地大模型主机,这款产品搭载了蓝海大模型2.0与Home Vita智能体系统,配备了24G+128G内存和64T算力,并支持全屋设备消息的整合、视频摘要生成以及自然语言检索功能。AI CoreX兼容萤石的所有系

最近两个月养龙虾的人可能会遇到几件烦心事:安装环境配置的困难、月底账单上的Token费用像滚雪球一样增加,以及每次授权时对数据安全性的担忧。这种情况并非偶然。自从OpenClaw兴起以来,整个行业一直未能解决这些难题。4月13日,荣耀在西安正式发布了自主研发的YOYO Claw龙虾技术(AI智能体系统),该技术将被应用于荣耀MagicBook系列轻薄笔记本电脑中,开创了养虾本的新类别,并声称能够一

大模型圈,变天了。2026年3月29日,一份名为FutureX的全球动态评测榜单刷新了成绩。北京中关村学院信息智能团队自主研发的智能体系统Milkyway,以60.9分的绝对优势霸榜!这个分数有多夸张?作为对比,由埃隆·马斯克(Elon Musk)旗下xAI打造、曾被寄予厚望的Grok-4,在这份榜单上仅拿到了25.9分。Milkyway的得分是它的一倍还多(Grok-4曾拿下该项目的首期冠军)。

近年来,基于大语言模型的多智能体系统(MAS)在复杂推理任务中得到了广泛应用。传统方法通常让多个独立生成决策的代理通过投票或辩论等方式进行聚合,从而提高算术、常识推断及专业问答等领域的准确率。当test-time compute成为常见的性能提升策略时,一个自然而然的问题随之产生:随着agent数量的增加,MAS是否能够持续增强其能力?直观上来看,这种想法似乎是合理的:类似ensemble或sel