SAIR Foundation 正式开启“数学蒸馏挑战赛”,标志着 AI 数学推理的新时代
“数学虽然无形,却遍布于我们的生活中。”
—— 菲尔兹奖获得者,SAIR Foundation 创始人陶哲轩
“数学与人工智能的结合,有可能成为人类迈向通用人工智能(AGI)和超级人工智能(ASI)的关键一步。”
—— SAIR Foundation

在2026年3月14日“国际数学日”当天,全球最早迎来“圆周率时刻”之际,SAIR Foundation 宣布启动首届数学蒸馏挑战赛。

这是一项旨在突破 AI 逻辑局限性,重新定义机器推理边界的顶尖赛事。比赛由陶哲轩教授、宾夕法尼亚大学的 Damek Davis 教授以及 SAIR Foundation 联合发起。对有兴趣参赛的科学爱好者,可以通过 SAIR Foundation 官网了解详情并报名,报名截止日期为2026年4月20日。
赛事愿景:从关注结果到理解过程
人工智能在处理复杂逻辑时常常遇到“幻觉”问题,这也是未来 AI 在科研和生活应用中必须解决的难题。在比赛启动时,陶哲轩强调,数学的价值在于找到答案的过程,而不仅仅在于结果本身。
陶哲轩指出:“即使顶尖的 AI 能够给出答案,我们更希望它们能够展示出解决问题的逻辑路径。”
本次比赛的核心问题非常直接而深刻:能否让 AI 更可靠地进行数学推理,而不仅仅是提供答案。
核心挑战:2200万道题与“一张 A4 纸”的极限考验
本次试点挑战聚焦于等式理论,设计了一场跨越模型能力差距的实验:
• 极致数据: 比赛提供了2200万道代数逻辑判断题。
• 能力跨越: 目前的顶级模型在解决难题时可以达到95%的准确率,而开源的“弱模型”则几乎只能随机猜测。
• 挑战目标: 参赛者需要编写一份“策略指南”,陶哲轩等评审专家期望看到参赛者如何巧妙地将整个代数领域的知识浓缩到一张 A4 纸上,帮助弱模型实现显著的推理能力提升。
比赛流程:从策略到 Lean 证明
挑战赛分为两个阶段:
1. 第一阶段:策略与直觉(即日起 – 4月20日)
参赛者可以在官方提供的“沙盒”环境中测试策略,目标是看“策略指南”能多大程度上提升弱模型的准确性。
2. 第二阶段:验证与证明(4月下旬)
顶尖团队将进入决赛,挑战包括提供明确的反例或使用 Lean 定理证明器提交形式化证明的任务,彻底消除逻辑上的不确定性。
开放合作:邀请全球学者和数学爱好者共同推动未来赛事的发展
SAIR Foundation 表示,欢迎数学及相关领域的科学家和 AI 从业者参与,同时也欢迎更多科学爱好者加入。在 AI 时代,每个人都有机会深入科研。
SAIR Foundation 的相关负责人指出,这不仅是一场竞赛,更是一次全球范围内的科研合作机会。比赛产生的数据将向全球研究社区开放,以加速数学与人工智能交叉领域的进步。
SAIR Foundation 特别向全球数学爱好者发出邀请:“我们诚挚地欢迎全球的学者、研究机构和数学爱好者加入我们。我们期待大家不仅作为参赛者,更作为合作伙伴,共同策划和举办未来挑战赛。通过构建这种开放、透明、可复现的竞赛框架,我们可以汇聚全球智慧,共同攻克数学与 AI 交叉领域的基础难题。”
-此文系量子位授权转载,观点为原作者所有-

量子位的朋友们