
新智元报道
最近,Google Research团队使用Gemini Deep Think结合树搜索框架独立破解了一道著名的理论物理难题——宇宙弦引力辐射功率谱的精确解析解。
这一突破性进展引起了广泛关注。
谷歌于三月六日发表的一篇论文激起了巨大的反响。
Gemini Deep Think与树搜索算法相结合,成功解决了长期以来困扰科学家们的理论物理难题。
一个令人类顶级研究团队都束手无策的问题,被这套系统攻克了。

该研究成果极具创新性,为未来科学研究带来了新的启示和可能。
简言之,AI破解了一个长期未解的数学与物理学难题。
回忆起Claude曾协助高德纳解决图论猜想的消息,这次谷歌的研究成果则标志着AI在连续数学及理论物理领域的重大突破。
这两次事件分别代表了组合数学和数学物理领域内的成就,它们几乎同时发生,标志着2026年3月最具标志性的「AI科学家」事件之一。
AI正逐步渗透到人类最核心的智力活动之中。

宇宙弦理论是宇宙学中的一种假设性结构,认为其形成于早期宇宙相变过程中的一维拓扑缺陷。
这些一维缺陷在振动时会向外界辐射引力波。
由于脉冲星计时阵首次观测到了疑似由宇宙弦产生的引力波背景信号,理论物理学家对这一课题的兴趣空前高涨。
宇宙弦
要准确预测这些引力波的特性,需要解决一个复杂的数学积分问题。
具体来说,有一个核心积分I(N, α),描述了宇宙弦环第N谐波发出的辐射强度。

尽管看似简单,但由于被积函数在边界存在奇点,使得标准数值方法难以适用。
历史上,研究者只能得到大N时的渐近解或奇数N的部分结果。

精确统一的解析解一直未能找到,直到Gemini Deep Think介入。
AI解决了什么问题

Gemini Deep Think计算出了一种名为「宇宙弦」发出引力波的确切数学公式。在此之前,研究者们只能依靠数值近似方法进行估算。

为了实现这一突破,谷歌团队采用了一套精密的系统提示词和负向提示策略来确保AI能够探索多种解法路径,并最终发现了最优解。
这种人机协作模式不仅展示了人工智能与人类智慧结合的可能性,也揭示了未来的科研趋势。
格根鲍尔多项式是这次成功的关键。它们的权函数恰好消除了积分中的奇点问题,使整个过程变得优雅且简洁。
在推导过程中,AI还发现了量子场论中费曼参数化方法与宇宙弦引力波谱计算之间的深层联系,这是人类研究者未曾预料到的现象。
虽然初始解法是由机器生成的,但最终形式的确立则离不开一位科学家的手动干预。这体现了人机协作的独特价值。
在结论部分,谷歌团队强调了这一过程对于加速科学发现的重要性,并展示了AI系统在未来科学研究中的潜力。
虽然这个解决方案基于大量的尝试和失败,但它证明了通过精确评估标准和强大推理能力可以实现看似不可能的任务。
难道人类科学家的问题
被Gemini攻克了
这项成果预示着未来科研模式的转变——人类提出问题,机器探索结构,再由人类赋予最终的意义。
「神经符号系统」作为AI科学发现的基础架构正变得越来越重要。它不仅适用于宇宙弦的研究,在材料科学、量子化学等领域也有广泛的应用前景。
随着这项技术的发展和完善,我们有理由相信,AI将成为数学家、物理学家以及所有科学家不可或缺的伙伴。这或许只是一个开始。
该研究成果详见论文《宇宙弦引力辐射功率谱的精确解析解》(arXiv:2603.04735)。
Gemini Deep Think负责「大脑」:生成数学假设,进行符号推导,判断哪条路径「看起来优雅可行」。
它不是简单地暴力试验,而是被指示进行深度推理链,提前预判无穷级数展开时的收敛问题。

树搜索(Tree Search)负责「系统性探索」:把整个解题空间建成一棵大树。
每个节点代表一个数学中间表达式——用LaTeX写出来,同时配上自动生成的Python代码,让计算机去数值验证。

搜索策略采用了PUCT算法(置信上限树搜索),这和AlphaGo下棋的底层逻辑一脉相承——在「开采已有好路径」和「探索新可能」之间保持平衡。
自动数值反馈负责「质量控制」:每一步推导完成后,立刻用高精度数值计算去核验符号结果是否正确。如果对不上,这条路径直接砍掉。
这一步最为关键:每当模型提出一个中间步骤,系统就会自动执行对应的Python代码,与高精度数值基准进行比较。如果发现数值不稳定、发散或执行错误,系统会把错误信息和误差反馈给模型,让它自主修正。

整个过程中,AI一共探索了约600个候选节点。
其中超过80%被自动验证器以「代数错误」或「数值发散」为由剪枝淘汰——包括灾难性抵消误差、不稳定的单项式求和、病态的基变换等。
只有少数路径,挺过了层层筛选,最终胜出。
这不是暴力搜索猜答案,而是真正的「AI驱动的数学研究」。
600条路,AI找到了6种解
经过系统探索,Gemini Deep Think一共找到了6种不同的解法,分为三大类:
第一类:单项式展开(Monomial Basis Approaches)
核心思路是把函数展开为幂级数,然后用不同的技巧计算积分。

方法1用生成函数方法,构造指数型生成函数,利用高斯积分求解。
方法2用高斯积分提升,把球面积分提升到三维空间中,转化为标准的高斯积分。
方法3是混合坐标变换,先展开为幂级数,再投影到Legendre基底上。
这三种方法数学上正确,但存在数值不稳定性——当N变大时,会出现大数相减导致精度损失的问题。
方法1:生成函数法(Generating Function)

方法2:高斯积分提升法(Gaussian Integral Lifting)

方法3:混合坐标变换法(Hybrid Coordinate Transformation)

这三种方法都基于幂级数展开,思路扎实。
但有个致命弱点:当N→∞时,数值不稳定,出现灾难性抵消误差。
第二类:谱分解(Spectral Basis Approaches)
这两种方法利用了Funk-Hecke球面卷积定理,直接在Legendre谱空间中工作。

方法4:谱Galerkin矩阵法,把问题转化为一个三对角线性方程组来求解。

方法5:谱沃尔泰拉递推法(Spectral Volterra Recurrence Method),推导出系数的前向递推关系。

这两种方法数值稳定,计算复杂度仅为O(N),比单项式方法快了整整一个数量级。
第三类:精确解析解(The Analytic Solution)
方法6:格根鲍尔方法(Gegenbauer Method)
这是最优雅的方法——Gegenbauer方法。
AI发现了一个绝妙的思路:选择Gegenbauer多项式作为展开基底,而这类多项式的正交权函数恰好是(1-t²),正好与被积函数分母中的奇异因子完全抵消!
这样一来,原本令人头疼的奇异积分,变成了一个完全正则的积分。
通过分部积分和标准恒等式,AI推导出了精确的闭合公式,甚至最终得到了一个优美的渐近表达式。

也是此次AI给出的王者之选。
最优雅的解法,让物理学家心动了
格根鲍尔多项式,Gegenbauer polynomials,记作 Cₗ^(3/2)(t))。
这是一种定义在[-1,1]上的正交多项式族,而它的权函数 w(t) = 1 - t²,恰好能自然地消去被积函数的奇点。
这不是凑巧,这是Gemini识别出的深层数学结构。

具体思路是这样的:
将被积函数 fN(t) 展开成格根鲍尔多项式的线性组合,利用正交性确定各展开系数。
关键时刻到来——权函数与分母相消,原本让人头疼的奇点,就这样被优雅地「吸收」进去了,留下的是一个完全正则的积分。
随后,借助恒等式 Cₖ^(3/2)(t) = Pₖ₊₁'(t)(格根鲍尔多项式与勒让德多项式导数的关系),以及分部积分,积分进一步化简为勒让德多项式的傅里叶变换形式。
最终,结果可以用余弦积分函数Cin(z)精确表达——一个封闭的解析表达式,无需数值近似,适用于任意环几何结构下的任意N。

谷歌团队在论文中写道——格根鲍尔方法是这6种解法中最优雅的,因为它在数学上最自然地处理了积分的奇点结构。
更惊艳的是:在寻找大N渐近行为时,Gemini还自主发现了与量子场论中费曼参数化的内在联系——这是一个跨越物理子领域的深层数学统一性,连人类研究者都没有预先料到。

人机协作,而非AI单打独斗
要特别说明的是,谷歌团队对这一过程的描述非常诚实——
初始的6种解法,是树搜索框架自动找到的,格根鲍尔方法最初给出的是一个无穷尾和形式的精确解,数学上无误,但不够简洁。
为了把它化为真正的有限封闭形式,一位人类研究者手动介入,把中间结果喂给一个更大、更强的Gemini Deep Think版本,要求它严格验证已有证明并寻找进一步化简。
在这次人机交互中,高级模型独立发现了方法5(谱沃尔泰拉递推法)初始表述中的一个错误,并在修正后识别出方法5和方法6的等价性——这使得方法6中的无穷尾和可以被精确「折叠」成有限形式,最终得到用余弦积分表达的漂亮解析解。
这是一次协同接力,而非完全自主的AI发现。
但这反而更重要——它展示了一种真实可行的人机协作范式。
谷歌团队在结论中保持了科学谦逊:
「我们并不声称这个物理问题本身具有深刻意义,但AI系统能够轻松解决它,对于加速科学发现过程具有重要潜力。」
但这句话的另一面同样值得细品——
所谓的「轻松」,是站在600次探索、80%淘汰率之上的。
这不是聪明的运气,这是系统化的智识搜索。
几十年来,物理学家和数学家们普遍认为,符号推导、理论发现,是AI最难触碰的圣域——因为这需要真正的数学直觉,需要从茫茫解法空间中识别出「优雅」。
但格根鲍尔方法告诉我们:AI正在发展出某种类似直觉的能力。
它不是随机试错,它在评估解法的优雅程度,在识别数学结构的深层美感。
这一次,是宇宙弦的引力波谱。
下一次,也许是弦论中更深的方程,也许是量子引力中的核心积分。
人类提出问题,AI系统化探索结构,人类完成最后的意义诠释——
这种新型科研模式,已经不再是科幻,而是正在被谷歌用一篇论文,白纸黑字地写下来。
「神经符号系统」,AI科学发现的基础设施
值得关注的是,这篇论文所使用的树搜索框架,并非一次性的专项工具,而是有系统性方法论的可复用框架。
谷歌团队在附录中详细公开了:
完整的系统提示词(System Prompt)
评估验证的代码实现
「负向提示」(Negative Prompting)策略——这是强制AI探索不同解法方向的关键技巧

所谓负向提示,就是在AI找到一个有效解法后,明确告诉它「不要再用这个方法」,强制它另辟蹊径,继续探索——这样才有了从方法1到方法6的多样解法。
这种方法论本身,就是一个可以迁移的科研工具。
今天用于宇宙弦,明天可以用于材料科学、量子化学、纯数学中的未解猜想。
AI正在叩开理论物理的大门
回顾这件事,有一个细节让人印象深刻。
在机器学习领域,大家早就习惯了AI能做的事:识别图片、生成文本、下棋、写代码……
但推导符号数学、独立识别数学结构的奇点并找到消除它的优雅方法——这件事,此前被认为几乎不可能。
因为数学发现不是搜索,是「顿悟」。
然而Gemini Deep Think的案例告诉我们——「顿悟」也许可以被分解成:
足够大的搜索空间 + 足够精密的评估标准 + 足够强的推理能力。
三者叠加在一起,就可以涌现出看起来像「直觉」的东西。
AI,已经准备好成为数学家、物理学家以及所有科学家的最强搭档。
这,也许真的只是一个开始。
参考资料:
https://arxiv.org/pdf/2603.04735
