
计算机科学泰斗高德纳(Donald Knuth)一辈子见过太多聪明人,但这一次让他动笔专门写文章记录的,是一个AI。

近期,Anthropic旗下的大语言模型Claude,在图论领域独立破解了一个困扰学界多年的组合数学猜想。高德纳随后在斯坦福大学发布了一篇题为《Claude's Cycles》的论文,亲自记录并验证了这一过程。
他明确将此定性为自动推理与创造性问题解决的全新里程碑,不是因为AI替代了数学家,而是因为它第一次展现出真正意义上的、跨越已知边界的数学直觉。

高德纳是《计算机程序设计艺术》(TAOCP)作者、发明TeX的图灵奖得主,算法界大师级人物
要理解这件事的分量,得先搞清楚AI做数学和真正"解决猜想"之间的差别。
过去几年,各类大模型在数学测试上表现亮眼,从IMO竞赛题到Putnam考试,GPT、Gemini、Claude轮流刷新记录。但批评者一直有一句话悬在那里,很难被驳倒,那就是:这些模型本质上都是在已有训练数据的范围内"检索和组合",真正的数学发现需要从未被表达过的直觉和跳跃。
这次的情况不一样。Claude处理的是一道高德纳本人设计的组合图论问题,涉及有向图中特定循环结构的存在性。
问题本身的核心难度在于:它不存在直接可以套用的现成路径,需要在探索过程中自主构造出新的论证框架。Claude不只是给出了一个答案,更是生成了若干具有独立数学价值的中间结论,这些结论经过高德纳本人手工验证后被确认为正确且具有新意。值得注意的是,这并非Claude独立"颁布"了一篇正式证明,真正的形式化工作仍由人类完成,但AI所提供的核心创意跳跃,让整个过程成为可能。
这就是这件事真正让人坐不住的地方。
放在更大的背景下来看,这一事件并非孤立。
2026年年初,剑桥大学的学生借助OpenAI的GPT-5.2在15分钟内解出了一道埃尔德什猜想,导师级别的数学家Terence Tao随后花时间验证了结果的正确性。同期,AxiomProver系统更是宣布自主解决了2025年Putnam竞赛的全部问题,并在若干未解的组合学问题上给出了全新的反例。
AI在数学领域的突破,正在以令人眩晕的速度叠加。
但这里需要保持一份清醒。现阶段AI在数学上的进展,主要集中在两类方向上,一类是形式化验证,即用Lean、Coq等证明辅助系统验证人类已有的猜测;另一类则是探索性生成,就是像Claude这次一样,在问题空间里尝试走人类没走过的路。后者对于AI来讲难度更高,也更值得关注,但它本质上仍然依赖于大量人类数学语料所形成的"直觉晶核"。换句话说,AI现在的创造力,更象是一种非常高效的"重组与涌现",而非从零构建全新的概念体系。
尽管如此,"涌现出训练数据中未曾明确存在的新结论"这件事本身,已经足够改变我们对AI推理上限的判断。
这件事让人联想到另一个维度上的思考。中国科学家刘锋等学者在2025年发表的论文中,曾提出将"智能体"作为理解宇宙基本单元的理论框架,认为智能的本质是信息处理能力的涌现与演化,并构建了"标准智能体模型"来衡量不同系统的智能水平。
按照该模型的框架,AI系统在信息输入、输出、存储、创造和控制这五个维度上的能力,决定了其智能层级。
Claude这一次在图论问题上的表现,恰恰对应了模型中"信息创造"这一维度的实质性突破,也就是不仅处理现有信息,而是生成了训练数据中不存在的新数学结构。这或许意味着,AI的智能演化正在悄悄越过某一个临界点,尽管它距离真正的"自主数学研究"还有相当距离。
2018年,类似的研究团队曾测算,当时最强的谷歌搜索引擎的智能水平只有6岁儿童的一半;到2024年,GPT-4和Claude的水平已超越了12岁少年。
如果这个坐标系还成立,那么今天Claude在图论上的这次跨越,也许正对应着某个我们尚未命名的新坐标。
数学,是人类智识活动中最纯粹的一种,没有歧异,只有对错,没有语言的弹性,只有逻辑的刚性。
正是因为如此,当AI在数学领域开始真正"做出一点什么"的时候,它的意义远超这道题本身,它在告诉我们,所谓创造性推理的边界,可能比我们想象的要近得多,也薄得多。
更新时间:2026-03-05
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight All Rights Reserved.
Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号