在人类智慧的探索版图中,数学宛如一座巍峨耸立的高峰,其每一次的理论突破,都如同在黑暗中点亮一盏明灯,照亮了从计算机科学到医学,再到国家安全等诸多关键领域前行的道路。然而,数学研究的征程向来艰辛,几百年来,数学家们依靠的工具不过是纸和笔,在逻辑与灵感交织的崎岖小径上,艰难地寻觅着通往真理的方向。如今,人工智能(AI)的迅猛发展,为这一古老而深邃的领域带来了新的曙光,美国国防高级研究计划局于今年 4 月启动的 “指数性数学” 计划,就旨在打造能大幅提升数学研究效率的 AI “合著者” 系统。但从当下能解高中数学题的 AI,到足以协助攻克前沿数学难题的得力助手,这之间的距离,究竟还有多远?
长久以来,计算机在数学研究中扮演着辅助计算或验证命题的角色。大型语言模型(LLM)早期在数学领域表现欠佳,常出现 “幻觉”,甚至会给出诸如 “2 + 2 = 5” 这般荒谬的结果。不过,科技的进步日新月异,OpenAI 的 o3、Anthropic 的 Claude 4 Thinking 等新一代大型推理模型的问世,让数学家们看到了新的希望。今年,这些模型在美国数学邀请赛中的成绩,已接近优秀高中生水平。它们不再是简单粗暴地直接给出答案,而是尝试模拟数学家逐步推理的思维过程,仿佛一位初窥门径的学徒,开始学习师傅思考问题的方式。
与此同时,一些将 LLM 与事实核查系统相结合的新型混合模型,同样取得了令人瞩目的突破。谷歌 “深度思维” 的 AlphaProof 系统,创新性地将语言模型与棋类 AI——AlphaZero 相结合,成为首个在国际数学奥林匹克竞赛中,取得与银牌得主相当成绩的系统。今年 5 月推出的 AlphaEvolve 模型更是大放异彩,在多个长期悬而未决的数学与计算难题上,成功找到了优于人类现有方案的解法。这些成果无疑证明了 AI 在数学领域的潜力,它们正以惊人的速度成长,逐渐改变着人们对 AI 与数学关系的固有认知。
尽管 AI 在竞赛和部分难题上取得了一定成绩,但专家们普遍清醒地认识到,目前的 AI 距离真正成为科研的得力助手,仍有很长的路要走。美国《麻省理工科技评论》指出,竞赛题虽具有较高难度,但本质上更像是有着固定套路的智力游戏,而真正的数学研究,其开放性和复杂性远超于此。当面对 “P vs NP”“黎曼猜想” 等重大数学难题时,AI 往往显得力不从心。这些难题犹如横亘在数学发展道路上的崇山峻岭,需要研究者具备深厚的知识积累、敏锐的洞察力和超凡的创造力,而这恰恰是当前 AI 所欠缺的。
为了精准评估 AI 的数学能力,初创公司 Epoch AI 去年推出了 FrontierMath 测试。该测试联合 60 多位数学家,精心设计了全新的高难度题目,并巧妙避开了模型已接触过的训练数据。结果令人咋舌,LLM 几乎集体 “交白卷”。这一测试结果无情地揭示了 AI 在数学领域的真实水平,它们在数学道路上虽已迈出了探索的步伐,但距离成为数学家们理想中的 “合著者” 角色,还有着难以跨越的鸿沟。
深入剖析数学问题,会发现它们存在着共性:解决问题需要完成一系列连续的步骤,而找到这些步骤,便是解题的关键所在。美国加州理工学院的谢尔盖・古科夫指出,不同难度的数学问题,其差异往往体现在推理路径的长度上。例如,高中数学问题的解决可能仅需 10 到 40 步,而像黎曼猜想这样的世界级难题,其推理路径可能长达百万步。这类 “超长路径” 问题,处理难度极大。以围棋为例,AI 需要在指数级增长的众多可能路径中,寻找出制胜序列,而数学问题的复杂度,相较于棋类游戏更是有过之而无不及。
为了攻克这一难题,古科夫团队积极探索,开发出一种将多个步骤打包成 “超级步骤” 的方法,形象地说,就如同穿上 “巨人靴”,大步跨越漫长的推理路程。他们构建的系统中,强化学习模型负责提出超级步骤,另一个模型则承担起验证其合理性的重任。这一策略在经典未解难题 —— 安德鲁斯 - 柯蒂斯猜想的研究上取得了突破。尽管尚未能彻底证明或推翻该猜想,但借助 AI 的力量,科学家们成功推翻了一个 40 年来被广泛引用的 “反例”,而这个 “反例” 曾被视作证明该猜想错误的关键依据。牛津大学数学家马丁・布里森对这一成果给予了高度评价:“排除错误路径,在科研进程中是极具价值的一步。” 古科夫坚信,这种 “压缩路径” 的创新思路,适用于所有需要构建推理链条的领域,有望推动 AI 突破现有的思维定式,为数学研究开辟新的天地。
跳出常规思维的束缚,是数学家们攻克难题的核心能力。数学并非仅仅是机械的推理,在高等数学的研究领域,更像是一场充满未知与挑战的实验,其中既有反复的试错过程,也不乏灵光一闪的顿悟时刻。这正是 AlphaEvolve 等 AI 工具所难以企及的。AlphaEvolve 通过 LLM 不断生成并改进解题代码,同时借助第二个模型对每一轮结果进行评估,最终得出优于人类的解法。这种方式虽然具备一定的探索能力,但它缺乏真正的创造力。
澳大利亚悉尼大学数学家乔迪・威廉姆森强调,探索性思维是数学的灵魂所在。他与 Meta 合作开发的 PatternBoost AI 系统,能够依据一个数学想法生成相似概念,从而激发灵感。他形象地比喻道:“这就好比面对一堆有趣但未知的事物,我们可以借助它来生成更多类似的东西。
” 以二十面体为例,古希腊人通过纯粹的推理发现了它,其独特的形状在自然界中并不存在,却对数学的发展产生了深远影响。威廉姆森期望,未来 AI 能够协助人类发现更多类似的 “新数学对象”。但就目前而言,让 AI 赢得一场棋局相对容易,而让它发明一种全新的棋类游戏,则几乎是不可能完成的任务。像 AlphaEvolve 和 PatternBoost 这样的工具,或许能够作为人类直觉的 “侦察兵”,帮助我们发现潜在的研究路径,避开可能的死胡同,但专家们一致认为,真正具有开创性的创新与突破,依然源自人类独有的智慧与灵感。
从当前的发展态势来看,AI 在数学领域的应用已经取得了一定进展,为数学家们提供了新的研究思路和工具。然而,要成为能够与数学家并肩作战、共同攻克前沿难题的得力助手,AI 还需要在技术上实现重大突破,跨越 “超长推理链” 等重重障碍,同时培养真正的创造力。在未来的发展中,AI 与数学家之间更可能是一种相互协作、相辅相成的关系,AI 发挥其强大的计算和搜索能力,而数学家则贡献独特的创新思维和深刻的洞察力,共同推动数学领域迈向新的高度,让数学这颗人类智慧的璀璨明珠,在 AI 的助力下绽放出更加耀眼的光芒。
更新时间:2025-06-22
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号