陶哲轩三小时超长访谈:我们如何解决难题?AI将如何重塑数学?

近日,当代最著名数学家之一、菲尔兹奖得主陶哲轩(Terence Tao)做客了莱克斯·弗里德曼(Lex Fridman)的播客节目。在这场长达三个多小时的深度对话中,陶哲轩分享了他对数学、物理、人工智能乃至现实本质的诸多思考。这场访谈信息量巨大,不仅探讨了诸如纳维-斯托克斯方程(Navier-Stokes equations)、P/NP 问题和黎曼猜想(Riemann Hypothesis)等数学领域的“圣杯”,还将话题延伸至人工智能如何重塑数学研究的未来。



图丨相关访谈(来源:Lex Fridman)


在访谈中,陶哲轩谈到了解决复杂数学问题的一种实用策略,他称之为“策略性作弊”。具体来说,就是面对一个包含多个难点的问题时,研究者会先暂时忽略大部分困难,集中精力攻克其中一个。通过这种方式逐一解决,最终再将各个部分的解法整合起来。


与此同时,陶哲轩详细阐述了他对人工智能在数学领域潜力的看法。他分享了自己使用证明助手语言 Lean 的亲身经历,并坦言,尽管 AI 目前在数学领域的能力如同一个“有时不太可靠,但能力超群”的研究生,但它正推动着数学研究范式的转变。他预言,在不远的将来(甚至有可能是 2026 年),AI 将能够与人类数学家合作发表研究级别的论文。这种合作模式将彻底改变数学的协作方式,使得大规模、分布式的数学实验成为可能。


此外,陶哲轩也谈到了他对一些著名猜想的看法。他认为孪生素数猜想(Twin Prime Conjecture)在未来十年内可能会有重大突破,但对于黎曼猜想,他则坦言目前尚无线索。他强调,这些难题的核心在于“结构”与“随机”的对立,而数学的本质正是在这两种看似矛盾的力量之间寻找深刻的联系。


以下是经过整理编译的对话全文


第一个难题


莱克斯:

你遇到的第一个真正意义上困难的研究级数学问题是什么?有没有一个让你真正停下来、卡住的时刻?


陶:

在本科学习中,我们会接触到一些“公认很难”的问题,比如黎曼猜想、孪生素数猜想。这些问题可以人为地制造出极高的难度——因为我们甚至知道有些问题是不可解的。但真正有趣的是那些处在“边界地带”的问题:它们不是完全绝望,但也远非轻松。现有技术可以解决其中的 90%,但最后那 10% 才是真正棘手的部分。


我想,在我读博士期间,挂谷问题(Kakeya Problem)无疑吸引了我的注意。而且它最近刚刚被解决了。这是我早期研究中投入了大量精力的一个问题。



图丨证明挂谷集合猜想的王虹(来源:NYU)


这个问题最早源于日本数学家挂谷宗一(Sōichi Kakeya)1918 年左右提出的一个小谜题:设想在平面上有一根针(可以想象成一辆车),你想让它掉头——也就是做一个 U 形转弯——并且你想用尽可能小的面积来完成这个转向。你可以无限灵活地操控这根针,比如让它原地旋转。作为单位长度的针,如果你绕中心旋转,所需的面积大约是 π/4。或者你可以做一个三点调头,这个方式更高效些,所需面积大约是 π/8。


一开始,人们以为这是最节省空间的方法。但别西科维奇(Besicovitch)证明,其实可以构造一种复杂的、多次反向旋转的轨迹,使得你能在任意小的面积内完成掉头——比如 0.01 的面积。关键是,这根针在这个过程中还会经过所有方向。


这个构造是在二维平面里完成的,我们对二维的理解已经很充分了。那么下一个自然的问题是:在三维空间中会发生什么?


想象一下哈勃太空望远镜,它是一个悬浮在太空中的管状物体。你想用它观察宇宙中每一颗星星,就需要让它转向每一个可能的方向。假设空间资源非常紧张,那么你希望在尽可能小的体积内完成这个“方向遍历”。这个体积最小能有多小?


你可以对别西科维奇的二维构造做一个简单修改:如果你的望远镜是零厚度的,那么理论上你仍可以用任意小的体积完成任务。但问题在于——如果你的望远镜并非完全没有厚度,而是有一个非常小的厚度 δ,那要实现对所有方向的遍历,所需体积的最小值会是多少?


随着 δ 越来越小,也就是望远镜变得越来越细,所需体积确实会变小。但这个体积减少的速度是怎样的?猜想是,它会非常缓慢地下降,大致是对数级的。这个猜想后来在经历大量工作之后被证明成立。


表面上看,这像是一个“几何小谜题”。但它的有趣之处在于,它和偏微分方程、数论、几何、组合等许多领域都有出人意料的联系。


举个例子,在波传播问题中:你把水搅动一下,就会产生朝各个方向传播的水波。但波动本身既有粒子特性,也有波动特性。你可以得到所谓的“波包”(wave packet):它在空间上高度局部化,并沿某个方向传播。


在时空图中,这种波包会占据一个类似细长管子的区域。某些情况下,一开始分散的波会在稍后的某个时间点聚焦到一个点上。比如你往池塘里扔一颗石子,水波会向外扩散。但你也可以设想时间反演的情景:水波从四面八方汇聚到一个点,在那里形成一个巨大“水花”——甚至可能形成奇点。


如果你把这种波看作是光波,可以把它看作是无数个光子叠加而成,这些光子都沿光线前进,并最终汇聚到某一点。因此,最初非常分散的波可以聚焦到某个极小区域,并在时空中达到极高浓度,然后再重新发散。


但如果挂谷猜想有一个否定的答案,也就是说,如果真的存在一种极其高效的方式,可以把朝各个方向的“管状物”都塞进一个极小的体积中,那么我们就有可能制造出一种非常特殊的波动结构:它们一开始非常分散,但后来不仅会聚焦到一个点,还会在多个时空点集中出现能量聚焦现象。


这样就可能造成所谓的“blowup”(爆破型奇异性):波的振幅会变得极大,以至于原本描述它们的线性波动方程不再成立,需要使用更复杂的非线性方程来描述这个系统。


纳维-斯托克斯奇点


陶:

在数学物理中,我们非常关心某些波动方程是否稳定,是否会形成所谓的奇点。有一个著名的未解问题叫做纳维-斯托克斯正则性问题。纳维-斯托克斯方程是支配像水这样的不可压缩流体流动的方程。这个问题在问:如果你从一个平滑的初始速度场出发,是否可能在某个点速度变成无穷大?这就叫做“奇点”。我们在现实生活中并不会观察到这种情况,比如你在浴缸里搅动水,它不会突然爆炸,或者以光速喷涌而出,但理论上这类现象是有可能发生的。


事实上,近年来学界的共识逐渐倾向于认为,对于某些非常特殊的初始状态,可能确实会出现奇点。尽管如此,目前还没有人真正证明这一点。克雷数学研究所设立了七个千禧年大奖难题,为解决其中任何一个问题提供 100 万美元的奖金,这就是其中之一。在这七个问题中,只有一个被解决了,那就是庞加莱猜想(Poincaré Conjecture)。虽然挂谷猜想与纳维-斯托克斯问题没有直接关系,但理解它会帮助我们理解波动集中等现象,从而间接帮助我们更好地理解纳维-斯托克斯问题。


莱克斯:

你能谈谈纳维-斯托克斯问题本身吗?就像你说的,它是一个关于平滑解是否存在的千禧年难题。你在 2016 年曾发表论文《三维纳维-斯托克斯平均方程的有限时间爆破》,对该问题有不少进展。通常我们认为纳维-斯托克斯方程不会爆破,但我们能否确定它永远不会爆破呢?



图丨相关论文(来源:arXiv)


陶:

没错。这确实是那个价值百万美元的问题。数学家与其他人最大的不同在于:即使某件事 99.99% 成立,对大多数人来说就足够了。但数学家在意的是,是否对 100% 的情形都成立。所以虽然绝大多数时候流体不会爆破,但是否存在一种特别的初始状态能让它爆破呢?


莱克斯:

我们或许应该说明一下,这是一组支配流体动力学领域的方程,试图理解流体的行为。而流体是一种极其复杂、难以建模的对象。


陶:

是的,所以它具有实际重要性。这个克雷奖问题关注的是所谓的不可压缩纳维-斯托克斯方程,主要涉及像水这样的流体。还有可压缩纳维-斯托克斯方程,例如描述空气流动的,这在天气预报中尤为关键。天气模型大量依赖于对纳维-斯托克斯方程的数值求解,同时也要收集大量数据来作为初始条件输入。这是一个系统性工程。


莱克斯:

为什么证明关于这组方程的普适性质,比如它不会爆破,会如此困难?


陶:

简单来说,是麦克斯韦妖(Maxwell's Demon)。这是热力学中的一个思想实验:设想你有一个装有氧气和氮气的箱子,氧气在一边,氮气在另一边,中间没有隔板。它们自然会混合,而且一旦混合,就不太可能重新分离。但在原则上,可能存在某种“麦克斯韦妖”的机制,使得每次氧分子与氮分子碰撞时,它们都会以某种方式反弹,从而使得氧气重新聚集一侧,氮气聚集另一侧——极其不可能,但数学上无法排除。


这种“极端但可能”的情形在数学中经常出现。比如圆周率 π 的数字 3.14159……这些数字看起来没有规律,我们相信它们是无偏的,也就是说从长远看,每个数字(0 到 9)出现的频率应相等。但或许在某处存在一个“π 妖”,使得每次多算几位时,某个数字被偏好。没有理由发生这种事,但我们也没法证明它绝对不会发生。


回到纳维-斯托克斯问题:流体有能量,而运动中的流体会把能量传递到不同位置。而由于水具有粘性,当能量分布较均匀时,粘性就会将其耗散。我们实验时也是如此:水的波动、涡旋会逐渐平息。但理论上也可能存在某种“妖”,它不断将流体的能量向更小的尺度推进,使局部速度越来越快。而当速度变快时,粘性的影响相对变小。所以有一种可能性:形成所谓的“自相似能量团”情景(self-similar blob scenario)——能量原本分布在一个大尺度区域,然后被集中转移到一个较小的区域,再以更快的速度进入更小的区域,如此反复。


每次转移耗时可能只有前一次的一半,那么整个过程会在有限时间内完成,即能量最终在一个点无限集中,这就是所谓的“有限时间爆破”(finite time blowup)。


在实际中,这种现象没有发生。水是“湍流”的,也就是说如果你有一个大的旋涡,它确实会破碎成几个小旋涡,但能量不会全部集中到一个小旋涡中,而是会分散成三四个,然后再细分为更多小旋涡。能量的分散使得粘性得以发挥作用,从而稳定系统。但如果能量被集中得足够快,使得粘性来不及起作用,那么就有可能发生爆破。


过去有很多论文声称,只要用能量守恒和粘性项就能控制住系统,不只是对纳维-斯托克斯,对很多类似的方程都适用。人们试图证明所谓的“全局正则性”(global regularity),也就是反过来否定“有限时间爆破”,即速度场始终保持光滑。但这些尝试全都失败了。总是会出现符号错误或一些微妙的问题,导致不可修补。


我感兴趣的是:我们为何一直无法证伪“有限时间爆破”?我没法直接在纳维-斯托克斯方程上操作,因为它太复杂。但我可以对其运动方程进行“平均化处理”,也就是人为关闭某些类型的流体相互作用,只保留我想研究的部分。


我基本上是在“工程化”地制造一个爆破,通过改变物理规律来实现——这是数学家被允许做的事情,我们可以改写方程。


这在数学中被称为构造阻碍(obstruction)。我做的事情是:关闭方程中的某些部分。通常关闭某些非线性交互项会让系统更“温顺”,更容易控制,更不容易爆破。但我发现,通过精心设计地关闭一组特定交互项,我反而可以强制让能量在有限时间内爆破。这意味着:如果你想要对真实的纳维-斯托克斯方程证明正则性(即不会爆破),那你必须使用那些我这个“人工方程”所不具备的特性。也就是说,我的构造排除了一部分可能的证明路径。


数学的精髓就在于,你不仅要找到能行得通的方法,更重要的是知道哪些方法永远行不通。对于那些真正难的问题,通常有几十种看似合理的办法,但只有在深入尝试之后你才会意识到它们注定失败。构造这些“相似但失败”的反例可以节省大量时间和精力,因为你已经知道某些方法在逻辑上根本无法奏效。


莱克斯:

这是否只与你所研究的流体动力学问题有关,还是你在数学上发展出的一种更普遍的直觉?


陶:

是的,我的这种技术背后其实利用了一个关键现象,叫做超临界性(supercriticality)。在偏微分方程中,很多问题其实是不同力之间的拔河比赛。比如在纳维-斯托克斯方程中,一方面是粘性带来的“耗散力”,它是线性的、可控的、会让系统趋于稳定;另一方面是“输运项”,能量从一个位置传递到另一个位置,它是非线性的,也正是产生所有问题的源头。


纳维-斯托克斯的两个核心项就是:耗散项和输运项。如果耗散占优势,系统就会趋于平稳,就有希望证明正则性;但如果输运项占优势,系统就变得不可预测,非常非线性,进入湍流状态。


在不同的空间尺度下,这种力量对比也会改变:可能在大尺度下还在平衡,在小尺度下就完全不平衡。纳维-斯托克斯的问题在于它是一个超临界方程:当你观察得越来越细时,输运项的影响变得远大于粘性项。


这就是问题难以解决的根本原因。相比之下,在二维空间里,苏联数学家拉德任斯卡娅(Ladyzhenskaya)在 60 年代就证明了不存在爆破。



图丨拉德任斯卡娅(来源:Wikipedia)


那是因为在二维中,这个方程是所谓的临界(critical)系统:输运与耗散在所有尺度下影响相当。而我们已经掌握了大量技术可以处理临界或次临界(subcritical)系统,进而证明正则性。


但对超临界系统,就很难说清楚。我的研究和许多后续工作已经表明:一旦非线性效应在小尺度上主导线性效应,各种“糟糕的事”就可能发生。这也正是这套研究工作的关键洞察之一:超临界 vs 临界/次临界,是决定一个方程“是否可控”的关键定性特征。


比如行星运动,它们的方程比较“温顺”、可预测,我们可以精确预测其数千年轨迹;但天气预测为什么过不了两周?就是因为大气系统是超临界的,它在极小尺度上会发生各种难以预料的奇异变化。


莱克斯:

所以说,只要存在巨大的非线性源头,就会导致系统难以预测?


陶:

是的,尤其是当这种非线性在越小的尺度上越“活跃”时,问题就更严重。并非所有非线性方程都难以处理——在很多情况下我们可以通过看系统的“整体行为”来近似局部结构。


比如,如果你想研究月球或火星的轨道,你并不需要知道月球的地震波结构或质量分布细节。你几乎可以把它们看作点质量,其运动主要由整体重力决定。


但如果你想模拟流体,比如天气系统,你不能只是说“洛杉矶的气温是 X,风速是 Y”来近似整个系统。对于超临界方程,微小尺度上的信息是极其关键的,你忽略不了。


莱克斯:

你曾提到过一种构想,也许可以请你详细解释一下:你设想通过构建一种“液体计算机”,从而将计算理论中的停机问题(halting problem)引入到流体动力学中。也就是说,通过这种方式展示计算复杂性对流体行为的影响。你能讲讲这个思路吗?


陶:

这个想法源自我之前构造出一个平均方程会爆破的工作。为了做到这一点,一种天真的做法是:你每到一个尺度,就立即将能量推向下一个尺度,尽可能快地推进。这种做法在五维及以上的空间维度中确实有效。但在三维中,我发现了一个奇怪的现象:如果你不断将能量往更小的尺度压缩,结果是能量会在多个尺度之间分散。也就是说,当你将能量从一个尺度推向下一个时,虽然它刚进入下一个尺度,但上一层仍有残留的能量——你试图同时推进一切,这会导致能量过于分散。


而一旦能量分散过多,就会让它更容易被粘性所抑制,从而失去爆破的可能性。所以这种“直接推进”的方法在三维中不奏效。后来有其他研究团队专门写了论文证明这一点。因此,我需要设计一种“延迟机制”,就像“气闸”一样:流体在一个尺度上活动时,只有等它将该尺度的全部能量完整传递到下一尺度之后,才开启通道进入下一级。


通过这种方式,能量可以逐级向前推进,而始终保持在一个特定尺度内局部集中,从而避免被粘性效应削弱。为了实现这个目标,我不得不构造一个非常复杂的非线性结构,它几乎就像是一个电子电路的设计。我也很感谢我的妻子,她是电子工程专业出身,曾和我聊过如何设计电路。


比如你想要一个灯能按一定频率闪烁,那你就得用电容、电阻等基本元件组合成某种结构,画成电路图。这些电路图可以通过“用眼睛追踪电流”来理解其工作原理。于是我就模仿这些电路元件,构造出数学上的对应物,例如模拟“电容”或“电阻”等组件。然后将它们组合在一起,形成一个能够定时打开或关闭“闸门”的结构。整个系统就像一个数学版的鲁布·戈德堡机器(Rube Goldberg machine)——复杂但可控。而这个设计最终确实起作用了。


这让我意识到:如果你能用在真实的流体方程上做出同样的事情,比如纳维-斯托克斯方程真的能够“支持”某种计算机制,那我们就可以构建一种“液体朋克”风格的系统。我们现在的计算机是由电子在细小电路中流动实现的,而这里,我们设想的是让水流脉冲充当信息载体。


你可以想象两种水流配置,分别表示“比特 1”与“比特 0”。如果两个水流“碰撞”后得到的输出状态是可预测的,那么这个碰撞就可以实现逻辑运算,比如“与门”“或门”等。将它们串联起来,你就可以构建出图灵机。这台机器完全由水组成,是一种“流体计算机”。


再进一步,如果你能用水来控制机器的形态,就像液态机器人,你甚至可以制造一种冯·诺依曼机(von Neumann machine)。



图丨冯·诺伊曼架构(来源:Wikipedia)


冯·诺依曼曾提出一种理论:如果你想殖民火星,运送人类和机器的成本太高,那不如送一台可以自我复制的机器。只要它能采矿、制造、组装,就可以在火星上不断复制自己,完成扩张。


同理,我们也可以设想这样一种流体机器人:它的使命就是复制出一个更小的自己。在某个“冷启动状态”下,小机器尚未运作;当准备就绪后,大机器人将自己的全部能量传输给小机器人,自己“关闭”,清空残余能量。接着,小机器人启动、重复这一过程,但更小、更快。


由于纳维-斯托克斯方程具有尺度不变性(scaling symmetry),这一过程理论上可以无限进行,从而实现“爆破”现象。这正是我在“平均化的纳维-斯托克斯”上所完成的构造——一种为理解原方程爆破机制提供路线图的方法。


当然,这仍是一个梦想,要真正实现它还有很多障碍。例如,我现在还不能真正构建出那些“流体逻辑门”,我也没有那些特定的水流配置(虽然像涡环之类的结构可能是候选)。此外,模拟计算比数字计算要脆弱得多,误差传播是一个巨大挑战,需要复杂的纠错机制。


我也还不清楚如何让大机器完全“关机”,以免干扰小机器的运行。但从物理角度来说,这一构想并不违背任何自然法则,所以它是“理论可行的”。目前也有其他团队在尝试推动纳维-斯托克斯爆破的证明,只不过他们使用的方法远没有我这种方案复杂。他们采用的是更直接的“自相似模型”(self-similar model),虽然仍未完全奏效,但思路可能更简洁可行。


从纳维-斯托克斯方程到图灵机,这个跳跃真的很惊人。你最初设想的是“自相似团块”,不断生成更小、更精细的结构,现在则是液体图灵机不断缩小复制自身,并且从中得出关于爆破的洞见——这个转化非常具有天才般的创造力。


莱克斯:

从纳维-斯托克斯方程跳到这台图灵机,这中间真是一次天才的飞跃。从一开始设想的那个越来越小的自相似斑点,到后来构想出一个越来越小的液体图灵机,并洞察到这可以用来解释爆破。这真是一个巨大的跨越。


生命游戏


陶:

这在数学中其实是有先例的。数学的一个强项就在于,它善于揭示那些看似完全无关的问题之间的深层连接。只要数学形式相似,就可能存在可以转化或类比的路径。


例如,有一类研究叫做“元胞自动机”(cellular automata),最著名的就是康威提出的生命游戏。这是一个无限的离散网格,每个网格点要么被一个“细胞”占据,要么是空的。整个系统依靠一套非常简单的规则演化,细胞会因邻近环境而“生”或“死”。


我在学生时期,这种动画非常流行,甚至被用作屏保。这些图像看起来非常混乱,甚至某种程度上有点像流体的湍流行为。但随着时间的推移,人们在“生命游戏”中发现了越来越多有趣的结构。


比如说,有一种叫做“滑翔子”(glider)的结构,只需要四五个细胞组成,演化过程中会稳定地朝某一方向“滑动”,就像涡环一样。这类现象说明,虽然“生命游戏”是一个离散系统,而纳维-斯托克斯是一个连续系统,但在数学特征上却存在一定的相似性。


“生命游戏”本身非常简单,只有三四条演化规则,但你却可以在其中设计出非常复杂的结构。比如有一种叫“滑翔子枪”(glider gun)的结构,它能周期性地发射滑翔子。后来又有人构建出了用于滑翔子的“与门(AND gate)”“或门(OR gate)”等逻辑结构。


这听起来很夸张,但这些结构是实实在在地被构造出来了。比如有一个巨大的系统:当两个方向上都有滑翔子流进入时,才会输出滑翔子流;若只有一边输入,则无输出——这就是典型的“与门”逻辑。


而一旦你可以用滑翔子构建出这些基础逻辑门,就可以像在软件工程中一样,逐层搭建出图灵机。尽管这些构造在图像上看起来像是“蒸汽朋克”风格的机械,但它们确实是可以自我复制的结构。有些系统耗费大量时间,通过滑翔子枪的组合,最终实现了一种可以复制自身的大型装置,即图灵意义上的自复制机。


很多这样的成果,其实都是由业余数学爱好者以众包的方式完成的。我早就关注这些研究,它们也成为我思考纳维-斯托克斯类似构想的启发来源之一。


当然,“生命游戏”是数字系统,而纳维-斯托克斯是连续系统,不能简单照搬它们的结构。但它至少表明:这种复杂结构的涌现在原则上是可能的。


莱克斯:

这种由“局部规则”所引发的“宏观结构”的涌现非常神奇——像“生命游戏”中的局部规则,在大规模运行下可以生成极其复杂的动态系统。你觉得这些现象是否可能被数学严谨地刻画?我们是否拥有工具能对这种复杂性说出深刻的见解?


陶:

问题在于,这些“复杂结构的涌现”往往需要精心设计的初始条件。像滑翔子枪、逻辑门、自复制系统这些结构,如果你只是随便在网格上撒一些随机细胞,它们是不会自然出现的。


这其实也与纳维-斯托克斯方程的情形相似:在一般的初始条件下,我们并不会看到任何“计算”或者“图灵机”的行为。但如果你用“工程方法”对初始条件精心设计,那么确实可以实现一些精妙的结构性演化。


莱克斯:

有没有可能证明它的反面……也就是说,证明只有通过“工程设计”,你才能创造出有趣的东西。


陶:

这其实是数学中一个反复出现的难题,我称之为“结构与随机性”的二元张力。我们在数学中遇到的大多数对象,其实是“看起来随机”的。比如圆周率的数字序列(π 的十进制展开),我们普遍相信它没有任何模式。


如果一个结构确实有规律,那我们是可以证明它的,比如周期性重复、等间距结构等等,这就属于“结构定理”的范畴。而我们也可以证明,在一个给定的统计框架下,“大多数”数字序列没有规律。比如大数法则告诉我们,随机序列中 1、2、3 这些数字应该在长远来看出现得一样多。


但困难在于:如果给你一个特定的序列,比如 π 的小数位,你该如何证明它没有隐藏的复杂结构?


这方面我做了很多研究,涉及到所谓的“结构定理”与“逆定理”,其核心在于:如果一个函数表现出某种看似结构化的行为,那可能是因为它接近于某个真正具有明确结构的函数。


比如,有些函数是所谓的“加性”的。如果你有一个从自然数到自然数的函数,比如 2 映到 4,3 映到 6,如果它满足“两个输入相加,等于两个输出相加”,那它就是加性的。最简单的例子就是乘以一个常数。如果你把一个数乘以 10,那么(A+B)×10 就等于 A×10 + B×10。有些函数是严格加性的,还有一些则是几乎加性的。


举个例子,如果我取一个数,乘以根号 2,然后取整数部分。比如 10 乘以根号 2 约等于 14 点几,所以 10 映到 14,20 映到 28。在这种情况下,10+10=20,14+14=28,加性是成立的。但由于取整操作,有时会产生误差,可能你把 A 和 A 相加,得到的结果并不完全是两个独立输出的和,而是差了那么一点点,比如加一或减一。所以,它是“近似加性”(almost additive),但又不完全是。


我研究的很多成果表明:若某个对象显示出某种结构的迹象,那么它就近似某个真正有结构的对象。通过这样的逆定理,我们能划分出一个清晰的二分世界——一个对象要么是彻底无结构的,要么就可以追溯到某种隐藏的结构,从而我们就有了进一步分析的可能性。


一个很好的例子是数学中一个叫做塞迈雷迪定理(Szemerédi s Theorem)的古老定理,它是在 1970 年代被证明的。它讨论的是在一组数字中寻找一种特定模式——等差数列,例如 3、5、7 或 10、15、20。


塞迈雷迪证明了:只要一个数字集合足够大、具有所谓“正密度”(positive density),那么这个集合中一定包含任意长度的等差数列。


比如,奇数集合的密度是二分之一(因为它占据所有整数的一半),我们显然可以在其中找到各种长度的等差数列。比如 11、13、15、17。因为奇数集合本身就很有结构,找出这种序列不难。


但塞迈雷迪定理的强大之处在于,它也适用于随机集合。比如我们取所有奇数,然后对每个数抛硬币,只保留抛出正面的那些。这样我们得到的就是一个“完全随机”的子集,表面上看似毫无规律。然而,即便在这样一个随机集合中,仍然会存在大量的等差数列。


莱克斯:

你能证明在一个随机集合里存在任意长度的等差数列吗?


陶:

是的。你听说过“无限猴子定理”(infinite monkey theorem)吗?通常数学定理的名字都很无聊,但这个还挺形象。


“无限猴子定理”的流行版本是说,如果你有无限只猴子,每只都在打一台打字机,随机敲字,那么几乎可以肯定,其中至少有一只猴子最终会打出整部《哈姆雷特》的剧本,或者任何你想要的有限文字序列。


这说明:如果你有一条无限长的数字序列或字符串,任何你想要的有限模式终将出现。这当然需要时间,可能是很长很长的时间,但只要是“无限”,它就会发生。


具体到我们之前讨论的等差数列:只要序列够长,任意长度的等差数列就一定会在其中出现。当然,需要的是极其巨大的随机序列。


我们可以把“无限”理解为一个没有上限的有限值的抽象化。现实世界中没有什么是真正“无限”的,但我们会思考:“如果我有无限多的钱会怎样?”“如果我可以无限快会怎样?”等等。


数学中有一套严格的形式系统来处理这些理想化的状态,把“非常大”或“非常小”的概念,抽象为“无限”或“零”,从而让问题变得更清晰、更易处理。


就像物理中我们经常开玩笑说“假设奶牛是球形的”,意思是我们故意忽略很多现实复杂性,用一种理想模型来近似分析。


莱克斯:

那你觉得,当我们引入“无限”这个理想化工具时,会不会有时偏离了物理现实?


陶:

确实有很多陷阱。所以我们在大学数学课程中会花很多时间教“数学分析”,它基本上就是在教人如何正确使用极限和无限。


举个例子:有限个数相加时,交换顺序不影响结果。但如果是无穷级数,事情就没那么简单了。你可以用不同顺序排列这些项,竟然会得到不同的收敛值!这就容易出错。


所以在处理无限的时候,你必须非常谨慎。我们引入了 ε 和 δ 这样的参数,制定一套非常严密的逻辑和推理方式,来防止在“无限”问题上犯错。


而近年来,数学家们开始把那些在“极限下成立”的结论转化为有限版本。也就是说:虽然你知道某件事在某个无限条件下是对的,但你会问:“那我到底要多大、多久才行?”


比如说,如果我没有无限只猴子,而只有一亿只,那我要等多久才能等出《哈姆雷特》?这是一个定量问题,而我们可以用纯粹的有限方法去分析它。结果是:所需时间是与目标文本长度呈指数增长的。


所以你永远看不到猴子敲出《哈姆雷特》,最多可能敲出个四个字母的单词罢了。我个人觉得,一旦你把一个“无限陈述”有限化,它就变得更容易理解,也不再那么玄乎了。


莱克斯:

所以即使你在处理无穷大的问题,最好也把它“有限化”,这样能帮助你建立直觉?


陶:

是的,缺点是有限化的证明要复杂得多。无限的证明通常是先被发现的,早了几十年,然后人们才将它们有限化。


数学 vs. 物理


莱克斯:

既然我们刚才提到了很多关于数学和物理的问题。那作为两种不同的学科、理解世界的方式,数学与物理的根本差异是什么?


陶:

我认为科学总体上可以被看作是三个元素的互动:现实世界、我们对现实的观察,以及我们关于现实运行机制的心智模型。


我们无法直接接触真实本身,我们拥有的只是观察结果——这些结果通常不完整、带有误差。很多时候我们想知道的事,比如明天天气如何,我们尚未有观察数据,但我们希望预测它。


在此基础上,我们建立了一些简化模型,有时会做出不太现实的假设(比如假设奶牛是球形的那类)。这些模型就是我们说的数学模型。


数学研究的,就是模型本身。科学则是收集观察数据,并据此提出能够解释这些观察的模型。而数学的做法是:我们从模型的前提出发,思考其逻辑结果,推导出这个模型可能带来的预测或结论,并检查这些结论是否符合已有数据或可能的数据。


所以二者之间确实是一种共生关系。我想数学与其他学科相比的特殊之处在于:数学从假设出发(比如模型的公理),然后推导出可能的结论。而其他大多数学科是从目标出发:我要造一座桥,我想赚钱,我要达成某个目标,然后再反推该怎么做。


在人类活动中,绝大多数事情都是结论导向的,包括物理与科学研究。例如他们会问:这个小行星的轨道将会如何?或明天天气如何?而数学除了从结果出发外,还会从假设出发:假设这个成立,那么会有什么结果?


莱克斯:

物理学里常常有理论与实验之间的张力。你觉得哪一种方式更能引导我们真正发现现实中的新思想?


陶:

你需要两者兼备,自上而下和自下而上。理论、观察与建模应该逐渐趋近现实。但一开始,它们总是相距甚远。要靠彼此推进彼此。


如果你的模型预测出了实验未曾观测到的异常现象,这恰好能告诉实验者去哪里找数据,以进一步校正模型。这个过程是不断往返推进的。


在数学内部其实也存在“理论”与“实验”的划分。只不过直到最近,数学几乎被理论方法完全主导。大约 99% 的数学是纯理论的,实验数学占比很小,但确实有人在做,比如研究素数分布,他们可能会生成大量数据。


早在计算机出现前,人们也进行过实验数学的尝试。比如高斯,他发现了一个著名的猜想,后来发展成了素数定理(prime number theorem),这个定理预测:小于某个数(比如一百万、一万亿)之间有多少个素数。这不是一个显然能答的问题。高斯基本上是靠自己(也雇了一些人肉计算员),计算了前十万以内的素数,并制作出对照表,从中得出预测。


这是早期“实验数学”的一个例子。但直到最近,实验数学还不是主流。


理论数学成功率更高也是因为:过去复杂计算几乎无法实现,即便今天计算机已很强大,也只有少部分数学问题可以通过数值方法探索。


有一个概念叫做“组合爆炸”(combinatorial explosion)。比如你想研究塞迈雷迪定理,设你考虑从 1 到 1000 的所有数字中选子集。表面看:一千个数,能有多难?但实际情况是,它的子集数有 2 的 1000 次方,这远远超出了目前任何计算机所能枚举的范围。


所以有些数学问题,一旦规模变大,就根本不可能靠穷举法解决。国际象棋也是经典例子:所有可能的棋局状态数量巨大,计算机也无法全部列出。


但现在我们有了 AI,能用另一种方式探索这种空间。它们不一定能给出“100% 有保障”的解法,但可以通过实验性模拟给出答案。比如现在的国际象棋 AI 非常强大,它们不穷尽所有棋步,但却能找到非常好的近似方案。现在很多人用这些 AI 引擎来做“实验性国际象棋”:重新评估那些旧的棋局理论,比如某个开局到底好不好,有些结论甚至推翻了传统的棋谱智慧。


我希望未来数学也能有更多的实验成分,可能由 AI 推动。


现实的本质


莱克斯:

你提到了柏拉图的“洞穴寓言”。从某种意义上说,这不就是数学家,甚至所有人类正在做的事情吗?我们只是在观察现实的影子。我们有可能真正地触及现实本身吗?


陶:

我们可以将世界分为三个本体层次:现实本身、我们的观察,以及我们对世界运作方式的模型。从严格意义上说,它们彼此是区分开的,而且我认为它们永远都会是分离的。但它们之间的距离可以随着时间缩小。而要让模型更接近现实,往往意味着必须舍弃你最初的直觉。


天文学就是个很好的例子。一开始我们对世界的模型是“地是平的”,因为它看起来就是平的,而且它非常大;而天空中的其他东西,比如太阳,看起来非常小。所以你最初的模型虽然离真实非常遥远,但它能很好地解释你当时的观察现象,因此它“看起来没问题”。


但随着你观察得越来越多,模型就会被拉近现实——我们逐步认识到地球是圆的,它会自转,它围绕太阳公转,太阳系围绕银河系运动,宇宙在膨胀,而且这个膨胀还是加速的自我膨胀。甚至就在最近的一年,我们发现,这种加速度本身也不是恒定的。


我们现在有一个模型能够解释,能够很好地拟合数据。但也有人批评说:“这不就是乏晰因子(fudge factors)吗?只要参数足够多,你什么都能解释。”但数学的观点是:你希望模型的参数尽量少于观察数据点的数量。


如果你用 10 个参数来解释 10 个观测值,这模型毫无意义,过拟合。但如果你用两个参数解释了一万亿个观测值——比如说“暗物质模型”,它大约有 14 个参数,却解释了天文学家所拥有的数百万 TB 的数据,那这个模型就极具价值。


你可以这样看:一个物理或数学理论,本质上是一种对宇宙的“压缩”,就像数据压缩。你手里有几百万 TB 的观测数据,你希望用五页纸的公式加上几个参数把它们概括出来。如果这个模型能以合理精度拟合几乎所有观察结果,那么你压缩得越彻底,理论就越好。


莱克斯:

而事实上,我们宇宙中最惊人的一点就是,它居然是可压缩的。这正是数学“不合理的有效性”。


陶:

是的,爱因斯坦有过一句类似的话:“关于宇宙,最不可理解的事情就是,它居然是可以被理解的。”数学中有一个叫做“普适性(universality)”的现象。很多宏观系统虽然来源于无数微观相互作用,但宏观规律本身并不复杂。本来你会以为,宏观规律应该比微观结构复杂得多、甚至是指数级复杂,如果你想完全精确建模,确实如此。


比如你要模拟一盒空气里的所有原子,阿伏伽德罗常数非常大,跟踪每一个粒子几乎是不可能的。但在某些情况下,一些宏观定律几乎不依赖微观细节,或仅仅依赖极少数参数。


所以你要模拟 10²³ 个粒子的气体,只需知道温度、压强、体积,加上五六个参数,就足够描述这个系统的行为了。我们在数学上对“普适性”的理解远远不够充分,但在一些简化模型中我们已经知道为什么这种现象出现。最经典的是中心极限定理:它解释了为什么“钟形曲线”(bell curve)无处不在,为什么那么多自然现象都符合高斯分布。


莱克斯:

而且这个梗本身也具有普适性。


陶:

对,甚至可以再“元”一点。确实存在很多过程,比如你取一堆独立的随机变量,用各种方式把它们平均起来,无论是简单平均还是复杂加权平均,最终都会得到钟形曲线,在很多情况下我们都可以证明这一点,非常令人满意。


当然,有时候不会出现钟形曲线。如果你有很多变量,但它们之间存在系统性相关性,你就可能得到远非高斯分布的结果。这种情况也非常重要。比如 2008 年金融危机就是一个著名例子。人们当时假设,按揭违约率是呈高斯分布的:你有 10 万个房贷用户,推测有多少人会违约,如果每个人违约行为是相互独立的,那就会呈钟形分布,你可以据此做期权、衍生品的风险管理。这套理论非常优雅。


但现实中,如果存在系统性冲击——经济系统整体波动导致所有人同时违约,那就是高度非高斯行为,而 2008 年的模型没能充分预见这种风险。


现在大家多少意识到了:系统性风险比我们之前以为的更严重。一个模型再优美,不代表它符合现实。所以理解数学模型的推理逻辑很重要,但理解模型与现实契合度的科学判断也同样重要。你需要二者兼顾。


数学可以帮助我们找出模型的薄弱之处。比如中心极限定理会告诉你:只要输入变量互不相关,结果就会呈现高斯分布。它能帮你定位问题源头。


假如你了解塞迈雷迪定理,有人想用高斯分布去建模违约风险,你作为数学家就可以质问:“你这些输入变量之间的系统性相关性有多大?”然后你可以问经济学家,这种风险是否被低估了,是否能找到证据。这就是科学与数学之间的协同。


莱克斯:

在普适性这个话题上,你因在数学领域涉猎之广、之深而闻名并备受赞誉,让人想起一个世纪前的希尔伯特(Hilbert)。事实上,伟大的菲尔兹奖得主、你的同事蒂姆·高尔斯(Tim Gowers)曾说过,你就是我们这个时代最接近希尔伯特的人。



图丨希尔伯特(来源:Wikipedia)


那么,作为一个能在数学中兼顾深度与广度的人,你是最合适回答这个问题的人:你认为所有数学领域之间存在某种深层的统一结构吗?


陶:

其实数学的很多进步,都是两个原本毫无关联的领域,后来发现了深刻的联系。比如一个古老的例子:几何与数论。在古希腊时期,这两个领域被视作完全不同的学科。当然,数学家可能同时研究它们,比如欧几里得,他既写了几何,也研究数论。但那时这两个领域并没有真正融合。


直到笛卡尔发明了解析几何——用两个实数坐标来参数化平面,将几何问题转化为代数问题。今天我们觉得这再自然不过:平面当然就是 x 和 y,但当时这可是一项革命性突破。


这类融合在数学史上反复发生:代数与几何曾分离,后来发展出代数几何;概率论和数论也开始融合;每一次跨领域连接,都是数学的重要进展。我个人非常喜欢这种数学。


我认为数学家有不同的风格——刺猬型与狐狸型。刺猬知道一件事,但非常深入;狐狸则对很多事略懂皮毛。


我个人更多地认同自己是“狐狸”。我喜欢套利式的探索:学会一个领域的工具后,把这些技巧带到另一个看似毫不相关的领域,而那里的人通常没用过这些方法,我能做出些新贡献。


还有一些数学家比我深刻得多,他们是典型的刺猬型,非常快、非常高效。但我可以为他们带来一些额外的工具。


莱克斯:

你曾说过,你可以根据具体语境或合作关系的不同,在“刺猬”和“狐狸”这两种思维方式之间切换。那么,如果可能的话,能否谈谈这两种处理问题的方式有什么区别?比如说,当你面对一个新问题时,是选择寻找跨领域的联系,还是保持高度专注的单一视角?


陶:

我更习惯于“狐狸”的范式。我喜欢寻找类比和叙事。我经常会花很多时间——比如当我在某个领域看到一个有趣的结果时,我可能很喜欢这个结果本身,但它的证明方式却用了一些我不太熟悉的数学工具。这种情况下,我会试着用我自己擅长的工具重新去证明它。


往往我自己的证明更差,但这个过程本身很有价值。因为在尝试重建的过程中,我会逐渐明白:原来的那个证明其实是想达成这个目标。通过这样“绕路”的方式,我反而能理解那个领域里使用的那些工具。这是一种非常探索性的过程,也意味着我经常会去一些陌生的领域、做些疯狂的尝试,甚至常常在“重复造轮子”。


相比之下,我觉得“刺猬式”的风格更学术化,知识体系也更稳固。这种风格依赖对某一领域的发展始终保持最新了解,熟悉所有历史脉络,并且对每种具体技术的优劣都有非常清晰的把握。我觉得这种风格更强调计算,而不是通过讲述故事或建构类比来理解。


我也能做到那种方式,但我知道有些人在那方面真的非常擅长。


莱克斯:

让我们退一步,来看一个稍微浪漫化一点的数学版本。你曾说过,在你年轻的时候,对你而言数学更像是一种解谜游戏。你是在什么时候第一次遇到一个问题或一个证明,让你意识到数学可以拥有一种优雅和美感?


陶:

这是个好问题。我刚到普林斯顿读研究生的时候,约翰·康威(John Conway)当时还在那里,他几年前去世了。但我记得我去听的第一场研究讲座之一,就是康威的一个关于他称之为“极端证明”(extreme proof)的讲座。


康威有一种神奇的思考方式,他总能以一种你完全想不到的方式看待各种事物。他把证明本身看作是占据了某种空间。比如你要证明一个命题,比如“素数是无穷的”,那么就会有很多种证明方法。你可以根据不同的维度对这些证明进行排序:有些证明很优雅,有些很长,有些很基础。于是这些证明在某种意义上构成了一个证明空间,而他感兴趣的是这个空间的“极限点”——也就是那些在某一方面达到极致的证明,比如最短的、最基础的、最不依赖其他定理的那一个。


他举了一些著名定理的例子,然后给出了他认为在不同方面堪称极端的证明。我发现那真的让我大开眼界,原来不仅仅是为一个有趣的结论找到一个证明,一旦你有了那个证明,再去从不同角度优化它,证明本身这个行为就蕴含了某种匠心。


这无疑影响了我的写作风格。比如,你做数学作业,作为本科生,你的作业之类的,你被鼓励只要写下任何一个能行的证明,交上去,只要能得到一个对勾,你就继续往下走了。但如果你希望你的成果能真正产生影响,能被人阅读,那它就不能仅仅是正确的。它还应该读起来令人愉悦,有清晰的动机,能够被推广到其他问题上。这和很多其他学科很像,比如编程。数学和编程之间有很多类比。我喜欢类比,如果你还没注意到的话。你可以写出一段代码,意大利面条式的代码——它能完成任务,但非常混乱,结构很差。虽然能用,但别的人看不懂,也很难修改或扩展。所以我们有各种写好代码的原则——写得更整洁、更易维护、更少 bug。数学也是一样的:一个好的证明,不只是为了“能用”,还要能被别人理解、引用和延续。


莱克斯

那你心中最优美、最优雅的数学公式是什么?很多人评价“美”时强调的是“简洁性”,比如说爱因斯坦的 E=mc²。而在数学领域,大家最常提的美丽公式是欧拉恒等式。你觉得这个公式美吗?


正如我所说,我发现最吸引人的是不同事物之间的联系……所以如果……eiπ=−1。是的,人们用上了所有基本常数。好吧,我是说,这很可爱,但对我来说……指数函数,由欧拉提出,是用来衡量指数增长的。比如复利或衰变,任何持续增长、持续减少、生长和衰变,或扩张或收缩的东西,都由指数函数建模,而 π 则来自圆和旋转,对吧?如果你想旋转一根针,比如说,180 度,你需要旋转 π 弧度,而 i,复数,代表了交换虚轴的 90 度旋转。所以是一个方向的改变。


所以,指数函数代表了在你当前方向上的增长和衰减。当你把一个 i 放入指数中,运动就不再是与你当前位置相同的方向,而是与你当前位置成直角的运动。所以是旋转,然后,eiπ=−1 告诉你,如果你旋转时间为 π,你最终会到达相反的方向。所以它通过这种复化的行为,即乘以 iπ 的旋转,统一了通过扩张的几何学和通过指数增长的动力学。所以它把所有这些数学领域联系在一起,动力学、几何学和复数。由于这个恒等式,它们在数学中都被认为是近邻。


莱克斯:

你觉得这些符号的“偶然碰撞”只是巧合,还是说它其实揭示了更深的东西?比如不同领域的符号相遇,是否也有其内在的价值?


陶:

我觉得这证明了你拥有了正确的概念。当你第一次研究任何东西时,你必须去测量事物,给它们命名。一开始,有时候因为你的模型离现实太远,你可能会给错误的东西起了最好的名字,你只有在后来才发现什么才是真正重要的。


莱克斯:

物理学家有时会这么做,但结果还不错。


陶:

实际上,物理学也一样,比如说爱因斯坦提出 E=mc²。回到更早的时候,亚里士多德、伽利略和牛顿提出了最初的运动定律。他们能测量的是质量、加速度和力,于是牛顿力学中最核心的就是 F = ma,这些可测量的量在理论中占据核心地位。


但随着人们对这些方程的进一步分析,出现了一些“额外的量”,比如动量和能量。能量并不是一个你能像质量和速度那样直接测量的东西,但人们逐渐意识到它在物理系统中极为关键。


到了 19 世纪,哈密顿重构了牛顿力学,提出了所谓的哈密顿力学。在这个体系中,“哈密顿量”(Hamiltonian)才是真正的核心对象。只要你能准确地测量出一个系统的哈密顿量,你就可以描述整个系统的演化。这种思维方式在后来面对量子力学时起到了关键作用。


早期的物理学家试图用牛顿的粒子图景去理解量子世界,发现完全不对劲,因为量子力学强调的是“波”。


你要问,“量子版的 F=ma 是什么?”根本没人能说清楚。但幸运的是,哈密顿量这个概念依然适用,它只是以不同的形式出现,是一个算符(operator),而不是一个函数。


只要你能给出哈密顿量,就能通过薛定谔方程描述量子系统的演化过程。


所以,虽然经典力学与量子力学在表面上完全不同,一个是粒子,一个是波,但因为都基于哈密顿量,我们就能将很多经典力学中的直觉迁移到量子力学中。


比如说,经典力学中有诺特定理(Noether theorem):每一个对称性都对应一个守恒定律。如果物理规律不随空间平移而改变,那就有动量守恒;如果不随角度旋转而改变,那就有角动量守恒;如果不随时间变化而改变,那就有能量守恒。


如果你等 10 分钟,所经历的物理定律仍然相同,这种时间平移不变性对应的就是能量守恒。也就是说,对称性和守恒律之间存在着根本性的联结。而这在量子力学中同样成立,尽管方程形式完全不同。但因为两者都以哈密顿量为核心,只要这个哈密顿量保持某种对称性,那么对应的方程就会产生一个守恒量。


一旦你找到了“正确的语言”,很多事情就会变得清晰许多。


至于为什么我们还无法统一量子力学与广义相对论,其中一个问题是我们还没搞清楚“基本的对象”到底应该是什么。比如,我们很可能要放弃将时空看作类欧几里得空间的想法。我们知道,在极小的尺度上存在量子涨落,存在所谓的“时空泡沫”,而此时再使用笛卡尔坐标系(x, y, z)显然是走不通的。但问题是:我们还不知道该用什么来替代。我们甚至没有找到类比于哈密顿量那样的组织性概念,能够像哈密顿量在经典和量子力学中那样,统摄一切。


万有理论


莱克斯:

你是否在直觉上相信,真的存在一套“万有理论”?我们真的可能找到这样一种语言,来统一广义相对论与量子力学?


陶:

我相信是存在的。从历史来看,物理学的发展就是不断统一的过程,某种程度上和数学的发展也类似。比如说,早期电学和磁学是两套完全不同的理论,后来被麦克斯韦统一了;牛顿则统一了天体的运动与地球上的物体运动。因此,这种统一是有前例可循的,它应当可以实现。


不过,回到理论与观测的关系,我们现在遇到的问题之一是物理学反而成为了它自身成功的受害者。因为我们目前的两大物理理论:广义相对论与量子力学,实在太有效了。这两者加起来,已经可以解释我们能观测到的 99.9% 的现象。


为了找到它们失效的边界,我们必须进入极端的实验条件,比如极高能量的粒子对撞机,或者宇宙早期的状态——这些都是难以实现的。因此,真正看到这两者之间差异、并据此找到融合路径,非常困难。但我相信,这条路我们已经走了几个世纪,一直都在进步,没有理由会停下。


莱克斯:

你认为你会是那个发展出万有理论的数学家吗?


陶:

通常发生的情况是,当物理学家需要某种数学理论时,往往已经有数学家早先一步做出了某种雏形。比如,当爱因斯坦开始意识到空间是弯曲的,他去找了一位数学家问:“有没有关于弯曲空间的理论,是数学家已经搞出来的,可能能用?”然后那位数学家说:“有的,黎曼搞出过一些类似的东西。”结果,黎曼发展出的黎曼几何——一个关于空间如何以各种方式弯曲的理论——几乎就是爱因斯坦的理论所需要的。这又回到了数学“不合理的有效性”上。我认为,那些能很好地解释宇宙的理论,往往也涉及到那些能很好地解决数学问题的数学对象。归根结底,它们都只是以有用的方式组织数据的不同方法。


莱克斯:

只是感觉你可能需要去到一个非常奇特、非常难以凭直觉把握的地方。比如弦理论。


陶:

是的,那在很长一段时间里都是一个主要的候选理论。但我想它正慢慢地失宠,因为它与实验不太匹配。


莱克斯:

所以,一个巨大的挑战当然在于,就像你说的,实验非常困难,因为广义相对论和量子力学本身就极其有效。但另一个挑战在于,这不是简单地“偏离”时空结构,而是走向一些非常极端的想象空间——比如多维空间、各种我们难以感知的构造。我们已经从平地走到了“弯曲空间”,你还得不断往前跳跃,而我们作为类人猿后代的认知结构,很难真正直觉地理解那种现实。


陶:

这就是类比如此重要的原因。“地圆说”是不直观的,因为我们被困在地球上。但是,我们对圆的物体本身是有直觉认知的,也理解光是如何传播的。所以,实际上是可以通过一些简单的实验来验证这一点的,比如日食、月相变化等现象,都可以通过圆形的地球和月亮模型轻松解释。你只需要一个篮球、一颗高尔夫球和一个灯光源,就可以自己在家动手模拟。所以直觉是可以培养的,只要你肯把它“迁移”过来。


莱克斯:

对我们来说,从“地平”到“地圆”,在认知上确实是一个巨大的飞跃,因为我们的生活大部分是在平地上度过的。如今我们对这些事情习以为常,是因为科学已经提供了大量证据。但你想想,我们其实正处在一个圆形的岩石上,以极快的速度在宇宙中飞行。这本身就是一种巨大的跳跃。而且,在科学进步的过程中,你需要不断地进行这类飞跃,一次又一次。


陶:

完全正确。现代科学或许又是“成功的受害者”——为了追求更高的准确性,它不得不与人类最初的直觉越来越远。而对于没有接受过完整科学教育的人来说,越是如此,就越容易显得“难以置信”。所以我们需要提供更扎实的基础。


当然,现在有很多科学家做着非常出色的公众传播工作。其实还有很多科学实验是可以在家里完成的。有很多 YouTube 视频,我最近也和一个叫 Grant Sanderson 的 YouTuber 合作了一个视频,我们就讨论了古希腊人是如何测量月亮和地球之间的距离的。他们所用的技术,其实今天我们每个人也可以自己动手试一试。根本不需要太空望远镜或复杂数学模型。


视角的转换非常重要。常言道,旅行开阔视野,那么这是一种“智识上的旅行”。你试图把自己放入古希腊人、或任何历史时期的人的视角,提出一些假设,比如“球形地球”,然后进行推演与想象。这其实就是数学家的工作方式,某种意义上,也类似于艺术家的创造。


只要你设定一组公理,数学的推演就会展开。你沿着这些公理不断推理,常常可以走得比最初的假设远得多。


广义相对论


莱克斯:

你提到了广义相对论,你也曾在理解爱因斯坦场方程的数学方面做出过贡献。你能否介绍一下这部分工作?从数学的角度来看,广义相对论中哪些方面最吸引你?又有哪些挑战?


陶:

我确实研究过一些相关方程。其中有一个叫“波映射方程”(wave maps equation),也称为 σ 场模型(Sigma field model),它并不是直接描述时空引力本身的方程,而是关于存在于时空之上的某些场的模型。


爱因斯坦的广义相对论方程描述的是“空间”与“时间”本身,但在这个基础之上还存在其他的场,比如电磁场、杨-米尔斯场(Yang-Mills fields)等等。这些方程形成了一个层级体系,而爱因斯坦方程虽然是其中最非线性、最复杂的之一,但在整个层级中却并不处于最高位置。


我研究的是其中相对低阶的一个——波映射方程。它的物理图景是这样的:想象一个波动,它在每一点上都被限制在球面之上。可以把它想象成时空中有一大堆小箭头,这些箭头指向不同的方向,像波一样传播。你轻轻拨动一个箭头,它的扰动就会扩散开来,让周围的箭头也开始运动,就像麦田中随风摇曳的麦穗一样。


我关注的问题是所谓“全局正则性问题”(global regularity problem),也就是:这些能量是否有可能集中在某个点上?我研究的这个方程属于“临界方程”(critical equation)类别,其特征是它在所有尺度上的行为基本相似。


我最终证明了:你无法构造出一个让所有能量集中在一点的情形——能量必须在某个时刻稍微地分散开来,即便只是一点点分散,也足以维持解的正则性。这项工作大约是在 2000 年完成的,也是我后来开始对纳维-斯托克斯方程产生兴趣的原因之一。


为了解决这个问题,我开发了一些新的技术。因为这个方程是高度非线性的,主要是因为球面本身的曲率带来了某种“非微扰效应”(non-perturbative effect)。在常规视角下,这些非线性效应甚至比波动方程的线性部分还要强,使得问题很难控制,即便能量很小也不例外。


于是我引入了一种称为“规范变换”(gauge transformation)的方法。你可以把这个系统想象成一大片麦穗在风中来回摆动,极其复杂。如果我们能让这些运动“稳定”下来,比如在空间的各个点上挂上小摄像头,这些摄像头可以随着主流动方向一起运动,从而捕捉到主要动态。


在这种稳定坐标系下,原本非线性的流动就变得更线性了。我正是通过这种方式找到了一个可以转换方程的坐标系统,成功减少了非线性影响,并最终得以解决该方程。


注:因平台正文字数不能超过50000字,该文章无法在此显示完整内容,可粘贴链接
https://mp.weixin.qq.com/s/v8e6ltSQ8Q_k1_rwJn1vag 至浏览器查看完整内容,或关注公众号——“DeepTech深科技”查看。


参考资料:

1.https://www.youtube.com/watch?v=HUkBz-cdB-k&t=7487s


运营/排版:何晨龙

展开阅读全文

更新时间:2025-06-24

标签:科技   难题   小时   数学   陶哲   方程   结构   能量   模型   系统   尺度   理论   哈密   数学家

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top