首页 > 教程攻略 > ai资讯 >断网解题,Claude Mythos推翻Erdős 80年猜想,比OpenAI更短更漂亮

断网解题,Claude Mythos推翻Erdős 80年猜想,比OpenAI更短更漂亮

来源:互联网 时间:2026-05-27 19:39:09

【导读】

OpenAI用125页思维链踹开Erdős 80年猜想的门,Mythos如今找到了一条更短更优雅的路。最离谱的是,它拿到第一个可行解就停手了——面对名满天下的开放问题,AI也会紧张。

AI在数学领域的前进速度,已经彻底“失控”了。

OpenAI前脚刚推翻一个悬置了80年的数学猜想,Anthropic后脚就亮出了自己的证明。同一周内,DeepMind还一口气攻克了9道同类型的难题。

就在不久前,Anthropic的研究员Levent Alpoge在社交平台上连发十条推文,核心信息令人咋舌:

OpenAI花了125页才解开的难题,他周末用Mythos随手一试,不仅分分钟搞定,而且找到的证明路径更短、更简洁。

断网隔离,Mythos开测

这位Levent Alpoge的来头可不小。1992年出生,哈佛本科以4.0满分毕业,随后在剑桥完成Part III课程,又在普林斯顿拿下博士学位,师从菲尔兹奖得主Manjul Bharga va。他早在2015年就获得了美国本科生数学研究的最高奖Morgan Prize,曾是哈佛Junior Fellow,并且解决了希尔伯特第十问题在所有数域上的推广。

2023年GPT-4发布时,他立刻被深深吸引,直言“它瞬间成了人类有史以来创造的最有趣的东西”,并因此决定重返计算机科学领域,随后加入了Anthropic。

本周,在OpenAI破解Erdős难题的消息公布后,Levent做了一件“理所当然”的事:让自家的Mythos模型也试试看。

为了确保测试的公平性和独立性,条件设置得非常严格:让多个Claude Code实例各自独立工作,全程断网,彻底杜绝了从OpenAI公开解法中“借鉴”的可能性。

结果出乎意料。模型不仅找到了与OpenAI类似的解法,而且更偏爱另一条完全不同、却更加简洁的路径。

更有意思的细节出现了:模型明明已经找到了一个足以推翻猜想的方案,却在得到第一个可行答案时就停了下来。它本可以再向前一步,得到一个更强的结论,但它似乎“紧张”了。面对这道声名显赫的开放性问题,它不敢相信自己的结论,保守地停在了第一个可行解上。

看到这一幕,Levent直接乐了,他表示:“这种感觉,所有数学家都懂!”

目前,Opus 4.7已经完成了证明全文的整理和排版。

80年没人赢过的赌注

时间拨回到1946年。匈牙利数学家保罗·埃尔德什(Paul Erdős)提出了一个听起来极其简单的问题:在平面上随意放置n个点,最多能有多少对点之间的距离恰好是1?

举个例子,就像在桌面上摆放100枚硬币。如果两枚硬币的圆心之间刚好隔着一个硬币的直径,就算一对“单位距离”。那么,100枚硬币最多能凑出多少对这样的组合?

埃尔德什自己给出了一个答案:把点排列成方格网格,经过适当的缩放后,单位距离对的数量大约是 n^(1 + c/log log n)。也就是说,100个点大概能凑出比100多“一丢丢”的对数。

然后,他下了个“赌注”:这就是极限了,没人能做得更好。

他如此自信,是因为这里存在一个关键瓶颈——高斯整数环Z[i]。埃尔德什的方格网格构造依赖于这个数系,而一个固定范数在Z[i]中能分解出的方式数量,取决于除数函数,其上限大约是 exp(O(log n / log log n))。这便构成了那个“多出一丁点”的天花板。

整整80年,数学家们都在这个框架内打转,无人能突破。

数论重武器,降维打击几何学

对于人类数学家而言,代代相传的直觉是“答案要在高斯整数Z[i]里找”。但Mythos没有这种传统包袱,它一上来就把Z[i]替换成了次数远大于2的数域K的整数环O_K。

这听起来有点像“用大炮打蚊子”,但正是这种跨学科的“暴力”方法,撬开了尘封80年的僵局。

具体方法是,先利用Golod-Shafarevich判则,在一个二次域上构建一座无限高的“数域塔” K₀ ⊂ K₁ ⊂ K₂ ⊂ …… 然后,对每一层K_n,取其一个四次根扩张F_n = K_n(D^{1/4}),其次数为d_n。

这座塔之所以有效,关键在于一个性质:无论塔建得多高,数域的“复杂度密度”始终有界,结构始终可控。一旦参数足够大,几何计数就能启动。

接下来是整个证明的核心。在埃尔德什依赖的Z[i]中,单位群只有{±1, ±i}四个元素。能向外延伸的“单位距离方向”就这么几个,直接被除数函数死死卡住。

但在高维数域里,情况截然不同。单位群的秩随着维度增长,van der Corput定理直接将这个秩转化成了方向的数量。于是,原本可怜的4个方向,变成了随维度爆炸式增长。

这段技术细节如果看不懂没关系,记住一个形象的比喻就够了:

埃尔德什被困在一个只有4个出口的房间里,而Mythos直接把墙给拆了。

接下来的构造就直观了。首先,选择一个实嵌入将这些数投射到平面上,得到点集P。然后,取一个单位向量去平移这些点,新旧两点之间的距离恰好是1。由于方向数量增长极快,满足条件的点对数量远远超过了埃尔德什设定的上限。两者相乘,便得到了多项式级别的增益。

更直观地说:

单位距离方向数的增长是exp(Ω(d log log d))量级,而所有其他损耗都只是exp(O(d))量级。d log log d 轻松碾压了 d。

就这样,埃尔德什的猜想被推翻了。整个论证过程在解析上并不复杂,与OpenAI那条长达125页的路径相比,显得简洁得多。

用Levent自己的话总结:

从高层视角看,这本质上还是埃尔德什的原始构造加上一座类域塔。只不过,这里做的是字面意义上最“笨”的事——把大小不超过半径一半的点,加到大小不超过半径一半的单位上。而它之所以管用,纯粹是因为类域塔的几何计数增长实在太快了。

一周三连,各自破城

过去这一周的时间线,信息密度高得离谱。

5月20日

,OpenAI官宣,其一个未公开名称的通用推理模型,自主反驳了埃尔德什单位距离猜想。同一天,普林斯顿大学教授Will Sawin在arXiv上贴出了手工改进版,将指数从6×10⁻³⁸提升到了0.014,差距高达10³⁵倍。曾与埃尔德什合作过的佐治亚理工学院数学家Tom Trotter感慨道:“如果埃尔德什还活着,他一定会激动到发疯。”

5月21日

,DeepMind上场,其AlphaProof Nexus模型一口气啃下了9道埃尔德什问题,每道题的推理成本最多只需几百美元。

5月26日

,Anthropic也宣布实现了独立证明,其路径比OpenAI的125页要短得多。

三家公司的技术路线完全不同,但结果都收敛到了同一个终点。

从笑话到《数学年刊》

要知道,就在七个月前,AI做数学研究还是个笑话。

2025年10月,时任OpenAI副总裁的Kevin Weil在社交平台上宣称GPT-5解决了10个埃尔德什问题。负责维护erdosproblems.com网站的数学家Thomas Bloom看到后当场回怼,指出模型只是检索到了已知解法,属于“严重歪曲事实”。Yann LeCun和Demis Hassabis也纷纷加入嘲讽行列。很快,Weil删除了帖子,并在四个月后离开了OpenAI。

当时业界的普遍判断是:模型或许会做题,但远不会做真正的数学研究。

转眼到了今天,风向彻底变了。Thomas Bloom亲自签署了验证报告。菲尔兹奖得主Timothy Gowers写下了“如果提交到《数学年刊》,我会毫不犹豫推荐接受”的盛赞。数学家Sam Litt则表示,这是“AI自主产出的第一个让我觉得本身就有意思的结果”。

甚至,Litt在《自然》杂志的采访中坦言:“没有人类能像大语言模型那样吸收全部数学文献。AI正在打破学科之间的壁垒。”

回想三年前,GPT-4连本科水平的数学题都应付得吃力。如今,让最伟大的数学家都感到棘手的埃尔德什问题,正在变成AI的“入学考试”。

打破80年僵局的,恰恰是一个不知道“这题应该怎么想”的模型。没有传统思维的包袱,反而让它能够从代数数论中借来“重武器”,去攻克一道几何难题。

埃尔德什留下了超过1000道未解难题。这一周,清单上又少了一道。