首页

手游

资讯

专题

首页 > 教程攻略 > ai资讯 >断网解题，Claude Mythos推翻Erdős 80年猜想，比OpenAI更短更漂亮

断网解题，Claude Mythos推翻Erdős 80年猜想，比OpenAI更短更漂亮

来源：互联网时间：2026-05-27 19:39:09

【导读】

OpenAI用125页思维链踹开Erdős 80年猜想的门，Mythos如今找到了一条更短更优雅的路。最离谱的是，它拿到第一个可行解就停手了——面对名满天下的开放问题，AI也会紧张。

AI在数学领域的前进速度，已经彻底“失控”了。

OpenAI前脚刚推翻一个悬置了80年的数学猜想，Anthropic后脚就亮出了自己的证明。同一周内，DeepMind还一口气攻克了9道同类型的难题。

就在不久前，Anthropic的研究员Levent Alpoge在社交平台上连发十条推文，核心信息令人咋舌：

OpenAI花了125页才解开的难题，他周末用Mythos随手一试，不仅分分钟搞定，而且找到的证明路径更短、更简洁。

断网隔离，Mythos开测

这位Levent Alpoge的来头可不小。1992年出生，哈佛本科以4.0满分毕业，随后在剑桥完成Part III课程，又在普林斯顿拿下博士学位，师从菲尔兹奖得主Manjul Bharga va。他早在2015年就获得了美国本科生数学研究的最高奖Morgan Prize，曾是哈佛Junior Fellow，并且解决了希尔伯特第十问题在所有数域上的推广。

2023年GPT-4发布时，他立刻被深深吸引，直言“它瞬间成了人类有史以来创造的最有趣的东西”，并因此决定重返计算机科学领域，随后加入了Anthropic。

本周，在OpenAI破解Erdős难题的消息公布后，Levent做了一件“理所当然”的事：让自家的Mythos模型也试试看。

为了确保测试的公平性和独立性，条件设置得非常严格：让多个Claude Code实例各自独立工作，全程断网，彻底杜绝了从OpenAI公开解法中“借鉴”的可能性。

结果出乎意料。模型不仅找到了与OpenAI类似的解法，而且更偏爱另一条完全不同、却更加简洁的路径。

更有意思的细节出现了：模型明明已经找到了一个足以推翻猜想的方案，却在得到第一个可行答案时就停了下来。它本可以再向前一步，得到一个更强的结论，但它似乎“紧张”了。面对这道声名显赫的开放性问题，它不敢相信自己的结论，保守地停在了第一个可行解上。

看到这一幕，Levent直接乐了，他表示：“这种感觉，所有数学家都懂！”

目前，Opus 4.7已经完成了证明全文的整理和排版。

80年没人赢过的赌注

时间拨回到1946年。匈牙利数学家保罗·埃尔德什（Paul Erdős）提出了一个听起来极其简单的问题：在平面上随意放置n个点，最多能有多少对点之间的距离恰好是1？

举个例子，就像在桌面上摆放100枚硬币。如果两枚硬币的圆心之间刚好隔着一个硬币的直径，就算一对“单位距离”。那么，100枚硬币最多能凑出多少对这样的组合？

埃尔德什自己给出了一个答案：把点排列成方格网格，经过适当的缩放后，单位距离对的数量大约是 n^(1 + c/log log n)。也就是说，100个点大概能凑出比100多“一丢丢”的对数。

然后，他下了个“赌注”：这就是极限了，没人能做得更好。

他如此自信，是因为这里存在一个关键瓶颈——高斯整数环Z[i]。埃尔德什的方格网格构造依赖于这个数系，而一个固定范数在Z[i]中能分解出的方式数量，取决于除数函数，其上限大约是 exp(O(log n / log log n))。这便构成了那个“多出一丁点”的天花板。

整整80年，数学家们都在这个框架内打转，无人能突破。

数论重武器，降维打击几何学

对于人类数学家而言，代代相传的直觉是“答案要在高斯整数Z[i]里找”。但Mythos没有这种传统包袱，它一上来就把Z[i]替换成了次数远大于2的数域K的整数环O_K。

这听起来有点像“用大炮打蚊子”，但正是这种跨学科的“暴力”方法，撬开了尘封80年的僵局。

具体方法是，先利用Golod-Shafarevich判则，在一个二次域上构建一座无限高的“数域塔” K₀ ⊂ K₁ ⊂ K₂ ⊂ …… 然后，对每一层K_n，取其一个四次根扩张F_n = K_n(D^{1/4})，其次数为d_n。

这座塔之所以有效，关键在于一个性质：无论塔建得多高，数域的“复杂度密度”始终有界，结构始终可控。一旦参数足够大，几何计数就能启动。

接下来是整个证明的核心。在埃尔德什依赖的Z[i]中，单位群只有{±1, ±i}四个元素。能向外延伸的“单位距离方向”就这么几个，直接被除数函数死死卡住。

但在高维数域里，情况截然不同。单位群的秩随着维度增长，van der Corput定理直接将这个秩转化成了方向的数量。于是，原本可怜的4个方向，变成了随维度爆炸式增长。

这段技术细节如果看不懂没关系，记住一个形象的比喻就够了：

埃尔德什被困在一个只有4个出口的房间里，而Mythos直接把墙给拆了。

接下来的构造就直观了。首先，选择一个实嵌入将这些数投射到平面上，得到点集P。然后，取一个单位向量去平移这些点，新旧两点之间的距离恰好是1。由于方向数量增长极快，满足条件的点对数量远远超过了埃尔德什设定的上限。两者相乘，便得到了多项式级别的增益。

更直观地说：

单位距离方向数的增长是exp(Ω(d log log d))量级，而所有其他损耗都只是exp(O(d))量级。d log log d 轻松碾压了 d。

就这样，埃尔德什的猜想被推翻了。整个论证过程在解析上并不复杂，与OpenAI那条长达125页的路径相比，显得简洁得多。

用Levent自己的话总结：

从高层视角看，这本质上还是埃尔德什的原始构造加上一座类域塔。只不过，这里做的是字面意义上最“笨”的事——把大小不超过半径一半的点，加到大小不超过半径一半的单位上。而它之所以管用，纯粹是因为类域塔的几何计数增长实在太快了。

一周三连，各自破城

过去这一周的时间线，信息密度高得离谱。

5月20日

，OpenAI官宣，其一个未公开名称的通用推理模型，自主反驳了埃尔德什单位距离猜想。同一天，普林斯顿大学教授Will Sawin在arXiv上贴出了手工改进版，将指数从6×10⁻³⁸提升到了0.014，差距高达10³⁵倍。曾与埃尔德什合作过的佐治亚理工学院数学家Tom Trotter感慨道：“如果埃尔德什还活着，他一定会激动到发疯。”

5月21日

，DeepMind上场，其AlphaProof Nexus模型一口气啃下了9道埃尔德什问题，每道题的推理成本最多只需几百美元。

5月26日

，Anthropic也宣布实现了独立证明，其路径比OpenAI的125页要短得多。

三家公司的技术路线完全不同，但结果都收敛到了同一个终点。

从笑话到《数学年刊》

要知道，就在七个月前，AI做数学研究还是个笑话。

2025年10月，时任OpenAI副总裁的Kevin Weil在社交平台上宣称GPT-5解决了10个埃尔德什问题。负责维护erdosproblems.com网站的数学家Thomas Bloom看到后当场回怼，指出模型只是检索到了已知解法，属于“严重歪曲事实”。Yann LeCun和Demis Hassabis也纷纷加入嘲讽行列。很快，Weil删除了帖子，并在四个月后离开了OpenAI。