首页

手游

资讯

专题

首页 > 教程攻略 > ai资讯 >ChatGPT证明了六年难题，图灵奖得主说：高兴早了

ChatGPT证明了六年难题，图灵奖得主说：高兴早了

来源：互联网时间：2026-06-08 13:32:29

学术圈流传着一句非常辛辣的评价：

“这项工作既有新意，又很好。可惜的是，好的部分不新颖，新颖的部分不好。”

这句话，原本是审稿人用来调侃那些“半桶水”论文的。但强化学习之父、图灵奖得主Richard Sutton，最近直接把这句话对准了整个生成式AI。

他说：这个评价，适用于今天我们所熟悉的大部分AI。

AI：好的部分不新颖，新颖的部分不好

Sutton的核心论断极其简洁，简洁到残忍：

生成式AI本质上是监督学习。

监督学习的逻辑是什么？说白了就是，模型要模仿人类，越像越好。

问题就在这里。

当模型严格按训练数据生成内容时，输出质量很高——因为它复现了人类已经验证过的好东西。但这不新颖。它只是在用不同的排列组合，重新包装人类已知的事物。

而当模型试图偏离训练数据、生成真正新颖的内容时，质量就崩了。因为它没有任何内部机制来判断“这个新东西到底好不好”。它只会生成，不会评估。

这就是那个结构性矛盾：

新颖性和质量，在纯监督学习的框架下，是跷跷板的两端。你按下一头，另一头就翘起来。

这根本不是工程问题。不是靠堆数据、扩大模型、加更多GPU就能解决的。

Sutton用了一个极其刺眼的类比：“幻觉”——大模型最被人诟病的毛病——本质上就是模型试图“新颖”的副产品。我们讨厌幻觉，恰恰证明了一件事：我们其实根本不要新颖性。我们只要高质量的模仿。

“好的不新颖，新颖的不好。”那个笑话里审稿人的毒评，竟然精准描述了整个生成式AI的内在局限。

真正的“发现”，需要三件套

Sutton从第一性原理出发，拆解了创造力的“三位一体公式”：

真正的发现（Discovery） = 变异（Variation）+ 评估（Evaluation）+ 选择性保留（Retention）。

任何真正的创造力与发现，都需要三个步骤，缺一不可：

变异

：产生多样化的可能性。可以是随机的，可以是基于已有知识的，但必须有真正的不确定性——否则不叫探索，叫查表。

评估

：判断哪些变异是有价值的。这需要一个明确的目标，或者一个能够识别“好坏”的标准。

选择性保留

：把有价值的变异留下来，让它影响未来的行动和学习。

这三个步骤，不是Sutton的发明。它是自然选择的逻辑，是科学方法的逻辑，是人类学习的逻辑。

进化论
：随机基因突变（变异）→ 环境筛选（评估）→ 适者生存（选择性保留）。
科学方法
：提出假说（变异）→ 实验验证（评估）→ 发表论文（选择性保留）。
人类学习
：尝试不同解法（变异）→ 检验对错（评估）→ 记住有效的方法（选择性保留）。

现在，生成式AI只完成了三位一体的第一步：几乎没有评估，更别提升级保留。它就像一个会随机射箭的弓箭手，但眼睛是蒙着的，射完之后既不看靶子，也不根据结果调整姿势。你叫它射一万箭，偶尔会中靶，但它永远不知道为什么中了。

那么，科学家还有没有用？

到这里你可能会有点焦虑：如果未来AI真的能自主完成“发现”的三位一体，科学家是不是就要失业了？

Sutton自己的回答是：不能被取代，但角色要彻底转型。他在演讲中说，哪怕是能独立证明数学定理的AI，目前仍然需要人类来告诉它：哪些问题是重要的。

这不是谦虚，而是真实的认知边界。

数学家Shiqian Ma，莱斯大学（Rice University）优化领域学者，提供了一个极好的案例。他说，他用ChatGPT，证明了一个让他研究了整整六年的算法收敛性问题。

这个算法叫BDRS（Bregman Douglas-Rachford Splitting），用于解决最优传输问题。论文摘要里有一句话很说明问题：“证明由ChatGPT 5.5生成，经作者验证。”

但人类能被AI取代吗？他的回答是不能。

他直言：AI不能创造性地提出这种算法，并声称“这是一种用于最优传输的高效算法，现在让我试着证明它的收敛性”。没有人类的引导，AI根本不知道该解决哪个问题。

这句话和Sutton精确对应：问题本身，必须由人类来定义。

他花了六年，才“提出正确问题”：“要提出哪些问题，实际上需要你对该主题有非常深入的理解。就本例而言，我已在这个问题上钻研了六年，因此我清楚地知道其中的难点所在。”

这六年不是浪费，是先决条件。正是这六年，让他知道这个证明卡在哪，之前所有路径失败的原因是什么，ChatGPT给出的哪个方向值得继续追、哪个是幻觉。

而且不是一次提示，是五个月。从1月到5月，整整五个月，无数次对话，每一次提示都在逼近那个证明。

他总结得极其清醒：研究的本质没变，还是反复试错。变的是每一次试错的速度——过去需要几周验证一个方向，现在几分钟就能知道这条路走不走得通。

然后，结尾直接封神：

“回到我关于BDRS收敛性的论文，我相当确信证明是正确的。但如果你发现任何错误，责任全由我承担——请不要责怪ChatGPT，它才3.5岁。”

这句话妙就妙在双重性：这是真诚的责任声明，也是一个精准的隐喻。“3.5岁”描述了AI此刻真实的处境：能力惊人，但判断未熟。

毕竟，人类从来没有指望3.5岁的孩童能做什么贡献。虽然你不能把证明的最终签名权交给AI，但你也不能假装AI没做任何贡献。

这也是为什么，真正的科学发现不会消失在人类手中。相反，它会更残酷地筛选人类：谁能提出好问题，谁才配拥有强AI。未来，科学家不借助AI，或许就像天文学家不用电脑一样过时。

最后，我们一起回味Sutton颇具宣言性质的话：

“如果我们希望充分发挥AI科学家的全部力量，就应该与他们共享目标，让他们能够创造、评估、发现，从而全面参与实现这些目标。让我们大胆一点！让我们彻底实现创造力与发现的全自动化！”

参考资料：

https://x.com/RichardSSutton/status/2061216087744946656
https://optimization-online.org/2026/05/convergence-of-bdrs-as-a-matrix-scaling-algorithm/

ChatGPT证明了六年难题，图灵奖得主说：高兴早了

AI：好的部分不新颖，新颖的部分不好

真正的“发现”，需要三件套

变异

评估

选择性保留

进化论

科学方法

人类学习

那么，科学家还有没有用？

参考资料：

相关阅读

相关下载