首页 > 教程攻略 > ai资讯 >AI自己造AI,概率60%,2028年底前,Anthropic联创坐不住了

AI自己造AI,概率60%,2028年底前,Anthropic联创坐不住了

来源:互联网 时间:2026-06-14 15:20:32

AI系统,可能很快就能自行构建自身了!

说出这句话的,是Anthropic联合创始人杰克·克拉克。5月4日,他在社交平台X上发布了一个引人深思的判断:「递归自我改进(RSI)有60%的概率在2028年底之前发生。」

克拉克不仅是Anthropic的联合创始人,也是知名通讯《Import AI》的创办者与主笔,长期追踪AI能力的前沿进展。这次发帖,他同步发布了一篇完整的分析文章,系统阐述了他的观点。

这件事非同小可。其潜在影响太过巨大,以至于让人感到自身的渺小,也引发了一个深刻的疑问:我们的社会,是否已经准备好迎接自动化AI研发所带来的根本性变革?

克拉克在文章中写道:

如果这一天到来,人类将跨过一道「卢比孔河」,进入一个几乎无法预测的未来

他并不认为这会在2026年发生,但他预判,未来一两年内,我们很可能在非前沿模型上看到概念验证:一个AI模型,能够端到端地训练出自己的「继任者」。支撑这一结论的,并非内部机密,而是一系列公开信息——arXiv、bioRxiv、NBER等平台上的论文,加上他对各大前沿实验室产品的持续观察。克拉克将这些碎片拼凑起来,勾勒出了一幅关于AI进展的全景图。

在他看来,AI工程化生产所需的所有组件,如今已基本就位。剩下的核心问题其实是:模型何时能积累足够的「创造力」,开始像人类研究员一样,真正推动前沿的演进。

四年,从30秒到12小时

克拉克的核心论据,建立在一系列清晰的能力进展曲线上。

先看METR机构绘制的时间轴图。这个机构专注于评估AI能力,他们追踪一个关键指标:AI系统独立完成一项任务,在达到50%成功率时,这项任务如果让一个熟练的人类来完成,大概需要多长时间。

这个数字的变化轨迹令人瞩目:2022年,GPT-3.5对应的时长是30秒;到了2023年,GPT-4将其推到了4分钟;2024年,o1模型达到了40分钟;2025年,GPT-5.2(高配版)跨过了6小时的门槛;而到了2026年,Claude Opus 4.6已经能够处理长达12小时的任务。

短短四年,从30秒到12小时,能力跨度增长了1440倍!AI能力研究员阿杰亚·科特拉甚至认为,到2026年底之前,这个数字有望突破100小时。一旦达到100小时的时间跨度,AI将能够覆盖许多需要数日才能完成的软件工程或研究辅助任务。

编程能力的飞跃同样惊人。以SWE-Bench基准测试为例,它衡量的是AI解决真实GitHub工程问题的能力。2023年底,Claude 2的得分仅为2%。而到了今年,Claude Mythos Preview的得分达到了93.9%,这意味着这个基准几乎被「打穿」了。

再看CORE-Bench,它测试的是另一项关键能力:给AI一篇学术论文和对应的代码库,让它独立复现实验结果——这正是AI研究员最基础的日常工作之一。2024年9月该测试推出时,最好成绩是21.5%。到了2025年12月,Opus 4.5在特定框架下的验证准确率达到了77.78%,经人工校验后高达95.5%,项目方宣布CORE-Bench已被解决。

15个月,从21.5%到95.5%,进步速度可见一斑。

还有MLE-Bench,它测试的是AI独立参加Kaggle数据科学竞赛的能力,覆盖75个真实项目。2024年10月发布时,最高分仅为16.9%;而到2026年2月,Gemini 3结合搜索工具的组合,分数已经跃升至64.4%。

Anthropic内部还有一个更直接的测试:让模型优化一段仅使用CPU的小型语言模型训练代码,比拼优化后的速度提升倍数。2025年5月,Claude Opus 4的优化倍数是2.9倍;到了11月,Opus 4.5达到了16.5倍;2026年2月,Opus 4.6提升至30倍;而到2026年4月,Claude Mythos Preview已经能做到52倍的优化。

不到一年时间,从2.9倍飙升至52倍。这直观地展示了AI在「优化AI训练代码」这项核心工程任务上的进展速度。

99%的工程活,AI快接完了

这里引出一个关键问题:AI研究这件事,到底有多少是纯粹的工程劳动,又有多少是真正的创意灵感?

克拉克引用了一个经典的框架——爱迪生的那句名言:天才是1%的灵感和99%的汗水。他认为,AI研究同样遵循这个比例。

一个典型的AI研究循环是这样的:基于现有系统,在某个维度上扩大规模,观察哪里开始出现问题,修复工程瓶颈,然后再进行下一轮扩大。在这个过程中,绝大部分工作是数据清洗、运行实验、调整参数、阅读论文、复现结果……这些都是「汗水」,而非「灵感」。偶尔会出现真正改变范式的发明,比如Transformer架构,或者混合专家模型(MoE)。但那只是1%,而且越来越不是瓶颈,因为那99%的工程性工作,正在被AI快速接管。

克拉克列举了几个明确的信号:

首先,AI已经能够管理其他AI。在Claude Code、OpenCode这类工具中,一个AI可以扮演「项目经理」的角色,将复杂任务分解并分发给多个子AI并行处理,最后汇总结果。这种工作流,与一个人类研究团队的组织方式已没有本质区别。

其次,PostTrainBench测试揭示了一个趋势:AI能否自己微调开源小模型,以提升其在特定任务上的表现?这通常是前沿实验室里经验丰富的研究员的工作。截至2026年3月,AI系统在这个任务上已经能达到人类研究员效果的一半左右,提升幅度约为25%到28%,而人类基线的提升幅度是51%。

更引人注目的是Anthropic内部的一个概念验证——「自动化对齐研究」:让一组AI智能体,在AI安全研究问题上进行自主攻关。结果是,AI给出的解决方案,甚至超过了Anthropic人类研究员设定的基线水平。

将这些证据串联起来,克拉克得出的判断是:AI今天已经能够自动化AI工程中的绝大部分工作。至于AI研究本身有多少能被自动化,虽然还不完全清楚,但迹象已经足够明显。

质疑声也来了

克拉克的观点抛出后,行业内也出现了一些理性的质疑声音。

华盛顿大学机器学习教授、《终极算法》作者佩德罗·多明戈斯回复道:「自50年代LISP语言发明以来,AI就已经能够构建自己了。问题的关键在于,这个过程带来的究竟是递增回报还是递减回报——而目前没有任何证据支持前者。」

这个观点切中了要害。递归自我改进听起来很科幻,但能循环不等于循环有收益。如果每一代AI优化自己的效率只有边际改善,而非指数级放大,那么这件事的实际影响将非常有限。

也有人对概念本身提出质疑。研究员丹·布里克利问道:「RSI到底有没有一个权威的定义?」

另一个更尖锐的观察来自账号@crepesupreme:克拉克预测2027年的概率是30%,2028年是60%。这意味着在一年内概率跳升了30个百分点,暗示着2027到2028年之间可能存在某个不连续的、突变性的能力事件。那么,这个具体事件可能是什么?

克拉克在通讯文章中回应了这个隐含的问题。他认为,AI研究仍需要某种创意上的突破,才能真正进入「自我研发」的循环,而AI目前在创造性方面尚未表现出变革性的能力。这正是他只给2027年设定30%概率的原因。而如果这个能力缺口在2028年底前被填补上,概率就会升至60%。同时他也承认,自己预测的是概率,而非确切的时间点。

还有人提出了一个更直接的问题:「你在Anthropic工作,为什么要去翻公开数据?直接走下楼去问你的研究员同事不就行了?」

克拉克的答案体现了一种严谨:使用公开数据,是因为公开数据才具有可验证的公信力。他要的不是内部的主观判断,而是一个任何人都能独立核验、基于客观事实的结论。

窗口还开着,但在缩窄

那么,为什么克拉克不给2027年更高的概率呢?

他在通讯文章中解释道,因为他认为AI研究仍然包含一些对创意和直觉的要求,而AI目前在这一领域只有「诱人的早期信号」,尚未取得系统性突破。他举了两个例子:一是Gemini模型参与攻克埃尔德什数学问题,在700个问题中解出了1个被数学家认为具有一定原创性的解;另一个是斯坦福、UBC等机构与Google DeepMind的合作,其中AI在发现新的数学证明中起到了「非常实质性的作用」。

这些成果,在AI能力演进的时间轴上,或许可以被视为某种早期信号。克拉克估计,如果到2028年底仍未出现他所描述的情况,那可能意味着当前的技术路径存在某个根本性的能力天花板,必须依靠人类的创意才能突破。

然而,比「是否发生」更关键的问题是「如果发生了」之后该怎么办。

Anthropic在2026年3月宣布成立「Anthropic研究所」时,其官方声明中写了这样一句话:「如果AI系统的递归自我改进确实开始发生,那么世界上谁应该被告知,以及这些系统应该如何治理?」

连Anthropic自己,都还没有这个问题的完整答案。

克拉克在文章中给出了一个更技术性的担忧:假设今天的AI对齐技术有99.9%的准确率,在递归迭代50代之后,准确率会衰减到95.1%;迭代500代之后,将骤降至60.5%。除非对齐方案在理论上能保证在更智能的系统上同样有效,否则问题很快就会失控。

或许,克拉克真正想说的是:

留给人类进行有效治理的时间窗口是有限的,而且它正在快速缩窄

。他希望通过这篇文章发出一个提醒:关于这件事的讨论、研究和治理设计,所剩余的时间,比大多数人想象的要短。

行业的动向也印证了这种紧迫感。根据山姆·奥特曼的直播及相关媒体报道,OpenAI的目标是让AI在2026年9月前达到「AI研究实习生」的水平,并在2028年实现更完整的自动化研究员能力。Anthropic自身也在发表自动化对齐研究的概念验证。一家名为「递归超级智能」的新公司刚刚完成了5亿美元的融资,其核心目标之一就是自动化AI研究。

整个行业,已经在朝这个方向全力加速。

克拉克总结道,无论从哪个维度审视,数据都指向同一个方向。每一条能力曲线,都在向右上方飞速延伸——时间越长,能力越强,而且没有任何一条曲线显示出减速的迹象。