首页 > 教程攻略 > ai资讯 >AGI倒计时,OpenAI首席研究官重磅表态:留给人类的窗口“很小”

AGI倒计时,OpenAI首席研究官重磅表态:留给人类的窗口“很小”

来源:互联网 时间:2026-07-01 16:03:30

通用人工智能(AGI),真的要来了。

OpenAI首席研究官Mark Chen有个观点:在某种意义上就像希望你能感觉到,AGI(通用人工智能)正在逼近……模型自主提出创新、甚至进行自我维持研究的世界,已经不是遥远的事。

这不仅仅是效率的提升——「进化」本身也被外包给了硅基生命。当他在镜头前熟练地切蘑菇和洋葱时,谈论的其实是一碗汤,以及一个更深远的问题:如果AI能做到自我研究,人类最后一块阵地还稳吗?AGI到来前夜,人们究竟该扮演什么角色?

每个领域都在经历自己的「神之一手」

要理解这句话的分量,得先回到Mark入行的起点。

2016年,AlphaGo与李世石的对弈,第二局里那手「第37手」,落子的瞬间,所有人类棋手都看不懂。

后来才发现,那是机器走出的一手人类根本想不到的棋。正是那一刻点燃了无数人,把Mark Chen也拽进了这个领域。

如今呢?他提到一个更疯狂的事实:现在几乎每个领域,都能看到这种「神之一手」——数学里有,计算机科学里有,编程里也有。

他描述了一个微妙的时间节点:很多人是在今年年初「一觉醒来」,突然意识到,AI agent在自身所在的领域,真的能干活了。不是玩具,不是demo,而是能替你完成有意义的、长周期的真实工作(long-horizon work)。

这意味着「模型自己做研究」这件事,已经从科幻片的剧本里,搬到了实验台的日程上。顺着这条线往前看,终点站着的,就是那个会自己搞研究的模型。

Scaling不止,预训练未死

这种乐观到底靠什么撑着呢?靠一个信念:Scaling曲线还没到头。

这两年,「预训练已死」「语言模型到不了AGI」的论调隔三差五就冒出来。Mark Chen对此相当激烈地反对,直接点破了一个套路——「预训练已死」听着新鲜,其实就是个被反复重播的老剧本。每年都有人指着某个瓶颈说「到顶了,过不去了」,结果OpenAI总能掏出一个新工程技巧或研究上的新见解,又把那堵墙凿穿。

他坚信,「我们正处在指数曲线上。它已经撑过了将近10个数量级,没有任何理由它不会继续撑下去。」

最有说服力的证据,是OpenAI自己亲手赌赢的一次——推理(reasoning)。o1刚立项时,连公司内部都有人不信。当时「预训练+后训练」的范式太能打了,有人觉得机器转得好好的,何必再去折腾别的?是Jakub Pachocki、Ilya Sutskever等几位有信念、有判断力的人硬推,才把它变成了全公司的根本性赌注。

一年后o1问世,推理范式引爆行业。曲线没到头,加上最大的突破往往来自一开始没人信的赌注——这两条加在一起,就是Mark Chen敢说「模型自我维持研究不远了」的底气。

当模型开始在长达数周甚至数月的任务上思考时,它所产生的创新,可能已经超出人类专家的认知盲区。这正是「自我维持科研」的基石:如果能推导出人类没见过的数学公式,当然也能写出比人类更优的算法架构。

Vibe Researcher:当执行力变得廉价

我们已经有vibe coder了——动动嘴,让AI写代码。

现在,研究也在朝这个方向滑行。访谈中一个极具争议的概念被反复提及:

Vibe Researcher(氛围研究员)

。这是略带自嘲但深思熟虑的职业预测。

Mark认为,未来的顶级研究员不再是那个写下每一行PyTorch代码的人,而是那个「拿捏感觉」的人——负责出主意,剩下的实现、执行、调度,模型自己搞定。

无论OpenAI还是其他实验室,大量工作正在变成以「编排」(orchestration)为主。人负责出主意,模型负责把活全干完。OpenAI的三年路线图上,终点写得明明白白:让模型做

端到端(end-to-end)的研究

,从出主意到出成果,全程自己来。

但这条路上,全是还没填平的坑

随着AI能自主执行和编排任务,人类的工作被压缩到两端:1、提出真正的问题;2、判断AI给出的答案是否有「灵魂」。这就是所谓的「品味」(Taste)。因为机器没有「生活」,所以没有「常识」,也就无从产生「品味」。

冷静下来想,Mark Chen比谁都清楚,这条路远没有铺平。

第一个坑:评测,崩了。

他用了内部词叫「Benchmaxxing」(刷榜)——找一堆和测试集长得几乎一模一样的题往死里训,分数好看但泛化能力半点没涨。更糟的是,公认的金标准benchmark数量太少。「我们真的处在一场评测危机里。」SAT那种经典测试,对今天的模型全都饱和了。甚至一个评测一旦公开,就像一张印出来就立刻作废的考卷。

应对策略有两个:一是将评估创建团队与模型优化团队分离,形成对抗性激励;二是大规模部署模型并观察实际应用中的失败模式。

他还指出,每项新能力的出现都会伴随对应的评估需求,引导评估方向是他工作中相当重要的一部分。

第二个坑:参差的前沿(jagged frontier)。

模型能拿下奥数、信奥级别的难题,却可能搞不定人类随手就能做的琐事——就像一个能心算微积分、却不会系鞋带的天才。差就差在「上下文」,差在持续学习(continual learning),把一个任务里学到的教训用到下一个任务上。这对人类太自然了,对模型,却是全行业正在死磕的硬骨头。

被问到通往AGI是否需要两三个根本性的突破时,Mark没接。他说,持续学习这种东西是「必须解锁的基础能力」,算不算「突破」他说不好,但「很多发都已经瞄准了球门,我相当确定它们会进。」

这就是他的态度:坑是真的,但每一个坑都已经有人在填,而且他赌填得上。

汤的隐喻:AGI之后去开个面馆

访谈中最温馨的一幕,是「汤」的故事。据说Mark Zuckerberg曾试图用自制的汤去挖走OpenAI的研究员,而Mark Chen的回应是直接把汤带到办公室分给大家。

被问到AGI实现后的终极愿望时,这位掌管全球最强大AI大脑的人回答:「我想去开个面馆。这可能是我的AGI后爱好。」

这个回答里藏着深意。当AI能完成所有「自我维持的科研」,当知识和创新能以光速产生,人类最稀缺的资源不再是智力,而是「体验」。机器可以算出一碗汤的最佳咸度,但它永远无法赋予这碗汤以「温度」和「故事」。