Gemini 3 之后,谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号
先说几个核心判断:Gemini 3 之后的AI行业,拼的早已不是谁家模型参数更大、回答更准,而是谁能让AI真正像人一样“干活”,并且还能低成本地铺开使用。谷歌首席科学家 Jeff Dean 在斯坦福的一次分享中,把这背后的逻辑讲透了。他把这归结为三个关键信号,不仅仅是技术迭代,更是对整个范式的重新定义。
这个能力背后的技术突破,核心集中在“可验证领域的强化学习”上。

具体怎么理解?咱们拿编程这个场景来举例:
AI 生成一段代码后,系统会自动检查:能编译通过吗?能,就给予奖励;不能,就施加惩罚。这还没完,逻辑可以进一步细化:代码通过了单元测试吗?如果通过了,奖励力度会更大。
同样的逻辑,在数学领域也完全适用:AI 生成一个证明步骤,系统会调出一个证明检查器来验证。正确就给奖励,出错则明确指出是在哪一步出的问题。
正如 Jeff Dean 所说,这项技术突破让模型可以真正去探索那些潜在解决方案的空间。日复一日,模型在这个探索过程中会变得越来越擅长,效率也越来越高。
那么效果到底有多惊人?一个直观的例子:Gemini 在2025年的国际数学奥林匹克竞赛(IMO)上,一气呵成地解决了六道题中的五道,直接拿下金牌。
这个成绩的分量有多重?
咱们可以回看一下,仅仅在三年前,也就是2022年,AI 在数学推理上的表现还很“稚嫩”。当时业界最先进的模型,在一个叫 GSM8K 的中学数学基准测试上,准确率也只有区区15%。那些考题是什么难度呢?举个例子:小明有5个玩具,圣诞节他又收到了2个,请问他现在一共有几个玩具?
就是这种小学算术级别的问题,当时的 AI 正确率也才15%。而现在,Gemini 能直接挑战并拿下全球数学天才顶峰竞赛的金牌。
从小学算术跨越到奥赛金牌,这个过程只用了不到三年。这个飞跃背后,说明 AI 不只是在回答问题这件事上变强了,它已经具备了真正的问题解决能力——自己探索、尝试、验证,直到找到正确答案。
具体到应用层面,一个合格的 AI Agent 需要具备三个关键能力:
状态感知
工具组合
多步执行
而 Gemini 3 的突破在于,它与 Google 生态进行了深度集成,能够串联起日历、邮件、云端服务等真实系统,把上述这些能力从理论变成了现实。
就像前面那个创建食谱网站的案例:你不需要再一步步拆解指令——先去识别文字,再去翻译,最后排版。你只需要说一句“把这个做成网站”,Gemini 3 就能自己搞定所有繁琐的步骤。
这直接改变了每个人的工作方式:过去,你需要手把手地告诉 AI 每一步怎么做;现在,你只需要说出目标,剩下的 AI 全权搞定。你的角色,已经从“使用者”变成了“指挥者”。
信号三:什么决定 AI 能否普及?
如果说 Pathways 架构是让模型变聪明,Agent 系统是让模型能行动,那第三个信号可能最容易被忽略,却也最为关键:让 AI 真正“用得起”。
Jeff Dean 在斯坦福的演讲里,提到了一个发生在2013年的故事。
当时,Google 刚训练出一个性能非常棒的语音识别模型,错误率比现有系统低了一大截。Jeff Dean 随手算了一笔账:如果真让1亿人每天对着手机说3分钟话,服务器得翻多少倍?
答案是:需要把 Google 当时的服务器数量直接翻上一倍。
换句话说,一个功能的改进,代价是整个公司服务器资源的翻倍。这让 Jeff Dean 意识到,光有好模型远远不够,必须让它变得“用得起”。
于是,TPU 应运而生。
1、TPU:为效率而生的硬件
2015年,第一代 TPU 正式投入使用。它专门为机器学习设计,目标非常纯粹:把低精度线性代数运算的效率做到极致。
结果如何?
它比同时期的 CPU 和 GPU 快了15到30倍,能效更是高出30到80倍。这让原本需要翻倍服务器才能推出的功能,现在只需要现有硬件的小部分就能实现。
到了最新的第七代 Ironwood TPU,单个 pod 就拥有9,216个芯片。与第一代机器学习超级计算 pod(TPUv2)相比,性能提升了3,600倍,能效提升了30倍。Jeff Dean 特别指出,这些惊人的提升不仅仅依赖芯片工艺的进步,更关键的是,谷歌从设计之初就把能效作为了核心目标来追求。
2、蒸馏:让小模型学会大模型的能力
硬件是基础,算法则是另一个驱动轮。Jeff Dean 与 Geoffrey Hinton、Oriol Vinyals 合作,共同研究了一项名为“蒸馏”的技术。
核心思想很形象:让大模型当老师,去教小模型。
他们在一个语音识别任务中进行了对比实验:
使用100%的训练数据,准确率可以达到58.9%;
如果只用3%的训练数据,准确率会骤降到44%;
但如果采用“蒸馏”技术,即使只用3%的数据,准确率就能达到57%。
这相当于用3%的数据,实现了接近全量数据训练的效果。
Jeff Dean 总结说:“你可以先训练一个非常大的模型,然后通过蒸馏技术,让一个体积小得多的模型获得与其极为相近的性能。”
这正是 Gemini 能做到性能领先,同时又能在手机上流畅运行的原因。大模型在云端训练,小模型通过蒸馏学习后部署到手机端。参数虽然只有大模型的十分之一,却能保留超过80%的核心能力。
3、真正的门槛:能不能在现实约束下落地
技术突破只是第一步。在 Jeff Dean 看来,AI 要真正普及到全球,必须直面更现实的问题:能源够不够?电力稳定吗?网络通畅吗?设备能支持吗?
这也是为什么 Google 要在东南亚等新兴市场大力推广 AI。这些地区可能没有强大的电网和服务器基础设施,但通过 TPU 和蒸馏这类效率技术,人们依然可以在现有条件下用上 AI。Google 的策略不是等条件完美了再推广,而是让技术主动适应现实。
这个思路的变化,直接改变了整个行业的关注点。
过去,大家比拼的是:这个模型有多强?参数有多大?处理了多少 token?
而现在,真正重要的问题是:它能不能在我的设备上用起来?成本能压到多低?能不能在离线的状态下使用?
所以,下一轮竞争的焦点,不再是参数,而是落地效率。
结语|从模型,到系统
看性能数据,Gemini 3 确实是一次漂亮的模型升级。但看 Jeff Dean 的整个思路,你会发现,这更是一次深刻的范式转变。
从2013年服务器翻倍的困境,到2025年拿下 IMO 金牌,Jeff Dean 一直在回答一个根本性的问题:如何让 AI 既强大,又可用?
答案指向了三个清晰的转变:
不是比谁的模型更大,而是比谁的设计更聪明(Pathways);
不是比谁的回答更准,而是比谁能真正做事(Agent);
不是比谁的参数更多,而是比谁能让更多人用上(TPU+蒸馏)。
Gemini 3 不是一个终点,而是这套系统思维第一次完整的、面向公众的展现。