首页 > 教程攻略 > ai教程 >Gemini 3 之后，谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号

Gemini 3 之后，谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号

来源：互联网时间：2026-06-19 07:15:07

先说几个核心判断：Gemini 3 之后的AI行业，拼的早已不是谁家模型参数更大、回答更准，而是谁能让AI真正像人一样“干活”，并且还能低成本地铺开使用。谷歌首席科学家 Jeff Dean 在斯坦福的一次分享中，把这背后的逻辑讲透了。他把这归结为三个关键信号，不仅仅是技术迭代，更是对整个范式的重新定义。

这个能力背后的技术突破，核心集中在“可验证领域的强化学习”上。

具体怎么理解？咱们拿编程这个场景来举例：

AI 生成一段代码后，系统会自动检查：能编译通过吗？能，就给予奖励；不能，就施加惩罚。这还没完，逻辑可以进一步细化：代码通过了单元测试吗？如果通过了，奖励力度会更大。

同样的逻辑，在数学领域也完全适用：AI 生成一个证明步骤，系统会调出一个证明检查器来验证。正确就给奖励，出错则明确指出是在哪一步出的问题。

正如 Jeff Dean 所说，这项技术突破让模型可以真正去探索那些潜在解决方案的空间。日复一日，模型在这个探索过程中会变得越来越擅长，效率也越来越高。

那么效果到底有多惊人？一个直观的例子：Gemini 在2025年的国际数学奥林匹克竞赛（IMO）上，一气呵成地解决了六道题中的五道，直接拿下金牌。

这个成绩的分量有多重？

咱们可以回看一下，仅仅在三年前，也就是2022年，AI 在数学推理上的表现还很“稚嫩”。当时业界最先进的模型，在一个叫 GSM8K 的中学数学基准测试上，准确率也只有区区15%。那些考题是什么难度呢？举个例子：小明有5个玩具，圣诞节他又收到了2个，请问他现在一共有几个玩具？

就是这种小学算术级别的问题，当时的 AI 正确率也才15%。而现在，Gemini 能直接挑战并拿下全球数学天才顶峰竞赛的金牌。

从小学算术跨越到奥赛金牌，这个过程只用了不到三年。这个飞跃背后，说明 AI 不只是在回答问题这件事上变强了，它已经具备了真正的问题解决能力——自己探索、尝试、验证，直到找到正确答案。

具体到应用层面，一个合格的 AI Agent 需要具备三个关键能力：

状态感知

：它能明白你到底想要什么，并随时了解任务推进到了哪一步。

工具组合

：它能自主调用搜索、计算器、API 等外部工具来解决问题。

多步执行

：它能根据中途的反馈不断调整计划，循环尝试，直到目标完成。

而 Gemini 3 的突破在于，它与 Google 生态进行了深度集成，能够串联起日历、邮件、云端服务等真实系统，把上述这些能力从理论变成了现实。

就像前面那个创建食谱网站的案例：你不需要再一步步拆解指令——先去识别文字，再去翻译，最后排版。你只需要说一句“把这个做成网站”，Gemini 3 就能自己搞定所有繁琐的步骤。

这直接改变了每个人的工作方式：过去，你需要手把手地告诉 AI 每一步怎么做；现在，你只需要说出目标，剩下的 AI 全权搞定。你的角色，已经从“使用者”变成了“指挥者”。

信号三：什么决定 AI 能否普及？

如果说 Pathways 架构是让模型变聪明，Agent 系统是让模型能行动，那第三个信号可能最容易被忽略，却也最为关键：让 AI 真正“用得起”。

Jeff Dean 在斯坦福的演讲里，提到了一个发生在2013年的故事。

当时，Google 刚训练出一个性能非常棒的语音识别模型，错误率比现有系统低了一大截。Jeff Dean 随手算了一笔账：如果真让1亿人每天对着手机说3分钟话，服务器得翻多少倍？

答案是：需要把 Google 当时的服务器数量直接翻上一倍。

换句话说，一个功能的改进，代价是整个公司服务器资源的翻倍。这让 Jeff Dean 意识到，光有好模型远远不够，必须让它变得“用得起”。

于是，TPU 应运而生。

1、TPU：为效率而生的硬件

2015年，第一代 TPU 正式投入使用。它专门为机器学习设计，目标非常纯粹：把低精度线性代数运算的效率做到极致。

结果如何？

它比同时期的 CPU 和 GPU 快了15到30倍，能效更是高出30到80倍。这让原本需要翻倍服务器才能推出的功能，现在只需要现有硬件的小部分就能实现。

到了最新的第七代 Ironwood TPU，单个 pod 就拥有9,216个芯片。与第一代机器学习超级计算 pod（TPUv2）相比，性能提升了3,600倍，能效提升了30倍。Jeff Dean 特别指出，这些惊人的提升不仅仅依赖芯片工艺的进步，更关键的是，谷歌从设计之初就把能效作为了核心目标来追求。

2、蒸馏：让小模型学会大模型的能力

硬件是基础，算法则是另一个驱动轮。Jeff Dean 与 Geoffrey Hinton、Oriol Vinyals 合作，共同研究了一项名为“蒸馏”的技术。

核心思想很形象：让大模型当老师，去教小模型。

他们在一个语音识别任务中进行了对比实验：

使用100%的训练数据，准确率可以达到58.9%；

如果只用3%的训练数据，准确率会骤降到44%；

但如果采用“蒸馏”技术，即使只用3%的数据，准确率就能达到57%。

这相当于用3%的数据，实现了接近全量数据训练的效果。

Jeff Dean 总结说：“你可以先训练一个非常大的模型，然后通过蒸馏技术，让一个体积小得多的模型获得与其极为相近的性能。”

这正是 Gemini 能做到性能领先，同时又能在手机上流畅运行的原因。大模型在云端训练，小模型通过蒸馏学习后部署到手机端。参数虽然只有大模型的十分之一，却能保留超过80%的核心能力。

3、真正的门槛：能不能在现实约束下落地

技术突破只是第一步。在 Jeff Dean 看来，AI 要真正普及到全球，必须直面更现实的问题：能源够不够？电力稳定吗？网络通畅吗？设备能支持吗？

这也是为什么 Google 要在东南亚等新兴市场大力推广 AI。这些地区可能没有强大的电网和服务器基础设施，但通过 TPU 和蒸馏这类效率技术，人们依然可以在现有条件下用上 AI。Google 的策略不是等条件完美了再推广，而是让技术主动适应现实。

这个思路的变化，直接改变了整个行业的关注点。

过去，大家比拼的是：这个模型有多强？参数有多大？处理了多少 token？

而现在，真正重要的问题是：它能不能在我的设备上用起来？成本能压到多低？能不能在离线的状态下使用？

所以，下一轮竞争的焦点，不再是参数，而是落地效率。

结语｜从模型，到系统

看性能数据，Gemini 3 确实是一次漂亮的模型升级。但看 Jeff Dean 的整个思路，你会发现，这更是一次深刻的范式转变。

从2013年服务器翻倍的困境，到2025年拿下 IMO 金牌，Jeff Dean 一直在回答一个根本性的问题：如何让 AI 既强大，又可用？

答案指向了三个清晰的转变：

不是比谁的模型更大，而是比谁的设计更聪明（Pathways）；

不是比谁的回答更准，而是比谁能真正做事（Agent）；

不是比谁的参数更多，而是比谁能让更多人用上（TPU+蒸馏）。

Gemini 3 不是一个终点，而是这套系统思维第一次完整的、面向公众的展现。

Gemini 3 之后，谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号

状态感知

工具组合

多步执行

信号三：什么决定 AI 能否普及？

1、TPU：为效率而生的硬件

2、蒸馏：让小模型学会大模型的能力

3、真正的门槛：能不能在现实约束下落地

结语｜从模型，到系统

相关阅读

相关下载

Gemini 3 之后，谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号

状态感知

工具组合

多步执行

信号三：什么决定 AI 能否普及？

1、TPU：为效率而生的硬件

2、蒸馏：让小模型学会大模型的能力

3、真正的门槛：能不能在现实约束下落地

结语｜从模型，到系统

相关阅读

相关下载

Gemini 3 之后，谷歌首席科学家 Jeff Dean 说清 AI 的 3 个关键信号