Google I/O全盘点:两大新模型上线,音频眼镜登台,Gemini接管一切
北京时间2026年5月20日凌晨,备受瞩目的Google I/O开发者大会终于拉开帷幕。与往年不同,由于Android 17的主要新功能已通过The Android Show提前发布,AI毫无悬念地成为了本届大会的绝对主角。
但谷歌的AI叙事,从来不只是关于模型本身。手握Gemini、YouTube、搜索引擎和Android等多个生态入口,谷歌此次的核心议题显而易见:
如何让AI深度融入并赋能其庞大的产品矩阵,从而构建一个更智能、更无缝的数字体验。
Gemini Omni与Gemini 3.5:迈向全能的模型进化
Gemini Omni与Gemini 3.5:迈向全能的模型进化
模型层面,谷歌正式推出了号称迄今最全能的Gemini Omni。它的核心能力可以用一句话概括:
能够处理任何形式的输入,并生成任何形式的输出。

图片来源:Google
以生成音乐短视频(MV)为例,用户只需提供音乐、视频片段、图片素材以及简单的画面描述,Gemini Omni就能直接合成一段完整的短片。大会现场演示了一个更为震撼的场景:在一张白纸上手绘一个圆圈,辅以文字指令,模型便能生成一个包含该圆圈元素的复杂特效视频。如果对其中某个元素不满意,
只需一句像“把玻璃建筑换成肥皂泡”这样的指令,就能精准替换,

图片来源:Google
用谷歌自己的比喻来说,
Gemini Omni堪称“视频领域的Nano Banana”。

图片来源:Google
除了这位“全能选手”,Gemini家族也迎来了版本更新——
Gemini 3.5 Flash。
Gemini 3.5 Pro将于下个月正式亮相。
总而言之,在模型能力上,谷歌此番可谓将“多、快、好、省”四个字展现得淋漓尽致。
Google Antigra vity与Gemini Spark:更智能、更强大的数字助手
Google Antigra vity与Gemini Spark:更智能、更强大的数字助手
底层模型能力突飞猛进,基于其上构建的AI智能体(Agent)自然也水涨船高。

图片来源:Google
在开发者侧,谷歌的AI开发环境Antigra vity现已集成Gemini 3.5 Flash。一个令人印象深刻的案例是,
借助新模型,Antigra vity仅用12小时就构建了一个操作系统内核,而整个过程的AI API成本还不到一千美元。

图片来源:Google
谷歌甚至利用这套工具重构了搜索的交互界面,提出了
“生成式UI”的新概念。

图片来源:Google
为此,谷歌基于Antigra vity的编程能力,打造了一个
能够自适应问题、自动生成交互界面的AI搜索。

图片来源:Google
这项功能预计在今年夏季向用户开放,并且作为谷歌搜索的更新,无需订阅Gemini即可使用。同时,Gemini App本身的界面也获得了更新,与Android的新视觉设计更加统一。
得益于Gemini 3.5 Flash的多模态能力,谷歌搜索的预测和输入方式也得到扩展。现在,
用户不仅可以输入文字和图片,还能直接上传视频或文档进行搜索;
升级为基于Gemini 3.5 Flash的AI智能补全。

图片来源:Google
除了前台的交互革新,搜索智能体的“后台能力”也被大幅强化。
全新的搜索Agent可以全天候运行,持续监控用户指定的信息。
说到智能体,谷歌此次还发布了面向个人用户的全新Agent——Gemini Spark。与其他AI助手类似,它能7×24小时接管手机和浏览器。但不同之处在于,
Gemini Spark运行在一个专门的虚拟化环境中,

图片来源:Google
毫无疑问,Gemini Spark同样由Gemini 3.5 Flash和Antigra vity驱动,支持语音与后台响应。在生态联动上,它不仅能与Google Docs、Calendar、Gmail等自家服务无缝协作,
还能通过MCP协议与外部应用程序互联,实现更广泛的任务自动化。
谷歌未明确公布Gemini Spark的详细适配计划,预计其将通过Gemini App(iOS)和谷歌搜索组件(Android)的形式登陆移动设备。

图片来源:Google
当AI智能体(无论前后台)运行时,
Android系统新增的“Halo”功能会在屏幕左上角常驻一个状态标记,
它已不再是普通的应用功能,而是与摄像头、麦克风同等重要的手机核心组件。

图片来源:Google
在电脑端,Gemini Spark将于今年夏季登陆Chrome浏览器。需要注意的是,
Gemini Spark是一项全订阅功能,下周将率先向Google AI Ultra订阅用户开放。
值得一提的是,为了区隔企业用户和高用量个人用户,谷歌在原有的AI Pro(20美元/月)和AI Ultra(250美元/月,限时优惠至200美元/月)之间,新增了一个“青春版”AI Ultra等级,定价为100美元/月。

图片来源:Google
这一定价策略的变化透露出一个明确信号:
即便是谷歌这样的巨头,也难以长期承受全面AI化带来的巨额算力成本。
甚至可以预见,随着AI Agent能力不断扩展,
为高级AI服务付费,很可能像如今的手机套餐一样,成为一项普遍的“刚性消费”。
音频眼镜亮相,Gemini生态闭环加速形成
音频眼镜亮相,Gemini生态闭环加速形成
去年,谷歌展示了具备显示功能的AI眼镜原型。今年,其“音频版”智能眼镜也首次登台。需要明确的是,
这款Gemini眼镜并非单纯的耳机替代品,而是配备了摄像头、具备AI视觉与多模态输入能力的智能音频设备。
由于产品要等到今年秋季才发布(很可能为了适配高通骁龙峰会的新芯片),谷歌并未透露重量、传感器型号、续航等具体参数,仅展示了外观设计和核心功能。

图片来源:Google
设计上,谷歌宣布将与三星及Gentle Monster、Warby Parker等知名眼镜品牌合作。功能方面,它与现有的一些AR眼镜类似,
用户可以通过语音或镜腿上的触控板唤醒Gemini。
借助底层模型和Spark智能体的能力,
Gemini眼镜能够将用户的语音指令自动分解为一系列操作,并在手机后台执行。
语音确认

图片来源:Google
值得一提的是,
谷歌确认Gemini音频眼镜将同时支持Android和iOS平台。
为了进一步拓展Gemini的能力边界,谷歌办公套件(Google Workspace)也全面接入了AI。用户可以通过语音指令让Gemini查找邮件、辅助写作,甚至生成图像。

图片来源:Google
结合此前曝光的全新高端“Googlebook”笔记本,
谷歌正不遗余力地将Gemini嵌入其所能掌控的每一个硬件生态之中。
主题演讲至此告一段落。或许有人会认为,这不过是谷歌在AI竞赛中后发制人的“画饼”之举。但深入来看,
Google I/O 2026所揭示的,恰恰是谷歌终于找到了打开AI时代大门的正确钥匙。
以“AI能做什么”这个根本问题为例,谷歌直接向其“发家之本”开刀,用生成式UI改变了AIGC“回合制”的单向交互模式。
这种从单向到双向的转变,同样体现在Gemini智能硬件上。

图片来源:Google
更重要的是,
Gemini正利用其在Android系统中的原生优势,构筑起一道其他厂商难以逾越的护城河。
回到开头提到的那个事实:谷歌同时掌握着Gemini、YouTube、搜索和Android等多个生态入口。
在Google I/O 2026上,这些四处“开花”的生态,终于迎来了“结果”的季节。
当然,Gemini高度依赖谷歌生态,这对OpenAI、Grok等对手是挑战,
但对国内AI企业而言,或许也意味着机遇。
毫无疑问,
Gemini全家桶在海外再如何所向披靡,其核心生态在国内市场仍面临“水土不服”的困境。
海外有谷歌在安卓底层大刀阔斧,