首页 > 教程攻略 > ai资讯 >谷歌发布两款全新AI模型，连通多媒体创作工作流

谷歌发布两款全新AI模型，连通多媒体创作工作流

来源：互联网时间：2026-07-05 08:34:14

7月1日，谷歌官方发布消息——两款全新人工智能模型正式亮相，目标很明确：让开发者和内容创作者在多模态内容生成这件事上，效率更高、成本更低。

先说图像模型，名字叫Nano Banana 2 Lite。用四个字形容的话：快、省、稳、强。它最快只需要4秒就能完成从文本到图像的生成，单张1K分辨率图片的成本更是压到了0.034美元。什么概念？相比行业里其他方案，这个性价比可以说相当炸裂。更重要的是，它的设计初衷就是冲着高并发场景和实时原型开发来的——换句话说，你反复试错、快速迭代的成本门槛，被大幅拉低了。现在开发者已经可以通过Google AI Studio和Gemini API直接接入，后续还会逐步整合到搜索AI模式等面向消费者的产品中。

与其搭配的，还有视频生成模型Gemini Omni Flash，目前已经进入公开预览阶段。它支持通过自然语言指令进行交互式视频编辑，生成费用是每秒0.10美元。别小看这个定价，它意味着轻量级团队甚至个人创作者，也能以相对可控的成本尝试视频生成。

更有意思的是，这两款模型可以协同工作。举个例子：你先在Nano Banana 2 Lite里快速生成一组静态画面草图，然后直接丢进Gemini Omni Flash一键转成动态视频——从创意构思到成片输出，整个开发周期被显著压缩。这才是真正的降维打击：不是单个模型强，而是组合起来好用。

至于安全层面，两者都建立在谷歌的安全基础设施之上，并集成了SynthID数字水印技术。也就是说，在追求效率和低成本的另一端，可追溯性和透明度同样被放在重要位置。

谷歌发布两款全新AI模型，连通多媒体创作工作流

相关阅读

相关下载