谷歌发布两款全新AI模型,连通多媒体创作工作流
来源:互联网
时间:2026-07-05 08:34:14
7月1日,谷歌官方发布消息——两款全新人工智能模型正式亮相,目标很明确:让开发者和内容创作者在多模态内容生成这件事上,效率更高、成本更低。
先说图像模型,名字叫Nano Banana 2 Lite。用四个字形容的话:快、省、稳、强。它最快只需要4秒就能完成从文本到图像的生成,单张1K分辨率图片的成本更是压到了0.034美元。什么概念?相比行业里其他方案,这个性价比可以说相当炸裂。更重要的是,它的设计初衷就是冲着高并发场景和实时原型开发来的——换句话说,你反复试错、快速迭代的成本门槛,被大幅拉低了。现在开发者已经可以通过Google AI Studio和Gemini API直接接入,后续还会逐步整合到搜索AI模式等面向消费者的产品中。
与其搭配的,还有视频生成模型Gemini Omni Flash,目前已经进入公开预览阶段。它支持通过自然语言指令进行交互式视频编辑,生成费用是每秒0.10美元。别小看这个定价,它意味着轻量级团队甚至个人创作者,也能以相对可控的成本尝试视频生成。
更有意思的是,这两款模型可以协同工作。举个例子:你先在Nano Banana 2 Lite里快速生成一组静态画面草图,然后直接丢进Gemini Omni Flash一键转成动态视频——从创意构思到成片输出,整个开发周期被显著压缩。这才是真正的降维打击:不是单个模型强,而是组合起来好用。
至于安全层面,两者都建立在谷歌的安全基础设施之上,并集成了SynthID数字水印技术。也就是说,在追求效率和低成本的另一端,可追溯性和透明度同样被放在重要位置。
