谷歌发布DiffusionGemma:尝试用文本扩散架构提速AI推理
来源:互联网
时间:2026-06-11 14:32:03
谷歌最近又搞了个大动作——6月10日,他们正式推出了一个名叫DiffusionGemma的实验性开源模型。这玩意儿最特别的地方,在于它采用的是一套文本扩散架构(对,就是Text-to-text diffusion),相当于选择了一条全新的路来提升AI的生成效率。
从性能测试来看,DiffusionGemma确实有自己独特的看家本领。得益于这套特别的架构,它在专用GPU上的文本生成速度,比传统的自回归大语言模型最高能快上4倍。不过话说回来,谷歌官方自己也挺清醒,明确表态说这还是个面向研究者和开发者的实验品。在输出质量上,它暂时还追不上标准的Gemma 4,所以现阶段真要搞生产环境,还是老老实实用标准版更靠谱。
说到应用场景,这个模型的速度优势其实是有边界的。性能提升主要集中在本地的设备运行和低并发的推理场景里。要是换成高并发的云端部署需求,这种架构带来的速度红利就相对有限了。
为了让技术社区能放手折腾、一起探索,谷歌把这个模型直接用Apache 2.0许可证公开了。这样一来,开发者就能以更低的门槛去验证技术思路,也为整个AI圈探索非自回归架构的推理潜力,添了一份新鲜的实验样本。虽然现在还处在早期摸索阶段,但DiffusionGemma无疑给未来提升大模型推理效率,指出了一个很值得留意的方向。