首页 > 教程攻略 > ai资讯 >腾讯混元开源DisCa视频生成加速方案 提速11.8倍获CVPR2026收录

腾讯混元开源DisCa视频生成加速方案 提速11.8倍获CVPR2026收录

来源:互联网 时间:2026-07-04 15:24:16

腾讯混元开源DisCa:为少步视频生成模型装上“高速缓存”,推理提速最高11.8倍

2026年4月,AI视频生成领域迎来一项关键的技术开源。腾讯混元团队正式发布了面向少步蒸馏视频生成模型的加速方案——DisCa。这个方案的核心,在于它用一套“可学习”的特征缓存技术,巧妙绕过了传统方法的误差瓶颈。结果呢?在丝毫不牺牲生成质量的前提下,推理速度被推向了新高,

最高加速比达到了惊人的11.8倍

。这项扎实的研究已被计算机视觉顶会CVPR 2026收录,更重要的是,其完整代码与模型权重现已全部开放,行业开发者可以直接上手测试。

说起来,AI生成视频无疑是当前AIGC赛道里需求最旺、也最让人“着急”的方向。人人都想用它,但生成速度慢、推理成本高这两座大山,实实在在地卡住了规模化应用的脖子。想想看,原生的扩散模型动辄需要几十甚至上百步推理才能产出一条合格视频,生成一条1080P的短视频,成本往往以数元计。即便后来通过知识蒸馏技术,把模型压缩成了步数更少的“少步模型”,其推理成本对于想要批量生产的场景来说,依然是个沉重的负担。

那么,用缓存技术来加速行不行?传统方案在多步模型上确实表现不错,可一旦直接套用到已经蒸馏过的少步模型上,问题就来了:缓存误差会被急剧放大,最终导致生成画面直接崩坏、质量跳水。这个矛盾,就像一把锁,把少步模型进一步的性能潜力给锁住了,而行业一直没能找到那枚合适的钥匙。

DisCa的核心突破:让缓存“学会”预测

DisCa的尝试,可以看作是学界和业界第一次针对蒸馏后的少步模型,系统性地探索可学习缓存加速技术。它的思路很清晰:既然模型本身的步数已经被压缩了,那我们能不能在它的推理过程中,再深挖一层,把每一步的计算成本也降下来?

针对传统方案误差过大的痛点,DisCa引入了一个巧妙的

轻量级神经网络预测器

。这个预测器通过对抗学习进行训练,其任务是学会根据已有的缓存特征,精准地预测出后续特征的演化轨迹。这就好比一个经验丰富的导航员,不仅记得走过的路,还能准确预判前方的弯道,从而从根源上大幅降低了缓存带来的误差。正是这一改进,让DisCa在保证画质无损的同时,将视频生成的推理速度边界一举提升了

最高11.8倍

开源与适配:降低行业落地门槛

此次腾讯混元团队不仅是拿出了一项被顶会认可的研究,更采取了彻底开源的态度。这意味着任何开发者都能直接获取并使用DisCa的完整代码和模型权重。对于整个行业而言,这项技术的吸引力还在于其极低的适配成本——它不需要你对现有的少步视频生成模型进行重新训练,只需要像叠加一个模块那样,把加速组件加上去就能见效。这对于算力资源相对紧张的中小开发团队来说,无疑是一个大幅降低推理成本的实用工具。

放眼整个生成式AI领域,基础模型的创新从未停歇。比如MIT何恺明团队提出的MeanFlow方案,就在图像生成领域验证了新生成路径的潜力。而像DisCa这类专注于推理加速的细分技术,恰恰可以与这些新框架叠加使用,进一步压降整体的落地成本。行业内的一个普遍共识是:正是这些在关键瓶颈处持续取得突破的“螺丝钉”技术,正在一块一块地铺平AI视频生成规模化落地的道路。