首页 > 教程攻略 > ai资讯 >重磅!MiniMax M3 即将发布:稀疏注意力架构突破,百万 Token 上下文效率暴增

重磅!MiniMax M3 即将发布:稀疏注意力架构突破,百万 Token 上下文效率暴增

来源:互联网 时间:2026-05-27 17:43:09

北京时间最新消息,国内AI独角兽MiniMax即将推出新一代大模型M3。其AI工程负责人Skyler Miao近日在社交平台释放预告,称“Something BIG is coming!”,这一信号迅速引发了业界的广泛关注。

image.png

M3核心架构创新:稀疏注意力机制

根据目前透露的信息,

M3的核心亮点在于采用了全新的稀疏注意力架构

。这套架构通过Index Branch进行快速索引,再结合Sparse Branch执行精准计算,巧妙地绕开了传统模型在处理超长上下文时遇到的计算瓶颈。

要知道,传统的Transformer模型在处理百万Token级别的长序列时,其计算量会随着序列长度呈平方级增长,这在实际应用中是一个巨大的负担。而M3的稀疏设计,正是为了大幅削减这部分开销。它能在保持高性能的同时,实现显著的效率跃升,这无疑为长文本深度理解、持续性长对话以及复杂的多文档分析等场景,提供了坚实的技术支撑。

实测性能大幅领先M2

与支持1M Token上下文的前代模型M2相比,M3在关键性能指标上实现了突破性的提升:

  • Prefill阶段速度提升9.7倍

  • Decoding阶段速度提升15.6倍

这些数据意味着什么?简单来说,在实际部署中,M3能够以极低的算力成本来高效消化超长上下文。这不仅将显著降低推理成本,更重要的是,它为更复杂、更依赖长上下文信息的AI应用打开了全新的想象空间。

行业意义:长上下文时代的效率新标杆

MiniMax此次对M3的预告,再次向市场展示了国内AI企业在底层架构创新上的强劲竞争力。稀疏注意力等关键技术的持续突破,或许正在将大模型的竞争焦点,从单纯的“参数规模竞赛”转向更务实的“效率与实用性竞赛”。

这对于整个行业而言是个积极的信号。未来,无论是企业级的复杂任务落地,还是面向消费者的AI应用,都有望因此获得更实惠、更高效的体验。目前,MiniMax尚未公布M3具体的发布时间与完整参数规模,但从工程负责人的高调预告和已披露的性能数据来看,这款模型极有可能成为长上下文处理领域一个强有力的竞争者。后续动态,值得持续关注。