重磅！MiniMax M3 即将发布：稀疏注意力架构突破，百万 Token 上下文效率暴增

来源：互联网时间：2026-05-27 17:43:09

北京时间最新消息，国内AI独角兽MiniMax即将推出新一代大模型M3。其AI工程负责人Skyler Miao近日在社交平台释放预告，称“Something BIG is coming!”，这一信号迅速引发了业界的广泛关注。

M3核心架构创新：稀疏注意力机制

根据目前透露的信息，

M3的核心亮点在于采用了全新的稀疏注意力架构

。这套架构通过Index Branch进行快速索引，再结合Sparse Branch执行精准计算，巧妙地绕开了传统模型在处理超长上下文时遇到的计算瓶颈。

要知道，传统的Transformer模型在处理百万Token级别的长序列时，其计算量会随着序列长度呈平方级增长，这在实际应用中是一个巨大的负担。而M3的稀疏设计，正是为了大幅削减这部分开销。它能在保持高性能的同时，实现显著的效率跃升，这无疑为长文本深度理解、持续性长对话以及复杂的多文档分析等场景，提供了坚实的技术支撑。

实测性能大幅领先M2

与支持1M Token上下文的前代模型M2相比，M3在关键性能指标上实现了突破性的提升：

Prefill阶段速度提升9.7倍
Decoding阶段速度提升15.6倍

这些数据意味着什么？简单来说，在实际部署中，M3能够以极低的算力成本来高效消化超长上下文。这不仅将显著降低推理成本，更重要的是，它为更复杂、更依赖长上下文信息的AI应用打开了全新的想象空间。

行业意义：长上下文时代的效率新标杆

MiniMax此次对M3的预告，再次向市场展示了国内AI企业在底层架构创新上的强劲竞争力。稀疏注意力等关键技术的持续突破，或许正在将大模型的竞争焦点，从单纯的“参数规模竞赛”转向更务实的“效率与实用性竞赛”。

这对于整个行业而言是个积极的信号。未来，无论是企业级的复杂任务落地，还是面向消费者的AI应用，都有望因此获得更实惠、更高效的体验。目前，MiniMax尚未公布M3具体的发布时间与完整参数规模，但从工程负责人的高调预告和已披露的性能数据来看，这款模型极有可能成为长上下文处理领域一个强有力的竞争者。后续动态，值得持续关注。

重磅！MiniMax M3 即将发布：稀疏注意力架构突破，百万 Token 上下文效率暴增

M3核心架构创新：稀疏注意力机制

M3的核心亮点在于采用了全新的稀疏注意力架构

实测性能大幅领先M2

Prefill阶段速度提升9.7倍

Decoding阶段速度提升15.6倍

行业意义：长上下文时代的效率新标杆

相关阅读

相关下载