首页 > 教程攻略 > ai资讯 >MiniMax M3正式发布:自研MSA稀疏注意力架构

MiniMax M3正式发布:自研MSA稀疏注意力架构

来源:互联网 时间:2026-06-01 17:27:01
2026年6月1日,国产AI大模型公司MiniMax正式推出了新一代通用模型——MiniMax M3。这个节点很有看头,因为官方直接给出了一个非常清晰的定位:在编程与智能体能力、超长上下文处理以及原生多模态理解这几个关键维度上,M3都实现了代际级的突破。用一句话来概括,这是国内首个同时集齐“前沿Coding能力、1M超长上下文、原生多模态”这三项核心能力的大模型,而且也是目前全球唯一具备这样完整能力组合的开源选择。

MiniMax M3正式发布:自研MSA稀疏注意力架构

M3能实现这样的融合,底层依赖的是全新自研的稀疏注意力架构——MiniMax Sparse Attention(MSA)。这才是它的核心引擎。相比传统的全注意力机制,MSA最直接的优势,是大幅降低长上下文场景下的计算成本。它把上下文窗口直接拉到了100万token。这意味着什么?意味着模型在处理超长文档、复杂的代码仓库、或者是多轮任务协作这类场景时,可以在单次推理中就保留完整的信息链路,不再需要分批次处理,效率和准确性都上了一个台阶。 再看实际测试表现。在衡量编程能力的SWE-Bench Pro评测集上,M3的成绩超过了GPT-5.5和Gemini 3.1 Pro,逼近Opus 4.7的水平。而在另一个综合评估SVG生成性能的SVG-Bench基准上,则直接超过了Opus 4.7。这组数据,放在全球竞品里横向对比,含金量非常高。 商业化路径也很清晰。MiniMax同步推出了Token Plan订阅方案,一共三个档位,覆盖不同需求:Plus版每月49元,包含6亿token;Max版每月119元,给到18亿token;Ultra版每月469元,直接配了55亿token。这个定价结构,基本是把门槛和天花板都摆在了台面上。