首页 > 教程攻略 > ai资讯 >MiniMax M3正式发布：自研MSA稀疏注意力架构

MiniMax M3正式发布：自研MSA稀疏注意力架构

来源：互联网时间：2026-06-01 17:27:01

2026年6月1日，国产AI大模型公司MiniMax正式推出了新一代通用模型——MiniMax M3。这个节点很有看头，因为官方直接给出了一个非常清晰的定位：在编程与智能体能力、超长上下文处理以及原生多模态理解这几个关键维度上，M3都实现了代际级的突破。用一句话来概括，这是国内首个同时集齐“前沿Coding能力、1M超长上下文、原生多模态”这三项核心能力的大模型，而且也是目前全球唯一具备这样完整能力组合的开源选择。

M3能实现这样的融合，底层依赖的是全新自研的稀疏注意力架构——MiniMax Sparse Attention（MSA）。这才是它的核心引擎。相比传统的全注意力机制，MSA最直接的优势，是大幅降低长上下文场景下的计算成本。它把上下文窗口直接拉到了100万token。这意味着什么？意味着模型在处理超长文档、复杂的代码仓库、或者是多轮任务协作这类场景时，可以在单次推理中就保留完整的信息链路，不再需要分批次处理，效率和准确性都上了一个台阶。再看实际测试表现。在衡量编程能力的SWE-Bench Pro评测集上，M3的成绩超过了GPT-5.5和Gemini 3.1 Pro，逼近Opus 4.7的水平。而在另一个综合评估SVG生成性能的SVG-Bench基准上，则直接超过了Opus 4.7。这组数据，放在全球竞品里横向对比，含金量非常高。商业化路径也很清晰。MiniMax同步推出了Token Plan订阅方案，一共三个档位，覆盖不同需求：Plus版每月49元，包含6亿token；Max版每月119元，给到18亿token；Ultra版每月469元，直接配了55亿token。这个定价结构，基本是把门槛和天花板都摆在了台面上。

MiniMax M3正式发布：自研MSA稀疏注意力架构

相关阅读

相关下载