首页 > 教程攻略 > 热点新闻 >MiniMax开源百万级上下文多模态大模型M3，摩尔线程

MiniMax开源百万级上下文多模态大模型M3，摩尔线程

来源：互联网时间：2026-06-13 19:05:03

2026年6月13日，MiniMax正式开源了新一代原生多模态旗舰大模型M3。与此同时，国产GPU企业摩尔线程宣布，旗下AI训推一体智算卡MTT S5000已完成对该模型的首发适配。这或许是个值得留意的信号：国产AI基础设施与大模型之间的协同演进，正在进入一个更务实的阶段。

M3创下了几个“国内首次”：同时支持百万级超长上下文、具备先进编程能力，且原生支持多模态输入输出。更关键的是，它基于自研的MSA稀疏注意力机制，将上下文窗口一举推至100万Token量级。在多项目国际主流基准测试中，M3的表现相当亮眼。

从训练阶段开始，M3就把文本与视觉信息深度融到了一起，能高效支撑智能体任务编排、代码生成与理解、超长文档分析这些高复杂度的应用场景。当然，能力越强，对底层硬件的考验就越大——算力密度、显存容量与带宽、软件栈的兼容性与优化深度，每一项都会被拉高到新的门槛。

为了让M3模型真正跑起来、跑得好，摩尔线程围绕硬件、软件和框架三个环节做了系统性优化。硬件方面，MTT S5000配备了80GB高带宽显存、1.6TB/s的显存带宽，支持原生FP8精度加速，单卡稠密AI算力达到1000 TFLOPS——这样的配置，刚好能接住百万级Token序列在缓存管理和数据吞吐上的极限需求。软件生态方面，基于MUSA统一架构及配套开发工具链，新引入的算子可以快速迁移；通过定制化原生算子，在不牺牲精度的前提下，进一步压缩推理延迟、提升吞吐能力。与此同时，这张卡还全面兼容vLLM和SGLang两大主流推理框架，开发者可以根据实际场景灵活选择部署路径。

如果你想亲手试试，现在就可以通过官方发布的预置镜像，结合摩尔线程MUSA软件栈，快速完成M3模型的本地部署和实机体验。

从更广的视角看，摩尔线程已经持续完成了多款国产主流大模型的首发适配工作，逐步构建起覆盖模型接入、运行部署与性能调优的全流程支持体系。这种软硬一体化的推进，无疑会加快大模型技术向真实业务场景的规模化落地。

MiniMax开源百万级上下文多模态大模型M3，摩尔线程

相关阅读

相关下载