首页 > 教程攻略 > 热点新闻 >MiniMax开源百万级上下文多模态大模型M3,摩尔线程

MiniMax开源百万级上下文多模态大模型M3,摩尔线程

来源:互联网 时间:2026-06-13 19:05:03

2026年6月13日,MiniMax正式开源了新一代原生多模态旗舰大模型M3。与此同时,国产GPU企业摩尔线程宣布,旗下AI训推一体智算卡MTT S5000已完成对该模型的首发适配。这或许是个值得留意的信号:国产AI基础设施与大模型之间的协同演进,正在进入一个更务实的阶段。

M3创下了几个“国内首次”:同时支持百万级超长上下文、具备先进编程能力,且原生支持多模态输入输出。更关键的是,它基于自研的MSA稀疏注意力机制,将上下文窗口一举推至100万Token量级。在多项目国际主流基准测试中,M3的表现相当亮眼。

从训练阶段开始,M3就把文本与视觉信息深度融到了一起,能高效支撑智能体任务编排、代码生成与理解、超长文档分析这些高复杂度的应用场景。当然,能力越强,对底层硬件的考验就越大——算力密度、显存容量与带宽、软件栈的兼容性与优化深度,每一项都会被拉高到新的门槛。

为了让M3模型真正跑起来、跑得好,摩尔线程围绕硬件、软件和框架三个环节做了系统性优化。硬件方面,MTT S5000配备了80GB高带宽显存、1.6TB/s的显存带宽,支持原生FP8精度加速,单卡稠密AI算力达到1000 TFLOPS——这样的配置,刚好能接住百万级Token序列在缓存管理和数据吞吐上的极限需求。软件生态方面,基于MUSA统一架构及配套开发工具链,新引入的算子可以快速迁移;通过定制化原生算子,在不牺牲精度的前提下,进一步压缩推理延迟、提升吞吐能力。与此同时,这张卡还全面兼容vLLM和SGLang两大主流推理框架,开发者可以根据实际场景灵活选择部署路径。

如果你想亲手试试,现在就可以通过官方发布的预置镜像,结合摩尔线程MUSA软件栈,快速完成M3模型的本地部署和实机体验。

从更广的视角看,摩尔线程已经持续完成了多款国产主流大模型的首发适配工作,逐步构建起覆盖模型接入、运行部署与性能调优的全流程支持体系。这种软硬一体化的推进,无疑会加快大模型技术向真实业务场景的规模化落地。