沐曦股份曦云C系列GPU产品Day 0适配MiniMax M3大模型
6月12日,MiniMax正式开源了新一代原生多模态旗舰模型M3。而沐曦股份的曦云C系列GPU,凭借全栈自研的软硬一体技术优势,成为了率先支持该模型的国产算力平台——而且是Day 0深度适配,也就是在新模型发布的当天就完成了对接。这其实已经是继M2.5、M2.7之后,曦云C系列又一次对MiniMax旗舰模型实现极速适配了。
这种"发布即适配"的效率,靠的是什么?关键在于沐曦"自研GPU硬件+MXMACA全栈软件"这套软硬一体的核心打法。
具体来说,曦云C系列GPU基于沐曦自主核心GPU IP打造,在高能效比和高通用性上做了充分权衡,正好能应对大模型那种超大规模参数处理和长上下文推理的场景。而真正让适配速度提升一个台阶的,是它们的MXMACA软件栈——它扮演了连接底层硬件算力和上层应用生态的枢纽角色,覆盖了从底层驱动、用户态接口、编译器、算子深度适配到主流训练/推理框架对接的全链路。目前,这套软件栈能够原生兼容PyTorch、TensorFlow、vLLM、SGLang等40多种主流AI框架,支持超过500个AI模型稳定运行。这就把传统模型适配周期大幅缩短了。
在国产GPU的Day 0适配这个赛道上,沐曦的领先地位是相当清晰的。截至今天,沐曦已经完成了26个模型的Day 0适配,覆盖了MiniMax、智谱、阿里千问、阶跃星辰、百度、DeepSeek等国内头部厂商的所有最新旗舰模型。品类也相当广——语言、多模态、OCR、文生图、3D生成,一个不落。可以说,一个"模型发布—芯片适配—产业落地"的高效闭环已经成型。
关于MiniMax新一代原生多模态旗舰模型M3
MiniMax M3在编程和智能体这些专业任务上,已经达到了行业前沿的水平。它采用了一种全新的注意力架构——MSA(MiniMax Sparse Attention),最高支持1M超长上下文。而且,它是一个真正意义上的原生多模态模型,能处理图片和视频输入,甚至能操作电脑桌面。在海外,这三个能力几乎是对闭源前沿模型的标配要求。而M3是国内第一个同时具备这些要素的模型,同时也是目前唯一一个做到这些的开源模型。

在Artificial Analysis的综合智能指数排行榜上,M3取得了全球开源模型中的最高排名。
MSA:结构创新带来的Context Scaling
MSA是一种设计相当简洁、且易于扩展的稀疏注意力架构。它的核心思路是让"上下文"这个维度也真正变得可以扩展。稀疏注意力机制通常通过增加一个初筛阶段来避免计算复杂度爆炸的问题。而相较于DSA、MoBA这些方案,MSA在KV分块的精确度上做得更好,实现了更高的有效上下文覆盖。
同时,MiniMax团队在算子层也做了直接优化——采用了一种以KV块为外层来聚合命中query的KV outer gather Q方案。每个块只读取一次,而且访存是连续的。在M3特定的head配比下,这种设计的计算访存比明显优于常规方法。实际跑下来,比起开源的Flash-Sparse-Attention、FlashMoBA,速度快了4倍以上。
更加可贵的是,MSA简洁、可扩展、实现起来也不复杂,而且对硬件友好——这些特性让理论性能提升真正落了地。在100万上下文的情况下,M3每个token的计算量只有上一代模型的1/20。prefilling阶段,加速倍率超过了9倍;decoding阶段,甚至超过了15倍。而且,在多个对照实验中,MSA的绝大部分能力已经和全注意力基本打平。
前沿的Coding和Agentic能力
Coding和Agent能力,是M3这次重点提升的方向。在涵盖软件工程、终端执行等多个维度的国际权威评测中,M3都达到了国际领先水平。

真正的下一代Agent Coding,比的已经不只是代码生成能力了。它更考验的是长期协作能力、规划能力、以及人和Agent之间的协同效率。M3把对Coding和Agent真正起关键作用的数据进行了规模化扩展——目标不仅仅是刷榜,而是真正成为开发者日常研发流程中值得信赖的协作伙伴。
多模态:原生训练,继续Scale
M3是从第一步开始就采用多模态混合训练的模型。走原生多模态路线,最重要的好处是让不同模态数据的语义空间融合得更自然、更深入。
在数据配比和构成上,MiniMax团队做了大量实验,发现一个有意思的结论:Interlea ved data(交错数据)对模型性能带来的提升,比大多数人想象的要关键得多。就是那种文本和图像或其他模态在序列中交替、自然排列的数据。这类数据对整体训练数据的规模扩展也相当重要。在团队为这些数据重构了一整套数据管线后,训练数据的Token规模已经可以提升到更大量级了。
关于沐曦股份
沐曦股份专注于自主研发全栈高性能GPU芯片及计算平台,面向智算、通用计算、云渲染这些前沿领域,提供高能效、高通用性的算力支撑,助力数字经济的发展。