首页 > 教程攻略 > ai资讯 >官方预告 MiniMax M3 系列 AI 模型即将登场

官方预告 MiniMax M3 系列 AI 模型即将登场

来源：互联网时间：2026-05-27 16:11:27

5月27日，AI领域传来新动向。上海稀宇科技有限公司（MiniMax）在其官方X平台账号发布预告，正式宣布即将推出MiniMax M3系列模型。

这条推文同时转发了一篇于5月26日发表在预印本平台arxiv上的论文，题为《The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence》。这篇论文可以看作是对已发布的MiniMax M2.x系列模型背后技术工作的系统性回顾与总结。

根据论文披露的信息，M2.x系列模型在架构设计上颇具巧思。其总参数量达到2299亿，但通过创新的稀疏激活机制，每个词元（token）实际激活的参数仅为98亿。这种“小激活，大智能”的设计理念，旨在以更低的计算成本换取更高的实际性能。模型配备了长达192K的上下文窗口，其预训练数据规模更是达到了惊人的29.2万亿词元。

具体到模型结构，M2系列采用了62层的解码器式Transformer架构。其核心在于引入了多达256个细粒度专家（Expert），并为每个处理到的词元动态选择激活其中的8个专家。这种混合专家模型（MoE）的设计，是实现高效稀疏激活的关键。

更值得关注的是其在训练系统层面的创新。论文中，MiniMax团队提出了名为“Forge”的强化学习系统，该系统旨在面向智能体（Agent）进行优化。Forge系统的特点在于能够统一接入白盒与黑盒智能体，并通过将训练、推理与智能体逻辑解耦，配合窗口化FIFO调度、前缀树合并和专门的推理加速技术，显著降低了长轨迹任务（long-horizon tasks）的训练成本。

在M2.7版本中，一个被称为“自我进化”雏形的能力开始显现。论文描述，模型已经能够自主排查训练失败的原因、阅读系统日志、并修改相关的脚手架代码，进而在内部任务上完成多达100轮的自主迭代优化。这听起来是不是有点“AI自我改进”的早期影子了？

数据显示，这套自我进化系统已经能够承担团队30%到50%的日常迭代工作量。在内部的一项编程脚手架优化任务中，它甚至带来了30%的性能提升。这意味着，模型正开始参与到其自身开发与优化的闭环中，虽然尚处早期，但方向已然明确。

相关论文：《The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence》。

官方预告 MiniMax M3 系列 AI 模型即将登场

相关阅读

相关下载