首页 > 教程攻略 > ai资讯 >国产多模态大模型迎来里程碑,MiniMax M3 正式开源且响应速度倍增

国产多模态大模型迎来里程碑,MiniMax M3 正式开源且响应速度倍增

来源:互联网 时间:2026-06-17 14:47:00

国内AI圈今天又迎来一个重磅消息——稀宇科技MiniMax,正式把自家的旗舰模型MiniMax M3给开源了。其实早在这之前,官方就已经放出了模型权重,还同步发了一篇关于稀疏注意力机制的论文,可以说诚意十足。社区里早就炸开了锅,大家都在讨论这个多模态模型到底有多能打。

image.png

综合性能荣登开源榜首

作为MiniMax花大力气打造的旗舰级选手,M3的体量相当惊人——总参数达到了428B,不过实际激活的参数只有23B。这意味着它在拥有大模型“知识储备”的同时,推理时并不需要消耗太多计算资源,平衡做得相当漂亮。更值得一提的是,这应该是行业里第一个从零开始、在训练初期就直接把多模态数据混在一起训练的模型,而非后期拼凑。

靠着这套扎实的技术架构,M3在发布后仅仅两周,就在全球综合智能指数排行榜上拿下了开源模型的第一名。发布初期因为访问量太大,体验上有点卡顿,官方表示已经速度从原来的30 TPS优化到了80 TPS,后续还会继续提速。

顶尖编码与代码交付能力

在编码和智能体能力这块,M3的表现可以说是直接拉满。它不仅能自主拆解复杂任务,还擅长调用各种外部工具进行多步推理,这正是目前大模型最有实用价值的能力之一。

相比传统模型,M3的代码质量明显上了一个台阶。官方对自家模型的代码质量很有信心,表示它产出的代码,目标是直接就能用、直接就能交付,而不是那种“看着像那么回事,但还得人工改半天”的半成品。这对开发者来说,意味着实实在在的生产力释放。