摩尔线程开源MusaCoder代码大模型,国产GPU全栈训练能力获突破
来源:互联网
时间:2026-06-10 21:10:40
国产GPU厂商在AI基础设施领域取得重要进展。近日,摩尔线程正式宣布开源其面向GPU底层算子生成的专用代码大模型MusaCoder。该模型的发布标志着国产GPU算力底座首次完成了代码大模型从训练到验证的全链路闭环,为高性能计算开发提供了新的工具选择。

据悉,MusaCoder包含9B和27B两种参数规模,专门针对GPU底层算子生成任务设计。其核心能力在于能够从PyTorch标准算子自动生成高性能的CUDA或MUSA原生Kernel代码。这一功能旨在降低开发者手动编写底层GPU算子的技术门槛,同时提升在GPU高性能计算场景下的代码生成、验证与优化效率。
性能表现超越主流模型
在关键的性能评测中,MusaCoder展现了行业领先的水平。根据官方公布的KernelBench评测结果,
MusaCoder-27B-RL模型取得了Overall Pass@8 93.2%、A vg.@8 88.60%的成绩
全栈训练流程依托国产算力
尤为值得关注的是,MusaCoder的完整后训练流程完全基于国产硬件平台完成。摩尔线程透露,该模型的监督微调(SFT)、拒绝采样微调(RFT)、强化学习(RL)、异步rollout、在线编译执行验证及奖励计算等全栈训练与验证流程,均依托于
基于MTT S5000 GPU构建的“夸娥”智算集群
这一成果验证了国产GPU不仅能够支撑大模型的推理和常规微调任务,也能够稳定承载代码大模型后训练全周期的算力需求。特别是在GPU Kernel生成这类复杂任务中,训练系统需要频繁进行代码生成、编译、执行、验证和反馈计算,对硬件、编译栈、运行时及调度系统都提出了极高要求。MusaCoder的成功训练,为国产算力在高强度AI训练场景中的应用提供了重要参考。