首页 > 教程攻略 > 热点新闻 >摩尔线程开源MusaCoder代码大模型,国产GPU全栈训练能力获突破

摩尔线程开源MusaCoder代码大模型,国产GPU全栈训练能力获突破

来源:互联网 时间:2026-06-10 21:10:40

国产GPU厂商在AI基础设施领域取得重要进展。近日,摩尔线程正式宣布开源其面向GPU底层算子生成的专用代码大模型MusaCoder。该模型的发布标志着国产GPU算力底座首次完成了代码大模型从训练到验证的全链路闭环,为高性能计算开发提供了新的工具选择。

摩尔线程开源MusaCoder代码大模型,国产GPU全栈训练能力获突破

据悉,MusaCoder包含9B和27B两种参数规模,专门针对GPU底层算子生成任务设计。其核心能力在于能够从PyTorch标准算子自动生成高性能的CUDA或MUSA原生Kernel代码。这一功能旨在降低开发者手动编写底层GPU算子的技术门槛,同时提升在GPU高性能计算场景下的代码生成、验证与优化效率。

性能表现超越主流模型

在关键的性能评测中,MusaCoder展现了行业领先的水平。根据官方公布的KernelBench评测结果,

MusaCoder-27B-RL模型取得了Overall Pass@8 93.2%、A vg.@8 88.60%的成绩

。这一表现超越了包括Claude Opus 4.7、DeepSeek-V4 Pro、GLM-5.1、Kimi K2.6在内的多款主流SOTA代码模型。

全栈训练流程依托国产算力

尤为值得关注的是,MusaCoder的完整后训练流程完全基于国产硬件平台完成。摩尔线程透露,该模型的监督微调(SFT)、拒绝采样微调(RFT)、强化学习(RL)、异步rollout、在线编译执行验证及奖励计算等全栈训练与验证流程,均依托于

基于MTT S5000 GPU构建的“夸娥”智算集群

完成。

这一成果验证了国产GPU不仅能够支撑大模型的推理和常规微调任务,也能够稳定承载代码大模型后训练全周期的算力需求。特别是在GPU Kernel生成这类复杂任务中,训练系统需要频繁进行代码生成、编译、执行、验证和反馈计算,对硬件、编译栈、运行时及调度系统都提出了极高要求。MusaCoder的成功训练,为国产算力在高强度AI训练场景中的应用提供了重要参考。