登录

摩尔线程宣布开源MusaCoder:首个国产全功能GPU全栈训练代码大模型


速读:今日,摩尔线程宣布正式发布并开源MusaCoder。
2026年06月10日 16:4

快科技6月10日消息,今日,摩尔线程宣布正式发布并开源MusaCoder,这是面向GPU底层算子生成的专用代码大模型。

摩尔线程表示, MusaCoder是业内首个基于国产GPU算力底座完成全链路训练与验证的开源代码大模型, 其完整后训练流程均在基于MTT S5000构建的夸娥智算集群上完成。

据介绍,MusaCoder包含9B和27B两个参数规模,主要面向GPU底层算子生成任务设计,重点支持从PyTorch标准算子自动生成高性能CUDA/MUSA原生Kernel代码。

这一能力可降低开发者手写底层GPU算子的门槛,提升GPU高性能计算场景下的代码生成、验证和优化效率。

性能方面,在KernelBench评测中,MusaCoder-27B-RL取得Overall Pass@8 93.2%、Avg.@8 88.60%的成绩, 超越Claude Opus 4.7、DeepSeek-V4 Pro、GLM-5.1、Kimi K2.6等主流SOTA代码模型, 达到当前行业领先水平。

摩尔线程称,MusaCoder的SFT(监督微调)、RFT(拒绝采样微调)、RL(强化学习)、异步rollout、在线编译执行验证及reward计算等全栈训练与验证流程,均依托MTT S5000构建的夸娥智算集群完成。

这也意味着,国产GPU不仅能够支撑大模型推理和常规微调任务,也能够稳定承载代码大模型后训练全周期算力需求。

尤其是在GPU Kernel生成这类任务中,训练系统需要频繁进行代码生成、编译、执行、验证和反馈计算,对硬件、编译栈、运行时、调度系统和评测基础设施都提出了更高要求。

MusaCoder训练总流程

【本文结束】如需转载请务必注明出处:

摩尔 gpu

新浪众测

新浪众测

新浪科技公众号

新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

陌陌母公司挚文季报图解:营收24亿净利降19% 唐岩刚获派息超8000万

风口上的AI短剧人,如履薄冰

“不好看就退票”服务,能救电影院吗?

中国首颗时间胶囊落地四川:封存信息500年后打开

女子买1100件衣服仅退款1000件被商家找上门:金额巨大已立案!

阿姨买充电宝被问要1万还是2万的!大姨当场愣住 直说太贵

三大运营商被质疑杀熟:专家称不把老用户满意度当考核指标情况不会改善!

女子在新疆一隧道撞倒29只羊 交警回应负全责羊有优先通行权:网友吵翻

从低配到增配 外资布局A股坚守“杠铃策略”

刚刚,Claude最强模型Fable 5发布:性能爆炸,价格翻倍

车企扎堆研发自己造芯:真相不止技术那么简单

苹果 CEO 库克挥泪告别:主持 WWDC26 频频拭泪,连说 18 声“谢谢”

全球手机系统最新份额一览:安卓、鸿蒙、iOS三分天下!

35次!SpaceX猎鹰9号火箭复用新纪录:超预计40%

时隔 11 年终迎换代,全新一代奥迪 Q7 正式亮相

丰田章男:看到大家都在向电动汽车靠拢,自己感到非常“孤独”

蔚来萤火虫纯电小车“像素玩家特别版”上市:配备专属金属车顶,13.58 万元

赛力斯、字节联手!赛豆汽车首款车型亮相 悬挂AIVA车标

曝哈啰单车曾计划殴打竞品核心人员,成功让对方离职可获高额奖金

女子买1100件衣服仅退款1000件被商家找上门:金额巨大已立案!

中国首颗时间胶囊落地四川:封存信息500年后打开

阿维塔称被抄袭:中国汽车不能走Ctrl+C、Ctrl+V之路

中国下饺子式发射卫星:央视称这不只是商业竞赛,而是一次必须打赢的战略突围

主题:验证|摩尔线程