摩尔线程携手智源FlagOS,为MTT S 5000 GPU完成DeepSeek
摩尔线程携手智源 FlagOS,为 MTT S5000 GPU 完成 DeepSeek-V4 模型 Day-0 适配
2026年04月24日 17:24
IT之家 4 月 24 日消息,摩尔线程今天携手智源 FlagOS, 为旗舰级 AI 训推一体全功能 GPU MTT S5000 完成 DeepSeek-V4-Flash 模型 Day-0 适配 。
据介绍,DeepSeek-V4-Flash 模型采用混合专家(MoE)架构,总参数量达 284B,激活参数 13B,支持百万 token(词元)上下文长度。预训练数据超 32Ttoken, 在最大推理力度模式(Flash-Max)下推理能力逼近 Pro 版本 。
值得注意的是,DeepSeek-V4 模型首次采用了“FP4+FP8”混合精度策略,而国内当前主流 AI 芯片仍普遍以 BF16 为主。摩尔线程凭借原生 FP8 支持能力,可更高效承载 DeepSeek-V4 的前沿精度设计。
同时,MTT S5000 GPU 内置硬件级 FP8 Tensor Core 加速单元,相比传统 BF16/FP16 能将数据位宽直接减半,显存带宽压力降低 50%, 理论计算吞吐量实现翻倍 。
为充分发挥 MTT S5000 的 FP8 优势,FlagOS 团队为 DeepSeek-V4 模型进行 FP8 量化。通过系统级分析,双方技术团队将本次适配的攻坚重点锁定在 FP8 算子与 Sparse Attention 算子, 在“编译优化”与“自动调优”两大方向取得重大突破 。
综合IT之家此前报道,摩尔线程已多次 Day-0 即时适配国产大模型,涵盖 MiniMax M2.7、智谱 GLM-5 等



新浪科技公众号
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

“不好看就退票”服务,能救电影院吗?
微信封禁自家“兄弟”红包,打的什么牌?
华住,比携程还会捞金?
爱喝无糖饮料的人天塌了:无糖饮料只是无蔗糖 但用甜味剂
爱喝无糖饮料的人“天塌了”,那些“0蔗糖”乳品、饮料你还敢喝吗?
雷军:今天9点欢迎来北京车展小米展台 新SU7全拆解版车身非常震撼
日本上榜数量第一!最新亚洲大学排名:清华、北大前二 连续7年蝉联前两位
估值一周翻倍至200亿美元 腾讯阿里洽谈投资DeepSeek
迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源
从纽北封神到闯进VGT殿堂 看小米汽车的概念超跑
今晚记得抬头看!月球光影魔术“月面X”限时上演
华为乾崑OS操作系统全球首发:时延降低30% 可靠性提升20倍
苹果地图 3D 化 F1 迈阿密站:精细还原赛道地标、集成丰富导航信息
主题: