登录

DeepSeek V 4适配国产芯片!摩尔线程MTT S 5000实现Day


速读:
DeepSeek V4适配国产芯片!摩尔线程MTT S5000实现Day-0支持

DeepSeek V4适配国产芯片!摩尔线程MTT S5000实现Day-0支持

2026年04月24日 16:37

快科技4月24日消息,今日,DeepSeek正式上线V4预览版并宣布开源,该模型支持百万字超长上下文处理。

摩尔线程联合智源众智FlagOS社区宣布,在旗舰AI训推一体GPU MTT S5000上,完成对DeepSeek-V4-Flash大模型的Day-0极速适配,并实现全量核心算子深度优化与部署支持。

DeepSeek-V4-Flash采用MoE架构,总参数284B、激活参数13B,支持百万Token上下文,首次采用FP4+FP8混合精度,对算力芯片提出更高要求。

摩尔线程MTT S5000是国内率先原生支持FP8的全功能GPU,搭载硬件级FP8 Tensor Core,相比BF16/FP16可将显存压力降低50%,计算吞吐量翻倍。

本次适配由智源FlagOS完成FP8量化,团队聚焦FP8算子与Sparse Attention算子两大关键,通过两大方向实现突破:

一是依托FlagTree编译器做精细化shape对齐与矩阵计算加速;

二是通过FlagOS-Tune自动搜索最优内核配置,效果超越手工调优。实测显示,开启自动调优后TTFT时延降低16.5%,ITL时延降低39.7%,吞吐量提升65.7%。

目前,双方已完成DeepSeek-V4-Flash适配,并正在推进更大规模的DeepSeek-V4-Pro(1.6T)在MTT S5000上的迁移适配。

开发者可在魔塔、HuggingFace下载镜像开箱即用。

【本文结束】如需转载请务必注明出处:

新浪众测

新浪众测

新浪科技公众号

新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

“不好看就退票”服务,能救电影院吗?

微信封禁自家“兄弟”红包,打的什么牌?

华住,比携程还会捞金?

爱喝无糖饮料的人天塌了:无糖饮料只是无蔗糖 但用甜味剂

爱喝无糖饮料的人“天塌了”,那些“0蔗糖”乳品、饮料你还敢喝吗?

雷军:今天9点欢迎来北京车展小米展台 新SU7全拆解版车身非常震撼

日本上榜数量第一!最新亚洲大学排名:清华、北大前二 连续7年蝉联前两位

估值一周翻倍至200亿美元 腾讯阿里洽谈投资DeepSeek

迈入百万上下文普惠时代:DeepSeek-V4 模型预览版正式上线并同步开源

从纽北封神到闯进VGT殿堂 看小米汽车的概念超跑

今晚记得抬头看!月球光影魔术“月面X”限时上演

华为乾崑OS操作系统全球首发:时延降低30% 可靠性提升20倍

苹果地图 3D 化 F1 迈阿密站:精细还原赛道地标、集成丰富导航信息

主题:摩尔线程MTTS5000|DeepSeekV4适配国产芯片