登录

DeepSeekV4-Pro


分类

模型

华为表示,基于DeepSeekV4-Pro模型,在8K输入场景,升腾950超节点可实现TPOT约20ms时单卡Decode吞吐4700TPS。
文章

针对DeepSeekV4-Pro模型,升腾A3同步支持推理部署,性能持续优化中。
文章