登录

DeepSeekV4-Pro

分类

模型

华为表示，基于DeepSeekV4-Pro模型，在8K输入场景，升腾950超节点可实现TPOT约20ms时单卡Decode吞吐4700TPS。

文章

针对DeepSeekV4-Pro模型，升腾A3同步支持推理部署，性能持续优化中。

文章