登录

FP8


分类

精度

作为国内率先原生支持FP8精度的全功能GPU,MTTS5000配置了强大的硬件级FP8TensorCore加速单元。
文章

算子

通过系统级分析,双方技术团队将本次适配的攻坚重点锁定在FP8算子与SparseAttention算子。
文章

效果

相比传统的BF16/FP16,FP8能够将数据位宽直接减半,使显存带宽压力降低50%,理论计算吞吐量实现翻倍。
文章