登录

DeepSeek-R1


描述

DeepSeek-R1是在2025年1月20日发布的开源推理大模型,它拥有6710亿参数、单Token激活参数为370亿,并采用了MoE架构,训练效率得到了显著提升。
文章

事件

2024-12-29

DeepSeek-R1-0528仍然使用去年12月所发布的DeepSeek V3 Base模型作为基座
文章

影响

那么,英伟达是怎样协同利用运行在Blackwell架构上的推理软件栈,以实现DeepSeek-R1在多种应用场景中的性能增益呢?
文章