登录
更多
已读文章
名词
现象
观点
问题
政要
DeepSeek-R1
描述
DeepSeek-R1
是在2025年1月20日发布的开源推理大模型,它拥有6710亿参数、单Token激活参数为370亿,并采用了MoE架构,训练效率得到了显著提升。
文章
事件
2024-12-29
DeepSeek-R1
-0528仍然使用去年12月所发布的DeepSeek V3 Base模型作为基座
文章
影响
那么,英伟达是怎样协同利用运行在Blackwell架构上的推理软件栈,以实现
DeepSeek-R1
在多种应用场景中的性能增益呢?
文章