R1
分类
模型
DeepSeek星期四(5月29日)晚在官方微信公众号发文称,DeepSeekR1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。
文章
DeepSeek也将继续开源新版R1模型,允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
文章
DeepSeek表示,更新后的R1模型在数学、编程与通用逻辑等多个基准测评中,取得当前中国“所有模型中首屈一指的成绩”,在整体表现上已接近OpenAI的o3和谷歌的Gemini-2.5-Pro等美国顶尖模型。
文章
文章特别提到,更新后的R1模型对“幻觉”问题(错误或误导性输出)进行了优化,在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45%至50%左右。
文章
没想到在不到一年之后的今天,R1模型的每token成本竟已降低了到了1/32!
文章
中国人工智能起步公司深度求索(DeepSeek)发布其热门推理模型R1的首次更新版本,称新版R1模型深度思考能力得到强化,整体表现上已接近美国竞争对手OpenAI和谷歌推出的顶尖模型。
文章
R1
另据路透社报道,今年1月发布的R1在全球引发热议,导致中国以外的科技股暴跌,挑战了“扩展人工智能需要巨大算力和投资”这一观点。
文章
事件
2025-05-29
DeepSeek星期四(5月29日)晚在官方微信公众号发文称,DeepSeek R1模型已完成小版本升级
文章
2025-05-00
外界普遍预计DeepSeek将推出R1的后续版本R2,路透社3月曾引述消息人士称,R2最初计划在5月发布
文章
2025-03-00
2025-01-29
今年1月发布的R1在全球引发热议,导致中国以外的科技股暴跌,挑战了“扩展人工智能需要巨大算力和投资
文章
2024-12-29
DeepSeek-R1-0528仍然使用去年12月所发布的DeepSeek V3 Base模型作为基座
文章
效果
没想到在不到一年之后的今天,R1模型的每token成本竟已降低了到了1/32!
文章
几天前,DeepSeek毫无预兆地更新了R1论文,将原有的22页增加到了现在的86页。
文章
影响
那么,英伟达是怎样协同利用运行在Blackwell架构上的推理软件栈,以实现DeepSeek-R1在多种应用场景中的性能增益呢?
文章