DeepSeek-V3
描述
援引博文介绍,DeepSeek-V3是一个6710亿参数的专家混合(MoE,使用多个专家网络将问题空间划分为同质区域)模型,激活参数370亿,在14.8万亿token上进行了预训练。
文章
分类
开源
国产大模型DeepSeek-V3开源:6710亿参数自研MoE,性能和GPT-4o不分伯仲
文章
国产大模型DeepSeek-V3开源:6710亿参数自研MoE,性能和GPT国产大模型DeepSeek-V3开源:6710亿参数自研MoE,性能和GPT-4o不分伯仲
文章