登录

DeepSeek-V3


描述

援引博文介绍,DeepSeek-V3是一个6710亿参数的专家混合(MoE,使用多个专家网络将问题空间划分为同质区域)模型,激活参数370亿,在14.8万亿token上进行了预训练。
文章

分类

开源

国产大模型DeepSeek-V3开源:6710亿参数自研MoE,性能和GPT-4o不分伯仲
文章

国产大模型DeepSeek-V3开源:6710亿参数自研MoE,性能和GPT国产大模型DeepSeek-V3开源:6710亿参数自研MoE,性能和GPT-4o不分伯仲
文章