登录

DeepSeek新模型上线,部署华为芯片后价格还会大降


速读:4月24日,DeepSeek全新系列模型V4预览版本正式上线并同步开源。 目前,DeepSeek-V4-Pro每百万tokens输入(缓存命中)价格为1元,每百万tokens输入(缓存未命中)价格为12元;
DeepSeek新模型上线,部署华为芯片后价格还会大降 _ 东方财富网

DeepSeek新模型上线,部署华为芯片后价格还会大降

2026年04月24日 14:19

  万众期待的DeepSeek新模型揭开面纱。4月24日, DeepSeek全新系列模型V4预览版本正式上线并同步开源。此次DeepSeek共计上线两个版本,DeepSeek-V4-Pro对标顶级闭源模型,1.6T,49B激活,上下文长度1M;DeepSeek-V4-Flash系更小更快的经济版,284B,13B激活,上下文长度1M。

图片   早在4月8日,DeepSeek App就已经进行了改版,上线支持复杂推理的“专家模式”,和处理简单任务的“快速模式”。随着V4的发布可以看到,负责“专家模式”的是1.6T参数量的V4-pro,支持“快速模式”的则是284B的V4-flash。

  据介绍,DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。DeepSeek-V4-Pro性能比肩顶级闭源模型。在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1。

图片   DeepSeek-V4与顶级闭源模型的性能对比。

  相比前代模型,DeepSeek-V4-Pro的Agent能力显著增强。在Agentic Coding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。

  自R1版本发布以来,DeepSeek就被视为以创新方式引领模型发展。这一次新模型发布也不例外,据DeepSeek介绍,DeepSeek-V4开创了一种全新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。

  以前DeepSeek网页版最多上下文长度是128K,从4月24日开始1M是全线官方服务的默认上下文。据介绍,这一变化背后是新的注意力机制V4在token维度做压缩,再叠加DeepSeek自家的DSA稀疏注意力。效果上,目前1M上下文下,V4-Pro的单token推理FLOPs只有V3.2的27%,KV cache只要V3.2的10%。V4-Flash更极致,单token FLOPs只要V3.2的10%,KV cache只要 7%。

  近段时间以来,DeepSeek另一个备受关注的消息是,梁文锋终于对外部融资松了口。此前有消息称,DeepSeek正在洽谈融资,投资方为腾讯与 阿里巴巴 ,DeepSeek本轮融资的估值约200亿美元。当时,DeepSeek、腾讯、阿里三方均未公开确认或回应上述投资意向。

  此外,业界也认为,DeepSeek新模型姗姗来迟或与V4将训练框架从 英伟达 迁移到 华为昇腾 上有关。据悉,DeepSeek V4将采用华为技术公司设计的最新芯片,部署国产算力。

  目前,DeepSeek-V4-Pro每百万tokens输入(缓存命中)价格为1元,每百万tokens输入(缓存未命中)价格为12元;每百万tokens输出价格为24元。DeepSeek强调,输入下半年昇腾950超节点批量上市后,pro版本价格会大幅下调。

图片   更轻便的DeepSeek-V4-Flash每百万tokens输入(缓存命中)价格为0.2元,每百万tokens输入(缓存未命中)价格为1元;每百万tokens输出价格为2元。

(文章来源:南方都市报)

主题:部署华为芯片后价格|基金|美股