DeepSeek新模型上线，部署华为芯片后价格还会大降

速读：4月24日，DeepSeek全新系列模型V4预览版本正式上线并同步开源。目前，DeepSeek-V4-Pro每百万tokens输入（缓存命中）价格为1元，每百万tokens输入（缓存未命中）价格为12元；

DeepSeek新模型上线，部署华为芯片后价格还会大降 _ 东方财富网

2026年04月24日 14:19

　　万众期待的DeepSeek新模型揭开面纱。4月24日， DeepSeek全新系列模型V4预览版本正式上线并同步开源。此次DeepSeek共计上线两个版本，DeepSeek-V4-Pro对标顶级闭源模型，1.6T，49B激活，上下文长度1M；DeepSeek-V4-Flash系更小更快的经济版，284B，13B激活，上下文长度1M。

　　早在4月8日，DeepSeek App就已经进行了改版，上线支持复杂推理的“专家模式”，和处理简单任务的“快速模式”。随着V4的发布可以看到，负责“专家模式”的是1.6T参数量的V4-pro，支持“快速模式”的则是284B的V4-flash。

　　据介绍，DeepSeek-V4拥有百万字超长上下文，在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。DeepSeek-V4-Pro性能比肩顶级闭源模型。在世界知识测评中，大幅领先其他开源模型，仅稍逊于顶尖闭源模型Gemini-Pro-3.1。

　　DeepSeek-V4与顶级闭源模型的性能对比。

　　相比前代模型，DeepSeek-V4-Pro的Agent能力显著增强。在Agentic Coding评测中，V4-Pro已达到当前开源模型最佳水平，并在其他Agent相关评测中同样表现优异。

　　自R1版本发布以来，DeepSeek就被视为以创新方式引领模型发展。这一次新模型发布也不例外，据DeepSeek介绍，DeepSeek-V4开创了一种全新的注意力机制，在token维度进行压缩，结合DSA稀疏注意力（DeepSeek Sparse Attention），实现了全球领先的长上下文能力，并且相比于传统方法大幅降低了对计算和显存的需求。

　　以前DeepSeek网页版最多上下文长度是128K，从4月24日开始1M是全线官方服务的默认上下文。据介绍，这一变化背后是新的注意力机制V4在token维度做压缩，再叠加DeepSeek自家的DSA稀疏注意力。效果上，目前1M上下文下，V4-Pro的单token推理FLOPs只有V3.2的27%，KV cache只要V3.2的10%。V4-Flash更极致，单token FLOPs只要V3.2的10%，KV cache只要 7%。

　　近段时间以来，DeepSeek另一个备受关注的消息是，梁文锋终于对外部融资松了口。此前有消息称，DeepSeek正在洽谈融资，投资方为腾讯与阿里巴巴，DeepSeek本轮融资的估值约200亿美元。当时，DeepSeek、腾讯、阿里三方均未公开确认或回应上述投资意向。

　　此外，业界也认为，DeepSeek新模型姗姗来迟或与V4将训练框架从英伟达迁移到华为昇腾上有关。据悉，DeepSeek V4将采用华为技术公司设计的最新芯片，部署国产算力。

　　目前，DeepSeek-V4-Pro每百万tokens输入（缓存命中）价格为1元，每百万tokens输入（缓存未命中）价格为12元；每百万tokens输出价格为24元。DeepSeek强调，输入下半年昇腾950超节点批量上市后，pro版本价格会大幅下调。

　　更轻便的DeepSeek-V4-Flash每百万tokens输入（缓存命中）价格为0.2元，每百万tokens输入（缓存未命中）价格为1元；每百万tokens输出价格为2元。

（文章来源：南方都市报）

主题：部署华为芯片后价格|基金|美股