登录

梁文锋出资200亿!DeepSeek首轮创纪录融资500亿,V 4.1定档6月


速读:如果最终落地,这会是中国大模型公司有史以来最大的一轮融资。 融资在这里的作用,给员工期权定价,让“跟着公司一起长大”这件事变得更具体。
2026-05-09 08:26:29

作者:

我有话说

梦晨 发自 凹非寺

量子位 | 公众号 QbitAI

21天翻5倍,DeepSeek首轮估值暴涨到 3500亿元 !

DeepSeek V4.1也被曝定档6月 ,一切都在加速。

这轮融资中最大的一张支票,可能不是来自VC或互联网巨头,而是来自梁文锋本人。

据The Information消息, 梁文锋个人出资最高达200亿元人民币 ,占本轮计划融资总额的40%。

整轮融资的目标,最高可达500亿元人民币。

如果最终落地,这会是中国大模型公司有史以来最大的一轮融资。

这家公司曾经最鲜明的标签,恰恰是“不融资、不商业化、不路演”。

一家一直强调研究优先的AI实验室,突然要拿一笔可能刷新纪录的钱。

短短3周内,DeepSeek的估值在短短3周,四次改写:

2026年4月初:约100亿美元,DeepSeek 启动首轮融资;

2026年4月22日:超过200亿美元,腾讯、阿里等洽谈投资;

2026年5月6日:约450亿美元,国家集成电路产业投资基金洽谈领投;

2026年5月上旬:部分报道称,最终估值可能高达500亿美元。

转向开始了。

当理想主义者交过了学费

DeepSeek过去的故事,多少带点技术理想主义。

一个量化基金孵化出来的AI团队,不急着商业化,不急着见投资人,埋头把模型做出来。

这种姿态本身就是传播点。

但AI这场比赛打到2026年,这种浪漫开始撞上三重现实。

第一件,是算力。

前沿模型越来越不像“写一篇论文、训一个模型”那么简单。推理能力、Agent能力、超长上下文、企业级稳定性,都会把算力需求继续往上推。

DeepSeek官方4月发布的V4系列,已经把上下文长度拉到1M,还开始测试视觉模式。

这类能力对开发者很友好,但背后都要算力支撑。

如果公司继续往企业服务走,算力就不只是训练时的大开销,还会变成持续推理、稳定交付的一部分。

第二件,是人才。

DeepSeek已经流失了一些明星研究员,郭达雅、王炳宣、魏浩然……跳槽后都拿到更高薪酬。

顶级AI研究员的竞争到了这个阶段,已经不是靠理想主义就能完全覆盖的。

研究文化能吸引人,但也不能忽视薪酬、股权和未来收益。

融资在这里的作用,给员工期权定价,让“跟着公司一起长大”这件事变得更具体。

第三件,是产品化。

DeepSeek也开始强调,不能永远只停在“模型很强”。

The Information消息称,DeepSeek员工已经开始向各行业企业推广模型,希望把技术变成可收费的产品和服务。

一个实验室可以只关心模型指标。

一家重资产AI公司,必须关心客户、收入、交付、成本和人才结构。

融资能解决一部分钱的问题。

但钱到位之后,下一个问题就是:DeepSeek要把这些钱投向哪里?

V4之后,商业化开始变具体

答案已经在DeepSeek V4和V4.1里露出了一点轮廓。

V4系列在4月24日上线,包含两个模型:deepseek-v4-pro和deepseek-v4-flash,都支持1M上下文。

对企业来说,1M上下文对应的是长文档、长代码库、多轮任务、复杂工作流。再加上工具调用、JSON输出,接入真实业务流程的障碍已经扫清。

这是商业化的基础。

主题:估值