登录

GPU公司曦望(Sunrise)完成超10亿元融资,估值破百亿


速读:下一代启望S3(QiwangS3)推理GPU的量产与交付。
2026年04月28日 08:5

中国 AI 推理 GPU 赛道再迎重磅融资。据凤凰网消息,国内 AI 推理 GPU 企业 曦望 (Sunrise) 完成新一轮超 10 亿元人民币 融资,估值突破 100 亿元 ,成为中国纯推理 GPU 领域首家独角兽企业。

这是 2026 年 AI 需求向推理侧转移背景下,国内 GPU 行业最大单笔融资之一。 曦望 源自 AI 巨头商汤科技分拆,至今已完成 7 轮融资 ,累计融资额约 40 亿元 。

本轮资金将主要用于:

下一代 启望 S3(Qiwang S3) 推理 GPU 的量产与交付

全栈软件生态建设

后续 S4、S5 芯片的持续研发迭代

启望 S3:主打推理效率,采用 LPDDR6 架构

曦望 于 2026 年 1 月正式发布旗舰推理 GPU 启望 S3 ,是 国内首款采用 LPDDR6 显存、同时兼容 LPDDR5X 的推理 GPU。

与高端训练 GPU 普遍采用 HBM 路线不同,该芯片 专为智能体(Agent)推理场景量身设计 ,从 AI Core 架构到存储 I/O 系统进行全栈重构。

架构思路源于推理负载截然不同的存储需求:在主流高并发、长上下文云场景中, KV 缓存可占总内存的 80% 以上 。

S3 基于 LPDDR6 的设计:

提供充足推理带宽

提升存储容量

功耗降低 50%

完美匹配推理场景 大容量、低成本、低功耗 的核心诉求。

算力层面

S3 解决了通用 GPU 算力利用率偏低的痛点:

推理性能较上一代 S2 提升 5 倍

目标将 Token 成本降低 90%

在大模型推理中,GEMM(通用矩阵乘法)与 Attention 操作占算力超 90%,S3 将核心算子利用率推至:

GEMM:约 99%

Flash Attention:约 98%

大幅提升整体效率。

企业定位:All-in 推理,已实现数万片量产

曦望董事长徐冰表示,2026 年 AI 推理需求预计将达到训练需求的 4–5 倍 ,过去半年推理算力租赁价格上涨近 40% 。

公司已完成 三代推理 GPU 研发,实现 数万片规模量产 。

作为国内 首家纯推理 GPU 独角兽 ,曦望的崛起标志着中国 AI 芯片从 “训推一体” 向 专业化推理芯片 的关键转向。

主题:推理GPU|曦望|启望S3