GPU公司曦望（Sunrise）完成超10亿元融资，估值破百亿

速读：下一代启望S3（QiwangS3）推理GPU的量产与交付。

2026年04月28日 08:5

中国 AI 推理 GPU 赛道再迎重磅融资。据凤凰网消息，国内 AI 推理 GPU 企业曦望（Sunrise）完成新一轮超 10 亿元人民币融资，估值突破 100 亿元，成为中国纯推理 GPU 领域首家独角兽企业。

这是 2026 年 AI 需求向推理侧转移背景下，国内 GPU 行业最大单笔融资之一。曦望源自 AI 巨头商汤科技分拆，至今已完成 7 轮融资，累计融资额约 40 亿元。

本轮资金将主要用于：

下一代启望 S3（Qiwang S3）推理 GPU 的量产与交付

全栈软件生态建设

后续 S4、S5 芯片的持续研发迭代

启望 S3：主打推理效率，采用 LPDDR6 架构

曦望于 2026 年 1 月正式发布旗舰推理 GPU 启望 S3 ，是国内首款采用 LPDDR6 显存、同时兼容 LPDDR5X 的推理 GPU。

与高端训练 GPU 普遍采用 HBM 路线不同，该芯片专为智能体（Agent）推理场景量身设计，从 AI Core 架构到存储 I/O 系统进行全栈重构。

架构思路源于推理负载截然不同的存储需求：在主流高并发、长上下文云场景中， KV 缓存可占总内存的 80% 以上。

S3 基于 LPDDR6 的设计：

提供充足推理带宽

提升存储容量

功耗降低 50%

完美匹配推理场景大容量、低成本、低功耗的核心诉求。

算力层面

S3 解决了通用 GPU 算力利用率偏低的痛点：

推理性能较上一代 S2 提升 5 倍

目标将 Token 成本降低 90%

在大模型推理中，GEMM（通用矩阵乘法）与 Attention 操作占算力超 90%，S3 将核心算子利用率推至：

GEMM：约 99%

Flash Attention：约 98%

大幅提升整体效率。

企业定位：All-in 推理，已实现数万片量产

曦望董事长徐冰表示，2026 年 AI 推理需求预计将达到训练需求的 4–5 倍，过去半年推理算力租赁价格上涨近 40% 。

公司已完成三代推理 GPU 研发，实现数万片规模量产。

作为国内首家纯推理 GPU 独角兽，曦望的崛起标志着中国 AI 芯片从 “训推一体” 向专业化推理芯片的关键转向。