海光信息:以芯片内生安全与万卡算力底座,重塑AI时代算力安全新格局
2026 年 4 月 2 日, 海光信息 在郑州举办 2026 春季技术沟通会,正式对外发布 芯片内生安全 体系与DCU 软件栈年度版本两大核心成果,系统阐述了在 AI 算力爆发与安全风险激增双重背景下,以 “CPU+DCU 双芯协同” 构建自主可控、安全可信、高性能 算力底座 的技术路径与产业实践。 海光信息 副总裁应志伟、光合组织人工智能专委会副主任胡辰分别围绕内生安全与 AI 算力底座 两大主题进行深度分享,并就行业关切的安全技术、大模型训练、云计算落地、智能体应用、抗量子密码等问题与媒体深入交流。
AI 时代安全危局: 芯片内生安全 成必答题
随着大模型、智能体、多模态应用全面普及,AI 算力呈指数级增长,传统信息安全边界彻底瓦解,新型安全威胁呈现全域化、智能化、底层化特征,软件层面防护已难以应对。应志伟在演讲中结合全球重大安全事件,系统阐释了 AI 时代安全的极端重要性与底层硬件防护的不可替代性。
从全球安全实践看,基础设施安全漏洞可直接引发国计民生危机:1991 年海湾战争、伊朗摄像头被攻克导致高层行踪暴露、2008 年微软盗版 Windows 黑屏事件、2017 年 Intel 管理引擎漏洞、2019 年委内瑞拉国家电网遭网络攻击瘫痪、2023 年我国数据中心遭境外利用手机短信漏洞攻击等一系列事件表明,底层计算基础设施若存在安全漏洞,将成为数字时代的致命软肋。我国自 2016 年起密集出台《网络安全法》《数据安全法》《个人信息保护法》等法律法规,将信息安全与数据安全提升至国家安全战略层面,为 算力安全 筑牢制度根基。
AI 时代的安全挑战呈现三大全新特征:
算力爆炸带来安全风险放大:内存需求 25 年增长近 10 倍,算力成为核心生产力,数据传输与处理规模呈几何级提升,传统安全方案算力消耗过高,无法适配 AI 场景;
智能体突破传统安全边界:以 “小龙虾” 为代表的智能体具备自主执行、代码生成、模型调用能力,行为超出开发者预设,可自主开启后门、上传数据,风险远超传统木马;
新型攻击手段层出不穷:供应链后门、模型投毒、算力劫持、数据泄露成为常态,AI 可一夜间挖掘数十个漏洞,攻击效率提升百倍,插件投毒、提示词攻击、密钥明文存储等风险被大模型全面放大。
应志伟强调,安全是 AI 的生命线、入场券与战斗力。数据是命脉、模型是核心资产、安全是底线、攻防是战略,AI 系统若失去安全保障,不仅无法落地金融、政务等关键领域,更可能成为破坏力惊人的 “数字武器”。传统防火墙、杀毒软件、权限管控等软件防护方案,本质是 “在应用层打补丁”,无法解决硬件底层漏洞、运行时数据明文、云环境不可信等核心问题 —— 软件运行于硬件之上,硬件被攻破则所有软件防护全面失效;刷机、调试、内存抓取等手段可轻易绕过软件防护,获取模型、数据与密钥明文。
在此背景下,只有 芯片内生安全 ,才能真正守护 AI 全生命周期安全。硬件是软件的根基,芯片出厂即固化的安全能力不可篡改、难以攻破,可实现 “数据可用不可见、程序运行不泄露、密钥全程不暴露”,成为 AI 安全的最终防线。
副总裁应志伟
海光内生安全:四大技术支柱,构建硬件级安全底座
海光拥有中国唯一的“C86+GPGPU”架构产品矩阵,深耕芯片安全十余年,构建起密码技术、可信计算、机密计算、漏洞防控四位一体的多维内生安全防护体系,实现从启动、运行、存储到传输的全链路硬件级安全,成为国内唯一实现 “安全、性能、生态” 三者平衡的芯片厂商。
(一)密码技术:国密合规,密钥硬件化,抗量子提前布局
海光 CPU 内置国密 SM2/SM3/SM4 算法与高性能密码加速引擎,集成专用安全处理器,实现密码算法硬件加速与密钥全生命周期硬件化管理。区别于传统软件加密将密钥存储于内存、文件系统的高风险模式,海光将密钥完全封装于芯片内部,密钥 “可用不可见”,从根源杜绝明文泄露风险,已通过国家商密二级认证,等效于芯片内置合规密码机。
针对量子计算对传统密码体系的颠覆性威胁,海光提前两年布局抗量子密码技术,成为国内首个推进抗量子密码硬件化的 CPU 厂商。量子计算可快速破解传统非对称密码算法,威胁金融、国防、通信等核心领域安全,即便当前量子计算机未完全成熟,攻击者也可 “存密待破”。海光同步布局国际与国内两套抗量子密码标准,先以安全处理器实现算法软件预埋,后续推进硬件化集成,确保在量子计算时代保持安全领先。
(二)可信计算:硬件可信根,全链路度量,全球最优支持
海光 CPU 是全球对可信计算支持最完善的芯片,全面支持TCM 2.0、可信计算 3.0(TPCM) 与国际 TCG 规范,构建从 CPU 启动第一条指令开始的硬件可信根与完整可信链。可信根硬件固化、不可篡改,逐级度量 BIOS、Bootloader、操作系统、应用程序,任何环节被篡改均可实时检测并阻断启动,实现 “主动防御、动态度量、安全启动”,彻底杜绝刷机、固件篡改等底层攻击。
(三)机密计算:运行时加密,内存隔离,CSV 3.0 实现云原生安全
机密计算是解决云环境 “运行时数据明文” 的核心技术,海光历经三代迭代,推出CSV 3.0 机密计算技术,率先在天翼云落地,成为国内首个实现云主机硬件级内存加密与隔离的方案。
传统机密计算仅实现内存加密,未解决完整性保护问题,攻击者仍可破坏密文导致系统崩溃;CSV 3.0 在加密基础上新增硬件级内存隔离与完整性保护,虚拟机全程密文运行,云厂商、管理员、恶意租户均无法获取明文,甚至无法查看密文,操作系统无权限关闭安全机制,真正实现 “租户数据完全可控”。实测显示,海光机密计算对业务性能损耗仅1%,近乎零开销,远优于软件加密 50% 以上的性能损失,适配 AI 大模型、高并发交易等高性能场景。
(四)CPU+DCU 同安全域:AI 全栈安全,破解大模型训推痛点
针对 AI 计算以 GPU/DCU 为核心的特征,海光创新实现CPU 与 DCU 融合为同一安全域,构建 AI 全栈安全能力。大模型从磁盘加载、CPU 传输、DCU 推理 / 训练的全流程,数据与模型始终处于加密状态,云厂商与第三方无法窃取;解决了大模型训练中提示词泄露、模型逆向、数据窃取等行业痛点,为金融、政务、能源等敏感领域大模型落地提供安全保障。
安全落地实践:从金融到政务,筑牢关键领域安全防线
海光内生安全技术已在金融、政务、电信、电商、医疗等关键领域规模化落地,验证了技术成熟度与实用性,成为国产 算力安全 的标杆方案。
金融领域:与国泰海通证券合作实现股票交易数据全链路国密加密,替代传统加密卡,避免硬件松动故障,支撑高并发交易;与四川农信实现数据库加密,解决银行数据内部泄露风险;与招商银行合作完成数万台柜员机终端磁盘加密,即便设备被盗数据仍安全;多家金融机构基于海光抗量子密码技术,提前布局量子安全防护。
政务与医疗:与绿盟科技打造 “数据保险箱”,实现疾控中心病理数据、监管数据 “可用不可见”,支撑多方安全计算与科研分析;落地国内首个政务大模型密态计算案例,实现多卡并行推理与数据安全保护。
云计算与电商:天翼云率先落地 CSV 3.0,打造国产化机密计算云主机,提升租户数据安全等级;与某头部互联网企业合作,实现中小商户营销数据安全流通,兼顾数据价值与隐私保护。
应志伟表示,软件安全是必要补充,但芯片内生安全是 AI 安全的终极方案。软件安全如同给房屋加装防盗窗,仍存在漏洞;芯片级安全如同将数据放入地下防爆保险库,房东(云厂商)亦无钥匙,真正实现自主可控。
DCU 软件栈年度升级:万卡集群支撑,领跑万亿大模型训练
在算力层面,海光 DCU 已成为国产 AI 算力的核心支撑,本次沟通会发布DCU 软件栈年度版本,全面对标国际主流生态,实现从硬件、基础软件、AI 框架到应用平台的全栈升级,支撑万亿参数大模型训练与推理,性能达到国内一流、国际前列水平。
海光 DCU 软件栈采用DTK→DS→DAP三层架构:
DTK 26.04(基础软件栈):全面对标 CUDA 12.6,完善驱动、编译器、运行时,实现统一内存、通信库优化,API 兼容度大幅提升,降低开发者迁移成本;
DS 4.8(AI 基础软件栈):全面支持千亿、万亿参数大模型,兼容 PyTorch、TensorFlow 等主流框架,支持 Llama 3、Qwen、Mixtral 2.5、GPT-23.5 等新一代模型,优化大批次、长上下文推理性能,实现 PP 分离、大 EP 集群部署;
DAP 2.254(AI 应用平台):升级模型管理、知识库、工作流能力,支持智能体(如小龙虾)接入,释放 DCU 算力,提供模型仓库、文档管理、开发者社区等一站式服务。
本次升级核心突破:
万卡集群稳定支撑:完成10 万亿参数大模型训练验证,强扩展效率达 99.63%,训练 40 天 Loss 曲线平滑度优于国际主流 GPU,精度差异仅千分位,支撑多模态、世界模型训练;
全场景性能优化:通过算子融合、编译优化、通信拓扑优化,生成式 AI、视觉模型性能提升近一倍,长上下文推理效率大幅提升;
容错系统成熟:构建万卡级故障检测、隔离、异步加载与自动恢复体系,接入飞书机器人实时告警,保障 40 天以上长时训练稳定运行;
生态全面开放:开源核心组件,融入社区生态,降低国产算力应用门槛,支撑互联网、科研、政企用户快速迁移。
胡辰透露,国内多个头部大模型厂商正基于数万张海光DCU组成的算力集群开展训练,在训推效率、集群稳定性、成本控制上具备显著优势。