海光信息：以芯片内生安全与万卡算力底座，重塑AI时代算力安全新格局

速读：应志伟强调，安全是AI的生命线、入场券与战斗力。海光信息副总裁应志伟、光合组织人工智能专委会副主任胡辰分别围绕内生安全与AI算力底座两大主题进行深度分享，并就行业关切的安全技术、大模型训练、云计算落地、智能体应用、抗量子密码等问题与媒体深入交流。数据是命脉、模型是核心资产、安全是底线、攻防是战略，AI系统若失去安全保障，不仅无法落地金融、政务等关键领域，更可能成为破坏力惊人的“数字武器”。硬件是软件的根基，芯片出厂即固化的安全能力不可篡改、难以攻破，可实现“数据可用不可见、程序运行不泄露、密钥全程不暴露”，成为AI安全的最终防线。海光拥有中国唯一的“C86+GPGPU”架构产品矩阵，深耕芯片安全十余年，构建起密码技术、可信计算、机密计算、漏洞防控四位一体的多维内生安全防护体系，实现从启动、运行、存储到传输的全链路硬件级安全，成为国内唯一实现“安全、性能、生态”三者平衡的芯片厂商。

2026年04月20日 11:2

2026 年 4 月 2 日，海光信息在郑州举办 2026 春季技术沟通会，正式对外发布芯片内生安全体系与DCU 软件栈年度版本两大核心成果，系统阐述了在 AI 算力爆发与安全风险激增双重背景下，以 “CPU+DCU 双芯协同” 构建自主可控、安全可信、高性能算力底座的技术路径与产业实践。海光信息副总裁应志伟、光合组织人工智能专委会副主任胡辰分别围绕内生安全与 AI 算力底座两大主题进行深度分享，并就行业关切的安全技术、大模型训练、云计算落地、智能体应用、抗量子密码等问题与媒体深入交流。

AI 时代安全危局：芯片内生安全成必答题

随着大模型、智能体、多模态应用全面普及，AI 算力呈指数级增长，传统信息安全边界彻底瓦解，新型安全威胁呈现全域化、智能化、底层化特征，软件层面防护已难以应对。应志伟在演讲中结合全球重大安全事件，系统阐释了 AI 时代安全的极端重要性与底层硬件防护的不可替代性。

从全球安全实践看，基础设施安全漏洞可直接引发国计民生危机：1991 年海湾战争、伊朗摄像头被攻克导致高层行踪暴露、2008 年微软盗版 Windows 黑屏事件、2017 年 Intel 管理引擎漏洞、2019 年委内瑞拉国家电网遭网络攻击瘫痪、2023 年我国数据中心遭境外利用手机短信漏洞攻击等一系列事件表明，底层计算基础设施若存在安全漏洞，将成为数字时代的致命软肋。我国自 2016 年起密集出台《网络安全法》《数据安全法》《个人信息保护法》等法律法规，将信息安全与数据安全提升至国家安全战略层面，为算力安全筑牢制度根基。

AI 时代的安全挑战呈现三大全新特征：

算力爆炸带来安全风险放大：内存需求 25 年增长近 10 倍，算力成为核心生产力，数据传输与处理规模呈几何级提升，传统安全方案算力消耗过高，无法适配 AI 场景；

智能体突破传统安全边界：以 “小龙虾” 为代表的智能体具备自主执行、代码生成、模型调用能力，行为超出开发者预设，可自主开启后门、上传数据，风险远超传统木马；

新型攻击手段层出不穷：供应链后门、模型投毒、算力劫持、数据泄露成为常态，AI 可一夜间挖掘数十个漏洞，攻击效率提升百倍，插件投毒、提示词攻击、密钥明文存储等风险被大模型全面放大。

应志伟强调，安全是 AI 的生命线、入场券与战斗力。数据是命脉、模型是核心资产、安全是底线、攻防是战略，AI 系统若失去安全保障，不仅无法落地金融、政务等关键领域，更可能成为破坏力惊人的 “数字武器”。传统防火墙、杀毒软件、权限管控等软件防护方案，本质是 “在应用层打补丁”，无法解决硬件底层漏洞、运行时数据明文、云环境不可信等核心问题 —— 软件运行于硬件之上，硬件被攻破则所有软件防护全面失效；刷机、调试、内存抓取等手段可轻易绕过软件防护，获取模型、数据与密钥明文。

在此背景下，只有芯片内生安全，才能真正守护 AI 全生命周期安全。硬件是软件的根基，芯片出厂即固化的安全能力不可篡改、难以攻破，可实现 “数据可用不可见、程序运行不泄露、密钥全程不暴露”，成为 AI 安全的最终防线。

海光信息副总裁应志伟

海光内生安全：四大技术支柱，构建硬件级安全底座

海光拥有中国唯一的“C86+GPGPU”架构产品矩阵，深耕芯片安全十余年，构建起密码技术、可信计算、机密计算、漏洞防控四位一体的多维内生安全防护体系，实现从启动、运行、存储到传输的全链路硬件级安全，成为国内唯一实现 “安全、性能、生态” 三者平衡的芯片厂商。

（一）密码技术：国密合规，密钥硬件化，抗量子提前布局

海光 CPU 内置国密 SM2/SM3/SM4 算法与高性能密码加速引擎，集成专用安全处理器，实现密码算法硬件加速与密钥全生命周期硬件化管理。区别于传统软件加密将密钥存储于内存、文件系统的高风险模式，海光将密钥完全封装于芯片内部，密钥 “可用不可见”，从根源杜绝明文泄露风险，已通过国家商密二级认证，等效于芯片内置合规密码机。

针对量子计算对传统密码体系的颠覆性威胁，海光提前两年布局抗量子密码技术，成为国内首个推进抗量子密码硬件化的 CPU 厂商。量子计算可快速破解传统非对称密码算法，威胁金融、国防、通信等核心领域安全，即便当前量子计算机未完全成熟，攻击者也可 “存密待破”。海光同步布局国际与国内两套抗量子密码标准，先以安全处理器实现算法软件预埋，后续推进硬件化集成，确保在量子计算时代保持安全领先。

（二）可信计算：硬件可信根，全链路度量，全球最优支持

海光 CPU 是全球对可信计算支持最完善的芯片，全面支持TCM 2.0、可信计算 3.0（TPCM）与国际 TCG 规范，构建从 CPU 启动第一条指令开始的硬件可信根与完整可信链。可信根硬件固化、不可篡改，逐级度量 BIOS、Bootloader、操作系统、应用程序，任何环节被篡改均可实时检测并阻断启动，实现 “主动防御、动态度量、安全启动”，彻底杜绝刷机、固件篡改等底层攻击。

（三）机密计算：运行时加密，内存隔离，CSV 3.0 实现云原生安全

机密计算是解决云环境 “运行时数据明文” 的核心技术，海光历经三代迭代，推出CSV 3.0 机密计算技术，率先在天翼云落地，成为国内首个实现云主机硬件级内存加密与隔离的方案。

传统机密计算仅实现内存加密，未解决完整性保护问题，攻击者仍可破坏密文导致系统崩溃；CSV 3.0 在加密基础上新增硬件级内存隔离与完整性保护，虚拟机全程密文运行，云厂商、管理员、恶意租户均无法获取明文，甚至无法查看密文，操作系统无权限关闭安全机制，真正实现 “租户数据完全可控”。实测显示，海光机密计算对业务性能损耗仅1%，近乎零开销，远优于软件加密 50% 以上的性能损失，适配 AI 大模型、高并发交易等高性能场景。

（四）CPU+DCU 同安全域：AI 全栈安全，破解大模型训推痛点

针对 AI 计算以 GPU/DCU 为核心的特征，海光创新实现CPU 与 DCU 融合为同一安全域，构建 AI 全栈安全能力。大模型从磁盘加载、CPU 传输、DCU 推理 / 训练的全流程，数据与模型始终处于加密状态，云厂商与第三方无法窃取；解决了大模型训练中提示词泄露、模型逆向、数据窃取等行业痛点，为金融、政务、能源等敏感领域大模型落地提供安全保障。

安全落地实践：从金融到政务，筑牢关键领域安全防线

海光内生安全技术已在金融、政务、电信、电商、医疗等关键领域规模化落地，验证了技术成熟度与实用性，成为国产算力安全的标杆方案。

金融领域：与国泰海通证券合作实现股票交易数据全链路国密加密，替代传统加密卡，避免硬件松动故障，支撑高并发交易；与四川农信实现数据库加密，解决银行数据内部泄露风险；与招商银行合作完成数万台柜员机终端磁盘加密，即便设备被盗数据仍安全；多家金融机构基于海光抗量子密码技术，提前布局量子安全防护。

政务与医疗：与绿盟科技打造 “数据保险箱”，实现疾控中心病理数据、监管数据 “可用不可见”，支撑多方安全计算与科研分析；落地国内首个政务大模型密态计算案例，实现多卡并行推理与数据安全保护。

云计算与电商：天翼云率先落地 CSV 3.0，打造国产化机密计算云主机，提升租户数据安全等级；与某头部互联网企业合作，实现中小商户营销数据安全流通，兼顾数据价值与隐私保护。

应志伟表示，软件安全是必要补充，但芯片内生安全是 AI 安全的终极方案。软件安全如同给房屋加装防盗窗，仍存在漏洞；芯片级安全如同将数据放入地下防爆保险库，房东（云厂商）亦无钥匙，真正实现自主可控。

DCU 软件栈年度升级：万卡集群支撑，领跑万亿大模型训练

在算力层面，海光 DCU 已成为国产 AI 算力的核心支撑，本次沟通会发布DCU 软件栈年度版本，全面对标国际主流生态，实现从硬件、基础软件、AI 框架到应用平台的全栈升级，支撑万亿参数大模型训练与推理，性能达到国内一流、国际前列水平。

海光 DCU 软件栈采用DTK→DS→DAP三层架构：

DTK 26.04（基础软件栈）：全面对标 CUDA 12.6，完善驱动、编译器、运行时，实现统一内存、通信库优化，API 兼容度大幅提升，降低开发者迁移成本；

DS 4.8（AI 基础软件栈）：全面支持千亿、万亿参数大模型，兼容 PyTorch、TensorFlow 等主流框架，支持 Llama 3、Qwen、Mixtral 2.5、GPT-23.5 等新一代模型，优化大批次、长上下文推理性能，实现 PP 分离、大 EP 集群部署；

DAP 2.254（AI 应用平台）：升级模型管理、知识库、工作流能力，支持智能体（如小龙虾）接入，释放 DCU 算力，提供模型仓库、文档管理、开发者社区等一站式服务。

本次升级核心突破：

万卡集群稳定支撑：完成10 万亿参数大模型训练验证，强扩展效率达 99.63%，训练 40 天 Loss 曲线平滑度优于国际主流 GPU，精度差异仅千分位，支撑多模态、世界模型训练；

全场景性能优化：通过算子融合、编译优化、通信拓扑优化，生成式 AI、视觉模型性能提升近一倍，长上下文推理效率大幅提升；

容错系统成熟：构建万卡级故障检测、隔离、异步加载与自动恢复体系，接入飞书机器人实时告警，保障 40 天以上长时训练稳定运行；

生态全面开放：开源核心组件，融入社区生态，降低国产算力应用门槛，支撑互联网、科研、政企用户快速迁移。

胡辰透露，国内多个头部大模型厂商正基于数万张海光DCU组成的算力集群开展训练，在训推效率、集群稳定性、成本控制上具备显著优势。

主题：安全|硬件|密码技术|海光信息|可信计算