AI时代CPU还有用吗?
AI时代 CPU还有用吗?
2026年06月15日 22:14
作者:
年悦 张雪
来源:
上海证券报·中国证券网

上证报中国证券网讯(年悦记者张雪)在 人工智能 算力热潮持续升温的背景下,科学与工程计算这一“高精度算力底座”也迎来了关键升级。当算力产业的目光聚焦于AI训练,科学与工程计算赛道是否已经被遗忘?当大模型参数规模膨胀,需要高精度、零误差的科学计算任务如何支撑?
6月15日, 中科曙光 新一代通用高性能计算平台发布。据介绍,该平台通过“算—存—网”全栈协同优化,整体规格首次达到国际厂商旗舰级水平;同时其以国产百核级512线程通用CPU为核心,主要面向科学与工程计算等无法用GPU重构的场景。
从单点突破到系统创新
实测数据显示, 中科曙光 新一代通用高性能计算平台搭载首个国产10T级通用CPU(128核、512线程、单CPU FP64双精度算力10T),HPL(高性能线性系统)双精度浮点性能较当代平台提升近2倍,访存性能提升近1倍,应用性能平均提升近1倍,均与国际主流高端平台处于同等水平。
应用方面,其已在气象、工业仿真、生命科学、材料科学等领域落地。以气象预报为例,平台可将分辨率从3公里提升到1公里,1小时内完成全国范围36小时时效的预报,工业仿真实测性能达到上一代的1.86倍。
中科曙光 高级副总裁李斌表示,未来全球算力产业的发展,不只是单点硬件突破,而是从芯片、系统、平台到应用的全链路协同创新。“此次发布平台性能突破的背后不是单点创新,而是从底层芯片到上层软件的全栈创新,具备‘算—存—传’三级协同的系统级能力。”中科曙光高端计算总工程师李建军介绍。
具体做法上,计算层采用了两项技术,BurstBuffer技术把数据先缓存到CPU附近的高速存储区,提高读写速度;SocketDirect技术让每颗CPU直接连网卡,不用绕道另一颗CPU,提升了 通信 效率。网络层基于自研的scaleFabric高速网络,带宽400G,适用于高性能计算集群。存储层采用节点间划(硬件)域并行方案,打破了传统存储的带宽瓶颈,实现更强的数据吞吐能力。
记者了解到,工业仿真、材料计算、生物计算等领域的应用软件往往经过长期深度优化,迁移与重构成本极高;相比单纯硬件性能提升,业内更关注平台的软件生态兼容能力。中科曙光此次发布的平台原生兼容x86生态,是国内首个原生支持AVX512指令集的国产通用计算平台。“生态兼容的核心价值是,客户遵循‘换手机一样’的正常设备更新周期,不需要做任何调整。”李建军解释道。
AI时代 CPU仍是基石
在 人工智能 浪潮中,计算平台为何还以CPU为核心?“关于CPU在AI时代的定位,我们和国外CPU厂商看法相同——重要性越来越高。”李建军给出了理由:CPU支持从浮点运算到逻辑判断在内的全类型计算,是通用型算力基座;CPU具有高精度浮点运算单元,可确保科学与工程计算的精度;主流科学与工程计算软件与通用CPU深度优化,没有迁移成本。
中科曙光解决方案与创新业务总经理张磊介绍,当前推理场景的兴起正在增加对CPU算力的需求,CPU的通用性决定了需求的多样性。东南大学物理学院副教授李强列举了地球科学、工业设计制造、能源勘探、物理化学材料、生命科学、集成电路六大典型应用场景。“这些场景无论并行规模、商业软件依赖还是逻辑判断运算,都需CPU处理。”他表示。
东南大学物理学院副教授李强以科研经历为例:材料模拟要求双精度起步,GPU在这方面反而是短板。而且原子之间相互作用很强,无法独立计算,对内存交互要求极高——从几十个原子到上千个原子,内存需求翻了十倍不止,这些恰恰是CPU擅长的。
关于CPU与GPU的关系,张磊在接受采访时表示,GPU负责暴力求解、算得快,核心逻辑部分还是需要CPU,未来二者将并驾齐驱、相互协同。而AI for Science的核心逻辑是数据,要求算得准、精度要高——CPU先天具备这样的特质。此外,记者了解到,由于GPU的高能耗,同一项任务用户普遍优先选择CPU。
从CPU本身来看,张磊认为,后期将走向深度融合:算得快不一定数据能吞吐得快,这是系统化的工程能力。他透露,中科曙光正在尝试新的互联协议,加速数据在进程间或物理核心间的 通信 能力,让CPU算力得到极致释放。
(文章来源:上海证券报·中国证券网)