AI时代CPU还有用吗？

速读：6月15日，中科曙光新一代通用高性能计算平台发布。中科曙光此次发布的平台原生兼容x86生态，是国内首个原生支持AVX512指令集的国产通用计算平台。

AI时代 CPU还有用吗？ _ 东方财富网

AI时代 CPU还有用吗？

2026年06月15日 22:14

作者：

年悦张雪

来源：

上海证券报·中国证券网

K图 603019_0

　　上证报中国证券网讯（年悦记者张雪）在人工智能算力热潮持续升温的背景下，科学与工程计算这一“高精度算力底座”也迎来了关键升级。当算力产业的目光聚焦于AI训练，科学与工程计算赛道是否已经被遗忘？当大模型参数规模膨胀，需要高精度、零误差的科学计算任务如何支撑？

　　6月15日，中科曙光新一代通用高性能计算平台发布。据介绍，该平台通过“算—存—网”全栈协同优化，整体规格首次达到国际厂商旗舰级水平；同时其以国产百核级512线程通用CPU为核心，主要面向科学与工程计算等无法用GPU重构的场景。

　　从单点突破到系统创新

　　实测数据显示，中科曙光新一代通用高性能计算平台搭载首个国产10T级通用CPU（128核、512线程、单CPU FP64双精度算力10T），HPL（高性能线性系统）双精度浮点性能较当代平台提升近2倍，访存性能提升近1倍，应用性能平均提升近1倍，均与国际主流高端平台处于同等水平。

　　应用方面，其已在气象、工业仿真、生命科学、材料科学等领域落地。以气象预报为例，平台可将分辨率从3公里提升到1公里，1小时内完成全国范围36小时时效的预报，工业仿真实测性能达到上一代的1.86倍。

　　中科曙光高级副总裁李斌表示，未来全球算力产业的发展，不只是单点硬件突破，而是从芯片、系统、平台到应用的全链路协同创新。“此次发布平台性能突破的背后不是单点创新，而是从底层芯片到上层软件的全栈创新，具备‘算—存—传’三级协同的系统级能力。”中科曙光高端计算总工程师李建军介绍。

　　具体做法上，计算层采用了两项技术，BurstBuffer技术把数据先缓存到CPU附近的高速存储区，提高读写速度；SocketDirect技术让每颗CPU直接连网卡，不用绕道另一颗CPU，提升了通信效率。网络层基于自研的scaleFabric高速网络，带宽400G，适用于高性能计算集群。存储层采用节点间划（硬件）域并行方案，打破了传统存储的带宽瓶颈，实现更强的数据吞吐能力。

　　记者了解到，工业仿真、材料计算、生物计算等领域的应用软件往往经过长期深度优化，迁移与重构成本极高；相比单纯硬件性能提升，业内更关注平台的软件生态兼容能力。中科曙光此次发布的平台原生兼容x86生态，是国内首个原生支持AVX512指令集的国产通用计算平台。“生态兼容的核心价值是，客户遵循‘换手机一样’的正常设备更新周期，不需要做任何调整。”李建军解释道。

　　 AI时代 CPU仍是基石

　　在人工智能浪潮中，计算平台为何还以CPU为核心？“关于CPU在AI时代的定位，我们和国外CPU厂商看法相同——重要性越来越高。”李建军给出了理由：CPU支持从浮点运算到逻辑判断在内的全类型计算，是通用型算力基座；CPU具有高精度浮点运算单元，可确保科学与工程计算的精度；主流科学与工程计算软件与通用CPU深度优化，没有迁移成本。

　　中科曙光解决方案与创新业务总经理张磊介绍，当前推理场景的兴起正在增加对CPU算力的需求，CPU的通用性决定了需求的多样性。东南大学物理学院副教授李强列举了地球科学、工业设计制造、能源勘探、物理化学材料、生命科学、集成电路六大典型应用场景。“这些场景无论并行规模、商业软件依赖还是逻辑判断运算，都需CPU处理。”他表示。

　　东南大学物理学院副教授李强以科研经历为例：材料模拟要求双精度起步，GPU在这方面反而是短板。而且原子之间相互作用很强，无法独立计算，对内存交互要求极高——从几十个原子到上千个原子，内存需求翻了十倍不止，这些恰恰是CPU擅长的。

　　关于CPU与GPU的关系，张磊在接受采访时表示，GPU负责暴力求解、算得快，核心逻辑部分还是需要CPU，未来二者将并驾齐驱、相互协同。而AI for Science的核心逻辑是数据，要求算得准、精度要高——CPU先天具备这样的特质。此外，记者了解到，由于GPU的高能耗，同一项任务用户普遍优先选择CPU。

　　从CPU本身来看，张磊认为，后期将走向深度融合：算得快不一定数据能吞吐得快，这是系统化的工程能力。他透露，中科曙光正在尝试新的互联协议，加速数据在进程间或物理核心间的通信能力，让CPU算力得到极致释放。

（文章来源：上海证券报·中国证券网）

主题：基金|AI时代CPU|新股|美股