浸没液冷—高功率场景散热需求终结者
在当代科技界,特别是在人工智能和新能源等技术领域,技术进步正以空前的速度迅猛发展。这些领域技术发展的显著特征是设备功率的不断提升和体积的逐渐缩小,从而使得散热挑战日益严峻。随之而来的是散热技术的不断创新,从传统的风冷到冷板液冷,再到近年来复兴的浸没式液冷技术。
展望未来,浸没式液冷技术有望成为散热领域的主流。以下因素预示着这一趋势:
一、业务驱动
人工智能技术的核心在于大规模数据处理和复杂算法运算,导致IT设备运算量激增,功率显著提高。例如,NVIDIA最新发布的B200单颗GPU芯片功率已达到1000W。这种高功率密度带来了散热难题,因为过高的温度会严重影响IT设备的性能和稳定性,甚至可能导致硬件损坏。因此,迫切需要更高效的散热解决方案。新能源汽车和汽车充电设备等领域也面临着类似的挑战。
二、政策驱动
在国家的科技发展战略规划中,对人工智能的发展给予了高度重视和积极推动。近年来,政府相继颁布了一系列政策,旨在促进数据中心和智算中心的建设,以增强我国在人工智能领域的竞争力和创新能力。
伴随数据中心规模的持续扩张及能耗的显著上升,国家对数据中心和智算中心机房的建设标准提出了更为严格的要求。特别是,电能利用效率(PUE值——即数据中心总体能耗与IT设备能耗之比,该值越接近1表明能源利用效率越高)已成为评估数据中心能效的关键性能指标。根据当前的国家政策,新建数据中心的PUE值普遍需控制在1.3以下,某些地区更是提出了将PUE值降至1.2甚至1.1的更高要求。这一政策导向激励了数据中心行业积极探索更为节能高效的散热解决方案,从而为浸没液冷技术的广泛采纳和应用创造了政策机遇。
三、需求驱动
(一)风冷的局限
风冷作为传统的散热方式,在面对日益增长的IT设备散热需求时其局限性越来越明显。当单CPU功率超过300W时,风冷系统无法有效地将热量散发出去,导致CPU温度过高,进而出现降频现象,严重影响设备的性能。在整机柜功率达到15kW以上时,风冷系统同样也会力不从心了。
(二)冷板液冷的问题
在高端功率应用场景中,风冷技术的逐步淘汰为液冷技术的高速发展提供了空间。得益于其相对较低的前期成本和较为成熟的产业链支持,冷板液冷技术在液冷技术路线的竞争中取得了先机,进入快速发展阶段。然而,其快速发展亦暴露出若干问题:
一是节能效率提升需求。尽管冷板液冷技术在某些方面优于风冷技术,但其节能效率仍有提升空间。该技术的最低PUE值仅能降至1.2,与国家政策标准和行业发展趋势相比,存在显著差距。以中等规模的数据中心为例,采用PUE值为1.2的冷板液冷系统,相较于采用PUE值为1.1的高效散热技术(如浸没液冷)的数据中心,每年在电力成本上的额外支出可能高达数十万元人民币。
二是成本考量。冷板液冷系统的总体成本相对较高,一方面,冷板的设计、制造和安装需要专业的技术支持和设备,导致初期投资成本增加。据行业分析数据,冷板液冷系统的初始投资成本较传统风冷系统高出30%-50%。另一方面,该系统的维护复杂,需要定期检查冷却液的泄漏情况和冷板的散热性能,成本将会进一步增加。
三是安全性评估。第一、业务连续性安全,冷板液冷系统若发生冷却液泄漏或冷板故障,可能导致服务器局部过热或短路,今年已有多起因冷却液泄漏导致的数据中心故障事件发生。第二、供应链安全,冷板液冷技术属于定制化液冷解决方案,对服务器的匹配度要求严格。一旦系统安装完毕,服务器与冷板液冷系统之间形成紧密的依赖关系。若需更换供应商,不仅需重新进行兼容性测试,还可能面临技术改造的挑战,这对数据中心的供应链稳定性构成潜在威胁。第三、 消防安全,随着数据中心、锂电池、充电设备等功率密度的提升,安全风险相应增加。在消防安全风险方面,冷板液冷系统仍未能提供有效的安全保障。
四、技术驱动
经过长期的积累和实践,近两年浸没式液冷技术取得了突破性进展,不管是技术还是成本上,都达到了大规模实用的条件。其中,杭州京工电科技有限公司是典型的代表,其自研的浸没液冷具有非常优良的物理和化学属性,可以兼容各类IT设备、锂电池以及新能源充电设备等。更重要的是,他们的冷却液在价格方面也已扫清了大规模商业推广的障碍。
浸没液冷方案是将服务器、锂电池等硬件完全浸没在特制的冷却液中,冷却液通过循环的方式将热量带走,然后通过热交换模块将热量传递给外部环境。这种散热方式具有诸多优势: