作者/星空下的夹心糖
编辑/菠菜的星空
排版/星空下的三明治
3月29日凌晨,腾讯旗下的微信和QQ产品曾出现大范围崩溃,事故原因是广州电信机房冷却系统发生故障。仓促之中,故障机房曾被迫使用冰块降温,但收效甚微。腾讯将这次事件定义为公司一级事故,多名相关人员受到处罚。
这起事故也提示我们:在人工智能、大数据及云计算等技术高速发展的今天,数据中心数量以及承担的计算量大幅增长,高热密度的环境给制冷设备带来重大挑战,极小的故障率都是不可接受的。
一、把数据中心泡在“水”里
大家可能都经历过手机、电脑过热导致性能下降的情况。数据中心看起来更庞大,但其实更脆弱。散热是数据中心的头等大事,数据中心散热消耗的电能甚至可能占到总电能的1/4以上。
随着 AI、 云计算、大数据以及区块链等技术的创新发展,作为信息基础设施的数据中心及通信设备承担的计算量越来越大,对计算效率的要求也越来越高。算力的持续增加推动通讯设备性能不断提升,芯片功耗和热流密度也在持续攀升,产品每演进一代,功率密度会攀升30–50%。目前,风冷技术(类比为吹空调)是数据中心较为成熟的冷却方案。
不过,风冷越来越不能满足数据中心的需求。
1.风冷的效率很差,且会产生冷热空气换热不均,会在服务器架之间形成局部热点;
2.为加强冷却效果,机房空调和整体服务器架的占地面积要足够大;
3.风冷设备的噪音很大,稳定性也不高,一旦发生故障后果严重。
面对风冷技术的种种问题,液冷技术逐渐走入人们视野。和风冷相比,液冷(类比为泡冷水澡)具有显著的优势,首先是散热效果好,由于冷却液和芯片直接接触,传热快速且均匀;其次,液冷能耗很低,如采用室外冷却塔,甚至可实现全年自然冷却,可节省大量能源;另外,液冷系统还具有噪音孝占地面积小等优点,液冷的整体投资成本也有竞争力。
资料来源:暖通研习会
目前液冷产品已经广泛应用于各个领域,包括电子器件的发热系统、电动车电池组件的冷却系统以及汽车部件、机械设备、光学仪器的润滑防护。液冷的方式主要有冷板式、浸没式和喷淋式三种,各种方式的比较如下表。
这其中,浸没式对数据中心来说是最佳冷却方案,降温效果最好,预计浸没式液冷数据中心的占比将从 2019 年的 18%左右提升至 2025 年的40%左右。
冷却液是液冷设备的关键。浸没式也需要更多的冷却液,从而带动冷却液行业市场的发展。根据《液冷白皮书》显示,浸没式液冷数据中心市场份额占比将从2019年18%上升到2025年40%,2025年预计达到757.1亿元。
二、冷却液为液冷技术关键材料
数据中心冷却液市场空间虽大,做起来却并不容易。冷却液虽然不像半导体产业链上光刻胶、抛光液、湿电子化学品等产品那样对性能和纯度要求严格,但依然具有很高的技术壁垒。一方面,其应用场景高端,发挥作用巨大,属于四两拨千斤的产品。另外,冷却液一旦出现问题,将对整个系统造成极其恶劣的影响,破坏内部所有电路元件,出现问题则危害极大。
由于在浸没式液冷技术中,冷却液与电子产品直接接触,对冷却液的绝缘性、传热性等性能有严格的要求。理想的浸没式冷却液需满足以下技术指标。首先,冷却液要有良好的热传递能力,毕竟这是冷却液的看家本领;其次,冷却液要有