来源:IDC圈
纵观人类历史,每次技术革新都伴随着生产要素和生产力的跨越式发展。如今,随着全球算力日益增长,数据中心单位空间中产生的热量正在不断增加、功率密度持续增大。赛迪顾问预测,快速增长的数据中心算力将推动高功率单机柜快速普及,预计到2025年全球数据中心平均功率达到25kW。“双碳”背景下, 数据中心“降耗增效”的绿色发展需求迫切,液冷作为一种具备更强散热能力的制冷技术,正在受到市场持续关注。
算力竞速开启 冷板式液冷应用广泛
近年来,随着英特尔、华为、浪潮、联想、阿里等企业在液冷领域不断探索,正加速推动液冷数据中心基础设施商业化的进程。科智咨询预计,到2025年,中国液冷数据中心应用市场规模将从2019年的114.7亿元达到849.5亿元。
2019-2025年中国液冷数据中心应用市场规模(单位:亿元)
数据来源:科智咨询
注:液冷数据中心应用市场规模包含配套机电设备,液冷解决方案以及液冷服务器等。
目前,常见的数据中心液冷方式主要包括冷板式、喷淋式和浸没式三种。其中,冷板式液冷主要应用于一般高密度的数据中心领域,该技术发展较早,是目前成熟度最高、应用最广泛的液冷散热方案,对促进当前数据中心的绿色发展、降低PUE有不可或缺的重要作用。
但在应用阶段,对于用户来说,始终存在两大疑虑:一个是成本相较风冷仍然较高,一个是存在漏液风险问题。英特尔携手生态伙伴紧密合作、联合创新,于2022年发布了《英特尔高效能数据中心白皮书》《绿色数据中心创新实践——冷板液冷系统设计参考》(下称《冷板液冷系统设计参考》)两份白皮书,将冷板式液冷技术发挥到极致、同时解决这两大棘手难题。
英特尔高效能数据中心白皮书:
绿色数据中心创新实践 —— 冷板液冷系统设计参考
用科技全方位守护 一站式消除用户疑虑
近年来,围绕降低PUE这一关键指标,整个ICT产业都在积极采用创新技术和模式。英特尔也不例外,在芯片、服务器和数据中心产品等领域,不断进行创新技术迭代。依托数十年在数据中心领域的创新和领导地位,英特尔提供了可持续性的数据中心处理器技术,全新的可拓展处理器可以通过内置加速器更高效地实现领先性能,从而实现平台级的功率节省。同时,基于英特尔及其生态伙伴多年的积累与实践,推出了“四横三纵”矩阵型绿色数据中心技术框架(“绿菜单”), 提供了一系列整体解决方案和参考设计,将散热技术置于关键地位,旨在有效实现数据中心的“降耗增效”,将PUE维持在1.25以内。
科技赋能,系统性解决冷板式液冷两大棘手难题
1、全方位、立体化解决方案,应对高成本
1)简易设计,满足冷却需求还能降低成本
冷板式液冷是指采用液体作为传热工质在冷板内部流道流动,通过热传递对热源实现冷却的非接触液体冷却技术。在常规设计中,为了提高冷却性能,需要尽可能多地增加冷板内部微通道与液体的接触面积,因此在冷板设计结构上,往往也会比较复杂。但问题也随之而来,设计越复杂,成本就越高。面对这一难题,英特尔联合众多生态伙伴发布的《冷板液冷系统设计参考》给出了一份绿色高效的解决方案,在“液冷部件的设计考量”方面,冷板的设计主要通过带有简易内部流体通道的模块结构来提高冷却性能、降低成本。
2)模块化生产,提高生产效率
数据中心“模块化”建设方式,可以为数据中心建设层面实现碳中和提供强有力支持。与传统数据中心模式相比,通过模块化设计的冷板式液冷解决方案,搭配专业冷媒,覆盖CPU、内存等主要部件,能够显著降低成本。英特尔通过积极行动和创新技术,与生态伙伴开放合作,驱动全栈联动节能,系统化减少碳足迹。
在合作伙伴比赫的《数据中心液冷整体解决方案》中,应对数据中心广泛的液冷需求,采用模块化+标准化生产一站式解决方案,实现数据中心冷板式液冷项目快速集成落地。作为唯一通过INTEL认证的冷板液冷方案集成商(截止2022年底),比赫在项目落地过程中,实行各个模块独立设计、厂内预制、独立包装、现场去工程化安装。整个模块化操作方案分为外冷设备及管道模块、一次侧CDU及管网模块、二次侧CDU及管网模块、集群环网模块四个模块组成部分,四个模块全部独立包装和安装。
3)标准化提升质量、规模化降低成本、差异化合作共赢
《冷板液冷系统设计参考》白皮书提出,标准化是推进液冷数据中心发展的关键。通过标准化可以有效地降低液冷应用的技术门槛和成本门槛,从而实现产业化、规模化。
目前,英特尔正在与液冷零部件厂商、OXM厂商以及大批终端用户一起来推动冷板式液冷各个部件的标准化工作。通过零部件设计质量要求和验证方法的制定,将整个行业的质量标准从及格提升到优质。然后从优质提升到优秀这个阶段,英特尔倡导生态伙伴创新共赢,通过差异化的方式吸引更多上下游客户进入液冷行业,持续降低整个行业平均成本,最终让用户享受到更加实惠的价格。以铲齿产品为例,在实现规模化以前,整个生产流程会经历很多步骤消耗大量工时,非常繁琐。规模化以后,直接用压铸冲压机就可以节省掉很多工时和流程,降低工艺成本,从而间接降低用户成本。
2、稳健泄漏预防策略,科技化解漏液风险问题
对冷板式液冷技术来说,成本与漏液这两个问题本身也存在内部逻辑联系:真正解决漏液风险才是实现降低成本的根本所在。简单说,泄漏风险越低,用户就越放心,用得人就越多,规模效应就越大,成本就越低。
1)通过全新的技术设计和制造工艺降低泄漏风险
冷板式液冷系统主要包括水冷板(water cold plate)、管道(tube)、 快换接头(quick disconnect coupling)、分液器(Manifold)、冷却液分配单元(CDU)与室外冷却设备等组件,任何一个组件和安装环节处理不好,都有出现漏液风险的可能性。
对于冷板式液冷来说,发生泄漏可能性最多的地方就是各个接口位置,比赫采用改进的接口设计工艺,最大程度降低了运行过程中的接口泄漏概率。为了降低人工操作失误带来泄漏风险,产品采用防呆设计,并通过扣压机实现自动化安装。同时还制造了包括依据Intel UQD规范设计的快换接头,实现单次插拔泄漏量小于1/6 液滴(连续插拔6次,允许一滴滴落)或小于0.5毫升,这种快换接头支持数据中心液冷系统工作过程中带液插拔,大幅提高了维护效率。
2)全方位漏液感知与干预系统守护安全
为了最大限度降低漏液带来的风险,英特尔和生态伙伴比赫采用了一套对用户来说体验可谓极致的漏液感知与干预系统,可以第一时间确定泄漏的发生位置,并通过服务器自我保护设计实现自动保护和报警。
通过漏液传感器LEAK SENSORS,包括漏液检测绳LEAK SENSORS ROPE在内的检测设备,直接检测漏液,在第一时间发送警报,并将漏液信息,包括时间、位置等提交给系统管理员。
考虑到工作人员响应时间周期内,依然存在漏液造成损失的风险问题,《冷板液冷系统设计参考》白皮书还提出了更进一步的自动干预方式,包括自动电气和流体干预,也就是当检测到泄漏通知时,IT设备自动断电,同时冷却液自动停止工作。这可以更大限度地避免大量硬件设施暴露接触到泄漏液体中,从而方便维修,进一步降低损失。
以人为本,用户至上,极致体验
1、低毒防腐的冷却工质
本着以人为本的原则,践行用户至上,充分考虑到冷却工质对人、自然环境和服务器带来的污染和腐蚀问题,《冷板液冷系统设计参考》主要推荐了纯水液(水基冷却工质)以及毒性较低的丙二醇(防冻液)等作为冷却工质。为了弥补冷却工质品质和系统腐蚀可能带来的风险,防止因颗粒物、碎屑和细菌污染而引起的操作可靠性问题,同时考虑到维护的便利性,还采取了计划周期性的维护和计划外的突发维护干预,使用冗余设计来保障液冷系统实现在线维护。
2、防高压喷溅设计
在冷板式液冷系统中,冷却工质在流动过程中如果压力过大,也会增加漏液风险,而且会对工作人员和设备造成潜在风险。根据《冷板液冷系统设计参考》,液冷系统及其部件需要符合当地安全规范,依据国际电工委员会(IEC)针对IT设备的安全标准(IEC60950-1和IEC62368-1)进行设计。为了防止出现高压喷溅风险,还要求服务器的进液口位置配置专门的防水锤阀门,全方位保障用户安全。
面向未来,聚力绿色可持续发展
“书同文,车同轨,行同伦”。作为国际领先的科技公司,节能、减碳、绿色、可持续化一直是英特尔公司的一个重要战略目标。面向未来,英特尔和他的生态伙伴们正携手深化合作创新,不断深入探讨液冷技术,推进IT设备、算力设施,尤其是作为数字经济底座的数据中心进一步降耗增效,释放整个产业生态和科技生态之力,助力中国为全球可持续发展做出更大贡献。
春夏秋冬,周而复始。在数据中心内部,持续发热的电子元器件需要24小时不间断冷却。而每一滴冷却液的静静流淌,都离不开科技与人性的倍加呵护