加入收藏 設(shè)為首頁(yè) 聯(lián)系我們 歡迎光臨本網(wǎng)站!
郵箱:support@zcecs.com
地址:北京市西城區(qū)南濱河路27號(hào)貴都國(guó)際中心A座1111室
在智算中心內(nèi)部,一排排高密度部署的AI服務(wù)器不間斷地進(jìn)行著計(jì)算,散發(fā)出遠(yuǎn)超過(guò)傳統(tǒng)數(shù)據(jù)中心的熱量。當(dāng)冷板內(nèi)的液體將芯片熱量帶出機(jī)柜后,這些載熱液體匯聚到一組亮著指示燈的金屬柜體——冷卻液分配單元,它安靜卻至關(guān)重要地維系著整個(gè)液冷系統(tǒng)的有序運(yùn)行。
一、CDU:連接服務(wù)器與基礎(chǔ)設(shè)施的核心樞紐
CDU是Coolant Distribution Unit的縮寫(xiě),中文譯為冷卻液分配單元。在智算中心的液冷系統(tǒng)中,它扮演著承上啟下的“交通樞紐”和“管理中樞”角色。
從功能上看,CDU位于一次側(cè)(機(jī)房級(jí)冷源)和二次側(cè)(服務(wù)器內(nèi)部冷卻循環(huán))的交界處。它的核心任務(wù)包括:
1. 流量與壓力分配:將一次側(cè)提供的冷卻介質(zhì),按需分配至各個(gè)機(jī)柜或服務(wù)器集群,確保每個(gè)冷卻支路獲得穩(wěn)定、均衡的流量和壓力。
2. 系統(tǒng)隔離與保護(hù):通常通過(guò)板式換熱器,將一次側(cè)回路與二次側(cè)回路物理隔離開(kāi)。這種設(shè)計(jì)允許兩個(gè)回路使用不同的工質(zhì),例如一次側(cè)使用價(jià)格低廉的軟化水或乙二醇水溶液,而二次側(cè)則使用絕緣性更好的去離子水或?qū)S秒娊橘|(zhì)液體,既保障了接觸服務(wù)器部件的安全,也降低了運(yùn)行成本。
3. 監(jiān)控與調(diào)節(jié):持續(xù)監(jiān)測(cè)冷卻液的溫度、壓力、流量和電導(dǎo)率等關(guān)鍵參數(shù),并可通過(guò)調(diào)節(jié)泵頻、閥門(mén)開(kāi)度或與一次側(cè)冷源通信,實(shí)現(xiàn)對(duì)冷卻效果的動(dòng)態(tài)控制。
可以這樣理解:如果說(shuō)服務(wù)器冷板是貼近熱源的“毛細(xì)血管”,那么CDU就是控制整個(gè)肢體血液(冷卻液)供回與健康的“心臟瓣膜與中書(shū)神經(jīng)系統(tǒng)”。
二、系統(tǒng)架構(gòu):多模塊協(xié)同的工程體
一臺(tái)功能完備的CDU是一個(gè)高度集成的模塊化系統(tǒng),其內(nèi)部架構(gòu)通常包含以下幾個(gè)關(guān)鍵部分:
動(dòng)力模塊(泵組):這是系統(tǒng)循環(huán)的“心臟”。通常采用變頻冗余泵設(shè)計(jì)(如“一用一備”或“兩用一備”),確保在任何單一泵故障時(shí),系統(tǒng)仍能維持冷卻液不間斷地輸送至服務(wù)器。變頻控制則可根據(jù)實(shí)際熱負(fù)荷調(diào)節(jié)流量,起到節(jié)能作用。
換熱模塊(板式換熱器):這是實(shí)現(xiàn)冷量交換、隔離兩側(cè)回路的核心“器官”。一次側(cè)冷源(來(lái)自冷水機(jī)組或自然冷卻系統(tǒng))的低溫介質(zhì),與從服務(wù)器回來(lái)的二次側(cè)高溫介質(zhì)在此進(jìn)行GAO效換熱,將熱量帶走。其換熱效率直接影響整個(gè)系統(tǒng)的冷卻能力和能耗。
過(guò)濾與補(bǔ)水模塊:相當(dāng)于系統(tǒng)的“腎臟與水平衡系統(tǒng)”。精細(xì)過(guò)濾器用于持續(xù)清除二次側(cè)回路中因腐蝕、雜質(zhì)等產(chǎn)生的顆粒物,保護(hù)服務(wù)器冷板內(nèi)狹窄的微通道不被堵塞。自動(dòng)補(bǔ)水單元?jiǎng)t用于補(bǔ)充因微滲漏等損失的冷卻液,維持系統(tǒng)壓力穩(wěn)定。
監(jiān)測(cè)與控制模塊:這是CDU的“大腦”。它集成了溫度、壓力、流量、液位、電導(dǎo)率等多種傳感器,并通過(guò)可編程邏輯控制器或?qū)S每刂破,?shí)現(xiàn)數(shù)據(jù)采集、邏輯判斷與自動(dòng)控制。所有信息通常上傳至數(shù)據(jù)中心基礎(chǔ)設(shè)施管理系統(tǒng),實(shí)現(xiàn)集中監(jiān)控。
管路與閥門(mén)模塊:構(gòu)成系統(tǒng)的“血管網(wǎng)絡(luò)”。包括主管路、各支路分配管、手動(dòng)/電動(dòng)調(diào)節(jié)閥、關(guān)斷閥、排氣閥等,用于冷卻液的輸送、分配、流量調(diào)節(jié)及系統(tǒng)維護(hù)時(shí)的隔離。
三、主要類(lèi)型:主動(dòng)式與被動(dòng)式的路徑選擇
根據(jù)CDU內(nèi)部二次側(cè)循環(huán)的動(dòng)力來(lái)源和控制方式,可將其分為兩大類(lèi)型,其選擇直接影響系統(tǒng)的架構(gòu)和特性。
1. 主動(dòng)式CDU
這是目前智算中心的主流選擇。其蕞大特點(diǎn)是CDU內(nèi)部集成有變頻泵組,主動(dòng)為二次側(cè)冷卻回路提供循環(huán)動(dòng)力。
工作模式:CDU內(nèi)的泵從二次側(cè)回液管吸入被服務(wù)器加熱的冷卻液,加壓后泵送至換熱器降溫,再將冷卻后的液體輸送至服務(wù)器冷板。
優(yōu)點(diǎn):控制能力強(qiáng)?梢詼(zhǔn)確控制二次側(cè)的總供液壓力、流量和溫度,不受一次側(cè)壓力波動(dòng)的影響。通過(guò)調(diào)節(jié)泵頻,能很好地適應(yīng)服務(wù)器負(fù)載變化,實(shí)現(xiàn)動(dòng)態(tài)節(jié)能。易于擴(kuò)展,可通過(guò)增加泵或CDU來(lái)應(yīng)對(duì)未來(lái)機(jī)柜的增加。
考量點(diǎn):系統(tǒng)相對(duì)復(fù)雜,初投資和泵本身的能耗是成本的一部分。對(duì)泵的可靠性要求高,需做好冗余設(shè)計(jì)。
2. 被動(dòng)式CDU
也稱(chēng)為“泵驅(qū)式”或“一次側(cè)泵驅(qū)”。在這種架構(gòu)下,CDU內(nèi)部不設(shè)二次側(cè)循環(huán)泵,二次側(cè)的循環(huán)動(dòng)力完全依賴(lài)于一次側(cè)循環(huán)泵提供的壓力差。
工作模式:一次側(cè)高壓流體通過(guò)CDU內(nèi)的換熱器,將冷量傳遞給二次側(cè)流體,并依靠此壓力差推動(dòng)二次側(cè)流體流向服務(wù)器。CDU在此主要起分配和換熱作用。
優(yōu)點(diǎn):系統(tǒng)結(jié)構(gòu)簡(jiǎn)化,減少了CDU內(nèi)的運(yùn)動(dòng)部件(泵),理論上潛在故障點(diǎn)減少,可靠性可能提升。同時(shí),也避免了二次側(cè)泵的能耗。
考量點(diǎn):系統(tǒng)控制靈活性降低,二次側(cè)流量和壓力受一次側(cè)系統(tǒng)影響較大。對(duì)一次側(cè)泵的揚(yáng)程和整個(gè)管網(wǎng)水力平衡設(shè)計(jì)提出更高要求。在應(yīng)對(duì)局部負(fù)載劇烈變化或進(jìn)行系統(tǒng)擴(kuò)展時(shí),調(diào)整可能不如主動(dòng)式靈活。
四、選型與應(yīng)用要點(diǎn):匹配場(chǎng)景的系統(tǒng)性思考
為智算中心選擇CDU,需要超越單一設(shè)備參數(shù),進(jìn)行系統(tǒng)性匹配分析。
與制冷架構(gòu)和工質(zhì)的匹配:這是首要前提。需要明確是一次側(cè)采用水冷、冷凍水還是自然冷卻方案,從而確定CDU換熱側(cè)的接口與參數(shù)。同時(shí),須根據(jù)服務(wù)器冷卻方式(冷板式/浸沒(méi)式)及供應(yīng)商要求,明確二次側(cè)冷卻工質(zhì)的類(lèi)型(去離子水、特種冷卻液等),這決定了CDU內(nèi)部材料兼容性及監(jiān)測(cè)要點(diǎn)(如對(duì)水電導(dǎo)率的監(jiān)控)。
容量與冗余配置:CDU的制冷容量(通常以kW計(jì))和流量須覆蓋其下聯(lián)所有服務(wù)器在蕞壞情況下的總熱負(fù)荷,并留有余量。其泵組、電源、控制器等關(guān)鍵部件須具備冗余能力,滿(mǎn)足智算中心對(duì)高可用性的要求。常見(jiàn)的部署模式是“N+1”CDU集群,為整個(gè)液冷機(jī)柜區(qū)提供冗余。
控制邏輯與智能化水平:好的CDU應(yīng)能實(shí)現(xiàn)與服務(wù)器負(fù)載的聯(lián)動(dòng)。例如,接收服務(wù)器入口水溫信號(hào)或與數(shù)據(jù)中心基礎(chǔ)設(shè)施管理系統(tǒng)協(xié)同,動(dòng)態(tài)調(diào)節(jié)二次側(cè)供液溫度或流量,在保障散熱安全的前提下,盡可能提高一次側(cè)自然冷卻的利用時(shí)間,優(yōu)化整體能效。
可維護(hù)性與空間布局:智算中心業(yè)務(wù)連續(xù)性強(qiáng),CDU需支持在線(xiàn)維護(hù)(如過(guò)濾器的更換、泵的切換)。其尺寸、接口位置、重量等物理特性,須與機(jī)房承重、通道、管道預(yù)留位置等現(xiàn)場(chǎng)條件相匹配。模塊化設(shè)計(jì)的CDU在部署和后期擴(kuò)容上通常更具優(yōu)勢(shì)。
全生命周期成本:選型時(shí)需綜合評(píng)估初投資、安裝成本、運(yùn)行能耗、維護(hù)成本及可能的升級(jí)成本。一個(gè)能效更高、可靠性好、維護(hù)簡(jiǎn)便的CDU,雖然初期投入可能較高,但在長(zhǎng)期的運(yùn)營(yíng)中可能更具價(jià)值。
隨著智算中心朝著更高密度、更大規(guī)模的方向發(fā)展,CDU作為液冷系統(tǒng)的核心調(diào)度節(jié)點(diǎn),其重要性愈發(fā)凸顯。未來(lái)的CDU將向著更高集成度、更精細(xì)化的智能控制、更開(kāi)放的標(biāo)準(zhǔn)化接口演進(jìn),并與AI能效管理平臺(tái)結(jié)合,從“被動(dòng)響應(yīng)”走向“主動(dòng)優(yōu)化”,持續(xù)為澎湃的AI算力提供冷靜、可靠的基礎(chǔ)環(huán)境保障。