2023年度液冷基礎設施市場份額達到61.3%,連續3年蟬聯行業榜首,根據《液冷數據中心白皮書》,曙光數創再次交出亮眼成績單。
智算快速發展環境下,其實不止曙光數創,整個行業的液冷正呈現高速發展態勢。曙光數創副總裁兼CTO張鵬博士在接受采訪時預測: “ 液冷整體滲透率目前并不高,不超過 10%,但未來3到5年這個比例將快速提高,有望達到30%甚至40% 。” 《中國液冷數據中 心市場深度研究報告》也顯示,目前中國液冷數據中心市場快速發展,預計到2027年, 液冷市場將以60%的復合增長率,突破千億規模。
液冷的兩種主要技術路線——冷板式與浸沒式的發展趨勢如何,目前挑戰是什么,如何 應對等成為行業熱議話題。
液冷是高效散熱必需
真正價值是激活芯片計算潛能
大模型等人工智能快速發展下,智算產業迅速拓展,據中國信通院統計,截至2023年底,我國 智算規模約69 EFLOPS,相較于2023年6月的50EFLOPS,半年時間規模增加38%,但在推動 數據中心產業的同時,也給數據中心散熱帶來巨大挑戰。
GPU芯片功率不斷提升,高密度成為發展趨勢。風冷有其制冷極限,無法滿足服務器及數據中心 的散熱要求,而同體積液體帶走的熱量是同體積空氣的3000倍以上,能夠高效降溫,保證芯片 的安全運行。因此, 液冷被公認為是算力基礎設施的標配與必然選擇。
在此基礎上,液冷應用的成本不斷降低 。張鵬表示, 經過測算,當數據中心機架部署密度超過 10kW后,冷板式液冷系統的初始投資已經低于風冷,并且隨著運行時間的增長, TCO (總體擁 有成本)優勢會更為明顯 。液冷還能夠促進節能減碳,其高效率制冷的能力可大幅度減少散熱的 電能消耗,讓數據中心實現低PUE,符合政策要求與綠色化發展趨勢。
尤為值得注意的是, 液冷能夠激活計算的潛能,這也是其真正價值所在 。張鵬指出, GPU頻率是 可變的,如果制冷能力不足,為了安全穩定的運行, GPU就需要降頻,而這就影響了計算能力。 換句話說, 散熱能力差束縛了芯片算力的輸出。液冷可高效地解決這-問題,確保芯片計算能力 的全火力輸出 。“ 以某國產CPU芯片為例,風冷條件下2.4GHz的CPU在相變浸沒液冷環境下主 頻可達到3.2GHz,處理速度提升超過30%! ” 張鵬說。
這些均推動了液冷應用的快速發展,行業客戶逐步增多,包括互聯網、運營商、金融等,同時, 相較于改造,目前液冷的使用主要以新增的數據中心為主 。張鵬表示,改造面臨很多現實問題, 如維保需要結合數據中心現有情況提供更完善的方案,可靠性需進行綜合考量;如服務器有著 — 定的使用年限,改造投入后,企業收益能否覆蓋成本、滿足商業需要也存在—定疑慮。
冷板式是當前主流
浸沒式未來將廣泛應用
面向大模型的智算需求,為釋放芯片算力,液冷已經成為大趨勢。從目前應用情況來看,冷板式 是液冷主流。張鵬指出, 目前冷板式在液冷市場約占大概80%到90%, 這是因為冷板式的成本 更低,產業鏈也更為成熟,同時,冷板式與風冷在運維上差異較小,使用習慣—致,市場接受程 度更高。
與之相對應的,浸沒式的運維邏輯不同,比如風冷中沒有換液等運維步驟,考慮到浸沒式的成本 與后續運維,張鵬直言,目前小型數據中心不推薦上浸沒式,大型數據中心可以承擔較多的成本 壓力,還可配置專門的液冷運維操作間,更適宜使用浸沒式。
不過這并不代表浸沒式 “ 止步于此 ” , 伴隨著芯片功率的提升,冷卻效率還要進-步提升,這將推 動浸沒式,準確地說是加快相變浸沒式的廣泛應用。
據了解,國內CPU芯片功率已經達到400W,而英偉達2024年3月最新推出的B200芯片相比 H100雖然算力能源效率提升了約25倍,但芯片功耗也將超過1000W。張鵬表示, 相變浸沒式的 冷卻效率要高于冷板式與單相浸沒式,更適合高功率的芯片散熱需求,或是終極液冷出路。
不僅如此,相較于冷板式,浸沒式還有多項優勢。如浸沒式是-站式解決方案,可靠性高,對環 境的依賴性小,能夠很好的防潮防塵。同時,在服務器更新的時候,強耦合的冷板式也會被替 換,浸沒式則只需要替換冷媒,這使得在成本方面浸沒式也會逐步顯示出優勢。
浸沒式應用推廣面臨多項挑戰
需要從技術、生產等方面優化
技術的大規模應用轉化需要成熟的技術與產業鏈的支撐,液冷同樣如此。
具體來看, 冷板式在技術上已經實現了多項突破,目前面臨的挑戰主要是產業鏈方面的,包括如 何推動產品的成熟,更好的降本增效,提升可靠性等,這意味著整個行業的發展,也是挑戰。 浸 沒式則處于技術創新突破的時期,其技術門檻極高,目前依舊有多項技術問題沒有解決,且并非 短時間內就可以解決。
這點從曙光數創的發展便能體現出來, 自2011年提出液冷技術路線并啟動相關技術研究,到 2017年浸沒式液冷才對外應用,曙光數創歷經6年才實現了浸沒技術的商用化,這其中有多項關 鍵技術的突破。
以浸沒冷媒為例,經過長期自主研發, 曙光浸沒相變液冷計算機所使用的冷媒——電子氟化液已 經迭代到第三代,實現了諸多創新,具有高絕緣、低沸點、大潛熱、穩定性高、低粘度、安全 性、以及環境友好(無臭氧破壞、溫室效應低)等特性,可支持浸沒相變液冷系統生命周期內可 靠穩定運行。
也正是依托技術上的長期研發突破, 曙光數創的相變浸沒液冷才能夠不斷應用推廣,成為目前國 內唯-實現全浸式液體相變冷卻大規模商業化部署的企業,在重慶和多個東部-二線城市均有相 變浸沒式數據中心的建設實踐。
面對未來更高功率的散熱要求,針對不同產業的差異化需求, 浸沒式技術還要進行更深入的發 展,需要企業從多方面來進行優化。
首先,需要大量的研發投入。以曙光數創為例,其以技術為導向,持續研發投入,根據財報來 看, 2023年研發投入共計6825.33萬元, 2024年第一季度研發費用總額超1440萬元,相較于 2023年第一季度同比增長超過4%。通過大量的研發投入,曙光數創有效優化了液冷散熱技術, 實現了高效可靠的全棧基礎設施解決方案全場景覆蓋。截至2023年末,曙光數創擁有已授權相 關專利135項,包含發明專利38項,軟著45項,其中與液冷相關的專利104項,軟著27項,在審 發明專利31項。
其次,需要為生產做好準備。如曙光數創在山東青島建設了目前我國規模最大的液冷數據中心全 鏈條產業創新基地,且已正式投產。該基地囊括研發、生產和保障三大功能區,擁有七大研發創 新實驗室和四條先進生產線,實現專業的全鏈條、 一站式系統解決方案的創新研發和生產,能夠 有效降本增效,提升交付能力,提高保密性,推動生產發展。
最后,需要時刻跟隨客戶需求。不同的企業在應用液冷的過程中有差異化需求,如金融業對安全 性的高要求,要求液冷廠商能夠依托自身技術與產品持續優化發展,以更契合客戶的發展需要, 促進算力的有效供給。
綜合來看,液冷是智算快速發展趨勢下散熱的標配與必需品,能夠有效釋放芯片的計算能力,并 且伴隨芯片功率的持續提升,液冷未來的發展方向是浸沒式,但浸沒式目前在技術與產業發展上 依舊存在諸多挑戰,需要圍繞客戶需求,加大研發投入,完善產業鏈做好生產準備,最終滿足不 同客戶對液冷的差異化需求,推動算力建設,加快智能化、數字化發展。
審核編輯 黃宇
-
芯片
+關注
關注
454文章
50460瀏覽量
421968 -
液冷
+關注
關注
4文章
95瀏覽量
4999
發布評論請先 登錄
相關推薦
評論