曾幾何時(shí),UDC水下數(shù)據(jù)中心,就像《流浪地球2》泡在水里的根服務(wù)器,是一個(gè)只存在于科幻電影、獵奇新聞中,或者是海外頂尖科研機(jī)構(gòu)用來“炫技”的“黑科技”。
如今,UDC已經(jīng)來到了我們身邊,并且正在加速。
今年7月我去2024世界人工智能大會(huì),在一家中國計(jì)算廠商的展臺(tái)“C位”,看到了一臺(tái)泡在水中、正在運(yùn)行的電腦。
原來,該企業(yè)研發(fā)的特殊液體,能夠與電路板兼容,而且不會(huì)腐化電路。依托相關(guān)材料打造的液冷服務(wù)器,可以抵御電子元器件的天敵——“水”,讓水下數(shù)據(jù)中心成為可能。
據(jù)現(xiàn)場工作人員透露,目前該企業(yè)已經(jīng)與蘇州達(dá)成合作,正在湖中部署水下數(shù)據(jù)中心。一是可以作為當(dāng)?shù)亍靶沦|(zhì)生產(chǎn)力”的標(biāo)桿項(xiàng)目,展現(xiàn)在智能計(jì)算方面的區(qū)域?qū)嵙Γ欢怯刑貏e好的節(jié)能減排降耗效果,可以為當(dāng)?shù)匾恍?a href="http://www.nxhydt.com/tags/ai/" target="_blank">AI企業(yè)和應(yīng)用提供綠色算力。
那怎么才能用到水底的算力呢?答案是,云。
從云上獲取AI算力,憑借天然的成本優(yōu)勢(shì)、靈活租用的彈性優(yōu)勢(shì),成為AI 初創(chuàng)企業(yè)的首選。建設(shè)更節(jié)能、更綠色、成本更低的“云”, UDC水下數(shù)據(jù)中心也走進(jìn)了云計(jì)算廠商的視野。
2014年微軟首次提出了水下數(shù)據(jù)中心概念,希望為沿海人口提供高速云服務(wù)。2018 年微軟正式將 855 臺(tái)服務(wù)器沉到海里,與Azure 云進(jìn)行對(duì)比。我國目前也有海底數(shù)據(jù)中心,核心業(yè)務(wù)就是算力服務(wù),以及跟騰訊、阿里等云廠家的大批量直接合作,為它們提供更具成本優(yōu)勢(shì)的云端算力。
本文就來聊一聊,水底下的云,到底怎么把算力價(jià)格“打下來”?
“AI的盡頭是電力”。大模型的參數(shù)量達(dá)到萬億級(jí)別,驅(qū)動(dòng)著智算中心的組網(wǎng)規(guī)模向五萬卡,甚至是十萬卡級(jí)演進(jìn)。而一個(gè)十萬卡集群,可能耗盡一個(gè)城市的電量。為了供養(yǎng)AI大模型,全城人都不能開空調(diào)、看電視,這未免也太賽博朋克了。
不僅我們不愿意出現(xiàn)這種情況,其實(shí)云廠商也不愿意。有調(diào)研顯示,水電費(fèi)支出占到了數(shù)據(jù)中心運(yùn)營成本的50%以上,而智算中心GPU的密度進(jìn)一步增加,電量負(fù)荷會(huì)倍數(shù)增長,直接導(dǎo)致云廠商的成本激增。
為了減少電費(fèi),云廠商們可謂是想盡了辦法。
有人把數(shù)據(jù)中心放到了烏蘭察布、青海,有人放到了湖邊(阿里巴巴千島湖數(shù)據(jù)中心),有人放進(jìn)了山洞(騰訊、華為),有人直接搬去了北極圈(Facebook Node Pole 數(shù)據(jù)中心、芬蘭哈米納港Google數(shù)據(jù)中心),還有人放到了海上(Google海上漂浮數(shù)據(jù)中心)、海底(微軟Project Natick數(shù)據(jù)中心)。
萬變不離其宗,就是減少依靠空調(diào)等電力設(shè)備降溫的風(fēng)冷,多靠自然環(huán)境中的空氣或水,進(jìn)行自然冷卻。
而這些自然冷卻方案中,水底下的云無疑是最有“減電”競爭力的。
顯然,相比陸地?cái)?shù)據(jù)中心,水下環(huán)境的復(fù)雜度更高,布線、維護(hù)更為麻煩,而且服務(wù)器本來就怕水,對(duì)水下數(shù)據(jù)中心的防水、防腐性能挑戰(zhàn)更大,為什么還能成為一種選擇?
水下數(shù)據(jù)中心的成本“第一刀”,就把自然冷卻效果打到了“地板價(jià)”。
作為冷卻效果最極致的解決方案,水下數(shù)據(jù)中心直接利用了水體的低溫特性,比其他物質(zhì)(如空氣冷卻、風(fēng)力冷卻)吸收更多熱量,大幅減少了額外的冷卻需求。
同時(shí),由于水下環(huán)境本身就提供了有效的冷卻,因此可以減少對(duì)空調(diào)系統(tǒng)的依賴和能耗。
可以說,利用水流帶走熱量,水下數(shù)據(jù)中心節(jié)能降耗的成本優(yōu)勢(shì)最為顯著。
在陸地上建數(shù)據(jù)中心,自然要占用土地空間,除了土地成本之外,一些天然氣溫較低的寒冷內(nèi)陸城市和地區(qū),基礎(chǔ)設(shè)施條件一般也沒有沿海地區(qū)發(fā)達(dá),比如北極圈,導(dǎo)致TCO總體擁有成本上升。
尤其是隨著超萬卡集群的到來,對(duì)陸地上的數(shù)據(jù)中心/智算中心配套設(shè)施,比如供電、承重、機(jī)房潔凈度和走線架設(shè)計(jì)等提出了極高要求。
《面向超萬卡集群的新型智算技術(shù)白皮書(2024年)》顯示,由于超萬卡集群的算力密度更高、功耗密度更高,線纜的布放量也隨之增大,一個(gè) 1.8 萬卡的智算集群,需要布放 10 萬量級(jí)的線纜,這將對(duì)走線架的寬度和承重帶來新的挑戰(zhàn)。
可以說,陸地?cái)?shù)據(jù)中心/智算中心的總體成本正在走高。
與之相比,水底數(shù)據(jù)中心的建設(shè)成本正在下降,二者之間的“剪刀差”越來越小。
一方面,由于湖泊、海洋的空間較大,建設(shè)方的選址范圍更廣,相比內(nèi)陸地區(qū),水下數(shù)據(jù)中心的土地成本更可控。
此外,水下數(shù)據(jù)中心往往采用高度集成、緊耦合、密封式數(shù)據(jù)艙,一些在陸地?cái)?shù)據(jù)中心中是必需的設(shè)備,如冷卻塔和壓縮機(jī)等,在水下都不需要。設(shè)計(jì)得當(dāng)?shù)暮5讛?shù)據(jù)倉,故障率和運(yùn)維成本更低。
2020年9月,微軟將沉入海底兩年的數(shù)據(jù)中心撈上來,評(píng)估發(fā)現(xiàn),水下數(shù)據(jù)中心的服務(wù)器故障率,比傳統(tǒng)數(shù)據(jù)中心更低,可靠性比陸地上的服務(wù)器高8倍。
這可能是因?yàn)椋聰?shù)據(jù)艙可以與多變的環(huán)境隔離,很少受到事故擾動(dòng)。總之,廣袤遼闊的水域,讓無需與人類爭奪土地資源的水下算力,價(jià)格“更香”了。
把服務(wù)器泡在水里,省水。這究竟是怎么一回事?
這就要提到一個(gè)指標(biāo):WUE(Water Usage Effectiveness),水資源利用效率。
很多人聽說過PUE,卻很少聽過WUE,而想要推動(dòng)環(huán)境可持續(xù)發(fā)展,實(shí)現(xiàn)碳中和,WUE也不得不降。
降低WUE,核心就是減少分子——輸入數(shù)據(jù)中心的水量,主要由冷凍補(bǔ)水、冷卻補(bǔ)水、加濕補(bǔ)水等生產(chǎn)用水組成。冷卻過程中消耗的水資源越少,WUE就越高。
把數(shù)據(jù)中心泡在水里,就能減少生產(chǎn)用水嗎?可以,而且甚至是0。
一方面,水下數(shù)據(jù)中心直接使用周圍水體的低溫來冷卻服務(wù)器,無需蒸發(fā)散熱,省去了傳統(tǒng)數(shù)據(jù)中心中的冷卻塔和冷水系統(tǒng),用于冷卻的水資源消耗等于0。
此外,水下數(shù)據(jù)中心冷卻過程中蒸發(fā)的水分直接回到水體中,對(duì)于公共水源來說也幾乎沒有損失。一些干旱缺水的地區(qū),如果利用湖泊、河流、地下水來降溫,蒸發(fā)的水資源卻未必能快速回到當(dāng)?shù)氐乃抵校瑫?huì)給當(dāng)?shù)厮h(huán)境帶來負(fù)面影響。
2023年,美國亞利桑那州就因?yàn)閾?dān)心水資源消耗問題,限制當(dāng)?shù)財(cái)?shù)據(jù)中心建設(shè)。國內(nèi),內(nèi)蒙古烏蘭察布市集寧區(qū)也出臺(tái)了《關(guān)于禁止集寧區(qū)大數(shù)據(jù)企業(yè)使用地下水冷卻降溫的通知》,轄區(qū)內(nèi)大數(shù)據(jù)企業(yè)一律禁止用地下水冷卻降溫。
而水下數(shù)據(jù)中心即使產(chǎn)生一些熱蒸騰,也會(huì)很快被廣闊的湖泊海洋而代謝掉,不會(huì)影響到當(dāng)?shù)氐乃h(huán)。
水下數(shù)據(jù)中心雖然成本優(yōu)勢(shì)大,但AI云服務(wù)如果一味降本,可能會(huì)出現(xiàn)“降本增笑”的事故。
舉個(gè)例子,西部數(shù)據(jù)中心的存算成本比東部更低,但一些東部企業(yè)考慮到傳輸時(shí)延、丟包率、業(yè)務(wù)可靠性等,寧肯多承擔(dān)50%的成本,也要把數(shù)據(jù)放在東部,尤其是自動(dòng)駕駛等對(duì)數(shù)據(jù)實(shí)時(shí)性要求較高的業(yè)務(wù)。這也是很多西部數(shù)據(jù)中心,上架率不高的重要原因。
水下數(shù)據(jù)中心的商業(yè)化困境在于,雖然價(jià)格低,但與AI需求沒有充分適配,而AI又被云廠商看作是當(dāng)下最關(guān)鍵的新增收入點(diǎn)。
水下的資源擴(kuò)展性受限。云服務(wù)需要根據(jù)用戶需求快速擴(kuò)展資源,增加算力規(guī)模、存儲(chǔ)空間,而水下數(shù)據(jù)艙的出廠、下水都有一定的時(shí)間周期(微軟官網(wǎng)顯示,Natick從工廠到運(yùn)行要90天),而目前陸地上的智算中心,采用模塊化建設(shè)只需一個(gè)月左右就能落成,能更快滿足AI算力需求。
目前,微軟也宣布暫停了Natick項(xiàng)目,據(jù)說要在后期加強(qiáng)安裝、維修機(jī)器人等方面的研究,看來遠(yuǎn)離人類活動(dòng)的水下環(huán)境,仍不適合大規(guī)模部署數(shù)據(jù)中心。
另外,對(duì)水下算力的納管和管理,也給云廠商提出了挑戰(zhàn)。目前水下算力的占比還比較小,云廠商要整合和管理這些異構(gòu)資源,確保不同來源的算力可以無縫集成,實(shí)現(xiàn)最佳性能,并讓用戶便捷簡單地使用這些資源,需要投入大量的資源進(jìn)行技術(shù)和系統(tǒng)、平臺(tái)的研發(fā)。
一些積累不夠深厚的中小型云廠商,可能出現(xiàn)“醬油(管理平臺(tái))比雞(算力)貴”的情況,并不能靠成本優(yōu)勢(shì)來提升綜合競爭力。
徐志摩曾在《偶然》詩中寫道:“我是天空中的一片云,偶爾投影在你的波心。”目前來看,AI云服務(wù)和水下數(shù)據(jù)中心,恐怕還無法長相廝守、成為彼此的唯一。
2024年5月,Natick項(xiàng)目第二期已經(jīng)開始,反映出微軟對(duì)云數(shù)據(jù)中心解決方案的持續(xù)追求,也讓“水下數(shù)據(jù)中心”成為中國不能落后太遠(yuǎn)的一條賽道,更適合作為科技自立、科技強(qiáng)國的一張名片,與國資云、央國企云、科研云一同試點(diǎn)探索。
而商業(yè)化屬性更強(qiáng)的云服務(wù)商,仍需要聚焦在陸地上。幸好中國地形地貌豐富、基礎(chǔ)設(shè)施完善,有廣闊天地來探索“極致性價(jià)比”。
從這個(gè)角度說,算力,從來不是一家計(jì)算企業(yè)或一個(gè)行業(yè)的事,而是一個(gè)舉世參與的系統(tǒng)工程。算力即國力的時(shí)代,才剛剛開始。
審核編輯 黃宇
-
云計(jì)算
+關(guān)注
關(guān)注
38文章
7583瀏覽量
136646 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
8648瀏覽量
84375 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
4491瀏覽量
71444
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論