01算力網絡的架構
之前我提到過,算力網絡的作用,是為用戶提供算力資源服務。 它將算力資源徹底“融入”通信網絡,以一個更整體的形式,提供最符合用戶需求的算力資源服務。
這是一個高度靈活、高度智能的網絡。
算力網絡的核心特征,是它通過算力,實現了對算力資源、網絡資源的全面接管,可以讓網絡實時感知用戶的算力需求,以及自身的算力狀態。經過分析后,算力網絡可以調度不同位置、不同類型的算力資源,為用戶服務。 我們可以把它理解成一個“萬能水龍頭”。它總能夠按你的需要,提供合適強度、合適溫度、合適酸堿度的水流,讓你擁有最好的用水體驗。 那么,我們自然會很好奇,這個“萬能水龍頭”的背后,究竟是一張怎樣的“水網”?它是如何進行資源控制和調度的? 接下來,我們就看看算力網絡的體系架構。 首先,我需要提前說明一下,算力網絡目前還是一個研究中的技術,并沒有完全定型。所以,我下面給出的,只是各個運營商和設備商的算力網絡架構(設想)圖,相互之間會存在一定的差異。而且,未來也很可能在發生變動,請大家知悉。 下面的這幾張,就是運營商和設備商比較有代表性的算力網絡架構(設想)圖:
中國移動(來自《算力網絡技術白皮書》,2022)
中國移動(來自《算力網絡白皮書》)
中國聯通(來自華為WIN-WIN創新周,2022)
中國聯通算力網絡架構 (來自《算力網絡架構與技術體系白皮書》)
中國電信云網融合目標技術架構 (來自《云網融合2030技術白皮書》)
華為(來自華為WIN-WIN創新周,2022) 這些圖都有點復雜,相信大家都不太看得懂。我畫一個簡單的示意圖,大家應該能看明白:
簡單來說,還是信息通信的分層思想,按層級來看,就能理清思路。為了減輕閱讀壓力,大家可以先把右邊的綠色低碳和安全防護先pass掉。 我們從下往上,一層一層來看。
算網基礎設施
算力網絡的最下層,依然是算網基礎設施層,這個逃不掉的。在算力網絡中,基礎設施不再僅僅是算力資源(CPU、存儲、GPU等),還包括了網絡資源。 在算力資源這邊,對算力基礎設施的整合,依舊是以云技術為核心,包括云原生、虛擬化、容器等。 在這里,和算力有關的一些底層新技術創新,也值得關注,例如異構計算、無服務計算(Serverless Computing)、存算一體、算力卸載等。大家可以先不管,以后再專題介紹。 網絡這邊,變化比較大。前幾期文章給大家介紹過,云網融合趨勢下的網絡變化,用一句話來解釋,就是把封閉的網,變得更開放(解耦),讓它變成像計算機一樣,可以通過軟件的方式(軟件定義),去給它下“命令”。 網絡的底層(物理層、數據鏈路層),在傳輸網這邊,依舊是光(只有光,才能保證通信帶寬和容量等基本硬指標)。光底層的技術,例如OTN、OXC、ROADM、C+L頻段、400G/800G啥的,都還是它們,沒有什么區別。 在接入網那邊,5G NR、PON(50G-PON),也沒有什么特別(除了邊緣算力會有點關系之外)。 變化大的,在網的上層。我們待會再講。
算網一體(算力資源管理、網絡資源管理)
再往上,開始有不一樣了。因為算力網絡要調度算力和網絡資源,所以,需要對資源進行“預處理”和“銜接”。(這一層,其實很多架構里都歸于編排管理層。我覺得單獨拎出來,會比較容易理解一些。) 這一層,最值得關注的是算力路由。 算力網絡和傳統網絡的最大區別,在于它所擁有三大特性。第一大特性,就是算力路由。 在算力之前,先要說說算力感知。 算力感知是網絡對算力資源和算力服務的部署位置、實時狀態、負載信息、業務需求的全面感知。中國移動的算力感知網絡白皮書,就是站在算力感知的角度,進行分析的。
算力感知網絡的體系架構 (來自中國移動《算力感知網絡CAN技術白皮書2021》) 一方面,各算力節點將算網信息度量建模后統一發布,網絡通過對多節點上報的算網信息進行聚合,構建全局統一的算網狀態視圖。另一方面,網絡完成對業務算網需求的統一解析,實現對業務的全面感知,為基于業務需求進行算力調度提供保障。
算力狀態感知與通告 (來自《算力感知網絡CAN技術白皮書2021》) 說白了,算力感知的目的,就是摸清手上到底有多少資源,用戶到底有怎樣的需求。 感知的對象,肯定需要進行度量和標識。于是,就有了算力度量和算力標識。 這兩塊,運營商目前非常重視。 算力這個東西存在多樣性,也存在異構硬件芯片,所以,目前還沒有形成統一的度量體系和標準。這會對建立統一的算力模型造成麻煩。很簡單,度量單位都不一樣,如何進行算力評估和計費? 算力標識的話,就相當于算力的身份證。用戶通過算力標識指示所需服務,網絡通過解析算力標識獲取目標算力服務、算力需求等信息,為算力調度等提供基礎。這個算力標識,必須是全局統一且可驗證的。 好了,接下來,就是算力路由。 在剛才那個中國移動的算力感知網絡架構圖里,在算力資源層之外,還單獨劃了一個算力路由層。 算力路由層是算力感知網絡的核心功能層,支持對網絡、計算、存儲等多維資源、服務的感知與通告,實現“網絡+計算”的聯合調度。 算力路由層,包括算力路由控制技術和算力路由轉發技術,實現業務請求在路由層的按需調度。 說到算力路由,肯定就要說到CFN(Computing First Networking,計算優先網絡)。 CFN廣義上有時候會被用來指代整個算力網絡。但是,在這里,CFN是一種分布式路由協議,在不同邊緣云之間,按需進行著算力的調度和均衡。
CFN技術架構(來自《算力感知網絡技術白皮書》) CFN這個東西其實很有意思。我們傳統理解的路由,都是數據報文的路由。CFN這里的路由,是將計算資源狀況和網絡資源狀況作為路由信息,發布到網絡。然后呢,網絡基于虛擬的服務ID,將計算任務報文,路由到最合適的計算節點。 目前,CFN協議主要通過在業務路由的BGP報文頭中,以擴展字節信息的方式攜帶算力信息,將網絡中計算節點的負載情況實時向全網進行擴散。 很顯然,算力路由和CFN,是上一層進行算力調度的前提。
編排管理
再往上,就是算力網絡的核心關鍵部分——編排管理。 搞過核心網NFV(網元功能虛擬化)的同學,對編排一定非常熟悉。在NFV架構里,就有編排。這是一個很有意思的詞,把你給“收編、安排”了。說白了,就是完全控制和調度。 算力網絡的第二大特性,就是算力調度。 算力調度,就是基于算網大腦,進行全網算力資源的智能編排、彈性調度。 更具體來說,是:完成算力運營及算力服務編排,完成對算力資源和網絡資源的管理,包括對算力資源的感知、度量和OAM管理等;實現對終端用戶的算網運營,以及對算力路由層和網絡資源層的管理。 算力資源被感知、標識和感知之后,為了進行管理,還有一個算力資源管理的邏輯過程(也有被單獨稱為:算力管理層)。主要包括算力注冊、算力OAM(性能監控、故障管理)、算力運營(計費管理、服務合約等)。
算力管理層(來自《算力感知網絡CAN技術白皮書2021》) 這個功能劃分就很麻煩。在有的運營商架構圖里,這塊被定義為算力管理層,單獨存在。而在有的架構圖里,沒有這一層,劃在了編排管理層。所以說,各個理解都不一樣,很頭大。反正大家要知道,有這么一個功能組。 想要實現它,肯定離不開一個控制網絡的“神經中樞”。 調度和編排算力網絡的核心控制部分,有的運營商把它叫做“算網大腦”。 這個“算網大腦”,有四個重要的作用: 1、獲取全域實時的算、網、數資源,以及云、邊、端分布情況,構建全域態勢感知地圖。 2、跨域協同調度,將多域協同的調度任務智能、自動地分解給各個使能平臺,實現算、網、數的資源調度。 3、多域融合編排,針對多域融合業務需求,基于算、網、數的原子能力按需靈活組合編排。 4、智能輔助決策,基于不同業務的SLA要求、網絡整體負載、可用算力資源池分布等因素,智能、動態地計算出算、網、數的最優協同策略。
算網管理編排層,維護全局靜態的算力、服務和網絡拓撲信息,并同步給各入口算力路由節點。算力路由節點維護算力服務的拓撲信息以及算力資源和網絡的資源實時狀態信息,通過分布式算力路由節點進行算網協同調度。 “算網大腦”是算力網絡的神經中樞,統籌全局資源,重要性不言而喻。
在“算網大腦”中引入AI人工智能,那肯定是不用說了。除了AI之外,現在,運營商和設備商還打算往里面塞“數字孿生”、“意圖引擎”,極力提升“算網大腦”的智能化水平。 說實話,仔細看管理編排層,我就有一種感覺,算力網絡就是SDN和NFV技術的升級加融合,處處都是這兩個技術的影子。只不過,表面又加上很多其它的技術,形成了一個更完整、更龐大的體系。
服務運營
算力大腦之上,是不是就沒有了?并不是,別忘了,我們還有服務運營層。 服務運營層,說白了,就是給上層應用提供管控算力網絡的接口。算網大腦不是真正的老板,只是一個“大管家”。真正管控網絡的,是上層用戶和應用。 服務運營層的目的,就是向上提供算力網絡的能力開放。重點技術包括:算力交易、算力并網、算力封裝、意圖感知等。 算力網絡的第三大特性,就是算力交易。
路由、調度、交易,是算力網絡三大特性 算力交易是算力網絡的一個重要創新。 在算力和網絡沒有融合之前,用戶使用誰家的云計算,就給誰錢,使用誰家的通信網絡,就給誰錢。算網融合后,算力到處都是,調度來調度去,你到底該給誰錢? 算力交易,就是為了解決這個問題。 在算力交易場景中,會有一個可信泛在算力交易平臺。
來自《算力網絡——云網融合2.0時代的網絡架構與關鍵技術》 大致過程是這樣的: 首先,算力消費方提出詳細的算力需求。然后,算力交易平臺根據需求,將可用的資源整合,生成一個算力網絡資源表。根據時延和成本等因素,會有對應的報價。接下來,算力消費方根據資源表,選擇一個最適合自己的“套餐”。然后,就是在算力交易平臺上簽訂交易合約。再然后,交易平臺根據合約,通過算力網絡調度資源,并且更新資源信息。最后,合約結束,服務終止,釋放資源。
算力網絡交易平臺(來自《整合多方算力網絡,實現計算資源利用率最優》,雷波) 在21世紀,凡是提到交易模式,就一定會牽扯到一個詞——區塊鏈。 是的沒錯,算力交易平臺,也是借助區塊鏈技術,實現分布式賬本、匿名交易等功能。 綜上所述,算力網絡緊密圍繞用戶的算力需求,覆蓋了算力產生、調度、交易、消費的全生命周期。算力網絡想要實現的,就是算隨人動,算隨“需求”動,達到極致完美的算力供給與需求匹配,一點也不將就,一點也不浪費。
02算力網絡的標準進展
這幾年,算力網絡在國內非常熱門。不管是運營商還是設備商,都極為重視這個概念。 尤其是國內運營商,對算力網絡簡直就是到了狂熱的地步。 原因很簡單,國外運營商很少碰網,基本上就是搞搞通信,最多搞搞傳統通信的云化。而國內運營商,既有網,又有云,特別希望把網和云的資源融合、盤活。而且,我們國家比較重視基礎設施建設,算力網絡是重要的數字基礎設施,所以,運營商作為國企,也特別看重這塊的積累。
一方面,為了掌握技術標準的主動權,另一方面,為了品牌宣傳和形象造勢,三大運營商在算力網絡上就開始卷起來了。 2019年,是公認的算力網絡元年。這一年的11月1日,中國聯通率先行動,在北京PT展期間,發布了《中國聯通算力網絡白皮書》。這是國內第一本和算力網絡相關的白皮書。 此后,國內運營商們爭先恐后,陸續發布了多本白皮書,以及積極推動算力網絡的標準制定。
在標準推進方面,我根據網上的資料,整理了一張表格,大致記錄了各大標準組織在算力網絡標準制定方面的情況,僅供參考:
綜合自中信證券,各大白皮書,官網消息
試驗進展:
來自中信證券
03結語
從實際情況來看, 算力網絡離我們還有很長一段距離。目前,我們處于云網融合的進展階段,算網一體或算力網絡,還在研究之中。 盡管如此,算力網絡作為算力和聯接力未來的發展趨勢,是毋庸置疑的。算與網的融合一體,是必然的,也是整個通信行業的歸途。傳統通信作為“管道”,無法提升自己的價值,唯有全面投入云的懷抱,才是最好的出路。 好了,以上就是今天文章的全部內容。技術干貨很多,看起來比較費勁。有些東西是我自己的理解,也不一定準確,歡迎大家批評指正。
審核編輯 :李倩
-
運營商
+關注
關注
4文章
2392瀏覽量
44382 -
通信網絡
+關注
關注
21文章
2028瀏覽量
51971 -
算力
+關注
關注
1文章
932瀏覽量
14747
原文標題:算力網絡,到底是如何工作的?
文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論