英特爾和微軟等幾家科技巨頭計劃開發(fā)開放的“Ultra Ethernet”解決方案堆棧,以滿足人工智能和高性能計算工作負載不斷增長的網絡需求。
周三,這些公司通過一個名為“Ultra Ethernet Consortium”(UEC:超以太網聯(lián)盟)的新組織宣布了他們的計劃,該聯(lián)盟尋求通過“全行業(yè)合作”“為高性能網絡構建一個完整的基于以太網的通信堆棧架構”。
該聯(lián)盟由 Linux 基金會成立,其他創(chuàng)始人包括網絡芯片巨頭 Broadcom、網絡硬件供應商 Cisco 和 Arista Networks、英特爾芯片競爭對手 AMD、服務器巨頭 Hewlett Packard Enterprise、Facebook 母公司 Meta 和解決方案提供商巨頭擁有的網絡安全業(yè)務 Evidian阿托斯。
該集團正在攻克一個快速增長的領域,這可能為渠道合作伙伴帶來重大機遇。研究公司 650 Group 表示,數(shù)據中心人工智能網絡市場預計今年將增長至 30 億美元,到 2027 年將達到 100 億美元。
“這并不是要徹底改革以太網,”Ultra Ethernet Consortium主席J Metz 博士在一份聲明中表示。“這是關于調整以太網以提高具有特定性能要求的工作負載的效率。我們正在研究每一層——從物理層一直到軟件層——以找到大規(guī)模提高效率和性能的最佳方法。”
據超以太網聯(lián)盟 (UEC) 在新聞稿中所說,他們正在匯集領先的公司進行全行業(yè)合作,為高性能網絡構建一個完整的基于以太網的通信堆棧架構。人工智能 (AI) 和高性能計算 (HPC) 工作負載正在快速發(fā)展,需要一流的功能、性能、互操作性和總體擁有成本,同時又不犧牲開發(fā)人員和最終用戶的友好性。超級以太網解決方案堆棧將利用以太網的普遍性和靈活性來處理各種工作負載,同時具有可擴展性和成本效益。
該聯(lián)盟將致力于最大限度地減少通信堆棧的變化,同時維護和促進以太網互操作性。
據報道,UEC 為改進以太網而做出的首批努力之一是目前稱為 UEC 傳輸?shù)募夹g。
Metz 表示,UEC 傳輸正在開發(fā)中,以幫助提供比目前 RDMA 更好的以太網傳輸。雖然仍將支持 RDMA,但 UEC 旨在提供更靈活的傳輸,不需要無損網絡。這將允許多對多人工智能工作負載所需的多路徑和無序數(shù)據包傳輸?shù)裙δ堋?/p>
“UEC 傳輸是一種處理傳輸層的新形式,它具有一些語義調整、擁塞通知協(xié)議和一些安全增強功能,”Metz 說。
UEC 技術咨詢委員會主席 Uri Elzur 告訴 SDxCentral,通過即插即用和合規(guī)性測試確保互操作性將是未來的重點。Elzur 表示,UEC 的目標是確保其開放性和可互操作性。
“為了實現(xiàn)我們的目標,必須改變一系列事情,同時我們保留以太網環(huán)境的優(yōu)點,并在此基礎上構建一個堆棧,”Elzur 說。
該聯(lián)盟的技術目標是開發(fā)規(guī)范、API 和源代碼來定義:
以太網通信的協(xié)議、電信號和光信號特征、應用程序接口和/或數(shù)據結構。
鏈路級和端到端網絡傳輸協(xié)議可擴展或替換現(xiàn)有鏈路和傳輸協(xié)議。
鏈路級和端到端擁塞、遙測和信令機制;上述各項均適用于人工智能、機器學習和高性能計算環(huán)境。
軟件、存儲、管理和安全結構可促進各種工作負載和操作環(huán)境。
UEC 將遵循模塊化、兼容、可互操作層和緊密集成的系統(tǒng)方法,為要求苛刻的工作負載提供全面改進。創(chuàng)始公司正在為聯(lián)盟的四個工作組做出極具價值的貢獻:物理層、鏈路層、傳輸層和軟件層。
“
現(xiàn)代AI工作的網絡需求
網絡對于高效且經濟高效的人工智能模型訓練變得越來越重要。GPT-3、Chinchilla 和 PALM 等大型語言模型 (LLM) 以及 DLRM 和 DHEN 等推薦系統(tǒng)在數(shù)千個 GPU 的集群上進行訓練。
訓練由頻繁的計算和通信階段組成,其中下一階段訓練的啟動取決于整個 GPU 套件通信階段的完成。最后到達的消息控制所有 GPU 的進度。這種尾部延遲(Tail latency,通過通信階段最后一條消息的到達時間來衡量)是系統(tǒng)性能的關鍵指標。
就參數(shù)數(shù)量、嵌入表條目和上下文緩沖區(qū)的字數(shù)而言,大型模型的規(guī)模不斷增加。例如,2020 年,GPT-3 是最先進的,擁有 1750 億個參數(shù)。最近,他們宣布了 GPT-4 模型,預計有 1 萬億個參數(shù),而 DLRM 擁有數(shù)萬億個參數(shù),并且預計還會增長。這些越來越大的模型需要越來越大的集群來訓練并在網絡上驅動更大的消息。當網絡性能不佳時,這些昂貴的集群就得不到充分利用。連接這些計算資源的網絡必須盡可能高效且經濟高效。
高性能計算 (HPC) 工作的要求也同樣很高,而且 HPC 和人工智能在分布式計算資源的規(guī)模和高效利用方面的需求日益趨同。雖然 AI 工作負載通常非常需要帶寬,但 HPC 還包括對延遲更加敏感的工作負載。
“
以太網的優(yōu)勢
目前,許多大型集群(包括用于人工智能訓練的 GPU 的超大規(guī)模部署)已經在基于以太網的 IP 網絡上運行,利用了它們的許多優(yōu)勢:
廣泛的多供應商生態(tài)系統(tǒng),由來自許多參與方的可互操作以太網交換機、NIC、電纜、收發(fā)器、光學器件、管理工具和軟件組成
經過驗證的 IP 網絡尋址和路由規(guī)模,可實現(xiàn)機架規(guī)模、建筑規(guī)模和數(shù)據中心規(guī)模網絡
一系列用于測試、測量、部署和高效運營以太網的工具
通過競爭性生態(tài)系統(tǒng)和規(guī)模經濟降低成本的歷史經驗
IEEE 以太網標準經過驗證的能力,能夠在許多物理層和光層上快速、定期地推進
我們預計這些優(yōu)勢將成為關鍵要求,并且以太網在未來將越來越多地主導各種規(guī)模的人工智能和高性能計算工作負載。
“
未來人工智能和高性能計算網絡的關鍵需求
即使考慮到使用以太網的優(yōu)點,也可以而且應該進行改進。網絡必須不斷發(fā)展,以更好地提供前所未有的性能,以適應未來網絡規(guī)模的擴大和帶寬的提高。最重要的是需要網絡支持盡快將消息傳遞到所有參與端點,即使是少數(shù)端點也不會出現(xiàn)長時間延遲。應盡量減少“尾部延遲”。
為了實現(xiàn)低尾部延遲,UEC 規(guī)范通過滿足下一代應用程序的以下關鍵網絡要求,提供了重大改進:
1、Multi-pathing and packet spraying
2、Flexible delivery order
3、Modern congestion control mechanisms
4、End-to-end telemetry
5、Larger scale, stability, and reliability
最后一點給前面的所有點帶來了額外的負擔。高性能系統(tǒng)幾乎沒有容錯空間,而在較大的網絡中,容錯空間會變得更加復雜。,隨著系統(tǒng)的發(fā)展,確定性和可預測性變得更加困難,需要新的方法來實現(xiàn)整體穩(wěn)定性。
“
超以太網聯(lián)盟的目標
在白皮書中,UCE表示,超以太網聯(lián)盟的成員認為,現(xiàn)在是重新開始并用超以太網傳輸取代傳統(tǒng) RoCE 協(xié)議的時候了。超以太網傳輸是一種現(xiàn)代傳輸協(xié)議,旨在提供 AI 和 HPC 應用程序所需的性能,同時保留超以太網生態(tài)系統(tǒng)的優(yōu)勢。
TCP/IP 和以太網成功的兩個基本教訓是,傳輸協(xié)議應提供丟失恢復功能,并且無損結構在不觸發(fā)隊頭阻塞和擁塞擴散的情況下運行非常具有挑戰(zhàn)性。UEC 傳輸遵循這些原則,建立在分布式路由算法和基于端點的可靠性和擁塞控制的成熟路徑之上。UEC 傳輸協(xié)議通過提供以下功能超越了現(xiàn)狀:
開放協(xié)議規(guī)范從一開始就設計為在IP 和以太網上運行
多路徑、數(shù)據包噴射傳送(packet-spraying delivery ),充分利用 AI 網絡,不會造成擁塞或隊頭阻塞,無需集中式負載均衡算法和路由控制器
Incast 管理機制,以最小的丟包控制到目標主機的最終鏈路上的扇入
高效的速率控制算法,允許傳輸快速提升至線速,同時不會導致競爭流的性能損失
用于無序數(shù)據包傳送的 API,可選擇按順序完成消息,最大限度地提高網絡和應用程序的并發(fā)性,并最大限度地減少消息延遲
可擴展未來網絡,支持 1,000,000 個端點
性能和最佳網絡利用率,無需針對網絡和工作負載調整擁塞算法參數(shù)
旨在在商用硬件上實現(xiàn) 800G、1.6T 和未來更快以太網的線速性能
UEC 規(guī)范將超越傳輸層,定義標準語義層、改進的低延遲交付機制以及一致的 AI 和 HPC API,并提供標準的多供應商支持,以便通過 UEC 傳輸協(xié)議實現(xiàn)這些 API。
“
英偉達可能遭遇重創(chuàng)?
一位解決方案提供商高管表示,超以太網聯(lián)盟的一個可能目標是提供 Nvidia InfiniBand 網絡解決方案的替代方案,該解決方案針對 AI 和 HPC 工作負載。他發(fā)現(xiàn)值得注意的是,英偉達并不是該組織的成員。
“他們正在嘗試找到一種處理這些織物的替代方法,”位于明尼蘇達州伯恩斯維爾的 HPC 系統(tǒng)集成商 Nor-Tech 的工程副總裁 Dominic Daninger 說。
英偉達沒有回應置評請求。
Daninger 表示,如果成功構建可互操作且速度更快的基于以太網的解決方案堆棧,該團隊可能會削弱 Nvidia 在人工智能和 HPC 領域的主導地位。這是因為 Nvidia 推出了 InfiniBand 解決方案,該解決方案是該公司通過2021 年收購 Mellanox獲得的,作為連接 GPU 集群以執(zhí)行此類工作負載的最佳低延遲解決方案。
他表示:“英特爾、AMD 和博通等公司可能有興趣擺脫與 Nvidia 的加速器和連接結構的束縛。”
該團隊的目標是開發(fā)超越“當今專業(yè)技術”性能的基于以太網的架構,重點關注功能、性能、總體擁有成本、互操作性以及為用戶和開發(fā)人員提供的友好環(huán)境。
從技術角度來看,超以太網聯(lián)盟正在尋求開發(fā)規(guī)范、API 和源代碼,以定義基于以太網的解決方案堆棧中的多個方面。
堆棧中的這些方面包括支持各種工作負載和操作環(huán)境所需的軟件、存儲、管理和安全構造。它們還涵蓋鏈路和傳輸協(xié)議以及電氣和光學信號特征以及以太網通信的應用程序接口和數(shù)據結構。
超以太網聯(lián)盟預計首批采用其規(guī)范的產品將于 2024 年問世。
審核編輯:劉清
-
英特爾
+關注
關注
60文章
9751瀏覽量
170670 -
以太網
+關注
關注
40文章
5288瀏覽量
169698 -
人工智能
+關注
關注
1787文章
46063瀏覽量
235093 -
英偉達
+關注
關注
22文章
3637瀏覽量
89871 -
RDMA
+關注
關注
0文章
74瀏覽量
8896
原文標題:芯片巨頭聯(lián)手,改革以太網,擺脫英偉達?
文章出處:【微信號:晶揚電子,微信公眾號:晶揚電子】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論