精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

揭秘超以太網聯盟(UEC)1.0 規范最新進展(2024Q4)

星融元 ? 來源:jf_55437772 ? 作者:jf_55437772 ? 2024-11-18 16:53 ? 次閱讀

近期,由博通、思科、Arista、微軟、Meta等國際頂級半導體、設備和云廠商牽頭成立的超以太網聯盟(UEC)在OCP Global Summit上對外公布其最新進展——UEC規范1.0的預覽版本。讓我們一睹為快吧!

UEC 旨在提出一種“升級版”的以太網通信協議棧用以應對AI智算、HPC等領域對RDMA網絡的性能挑戰——當前大規模計算節點互聯場景下主要有InfiniBand和基于以太網協議的RoCE兩大技術路線。有關IB和RoCE協議棧的詳盡對比可參閱:

[高性能網絡傳輸:RoCE與IB協議棧對比解析]
相比較為封閉的IB架構,以太網在互操作性和帶寬成本上的優勢已在市場層面得到了廣泛認可,尤其是大規模的AI算力中心場景。當前全球TOP500的超級計算機中RoCE和IB的占比相當,以端口帶寬總量計算,IB占比為39.2%,RoCE已達48.5%。

盡管IB和RoCE在高性能傳輸的擁塞控制、QoS皆有應對設計,但也暴露出一些缺陷。例如亂序需要重傳、不夠完美的負載分擔、Go-back-N問題,DCQCN 部署調優復雜等等。

面向GPU Scale-out網絡的UEC 1.0 規范從軟件API、運輸層到鏈路層以及網絡安全和擁塞控制皆有涉及,較傳統RDMA網絡有了大量改進,我們將挑出重點介紹。

什么是超級以太網系統

一個超級以太網系統的組成如下。一個集群(Cluster)由節點(Node)和網絡(Fabric)組成,節點通過網卡(Fabric Interface)連接到網卡,一個網卡中可以有多個邏輯的網絡端點(Fabric End Point,FEP)。網絡由若干平面(Plane)組成,每個平面是多個FEP的集合,通常通過交換機互聯。

超以太網協議棧概覽

? 物理層與傳統以太網完全兼容,可選支持FEC(前向糾錯)統計功能

? 鏈路層可選支持鏈路層重傳(LLR),并支持包頭壓縮,為此擴展了LLDP的協商能力

? 網絡層依然是IP協議,沒有變化

? 傳輸層是全新的,作為UEC協議棧的核心數據包傳輸子層(Packet Delivery)和消息語義子層(Message Semantics)。包傳輸子層實現新一代擁塞控制、靈活的包順序等功能,消息語義子層支持xCCL和MPI等消息。可選支持安全傳輸。另外,在網集合通信(In Network Collective,INC)也在這一層實現

? ** 軟件API層** 。提供UEC擴展的Libfabrics 2.0

物理層

UEC 1.0規范下的物理層與傳統以太網(符合IEEE802.3標準)完全兼容,支持每通道100Gbps和200Gbps速率,在此基礎上實現800Gbps和更高的端口速率。

另外可選支持物理層性能指標統計功能(PHY metrics)。這些指標基于 FEC 碼字進行計算,不受流量模式和鏈路利用率的影響。估計算法基于FEC錯誤計數器的數據,從而得出不可糾正錯誤率(UCR )和數據包錯誤平均間隔(MTBPE)。這些指標衡量了物理層的傳輸性能和可靠性,用于上層的遙測和擁塞控制等。為了支持新的 UEC 鏈路層功能,UEC規范中也對協調子層(RS)進行了相應的修改。

鏈路層

UEC鏈路層最大的變化是引入了LLR(Link Level Retry)協議。它可以讓以太網不依賴PFC,實現無損傳輸。

LLR 機制是基于幀的。每個幀都分配了一個序列號,接收端成功接收這一幀后,檢查幀的序列號是否符合預期,如果正確,發送確認消息(ACK),如果發現幀亂序或者丟失,則發送否定確認消息 (NACK)。發送端具有超時機制,用于保證在 NACK 丟失時重傳。

傳輸層:UET,新一代協議棧的核心

前文提過,傳統的RDMA網絡傳輸層(包括IB和RoCE)在多路徑傳輸、負載分擔、擁塞控制以及參數調優等方面存在著不足之處。隨著AI/HPC集群規模增長,網絡的確定性和可預測性越來越困難,需要全新的方法來解決。

UEC傳輸層(UEC Transport Layer,簡稱UET)運行在IP和UDP協議之上, 支持實現以下幾大技術目標:

? 支持高達 100 萬個 GPU/TPU 的算力集群

? 往返時間低于 10μs

? 單接口帶寬800Gbps及以上

? 網絡利用率超過85%

選擇性重傳

(Selective Retransmit)

傳統傳輸協議,如TCP需要嚴格的傳輸順序,并采用了Go-Back-N機制。而一個RDMA消息通常包含多個數據包,只要有一個數據包錯誤,則從這個數據包起的所有數據包都要重傳。這讓偶爾的傳輸錯誤被放大,加劇了網絡擁塞。UEC采用選擇性重傳機制,僅傳輸錯誤的數據包。

亂序交付

(Out-of-Order Delivery)

UET不僅支持有序傳輸,也支持無序傳輸。這是因為現代網絡中通常有多路徑存在,同一個流的數據包經過不同路徑傳輸,就可能造成亂序。如果還要求嚴格的順序傳輸,就無法利用多路徑來實現負載分擔。此外,選擇性重傳也需要無序傳輸的支持。為了實現無序傳輸,需要接收方有更大的數據包緩沖區,從而將亂序的數據包組成一個完整的RDMA消息。

UET支持四種傳輸方式:

? ROD (Reliable Ordered Delivery)

– 需要擁塞控制、有序、可靠、無重傳(依舊采用Go-Back-N)

? RUD (Reliable Unordered Delivery)

– 需要擁塞控制、無序、可靠、無重傳

? RUDI (RUD for Idempotent Operations)

– 可選擁塞控制、無序、可靠、重傳

? UUD (Unreliable Unordered Delivery)

– 可選擁塞控制、無序、不可靠、重傳

包噴灑

(Packet Spraying)

包噴灑是一種基于包的多路徑傳輸。由于傳統傳輸協議不支持無序傳輸,同一個數據流必須按照同一個路徑傳輸,否則就會造成亂序,引發重傳。而在AI/HPC應用中,存在大量的“大象流”,它們數據量大、持續時間長,如果能使用多路徑傳輸一個流,將顯著提高整個網絡的利用率。

由于支持了RUD,UET就可以將同一個流的不同包分散到多個路徑上同時傳輸,實現包噴灑功能。這讓交換機可以充分發揮ECMP甚至WCMP(Weighted Cost Multi- Pathing)路由能力,將去往同一目的地的數據包通過多條路徑發送,大幅度提高網絡利用率。

擁塞控制

(Congestion Control)

UET 擁塞控制包含以下重要特性,由端側硬件和交換機配合完成,有效減小了尾部延遲。

? **Incast管理。**它用于解決集合通信(Collective)中下行鏈路上的扇入問題。AI和HPC應用經常采用集合通信在多個節點之間同步信息,當多個發送者同時向一個接收者發送流量,就會產生Incast擁塞。

? **速率調整加速。**現有的擁塞控制算法,在發生網絡擁塞后調整速率的過程較長,而 UET 可以快速上升到線速。方法是測量端到端延遲來調節發送速率,以及根據接收方的能力通知發送方調整速率。

? **基于遙測。**源自網絡的擁塞信息可以通告擁塞的位置和原因,縮短擁塞信令路徑并向終端節點提供更多信息,從而實現響應速度更快的擁塞控制。

? 基于包噴灑的自適應路由 。當擁塞發生時,通過包噴灑技術將流量重新路由到其它路徑上,繞過擁塞點。

端到端的安全

UEC在傳輸層內置安全。它是基于作業(Job)的,可以對整個作業的流量進行端到端的AES加密,充分利用 IPSec 和PSP(Packet Security Protocol)的能力,減小安全加密的開銷,提供可擴展安全域,并且可以由硬件卸載。

在網計算

(In Network Collectives)

在網計算最早應用在HPC集群,業界主要有兩個思路,一是基于網卡的,二是基于交換機。

UEC V1.0 的目標是后者,即將集合操作卸載到各級交換機上完成,避免過多的收發次數,降低節點交互頻率和處理時延開銷,減少約一半數據傳輸量,從而加速All-Reduce操作。

在部署實現上,目前AI智算領域唯一大規模商用的案例僅有英偉達的SHARP(在ASIC層面實現的硬件加速),以太網設備廠家仍處在探索階段,例如將算力內置于交換機或外接,甚至P4可編程都是可能的思路方向。

軟件層:Extended Libfabrics 2.0

在軟件層,UEC提供簡化的API。它簡化了RDMA操作,并為AI和HPC應用提供專用的API,如xCCL, MPI, PGAS和OpenShmem等。

硬件升級:支持UEC的交換機和網卡

UEC在規范中定義了支持超級以太網交換機的架構,可以看到大體是繼承了SONiC的架構。這部分的主要關注在于控制平面上支持INC和SDN控制器;數據平面升級了SAI(Switch Abstraction Interface)API調用硬件提供的INC等能力。

UEC同樣定義了網絡端點(Fabric End Point)的軟硬件架構。在硬件層,網卡升級支持UEC功能。在操作系統內核態,實現網卡驅動。在用戶態,基于libfabric擴展實現INC管理等功能,支持上層的xCCL/MPI/SHMEM等應用。

總的來說,UEC v1.0規范重構了數據中心以太網以完全替代傳統的RDMA網絡,用更高的性能、更低的成本實現穩定可靠、具有百萬節點的AI/HPC集群。

星融元RoCE交換機與UEC

作為UEC成員單位,星融元提供的超低時延RoCE交換機(CX-N系列)全系采用高性能的標準白盒網絡硬件,搭載為生產環境深度調優的企業級SONiC發行版——多項 Easy RoCE 特性,全面兼容現有規范并提供靈活、廣大的升級空間,未來將平滑演進與新一代以太網標準保持同步。

[搶先圍觀!星融元51.2T 800G RoCE交換機測試]

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 以太網
    +關注

    關注

    40

    文章

    5385

    瀏覽量

    171160
  • 通信
    +關注

    關注

    18

    文章

    5977

    瀏覽量

    135869
  • 網絡
    +關注

    關注

    14

    文章

    7523

    瀏覽量

    88649
  • RDMA
    +關注

    關注

    0

    文章

    76

    瀏覽量

    8929
收藏 人收藏

    評論

    相關推薦

    Qorvo在射頻和電源管理領域的最新進展

    了半導體行業的重大變革,還成功引領Qorvo成為射頻技術的領導者。在本次專訪中,Philip將為大家分享Qorvo在射頻和電源管理領域的最新進展,并探討HPA事業部如何通過技術創新應對全球電氣化和互聯化的挑戰。
    的頭像 發表于 11-17 10:57 ?350次閱讀

    小鵬汽車圖靈芯片及L4自動駕駛新進展

    的特定領域架構,進一步提升了其處理能力。 據悉,小鵬汽車已在今年10月份成功在圖靈芯片上跑通了智能駕駛功能,這標志著公司在智能駕駛領域取得了重要進展。 除了圖靈芯片,何小鵬還透露了小鵬汽車在L4級自動駕駛方面的最新進展。他表示,
    的頭像 發表于 11-08 11:01 ?891次閱讀

    芯片和封裝級互連技術的最新進展

    近年來,計算領域發生了巨大變化,通信已成為系統性能的主要瓶頸,而非計算本身。這一轉變使互連技術 - 即實現計算系統各組件之間數據交換的通道 - 成為計算機架構創新的焦點。本文探討了通用、專用和量子計算系統中芯片和封裝級互連的最新進展,并強調了這一快速發展領域的關鍵技術、挑戰和機遇。
    的頭像 發表于 10-28 09:50 ?331次閱讀

    高燃回顧|第三屆OpenHarmony技術大會精彩瞬間

    第三屆OpenHarmony技術大會圓滿落幕 全球開源精英齊聚 共同展示OpenHarmony技術、生態、人才的最新進展 見證OpenHarmony南北向生態繁榮 共繪開源生態發展藍圖 星光璀璨致謝
    發表于 10-16 18:47

    5G新通話技術取得新進展

    在探討5G新通話這一話題時,我們需首先明確其背景與重要性。自2022年4月國內運營商正式推出以來,5G新通話作為傳統語音通話的升級版,迅速吸引了公眾的目光,并引起了社會的廣泛關注。它基于5G網絡,代表了通信技術的新進展
    的頭像 發表于 10-12 16:02 ?544次閱讀

    定義AI Agent四大核心能力,榮耀IFA劇透端側AI創新進展

    ,榮耀CEO趙明在2024德國柏林消費電子展(Internationale Funkausstellung Berlin,以下簡稱IFA)再度帶來端側AI創新最新進展,首次向外界透露榮耀AI
    的頭像 發表于 09-10 11:42 ?231次閱讀
    定義AI Agent四大核心能力,榮耀IFA劇透端側AI創<b class='flag-5'>新進展</b>

    廣東的5G-A、信號升格和低空經濟,又有新進展

    了兩地的5G/5G-A、智算等數字基礎設施建設,深入了解了他們在信號升格和低空經濟方面的最新進展。活動一共持續了三天,前后跑了8個項目,雖然很累,但收獲滿滿。接下
    的頭像 發表于 04-19 08:05 ?821次閱讀
    廣東的5G-A、信號升格和低空經濟,又有<b class='flag-5'>新進展</b>!

    百度首席技術官王海峰解讀文心大模型的關鍵技術和最新進展

    4月16日,以“創造未來”為主題的Create 2024百度AI開發者大會在深圳國際會展中心成功舉辦。百度首席技術官王海峰以“技術筑基,星河璀璨”為題,發表演講,解讀了智能體、代碼、多模型等多項文心大模型的關鍵技術和最新進展
    的頭像 發表于 04-18 09:20 ?669次閱讀
    百度首席技術官王海峰解讀文心大模型的關鍵技術和<b class='flag-5'>最新進展</b>

    官網上線!4月16日-17日,揭秘百度Create大會“AI公開課”

    3月5日,百度Create AI開發者大會官方網站正式上線。本次大會將于20244月16日至17日在深圳國際會展中心(寶安)舉辦,屆時不僅會帶來AI技術的最新進展,還將設置30節“
    的頭像 發表于 03-06 15:30 ?894次閱讀

    四個50億+,多個半導體項目最新進展

    來源:全球半導體觀察,謝謝 編輯:感知芯視界 Link 近日,半導體行業多個項目迎來最新進展,其中浙江麗水特色工藝晶圓制造項目、浙江中寧硅業硅碳負極材料及高純硅烷系列產品項目、晶隆半導體材料及器件
    的頭像 發表于 02-27 09:35 ?969次閱讀

    清華大學在電子鼻傳感器仿生嗅聞方向取得新進展

    近日,清華大學機械系在電子鼻仿生嗅聞研究中取得新進展,相關研究成果以“Sniffing Like a Wine Taster: Multiple Overlapping Sniffs (MOSS
    的頭像 發表于 02-20 10:57 ?934次閱讀
    清華大學在電子鼻傳感器仿生嗅聞方向取得<b class='flag-5'>新進展</b>

    800G以太網技術到底有何好處?

    5G和50G以太網聯盟標準提供了基于8 lanex100Gb/s技術的800G實施規范,使采用者能夠部署先進的高帶寬互操作以太網技術。
    發表于 01-16 18:22 ?844次閱讀
    800G<b class='flag-5'>以太網</b>技術到底有何好處?

    兩家企業有關LED項目的最新進展

    近日,乾富半導體與英創力兩家企業有關LED項目傳來最新進展
    的頭像 發表于 01-15 13:37 ?659次閱讀

    萬兆以太網規范解讀

    就目前來說,萬兆以太網標準和規范都比較繁多,在標準方面,有 2002 年的IEEE 802.3ae,2004 年的 IEEE 802.3ak,2006 年的 IEEE 802.3an、IEEE
    的頭像 發表于 01-15 10:21 ?2358次閱讀
    萬兆<b class='flag-5'>以太網</b><b class='flag-5'>規范</b>解讀

    超越傳統以太網揭秘UEC工作組的最新進展

    以太網聯盟致力于從物理層、鏈路層、傳輸層、軟件層改進以太網技術,在兼容當前以太網生態的前提下,提升以太網的轉發性能,致力于改進
    發表于 12-12 15:05 ?4607次閱讀
    超越傳統<b class='flag-5'>以太網</b>,<b class='flag-5'>揭秘</b><b class='flag-5'>UEC</b>工作組的<b class='flag-5'>最新進展</b>!