精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

看看RDMA讓網絡實現低時延的絕招

中興文檔 ? 來源:中興文檔 ? 作者:中興文檔 ? 2022-11-15 09:46 ? 次閱讀

數據中心現狀

隨著“新基建”將5G人工智能工業互聯網列為新型基礎領域,機器學習智能語音交互、自動駕駛等一大批基于高性能計算的應用層出不窮,這些應用帶來了數據的爆炸式增長,給數據中心的處理能力帶來了很大的挑戰。

計算、存儲和網絡是推動數據中心發展的三駕馬車。計算隨著CPUGPUFPGA的發展,算力得到了極大的提升。存儲隨著閃存盤(SSD)的引入,數據存取時延已大幅降低。但是網絡的發展明顯滯后,傳輸時延高,逐漸成為了數據中心高性能的瓶頸。

e9e9c194-6473-11ed-8abf-dac502259ad0.png

在數據中心內,70%的流量為東西向流量(服務器之間的流量),這些流量一般為數據中心進行高性能分布式并行計算時的過程數據流,通過TCP/IP網絡傳輸。如果服務器之間的TCP/IP 傳輸速率提升了,數據中心的性能自然也會跟著提升。

ea04aa54-6473-11ed-8abf-dac502259ad0.png

下面我們就來看看服務器之間數據TCP/IP 傳輸的過程,了解下“時間都去哪了”,才好“對癥下藥”。

服務器間的TCP/IP傳輸

在數據中心,服務器A向服務器B發送數據的過程如下:

1、CPU控制數據由A的APP Buffer拷貝到操作系統Buffer。

2、CPU控制數據在操作系統(OS)Buffer中添加TCP、IP報文頭。

3、添加TCP、IP報文頭后的數據傳送到網卡(NIC),添加以太網報文頭。

4、報文由網卡發送,通過以太網絡傳輸到服務器B網卡。

5、服務器B網卡卸載報文的以太網報文頭后,將其傳輸到操作系統Buffer。

6、CPU控制操作系統Buffer中的報文卸載TCP、IP報文頭。

7、CPU控制卸載后的數據傳輸到APP Buffer中。

ea38b1b4-6473-11ed-8abf-dac502259ad0.png

從數據傳輸的過程可以看出,數據在服務器的Buffer內多次拷貝,在操作系統中需要添加/卸載TCP、IP報文頭,這些操作既增加了數據傳輸時延,又消耗了大量的CPU資源,無法很好得滿足高性能計算的需求。

那么,如何構造高吞吐量、超低時延和低CPU開銷的高性能數據中心網絡呢?RDMA技術可以做到。

什么是RDMA

RDMA( Remote Direct Memory Access,遠程直接地址訪問技術 )是一種新的內存訪問技術,可以讓服務器直接高速讀寫其他服務器的內存數據,而不需要經過操作系統/CPU耗時的處理。

RDMA不算是一項新技術,已經廣泛應用于高性能(HPC)科學計算中。隨著數據中心高帶寬、低時延的發展需求,RDMA也開始逐漸應用于某些要求數據中心具備高性能的場景中。

舉個例子,2021年某大型網上商城的雙十一交易額再創新高,達到5000多億,比2020年又增長了近10%。如此巨大的交易額背后是海量的數據處理,該網上商城采用了RDMA技術來支撐高性能網絡,保障了雙十一的順暢購物。

下面我們一起來看看RDMA讓網絡實現低時延的絕招吧。

RDMA將服務器應用數據直接由內存傳輸到智能網卡(固化RDMA協議),由智能網卡硬件完成RDMA傳輸報文封裝,解放了操作系統和CPU。

ea6f6d12-6473-11ed-8abf-dac502259ad0.png

這使得RDMA具有兩大優勢:

Zero Copy(零拷貝):無需將數據拷貝到操作系統內核態并處理數據包頭部的過程,傳輸延遲會顯著減小。

Kernel Bypass(內核旁路)和Protocol Offload(協議卸載):不需要操作系統內核參與,數據通路中沒有繁瑣的處理報頭邏輯,不僅會使延遲降低,而且也大大節省了CPU的資源。

ea949f1a-6473-11ed-8abf-dac502259ad0.png

三大RDMA網絡

目前,大致有三類RDMA網絡,分別是InfiniBand、RoCE(RDMA over Converged Ethernet,RDMA過融合以太網)和iWARP(RDMA over TCP,互聯網廣域RDMA協議)。RDMA最早專屬于Infiniband網絡架構,從硬件級別保證可靠傳輸,而RoCE 和 iWARP都是基于以太網的RDMA技術。

InfiniBand

InfiniBand是一種專為RDMA設計的網絡。

采用Cut-Through轉發模式(直通轉發模式),減少轉發時延。

基于Credit的流控機制(基于信用的流控機制),保證無丟包。

要求InfiniBand專用的網卡、交換機和路由器,建網成本最高。

RoCE

傳輸層為InfiniBand協議。

RoCE有兩個版本:RoCEv1基于以太網鏈路層實現,只能在L2層傳輸;RoCEv2基于UDP承載RDMA,可部署于三層網絡。

需要支持RDMA專用智能網卡,不需要專用交換機和路由器(支持ECN/PFC等技術,降低丟包率),建網成本最低。

iWARP

傳輸層為iWARP協議。

iWARP是以太網TCP/IP協議中TCP層實現,支持L2/L3層傳輸,大型組網TCP連接會消耗大量CPU,所以應用很少。

iWARP只要求網卡支持RDMA,不需要專用交換機和路由器,建網成本介于InfiniBand和RoCE之間。

Infiniband技術先進,但是價格高昂,應用局限在HPC高性能計算領域,隨著RoCE和iWARPC的出現,降低了RDMA的使用成本,推動了RDMA技術普及。

在高性能存儲、計算數據中心中采用這三類RDMA網絡,都可以大幅度降低數據傳輸時延,并為應用程序提供更高的CPU資源可用性。其中InfiniBand網絡為數據中心帶來極致的性能,傳輸時延低至百納秒,比以太網設備延時要低一個量級。

RoCE和iWARP網絡為數據中心帶來超高性價比,基于以太網承載RDMA,充分利用了RDMA的高性能和低CPU使用率等優勢,同時網絡建設成本也不高。

基于UDP協議的RoCE比基于TCP協議的iWARP性能更好,結合無損以太網的流控技術,解決了丟包敏感的問題,RoCE網絡已廣泛應用于各行業高性能數據中心中。

結語

隨著5G、人工智能、工業互聯網等新型領域的發展,RDMA技術的應用會越來越普及,RDMA將成為助力數據中心高性能的一大功臣。







審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1626

    文章

    21675

    瀏覽量

    601982
  • SSD
    SSD
    +關注

    關注

    20

    文章

    2851

    瀏覽量

    117240
  • RDMA
    +關注

    關注

    0

    文章

    76

    瀏覽量

    8928

原文標題:RDMA能給數據中心帶來什么

文章出處:【微信號:ztedoc,微信公眾號:中興文檔】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    RoCE與IB對比分析(一):協議棧層級篇

    在 AI 算力建設中, RDMA 技術是支持高吞吐、延遲網絡通信的關鍵。目前,RDMA技術主要通過兩種方案實現:Infiniband和Ro
    的頭像 發表于 11-15 13:58 ?817次閱讀
    RoCE與IB對比分析(一):協議棧層級篇

    2.34納秒超低時,滿足金融市場高頻交易,AMD發布新一代金融加速卡

    是降低成本和獲得利潤的關鍵所在。 ? 近日,AMD推出Alveo UL3422 加速卡,它是由 AMD Virtex UltraScale+ FPGA 提供支持,其采用新穎的收發器架構,具備硬化且經過優化的網絡連接核,專為高速交易定制打造。它可實現超低時
    的頭像 發表于 11-11 01:13 ?1069次閱讀
    2.34納秒超低時<b class='flag-5'>延</b>,滿足金融市場高頻交易,AMD發布新一代金融加速卡

    以太網RDMA RoCE的技術局限

    上期我們講到了RDMA的WHY,WHAT & HOW(AI網絡背景下RDMA的Why,What & How),這一期我們來談一談RDMA的不足。
    的頭像 發表于 10-22 10:02 ?221次閱讀
    以太網<b class='flag-5'>RDMA</b> RoCE的技術局限

    TLV3201電流檢測電路的時應該怎么算?

    TLV3201請教一下大佬。這種電流檢測電路的時應該怎么算?這里的時指的是從輸入電流發生變化到比較器輸出反饋的時間。 我的理解是放大器的建立時間+比較器的傳輸時嘛?比如按照以下放大器和比較器手冊中的數據,整個鏈路上的
    發表于 07-31 07:19

    HarmonyOS實戰開發-如何實現音頻錄制和播放,AudioVivid音樂播放的相關功能

    ||||---Ability.test.ets // 自動化測試用例 具體實現 音頻錄制和播放-源碼參考:audioRecording.cpp錄制開發指導文檔
    發表于 05-11 20:26

    金融信創優秀解決方案-超低時網絡解決方案

    本方案基于中科馭數自主研發的網絡DPU卡SWIFT-2200N和超低時數據處理開發平臺SWIFT-NDPP
    的頭像 發表于 04-30 14:29 ?794次閱讀
    金融信創優秀解決方案-超低時<b class='flag-5'>延</b><b class='flag-5'>網絡</b>解決方案

    KPU FLEXFLOW? -2100R是中科馭數完全自研的首款具備RDMA功能的DPU加速卡#RDMA

    DPURDMA
    中科馭數(北京)科技有限公司
    發布于 :2024年03月25日 18:40:59

    利用CXL技術重構基于RDMA的內存解耦合

    本文提出了一種基于RDMA和CXL的新型延遲、高可擴展性的內存解耦合系統Rcmp。其顯著特點是通過CXL提高了基于RDMA系統的性能,并利用RDMA克服了CXL的距離限制。
    發表于 02-29 10:05 ?2653次閱讀
    利用CXL技術重構基于<b class='flag-5'>RDMA</b>的內存解耦合

    Multi-Channel PCIe QDMA&RDMA IP應用介紹

    Scather Gather DMA,提供FIFO/AXI4-Stream用戶接口。基于PCI Express Integrated Block,Multi-Channel PCIe RDMA Subsystem實現了使用DMA Ring緩沖的獨立多通道、高性能/超低延時
    發表于 02-22 14:34 ?1次下載

    RDMA RNIC虛擬化方案

    遠程直接內存訪問(Remote Direct Memory Access,RDMA)技術允許應用程序繞過操作系統內核,以零拷貝的方式和遠程計算機進行網絡通信,具有延遲和高帶寬的優勢。RDMA
    的頭像 發表于 01-23 17:23 ?1827次閱讀
    <b class='flag-5'>RDMA</b> RNIC虛擬化方案

    國產技術創新與實踐分享|2024技術創新實踐論壇精彩回顧來啦!

    1月19日下午,由中科馭數主辦的第二屆證券基金行業先進計算技術大會暨2024技術創新實踐論壇(上海站)圓滿落幕。本次論壇得到了中國計算機學會集成電路設計專委、中國電子工業標準化技術協會新一代
    的頭像 發表于 01-20 11:40 ?1260次閱讀

    深入了解RDMA技術

    Explorer,專注于高性能網絡、虛擬化網絡及網卡的測試方案研究。熟悉dpdk,rdma,sdn等技術的應用與解決方案。
    的頭像 發表于 12-26 09:23 ?1630次閱讀
    深入了解<b class='flag-5'>RDMA</b>技術

    rdma網絡是什么?RDMA網絡有什么應用場景?

    RDMA(Remote Direct Memory Access)網絡是一種技術,它通過網絡直接在計算機之間傳輸數據,而無需雙方操作系統的介入。這種技術可以允許高吞吐、延遲的
    的頭像 發表于 12-22 09:30 ?1108次閱讀

    你的聲音被聽到:看看你的TWS耳塞是怎么設計的

    你的聲音被聽到:看看你的TWS耳塞是怎么設計的
    的頭像 發表于 12-05 17:25 ?533次閱讀
    <b class='flag-5'>讓</b>你的聲音被聽到:<b class='flag-5'>看看</b>你的TWS耳塞是怎么設計的

    RDMA和TCP/IP有什么區別

    在分布式存儲網絡中,我們使用的協議有RoCE、Infiniband(IB)和TCP/IP。其中RoCE和IB屬于RDMA (RemoteDirect Memory Access)技術,他和傳統的TCP/IP有什么區別呢,接下來我們將做詳細對比。
    的頭像 發表于 11-30 09:19 ?1688次閱讀
    <b class='flag-5'>RDMA</b>和TCP/IP有什么區別