精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RDMA技術(shù)簡(jiǎn)介

Linux閱碼場(chǎng) ? 來源:Linux閱碼場(chǎng) ? 2023-04-13 10:48 ? 次閱讀

13.3 RDMA 協(xié)議

RDMA 指的是一種遠(yuǎn)程直接存儲(chǔ)器訪問技術(shù)。具體到協(xié)議層面,它主要包含 InfiniBand、RoCE 和 iWARP 三種協(xié)議。三種協(xié)議都符合 RDMA 標(biāo)準(zhǔn),共享相同的上層用戶接口(Verbs),只是在不同層次上有一些差別。圖 13-6 對(duì)比了這幾個(gè)協(xié)議在不同層次上的差異。

ce00fcdc-d92f-11ed-bfe3-dac502259ad0.png

RDMA 技術(shù)簡(jiǎn)介

13.3.1 InfiniBand

InfiniBand(直譯為“無限帶寬”,縮寫為 IB)是一個(gè)用于高性能計(jì)算的計(jì)算機(jī)網(wǎng)絡(luò)通信標(biāo)準(zhǔn),它具有極高的吞吐量和極低的時(shí)延,在 2000 年由 IBTA(InfiniBand TradeAssociation)提出。IBTA 是 RDMA 技術(shù)最主要的倡導(dǎo)者和先行者,其規(guī)定了一整套完整的鏈路層到傳輸層(和傳統(tǒng) OSI 七層模型的傳輸層不同)規(guī)范,如圖 13-7 所示。但是 InfiniBand無法兼容現(xiàn)有以太網(wǎng),如果企業(yè)想部署的話,除了需要專用網(wǎng)卡之外,還要重新購(gòu)買配套的網(wǎng)絡(luò)交換設(shè)備

ce333404-d92f-11ed-bfe3-dac502259ad0.png

13.3.2 RoCE

基于融合以太網(wǎng)的 RDMA(RDMA over Converged Ethernet,RoCE)也是由 IBTA 定義的。InfiniBand 架構(gòu)規(guī)范定義了如何通過 InfiniBand 網(wǎng)絡(luò)執(zhí)行 RDMA,而 RoCE 則定義了如何通過以太網(wǎng)網(wǎng)絡(luò)執(zhí)行 RDMA。RoCE 有 RoCEv1 和 RoCEv2 兩個(gè)版本。如圖 13-6 所示,RoCE v1 的網(wǎng)絡(luò)層使用了InfiniBand 規(guī)范,鏈路層使用以太網(wǎng)協(xié)議,因此允許同一個(gè)以太網(wǎng)廣播域中的兩臺(tái)主機(jī)進(jìn)行通信。RoCEv2 使用了“UDP+IP”作為網(wǎng)絡(luò)層,是一個(gè)“網(wǎng)絡(luò)層+鏈路層”協(xié)議,因此 RoCE v2網(wǎng)絡(luò)中的數(shù)據(jù)包可以被路由。RoCE 被認(rèn)為是 InfiniBand 的“低成本解決方案”,將 InfiniBand傳輸層的報(bào)文封裝成以太網(wǎng)數(shù)據(jù)包進(jìn)行收發(fā)(也就是說 RoCE 仍然使用 InfiniBand 傳輸層,見圖 13-6)。由于 RoCE 可以使用以太網(wǎng)交換設(shè)備,因此在企業(yè)中的應(yīng)用比較多,但是其在相同場(chǎng)景下相比 InfiniBand 會(huì)有一些性能方面的損失。

RoCE 與 InfiniBand 有如下幾個(gè)技術(shù)差異。

? 鏈路級(jí)流量控制。InfiniBand 使用基于信用(credit-based)的算法來保證無損的網(wǎng)絡(luò)通信。RoCE 的實(shí)現(xiàn)需要無損以太網(wǎng)網(wǎng)絡(luò),以達(dá)到類似 InfiniBand 的性能。無損以太網(wǎng)通常通過以太網(wǎng)流量控制或優(yōu)先級(jí)流量控制(PFC)進(jìn)行配置,配置一個(gè)無損以太網(wǎng)網(wǎng)絡(luò)比配置一個(gè) InfiniBand 網(wǎng)絡(luò)復(fù)雜。

? 阻塞控制。InfiniBand 定義了基于 FECN/BECN 標(biāo)記的阻塞控制協(xié)議。RoCEv2 定義了一種使用 ECN 進(jìn)行標(biāo)記、CNP 幀進(jìn)行反饋的阻塞控制協(xié)議,網(wǎng)絡(luò)中的交換機(jī)中需要支持 ECN 功能。

? InfiniBand 交換機(jī)的時(shí)延通常低于以太網(wǎng)交換機(jī)。在以太網(wǎng)鏈路層上使用 RDMA 應(yīng)用程序時(shí),應(yīng)注意以下幾點(diǎn)。

? 網(wǎng)絡(luò)中不需要子網(wǎng)管理器。對(duì)于那些需要與子網(wǎng)管理器通信的操作,在 RoCE 網(wǎng)絡(luò)中會(huì)以不同的方式進(jìn)行管理。

? 由于 LID 是 InfiniBand 協(xié)議棧鏈路層的屬性,其在 RoCE 網(wǎng)絡(luò)中無效,因此在查詢RoCE 網(wǎng)卡的端口時(shí),LID 顯示為零。

? 因?yàn)樽泳W(wǎng)管理器不存在,所以無法查詢路徑。因此,在建立連接之前,必須將相關(guān)的值填充進(jìn)路徑記錄結(jié)構(gòu)。建議使用 RDMA CM 建立連接,因?yàn)樗梢载?fù)責(zé)填充路徑記錄結(jié)構(gòu)。

? RoCE 設(shè)備的流量不顯示在相關(guān)以太網(wǎng)設(shè)備的計(jì)數(shù)器(比如 ifconfig 命令的輸出中可以看到的收發(fā)包計(jì)數(shù))中,因?yàn)樗臄?shù)據(jù)收發(fā)不通過以太網(wǎng)設(shè)備驅(qū)動(dòng)程序。RoCE 設(shè)備 和 InfiniBand 設(shè)備的流量統(tǒng)計(jì)都在 /sys/class/infiniband//ports//counters/目錄下。作者使用的 Mellanox ConnectX-5 100G 網(wǎng)卡就是一種 RoCE 設(shè)備。在安裝了該設(shè)備的機(jī)器上,執(zhí)行 ibv_devinfo 命令可以獲取如下比較詳細(xì)的設(shè)備信息,如下所示。

ce4bca96-d92f-11ed-bfe3-dac502259ad0.png

從其中的 transport: InfiniBand 可以看出其傳輸層為 InfiniBand 傳輸層,link_layer: Ethernet表示它支持以太網(wǎng)鏈路層,再結(jié)合圖 13-6,就可以確認(rèn)這是一種符合 IBTA 定義的 RoCE 類型的 RDMA 設(shè)備。另外,port_lid: 0 表示其 LID 為 0(LID 對(duì) RoCE 無意義)。執(zhí)行 cma_roce_mode 命令可以獲知此網(wǎng)卡當(dāng)前支持的 RoCE 版本為 RoCEv2。

ce63af12-d92f-11ed-bfe3-dac502259ad0.png

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 以太網(wǎng)
    +關(guān)注

    關(guān)注

    40

    文章

    5385

    瀏覽量

    171160
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    38

    文章

    7455

    瀏覽量

    163622
  • 接口
    +關(guān)注

    關(guān)注

    33

    文章

    8526

    瀏覽量

    150861
  • InfiniBand
    +關(guān)注

    關(guān)注

    1

    文章

    29

    瀏覽量

    9183
  • RDMA
    +關(guān)注

    關(guān)注

    0

    文章

    76

    瀏覽量

    8929

原文標(biāo)題:好書連載 | RDMA技術(shù)簡(jiǎn)介(3)

文章出處:【微信號(hào):LinuxDev,微信公眾號(hào):Linux閱碼場(chǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    深入了解RDMA技術(shù)

    Explorer,專注于高性能網(wǎng)絡(luò)、虛擬化網(wǎng)絡(luò)及網(wǎng)卡的測(cè)試方案研究。熟悉dpdk,rdma,sdn等技術(shù)的應(yīng)用與解決方案。
    的頭像 發(fā)表于 12-26 09:23 ?1637次閱讀
    深入了解<b class='flag-5'>RDMA</b><b class='flag-5'>技術(shù)</b>

    RDMA RNIC虛擬化方案

    遠(yuǎn)程直接內(nèi)存訪問(Remote Direct Memory Access,RDMA技術(shù)允許應(yīng)用程序繞過操作系統(tǒng)內(nèi)核,以零拷貝的方式和遠(yuǎn)程計(jì)算機(jī)進(jìn)行網(wǎng)絡(luò)通信,具有低延遲和高帶寬的優(yōu)勢(shì)。RDMA協(xié)議
    的頭像 發(fā)表于 01-23 17:23 ?1832次閱讀
    <b class='flag-5'>RDMA</b> RNIC虛擬化方案

    利用CXL技術(shù)重構(gòu)基于RDMA的內(nèi)存解耦合

    本文提出了一種基于RDMA和CXL的新型低延遲、高可擴(kuò)展性的內(nèi)存解耦合系統(tǒng)Rcmp。其顯著特點(diǎn)是通過CXL提高了基于RDMA系統(tǒng)的性能,并利用RDMA克服了CXL的距離限制。
    發(fā)表于 02-29 10:05 ?2656次閱讀
    利用CXL<b class='flag-5'>技術(shù)</b>重構(gòu)基于<b class='flag-5'>RDMA</b>的內(nèi)存解耦合

    基于RDMA技術(shù)的Spark Shuffle性能提升

    一篇文章教你使用RDMA技術(shù)提升Spark的Shuffle性能
    發(fā)表于 10-28 16:46

    技術(shù)盛宴 | 淺析RDMA網(wǎng)絡(luò)下MMU水線設(shè)置

    了廣泛應(yīng)用。為保障RDMA的穩(wěn)定運(yùn)行,基礎(chǔ)網(wǎng)絡(luò)需要提供端到端無損零丟包及超低延時(shí)的能力,這也催生了PFC、ECN等網(wǎng)絡(luò)流控技術(shù)RDMA網(wǎng)絡(luò)中的部署。在RDMA網(wǎng)絡(luò)中,如何合理設(shè)置MM
    發(fā)表于 11-22 12:44 ?1132次閱讀

    基于RDMA網(wǎng)絡(luò)的MMU水線設(shè)置步驟與應(yīng)用實(shí)例

    RDMA(Remote Direct Memory Access),通俗的說就是遠(yuǎn)程的DMA技術(shù),是為了解決網(wǎng)絡(luò)傳輸中服務(wù)器端數(shù)據(jù)處理的延遲而產(chǎn)生的。
    的頭像 發(fā)表于 01-02 16:15 ?3953次閱讀
    基于<b class='flag-5'>RDMA</b>網(wǎng)絡(luò)的MMU水線設(shè)置步驟與應(yīng)用實(shí)例

    如何選擇最適合自己的RDMA網(wǎng)卡

    近些年來,RDMA網(wǎng)卡的技術(shù)應(yīng)用在全球以太網(wǎng)通訊市場(chǎng)上刮起一股旋風(fēng),特別是阿里、騰訊、浪潮、超微、聯(lián)想等一些互聯(lián)網(wǎng)巨頭企業(yè)在服務(wù)器上大量部署RDMA網(wǎng)卡。2019年,據(jù)官方數(shù)據(jù)報(bào)道,天貓雙11當(dāng)天
    發(fā)表于 10-21 15:35 ?702次閱讀

    RDMA是什么?RDMA網(wǎng)卡有什么作用?

    近幾年RDMA這個(gè)詞在行業(yè)內(nèi)炒的如火如荼,但是很多人表示RDMA具體是什么?主要應(yīng)用在哪些領(lǐng)域,有什么作用?RDMA都有哪幾種協(xié)議?今天小編就這幾個(gè)問題給大家科普一下。
    發(fā)表于 12-27 17:15 ?1.2w次閱讀

    RDMA技術(shù)有助于實(shí)現(xiàn)網(wǎng)絡(luò)和設(shè)備的性能提升

    RDMA作為一種遠(yuǎn)程直接內(nèi)存訪問技術(shù),可以使數(shù)據(jù)通過應(yīng)用程序繞過CPU直達(dá)網(wǎng)卡,實(shí)現(xiàn)低延遲、低負(fù)載、高效率的數(shù)據(jù)傳輸。從而提升網(wǎng)絡(luò)和設(shè)備性能。
    發(fā)表于 03-28 15:03 ?594次閱讀

    RDMA技術(shù)簡(jiǎn)介 RDMA的控制通路和數(shù)據(jù)通路方案

    RDMA 技術(shù)基于傳統(tǒng)以太網(wǎng)的網(wǎng)絡(luò)概念,但與以太網(wǎng)網(wǎng)絡(luò)中的同類技術(shù)存在差異。關(guān)鍵區(qū) 別在于,RDMA 提供了一種消息服務(wù),應(yīng)用程序可以使用該服務(wù)直接訪問遠(yuǎn)程計(jì)算機(jī)上的虛擬內(nèi)存。
    發(fā)表于 04-10 09:59 ?1762次閱讀

    RDMA技術(shù)簡(jiǎn)介

    iWARP(Internet Wide Area RDMA Protocol)是 IETF 定義的基于 TCP 的 RDMA,它和RoCE v2 都可以路由。因?yàn)?TCP 是面向連接的可靠協(xié)議,這使
    的頭像 發(fā)表于 04-20 09:49 ?3038次閱讀
    <b class='flag-5'>RDMA</b><b class='flag-5'>技術(shù)</b><b class='flag-5'>簡(jiǎn)介</b>

    什么是RDMA?什么是RoCE網(wǎng)絡(luò)技術(shù)

    在數(shù)據(jù)為王的時(shí)代,人們對(duì)網(wǎng)絡(luò)的要求更加嚴(yán)苛。然而傳統(tǒng)的TCP / IP以太網(wǎng)連接占用了大量的CPU資源,并且需要額外的數(shù)據(jù)處理,已無法再滿足當(dāng)前更快、更高效和可擴(kuò)展性的網(wǎng)絡(luò)需求。在這種情況下,RoCE(RDMA over Converged Ethernet )走進(jìn)了人們的視野。
    的頭像 發(fā)表于 07-24 17:40 ?6919次閱讀
    什么是<b class='flag-5'>RDMA</b>?什么是RoCE網(wǎng)絡(luò)<b class='flag-5'>技術(shù)</b>?

    Redis RDMA改造方案分析

    RDMA傳輸?shù)倪m配,從業(yè)務(wù)場(chǎng)景的使用角度來看,大致可分為如下幾種類型。
    的頭像 發(fā)表于 08-16 10:22 ?2257次閱讀
    Redis <b class='flag-5'>RDMA</b>改造方案分析

    rdma網(wǎng)絡(luò)是什么?RDMA網(wǎng)絡(luò)有什么應(yīng)用場(chǎng)景?

    RDMA(Remote Direct Memory Access)網(wǎng)絡(luò)是一種技術(shù),它通過網(wǎng)絡(luò)直接在計(jì)算機(jī)之間傳輸數(shù)據(jù),而無需雙方操作系統(tǒng)的介入。這種技術(shù)可以允許高吞吐、低延遲的網(wǎng)絡(luò)通信,尤其適合在大規(guī)模并行計(jì)算機(jī)集群中使用。
    的頭像 發(fā)表于 12-22 09:30 ?1108次閱讀

    以太網(wǎng)RDMA RoCE的技術(shù)局限

    上期我們講到了RDMA的WHY,WHAT & HOW(AI網(wǎng)絡(luò)背景下RDMA的Why,What & How),這一期我們來談一談RDMA的不足。
    的頭像 發(fā)表于 10-22 10:02 ?224次閱讀
    以太網(wǎng)<b class='flag-5'>RDMA</b> RoCE的<b class='flag-5'>技術(shù)</b>局限