精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVLink的演進

sakobpqhz ? 來源:算力基建 ? 2023-10-11 15:32 ? 次閱讀

NVLink是Nvidia開發的一項用于GPU之間點對點高速互聯的技術,其旨在突破PCIe互聯帶寬的限制,實現GPU芯片間低延遲、高帶寬的數據互聯,使得GPU間更加高效地協同工作。在NVLink技術問世之前(2014年前),GPU之間的互聯需要通過PCIe switch來實現,如下圖所示。GPU發出的信號需要先傳遞到PCIe switch, PCIe switch中涉及到數據的處理,CPU會對數據進行分發調度,這些都會引入額外的網絡延遲,限制了系統性能。彼時,PCIe協議已經發展到Gen 3, 單通道的速率為8Gb/s, 16通道的總帶寬為16GB/s (128Gbps,1 Byte= 8 bits ),隨著GPU芯片性能的不斷提升,其互聯帶寬成為瓶頸。

9b8b6bce-67c9-11ee-939d-92fbcf53809c.png

(圖片來自https://en.wikichip.org/wiki/nvidia/nvlink)

2014年,NVLink 1.0發布,并應用在P100芯片上,如下圖所示。兩顆GPU之間有4條NVlink, 每個link中包含8個lane, 每條lane的速率是20Gb/s, 因此整個系統的雙向帶寬為160GB/s,是PCIe3 x16帶寬的5倍。

9b95d640-67c9-11ee-939d-92fbcf53809c.png

(圖片來自https://en.wikichip.org/wiki/nvidia/nvlink)

單個NVLink內部含有16對差分線,對應兩個方向各8條lane的信道,如下圖所示,差分對的兩端為PHY,內部包含SerDes。

9b9e0c0c-67c9-11ee-939d-92fbcf53809c.png

(圖片來自https://www.nextplatform.com/2016/05/04/nvlink-takes-gpu-acceleration-next-level/)

基于NVLink 1.0,可以形成4個GPU的平面mesh結構,兩兩之間形成點對點直連,而8個GPU則對應cube-mesh,進而可以組成DGX-1服務器,這也對應常見的8卡配置,如下圖所示,需要注意的是,此時8個GPU并沒有形成all-to-all連接。

9bb9340a-67c9-11ee-939d-92fbcf53809c.png

(圖片來自https://developer.nvidia.com/blog/dgx-1-fastest-deep-learning-system/)

2017年,Nvidia推出了第二代NVLink技術。兩顆GPU V100之間含6條NVLink, 每個link中包含8個lane, 每條lane的速率提升到25Gb/s, 整個系統的雙向帶寬變為300GB/s,帶寬是NVLink 1.0的近2倍。與此同時,為了實現8顆GPU之間的all-to-all互聯,Nvidia推出了NVSwitch技術。NVSwitch 1.0含有18個port, 每個port的帶寬為50GB/s, 整體帶寬為900GB/s。每個NVSwitch預留了兩個port, 用于連接CPU。使用6個NVSwitch即可實現8顆GPU V100的all-to-all連接,如下圖所示。

9bc5bac2-67c9-11ee-939d-92fbcf53809c.png

(圖片來自https://en.wikichip.org/wiki/nvidia/nvswitch)

DGX-2系統則采用兩個上圖中的板子構建而成,如下圖所示,實現了16顆GPU芯片的all-to-all連接。

9be3b6c6-67c9-11ee-939d-92fbcf53809c.png

(圖片來自https://en.wikichip.org/wiki/nvidia/nvswitch)

2020年,NVLink 3.0技術誕生,兩顆GPU A100芯片之間存在12條NVLink, 每條NVLink含有4條lane, 單條lane的速率為50Gb/s, 因此整個系統的雙向帶寬提升到600GB/s,總帶寬相比NVLink 2.0提升了1倍。由于NVLink的數目增加了,NVSwitch的port數目也相應增加到36個,每個port的速率為50GB/s。由8顆GPU A100與4個NVSwitch組成了DGX A100, 如下圖所示。

9bf1ad8a-67c9-11ee-939d-92fbcf53809c.png

(圖片來自http://www.eventdrive.co.kr/2020/azwell/DGX_A100_Azwellplus.pdf)

2022年,NVLink技術升級到第四代,兩個GPU H100芯片間通過18條NVLink互聯,每條link中含2條lane, 每條lane支持100Gb/s PAM4的速率,因此雙向總帶寬提升到900GB/s。NVSwitch也升級到第三代,每個NVSwitch支持64個port,每個port的速率為50GB/s。DGX H100由8顆H100芯片與4顆NVSwitch芯片構成,如下圖所示。圖中每個NVSwitch的另一側與多個800G OSFP光模塊相連。以左側第一個NVSwitch為例,其與GPU相連側的單向總帶寬為4Tbps (20NVLink*200Gbps),與光模塊相連側的總帶寬為也為4Tbps (5*800Gbps),兩者大小相等, 是非阻塞(non-blocking)網絡。需要注意的是,光模塊中的帶寬是單向帶寬,而在AI芯片中一般習慣使用雙向帶寬。

9bfc58a2-67c9-11ee-939d-92fbcf53809c.png

(圖片來自https://blog.apnic.net/2023/08/10/large-language-models-the-hardware-connection/)

下表整理了每一代NVLink的指標參數

9c11e384-67c9-11ee-939d-92fbcf53809c.png

而PCIe每一代的參數如下表所示,

9c1af848-67c9-11ee-939d-92fbcf53809c.png

從單條lane的速率來看,NVLink整體比同一時期的PCIe的指標高1倍左右,而總帶寬的優勢更是明顯,NVLink是PCIe總帶寬的5倍左右。一直在超越,從未停止。

NVLink經過近十年的發展,已經成為Nvidia GPU芯片中的一個核心技術,是其生態系統中的重要一環,有效解決了GPU芯片之間高帶寬、低延遲的數據互聯難題,改變了傳統的計算架構。但由于該技術是Nvidia獨有,其它AI芯片公司只能采用PCIe或者其它互聯協議。與此同時,Nvidia正在探索利用光互連實現GPU之間的連接,如下圖所示,硅光芯片與GPU共封裝在一起,兩顆GPU芯片間通過光纖連接。

9c31b772-67c9-11ee-939d-92fbcf53809c.png

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    27

    文章

    4591

    瀏覽量

    128149
  • PCIe
    +關注

    關注

    15

    文章

    1165

    瀏覽量

    81994
  • PHY
    PHY
    +關注

    關注

    2

    文章

    296

    瀏覽量

    51555

原文標題:NVLink的演進

文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    帶寬和1.8TB/s的NVLink帶寬,使處理能力翻倍,大幅增加內存容量和帶寬,為處理大規模人工智能模型和復雜計算提供必要資源。 針對大規模模型如GPT-MoE-1.8T,HGX B200的推理性
    發表于 05-13 17:16

    特斯拉V100 Nvlink是否支持v100卡的nvlink變種的GPU直通?

    /4029/SYS-4029GP-TVRT.cfm)我們正試圖做pci將GPU直接傳輸到VM中但是當我們通過pci設備并安裝驅動程序時,我們會從nvidia-nvlink模塊中獲得錯誤。是否支持v100卡的nvlink
    發表于 09-12 16:25

    java的IO演進之路概述

    第一章 java的IO演進之路
    發表于 07-24 16:53

    英偉達GPU卡多卡互聯NVLink,系統累積的公差,是怎么解決的?是連接器吸收的?

    英偉達不斷推出GPU卡,并且實現多卡互聯NVLink,實際整個系統會累積到一個較大的公差,而目前市面上已有的連接器只能吸收較少的公差,這個是怎么做到匹配的呢?
    發表于 03-05 16:17

    技嘉發布的NVLink連接器支持RGB燈光

    10月3日消息 隨著RTX 2080和RTX 2080 Ti顯卡的推出,各家廠商也推出了自家的NVLink連接器,已提供給發燒友使用,讓他們享受到最為強大的顯卡性能。之前華碩就公布了自家
    發表于 10-10 17:07 ?814次閱讀

    技嘉發布全新NVLink連接器:擁有RGB燈光

    【大比特導讀】10月3日消息 隨著RTX 2080和RTX 2080 Ti顯卡的推出,各家廠商也推出了自家的NVLink連接器,已提供給發燒友使用,讓他們享受到最為強大的顯卡性能。之前華碩就公布了
    發表于 12-24 16:46 ?335次閱讀

    RTX 3080 PCB上沒有NVLink連接器

    查看兩張照片,立即彈出的一件事是RTX 3080 PCB上沒有NVLink連接器。另一方面,RTX 3090具有一個,考慮到其雙GPU支持,可以預期。
    的頭像 發表于 09-25 16:17 ?4138次閱讀

    GTC2022大會亮點:NVIDIA宣布推出NVIDIA NVLink Switch系統

    GTC2022大會亮點:NVIDIA宣布推出NVIDIA NVLink Switch系統,借助NVLink Switch系統,可以將其擴展為一個巨大的擁有32個節點、256個GPU的DGX POD,都可借助4個端口光學收發器連接到NVL
    的頭像 發表于 03-24 15:15 ?2971次閱讀
    GTC2022大會亮點:NVIDIA宣布推出NVIDIA <b class='flag-5'>NVLink</b> Switch系統

    英偉達發布采用NVLink-C2C技術的Grace Superchip芯片

    電子發燒友網報道(文/周凱揚)英偉達在GTC22上發布了全新的Grace Superchip,該芯片中用到了NVLink-C2C技術,而去年公開的Grace Hopper Superchip同樣用到
    的頭像 發表于 03-26 11:20 ?2951次閱讀

    什么是 NVLink

    NVLink 是加速系統中 GPU 和 CPU 處理器的高速互連技術,推動數據和計算加速得出可執行結果。 加速計算是一項曾經只有政府研究實驗室中才有的高性能計算能力。如今,它已成為主流技術。 銀行
    的頭像 發表于 04-19 04:05 ?2575次閱讀
    什么是 <b class='flag-5'>NVLink</b>?

    一文解析Nvlink的誕生和技術演進歷程

    Nvlink-C2C是個錯誤的技術路徑。 我仿佛記得Nvlink-C2C的主架構師Wei wei是我大學同學 ?有這么個模糊印象。 如果單純從技術的角度,Nvlink-C2C真的是一個恰到好處的設計,挺佩服的。增之一分則太長,減
    發表于 07-03 11:50 ?4684次閱讀
    一文解析<b class='flag-5'>Nvlink</b>的誕生和技術<b class='flag-5'>演進</b>歷程

    什么是 NVLink?

    什么是 NVLink?
    的頭像 發表于 10-27 16:10 ?705次閱讀
    什么是 <b class='flag-5'>NVLink</b>?

    NVLink演進:從內部互聯到超級網絡

    NVLink是NVIDIA開發的一種高速、低延遲的互聯技術,旨在連接多個GPU以實現高性能并行計算。與傳統的PCIe總線相比,NVLink提供了更高的帶寬和更低的延遲,使得GPU之間可以更加高效地共享數據和通信。
    的頭像 發表于 04-13 11:22 ?954次閱讀
    <b class='flag-5'>NVLink</b>的<b class='flag-5'>演進</b>:從內部互聯到超級網絡

    全面解讀英偉達NVLink技術

    NVLink是一種解決服務器內GPU之間通信限制的協議。與傳統的PCIe交換機不同,NVLink帶寬有限,可以在服務器內的GPU之間實現高速直接互連。第四代NVLink提供更高的帶寬,每條通道達到112Gbps,比PCIe Ge
    發表于 04-22 11:01 ?995次閱讀
    全面解讀英偉達<b class='flag-5'>NVLink</b>技術

    科技巨頭組建“復仇者聯盟”,挑戰英偉達的NVLink技術

    據報導,包括 AMD、谷歌、微軟、英特爾(Intel)、博通(Broadcom)和思科(Cisco)在內的多家國際科技龍頭聯手,組成“復仇者聯盟”,欲挑戰 NVIDIA 的 NVLink 技術。
    的頭像 發表于 05-31 11:54 ?466次閱讀