精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)Blackwell平臺網(wǎng)絡(luò)配置分析

智能計(jì)算芯世界 ? 來源:智能計(jì)算芯世界 ? 2024-04-17 11:01 ? 次閱讀

本文來自“英偉達(dá)Blachwell平臺網(wǎng)絡(luò)配置詳解”。GTC大會英偉達(dá)展示了全新的 Blackwell 平臺系列產(chǎn)品,包括 HGX B100 服務(wù)器、NVLINK Switch、GB200Superchip Computer Node、Quantum X800 交換機(jī)和 CX8 網(wǎng)卡(InfiniBand 方案)、ETH Spectrum X800 交換機(jī)和 BF3 網(wǎng)卡(以太網(wǎng)方案)。

1. Blackwell 平臺網(wǎng)絡(luò)配置分析

從網(wǎng)絡(luò)配置的角度,英偉達(dá)提供了第五代 NVLINK、第六代 PCIE、單端口800Gbit/s 的 IB 和以太網(wǎng)網(wǎng)卡、1.6T 光模塊需求。從目前英偉達(dá)公布的產(chǎn)品介紹看,這些升級后的網(wǎng)絡(luò)能力可能不會第一時間全部配置在最新的 DGX B200 服務(wù)器上,而是在后續(xù)的產(chǎn)品中逐步升級。從英偉達(dá)公布的產(chǎn)品說明材料看,DGX B200 服務(wù)器配置 8 顆 NVIDIA B200 Tensor Core GPUs,4 個 800G OSPF 光模塊,最大功耗為 14.3kW。

2 DGX GB200: NVLink domain 提升至 576 GPUs

采用 DGX GB200 系統(tǒng)的 NVIDIA DGX SuperPOD 專為訓(xùn)練和推理萬億參數(shù)生成式AI 模型而構(gòu)建。每個液冷機(jī)架配備 36 個 NVIDIA GB200 Grace Blackwell 超級芯片(36 個 NVIDIA Grace CPU 和 72 個 Blackwell GPU),與 NVIDIA NVLink 連接為一體。多個機(jī)架與 NVIDIA Quantum InfiniBand 連接,可擴(kuò)展到數(shù)萬個 GB200 超級芯片。

GB200 可以在單機(jī)柜內(nèi)搭建包含 36 個或者 72 個 GPU 的 NVLink domain。一個機(jī)柜內(nèi)包含 18 個計(jì)算節(jié)點(diǎn)和 9 臺 L1 NVLink Switch。基于第五代 NVLink 技術(shù),每個 NVLink 交換機(jī)可以提供 144 個 100GB NVLink 端口。通過機(jī)柜內(nèi)的 9 個 L1NVLink Switch 可以合計(jì) 提 供 1296 個 100GB NVLink 端口 ,機(jī)柜 內(nèi)的每 個Blackwell GPUs 可以獲得 18 個端口,合計(jì) 1.8T 的 NVLink 帶寬。

GB200 NVL72 使用了一個定制化的 Copper cable cartridge 實(shí)現(xiàn)機(jī)柜內(nèi) 9 個L1 NV Switch 和 18 個計(jì)算節(jié)點(diǎn)的 NVLink 連接。英偉達(dá)介紹 NVIDIA GB200 NVL72可以在一個 NVLink domain 內(nèi)連接 576 個 GPU。英偉達(dá)當(dāng)前公布的 GB200 NVL72 配置了 72 個 CX7 網(wǎng)口(OSFP 400Gb/s InfiniBand),并沒有使用最新的 CX8 網(wǎng)卡。

3 全新 IB 交換機(jī),雙層胖樹支持萬卡集群

NVIDIA Quantum-X800 Q3400-RA 是一臺 4U 的 IB 交 換機(jī) ,對比 上一 代Quantum-9700 交換機(jī)設(shè)備尺寸提升了一倍。Quantum-X800 也是英偉達(dá)第一款使用200Gb/s-per-lane SerDes 方案的交換機(jī)設(shè)備,通過 72 個 OSPF 1.6T 光模塊提供144 個 800G 端口。英偉達(dá)指出,基于 Quantum-X800 的高性能,兩層胖樹網(wǎng)路拓?fù)渚涂梢赃B接 10386 個網(wǎng)絡(luò)接口卡。

GTC 大會上,英偉達(dá)推出的 Spectrum-X800 SN5600 是一臺 51.2T 端口容量的以太網(wǎng)交換機(jī),可以配置 64 個 OSPF 800G 光模塊。

4 新平臺依然需要 800G 和 400G 光模塊

從 GTC 大會的介紹看,BLACKWELL 平臺會帶來第五代 NVLINK、第六代 PCIE、第八代 IB 網(wǎng)絡(luò)應(yīng)用。但是在當(dāng)前早期交付的產(chǎn)品中依然會采用 800G 和 400G 光模塊。其中 DGX B200 服務(wù)器配置通過 4 個 800G OSPF 光模塊提供 8 個 400G 端口,這和DGX H100 服務(wù)器的配置相同。

我們認(rèn)為 B200 GPU 和 800 光模塊的配置比例和 H100 GPU 保持一致。而 GB200NVL72 需要配置 72 個 OSPF 400G 光模塊,以便通過 IB 網(wǎng)絡(luò)實(shí)現(xiàn)萬卡集群的連接。

5 新的IB網(wǎng)絡(luò)帶來1.6T光模塊需求

NVIDIA Quantum-X800 Q3400-RA 和 CX8 NIC 則明確需要配置 1.6T 光模塊。和上一代 IB 網(wǎng)絡(luò)相比,主要的變化是 Quantum-X800 的端口能力提升至 115.2T,可以通過兩層胖樹拓?fù)鋵?shí)現(xiàn) 10386 個網(wǎng)絡(luò)接口卡的連接,萬卡規(guī)模 Blackwell GPU 集群使用 IB 網(wǎng)絡(luò)組網(wǎng)的成本得到優(yōu)化。我們認(rèn)為這會弱化以太網(wǎng)方案的價格優(yōu)勢,提升 IB 網(wǎng)絡(luò)方案的競爭力。

6 NVLink domain 容量擴(kuò)展帶來新增的銅纜連接需求

通過第五代 NVLINK 從 900GB 提升至 1800GB,單個 NVLINK domain 的 GPU 數(shù)量提升至 576 個。最大的變化是 L1 NV Switch 從服務(wù)器 PCB 板載芯片的形式調(diào)整為機(jī)柜內(nèi)的 9 臺交換機(jī),連接能力提升至 72 個 GPU,需要使用銅纜實(shí)現(xiàn)機(jī)柜內(nèi)的NVLINK 連接。

而如何實(shí)現(xiàn) 576 個 GPU 連接,目前英偉達(dá)還沒有給出具體的連接方案,但是鑒于目前最新的 IB 交換機(jī)能力,我們認(rèn)為連接 576 個 GPU 需要 L2 NV Switch。最終的方案使用銅纜還是光模塊,核心是銅纜的連接距離是否可以滿足 8 個機(jī)柜的連接需求,低成本的銅纜連接方案會是優(yōu)先選項(xiàng)。

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 以太網(wǎng)
    +關(guān)注

    關(guān)注

    40

    文章

    5385

    瀏覽量

    171160
  • 交換機(jī)
    +關(guān)注

    關(guān)注

    21

    文章

    2624

    瀏覽量

    99285
  • 光模塊
    +關(guān)注

    關(guān)注

    76

    文章

    1240

    瀏覽量

    58893
  • 網(wǎng)絡(luò)配置
    +關(guān)注

    關(guān)注

    1

    文章

    22

    瀏覽量

    7579
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3749

    瀏覽量

    90856

原文標(biāo)題:英偉達(dá)Blackwell平臺網(wǎng)絡(luò)配置詳解

文章出處:【微信號:AI_Architect,微信公眾號:智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    英偉達(dá)Blackwell GPU未來一年訂單爆滿

    據(jù)摩根士丹利(大摩)透露,人工智能(AI)芯片領(lǐng)域的領(lǐng)軍企業(yè)英偉達(dá)(NVIDIA)的管理層在近期的一系列與投資人的會議中,分享了關(guān)于其下一代繪圖處理器(GPU)Blackwell的強(qiáng)勁市場需求情況。
    的頭像 發(fā)表于 10-17 16:52 ?487次閱讀

    英偉達(dá)Blackwell芯片量產(chǎn)加速,Q4預(yù)計(jì)出貨達(dá)45萬片

    摩根士丹利最新發(fā)布的報(bào)告揭示了英偉達(dá)在AI芯片領(lǐng)域的重大進(jìn)展,其最新力作Blackwell芯片已成功步入量產(chǎn)階段,預(yù)示著英偉達(dá)有望在今年第四
    的頭像 發(fā)表于 09-27 15:02 ?831次閱讀

    英偉達(dá)Blackwell GPU量產(chǎn)加速,Q4營收沖刺百億美元大關(guān)

    近日,全球領(lǐng)先的圖形處理單元(GPU)及人工智能芯片制造商英偉達(dá)傳來重大利好消息。據(jù)摩根士丹利最新發(fā)布的行業(yè)分析報(bào)告指出,英偉達(dá)基于
    的頭像 發(fā)表于 09-26 15:58 ?298次閱讀

    英偉達(dá)Blackwell可支持10萬億參數(shù)模型AI訓(xùn)練,實(shí)時大語言模型推理

    。 ????????????????????? 英偉達(dá)Blackwell是通用計(jì)算全棧矩陣的終極解決方案,由多個英偉達(dá)芯片組成,包括
    的頭像 發(fā)表于 09-04 09:10 ?2835次閱讀

    英偉達(dá)Blackwell架構(gòu)揭秘:下一個AI計(jì)算里程碑?# 英偉達(dá)# 英偉達(dá)Blackwell

    英偉達(dá)行業(yè)資訊
    jf_02331860
    發(fā)布于 :2024年08月26日 10:58:09

    英偉達(dá)Blackwell芯片已投產(chǎn),預(yù)告未來AI芯片發(fā)展

    英偉達(dá)創(chuàng)始人兼CEO黃仁勛近日宣布,公司旗下的Blackwell芯片已正式投入生產(chǎn)。這款芯片是英偉達(dá)在AI領(lǐng)域的重要突破,預(yù)計(jì)將為未來的智能
    的頭像 發(fā)表于 06-04 09:23 ?1943次閱讀

    英偉達(dá)或?qū)⑼瞥鋈诤螦rm與Blackwell內(nèi)核的AI PC芯片

    近日,業(yè)內(nèi)傳出英偉達(dá)正在研發(fā)一款全新芯片的傳聞。據(jù)悉,這款芯片將結(jié)合下一代Arm Cortex CPU內(nèi)核與英偉達(dá)自家的Blackwell
    的頭像 發(fā)表于 05-31 10:31 ?575次閱讀

    英偉達(dá)業(yè)績強(qiáng)勁,Blackwell AI芯片助推下一波增長?

     在與分析師的電話會議上,英偉達(dá)首席執(zhí)行官黃仁勛透露,公司即將推出的Blackwell AI芯片將于本季度發(fā)貨,下季度產(chǎn)量將有所提升,“隨著下一代B
    的頭像 發(fā)表于 05-23 15:55 ?466次閱讀

    亞馬遜AWS暫緩采購英偉達(dá)GH200芯片,期待Blackwell更強(qiáng)

    然而,AWS對此予以澄清,稱實(shí)際上并未取消任何對英偉達(dá)的訂單。據(jù)其代表解釋,此次從Grace Hopper芯片轉(zhuǎn)向Blackwell芯片的調(diào)整僅限于AWS與英偉
    的頭像 發(fā)表于 05-22 15:05 ?667次閱讀

    亞馬遜未中斷英偉達(dá)訂單,等待Grace Blackwell更強(qiáng)性能

    英國《金融時報(bào)》昨日報(bào)道稱,亞馬遜AWS已暫停訂購英偉達(dá)最新款“超級芯片”Grace Hopper,等待性能更強(qiáng)的新品Grace Blackwell(GH200)。此舉引發(fā)市場擔(dān)憂,認(rèn)為英偉
    的頭像 發(fā)表于 05-22 11:00 ?441次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    千萬億次浮點(diǎn)運(yùn)算。 英偉達(dá)還構(gòu)建了由72張GB200構(gòu)成的DGX GB200 NVL72[超級計(jì)算機(jī)]。該超級計(jì)算機(jī)在內(nèi)部節(jié)點(diǎn)間使用銅纜連接,以降低功耗。 Blackwell 圖形處理器采用雙芯片
    發(fā)表于 05-13 17:16

    英偉達(dá)發(fā)布新一代AI芯片架構(gòu)Blackwell GPU

    近日,英偉達(dá)首席執(zhí)行官黃仁勛在GTC 2024會議上發(fā)表主題演講,重磅推出全新AI芯片架構(gòu)Blackwell GPU。這一創(chuàng)新技術(shù)的首款芯片產(chǎn)品命名為GB200,標(biāo)志著英偉
    的頭像 發(fā)表于 03-26 11:19 ?835次閱讀

    英偉達(dá)發(fā)布最強(qiáng)AI加速卡Blackwell GB200

    英偉達(dá)在最近的GTC開發(fā)者大會上發(fā)布了其最新、最強(qiáng)大的AI加速卡——GB200。這款加速卡采用了新一代AI圖形處理器架構(gòu)Blackwell,標(biāo)志著英偉
    的頭像 發(fā)表于 03-20 11:38 ?1074次閱讀

    英偉達(dá)宣布推出新一代GPU Blackwell,SK海力士已量產(chǎn)HBM3E

    英偉達(dá)GTC 2024大會上,英偉達(dá)CEO黃仁勛宣布推出新一代GPU Blackwell,第一款Bla
    的頭像 發(fā)表于 03-20 11:32 ?1136次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>宣布推出新一代GPU <b class='flag-5'>Blackwell</b>,SK海力士已量產(chǎn)HBM3E

    英偉達(dá)最新一代AI芯片Blackwell GPU,AI算力能力較上代提升30倍!

    黃仁勛說:"我們已經(jīng)來到了一個臨界點(diǎn),因此需要一種新的計(jì)算方式來加速整個行業(yè)的發(fā)展效率。那么英偉達(dá)能夠做什么?當(dāng)然,答案就是——更大的芯片。”接著,英偉達(dá)新一代圖形計(jì)算
    的頭像 發(fā)表于 03-19 13:39 ?1714次閱讀