精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

900GB/s,NVLink才是英偉達(dá)的互聯(lián)殺手锏

E4Life ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2022-03-25 07:03 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))英偉達(dá)在GTC22上發(fā)布了全新的GraceSuperchip,該芯片中用到了NVLink-C2C技術(shù),而去年公開的GraceHopperSuperchip同樣用到了這一技術(shù)。根據(jù)英偉達(dá)超大規(guī)模計(jì)算部門副總裁IanBuck的說(shuō)法,Chiplet和異構(gòu)計(jì)算已經(jīng)成了解決摩爾定律緩慢進(jìn)展的兩大有效手段。而NVLink-C2C這一面向die和chip的互聯(lián)技術(shù),成了英偉達(dá)對(duì)愈發(fā)普及的Chiplet設(shè)計(jì)的回應(yīng)。

Superchip的互聯(lián)


也許在不少人看來(lái)的印象中,提到NVLink會(huì)想到下圖這個(gè)橋接多個(gè)高端顯卡或?qū)I(yè)顯卡的RTX NVLinkBridge,其實(shí)NVLink這一技術(shù)在服務(wù)器級(jí)別的GPU中反倒更為普遍。從P100的第一代NVLink,到V100的第二代NVLink,A100的第三代NVLink,最后再到如今H100的第四代NVLink。NVLink可以說(shuō)是跟著GPU架構(gòu)一路推陳出新了,如今享受第四代NVLink性能的成了Hopper架構(gòu)的GPU。而在英偉達(dá)的SERDES和LINK技術(shù)發(fā)展下,NVLink也從PCB、MCM走向了硅中介層和晶圓,也因此有了NVLink-C2C。

RTX NVLinkBridge/ 英偉達(dá)


GraceSuperchip顯然用的是ARM NeoverseN2這一基于Armv9架構(gòu)的設(shè)計(jì),但從芯片圖可以看出,單個(gè)GraceSuperchip芯片由兩個(gè)GraceCPU組成,才讓總核心數(shù)達(dá)到了144。而這兩個(gè)CPU組成的方式,正是NVLink-C2C這一互聯(lián)技術(shù)。我們?cè)陂_頭已經(jīng)提到,去年公開的GraceHopperSuperchip同樣使用了這一互聯(lián)技術(shù),只不過(guò)當(dāng)時(shí)單個(gè)GraceHopperSuperchip芯片中互聯(lián)的,是一個(gè)GraceCPU和一個(gè)HopperGPU。


NVLink-C2C為英偉達(dá)帶來(lái)的遠(yuǎn)不止這樣一對(duì)一的互聯(lián)方案,而是一整套系統(tǒng)架構(gòu)上的創(chuàng)新。在NVLink-C2C的支持下,英偉達(dá)可以選擇一個(gè)GraceCPU,兩個(gè)HopperGPU的設(shè)計(jì),或是兩個(gè)2個(gè)GraceCPU+2個(gè)HopperGPU,甚至是2個(gè)GraceCPU+8個(gè)HopperGPU。可以看出,NVLink-C2C為Grace和Hopper在數(shù)據(jù)中心和HPC應(yīng)用提供了極大的擴(kuò)展性。

遠(yuǎn)超PCIe5.0的性能

英偉達(dá)強(qiáng)調(diào),NVLink-C2C具有前所未有的性能,比如處理器與加速器之間900GB/s的高帶寬數(shù)據(jù)傳輸,以及快速同步和高頻率更新下的超低延遲,以及在先進(jìn)封裝英偉達(dá)芯片下,能效比可以做到PCIe5.0的25倍,面積效率更是達(dá)到90倍。

H100 SXM5 GPU / 英偉達(dá)


NVLink-C2C900GB/s的帶寬確實(shí)優(yōu)秀,也與第四代NVLink的性能一致,但這并不代表只要用上NVLink就能獲得,我們從Hopper架構(gòu)的GPU H100的參數(shù)上也能窺見一二。要想獲得900GB/s的帶寬性能,必須用到SXM5的大功率卡,而不是PCIe5.0的卡,雖然前者的功耗是后者的兩倍,達(dá)到了可怕的700W,但PCIe5.0的H100在總體性能和帶寬上確實(shí)差SXM5一截。

兩者在PCIe5.0上的帶寬一致,都是128GB/s,但如果用上NVLink,PCIe5.0版本的H100只能達(dá)到600GB/s的帶寬,與第三代NVLink性能一致,只有SXM5版本下的NVLink才能達(dá)到滿血的900GB/s。


另外在第四代NVLink和第三代NVSwitch技術(shù)的組合下,英偉達(dá)推出了NVLinkSwitch這一方案,該系統(tǒng)最多支持到256個(gè)GPU,可實(shí)現(xiàn)57.6TB/s的總帶寬。NVLinkSwitch也是英偉達(dá)DGX H100 SuperPOD系統(tǒng)的關(guān)鍵技術(shù),英偉達(dá)甚至把自己收購(gòu)的Mellanox旗下的InfiniBand節(jié)點(diǎn)互聯(lián)技術(shù)拿來(lái)對(duì)比。從上圖可以看出與基于A100+InfiniBand的SuperPOD系統(tǒng)相比,基于H100+NVLinkSwitch的SuperPOD系統(tǒng)在對(duì)分帶寬上是前者的9倍。

開放而不是獨(dú)占


其實(shí)NVLink的存在最初讓不少人覺得有些一家獨(dú)大的意思,畢竟最早NVLink僅僅只是用于多個(gè)英偉達(dá)GPU之間的互聯(lián),僅僅只是為自家的產(chǎn)品提供更多優(yōu)勢(shì)而已。而去年發(fā)布的GraceHopperSuperchip同樣用到了這一技術(shù),但這顆芯片卻是英偉達(dá)設(shè)計(jì)的ArmCPU和GPU的互聯(lián)。

這讓人不禁擔(dān)心,如果英偉達(dá)真的成功收購(gòu)了Arm,會(huì)不會(huì)利用這一優(yōu)勢(shì)來(lái)全面壟斷數(shù)據(jù)中心和HPC市場(chǎng)。畢竟Arm自己給出的互聯(lián)方案CMN-700支持的是CCIX 2.0和CXL 2.0這兩大標(biāo)準(zhǔn)互聯(lián)協(xié)議,同時(shí)為第三方加速器提供PCIe5.0的連接。但就紙面參數(shù)給到的性能看來(lái),NVLink這種專用方案似乎更加吃香一些。

不過(guò)Arm作為一家IP公司,目標(biāo)自然是支持到多樣化的加速器,從而全面發(fā)展Arm的生態(tài)。此前Arm在接受電子發(fā)燒友網(wǎng)采訪時(shí)也表示,Arm期待給市場(chǎng)帶來(lái)更多的靈活性,支持更多像Grace這樣的系統(tǒng)。

NVLink-C2C示意圖 / 英偉達(dá)


好在英偉達(dá)似乎也不打算將NVLink-C2C獨(dú)占,而是宣布開放這一技術(shù),支持集成英偉達(dá)技術(shù)的芯片半定制,通過(guò)Chiplet技術(shù)充分利用自家的GPU、DPU、NIC、CPU和SoC產(chǎn)品,與客戶的IP進(jìn)行NVLink-C2C互聯(lián)。

盡管收購(gòu)失敗,英偉達(dá)與Arm的合作并沒(méi)有就此停止,英偉達(dá)也在GTC22上宣布繼續(xù)與Arm緊密合作,以支持并在未來(lái)改進(jìn)Arm的AMBA CHI協(xié)議,加上對(duì)CXL的支持,從而與更多加速器和處理器做到互聯(lián)。

與此同時(shí),在全行業(yè)群策群力,試圖打通生態(tài)的情況下,英偉達(dá)也并不打算將NVLink-C2C作為唯一的可選方案。所以除了NVLink-C2C外,集成了英偉達(dá)芯片的定制SoC也可選用前段時(shí)日公布的UCIe通用Chiplet互聯(lián)標(biāo)準(zhǔn),所以不必將數(shù)據(jù)中心上的CPU、DPU和GPU一整套都換成英偉達(dá)旗下的產(chǎn)品,給到第三方服務(wù)器芯片、DPU和加速器一個(gè)機(jī)會(huì)。不過(guò),考慮到這兩種互聯(lián)方式只能選其一,英偉達(dá)也強(qiáng)調(diào)了NVLink-C2C經(jīng)過(guò)優(yōu)化,擁有更低的延遲、更高的帶寬和更高的能效比,該如何選擇還是看廠商自己的考量了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    450

    文章

    49636

    瀏覽量

    417210
  • 互聯(lián)技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    8319
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3637

    瀏覽量

    89863
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    挑戰(zhàn)英偉達(dá)NVLink!英特爾/谷歌等成立聯(lián)盟,推出UALink 1.0

    ,UALink推廣組正在抓緊制定一項(xiàng)新的行業(yè)標(biāo)準(zhǔn),用于推進(jìn)數(shù)據(jù)中心內(nèi)連接的大規(guī)模AI系統(tǒng)的高速和低延遲通信,擺脫英偉達(dá)NVLink在AI加速器連接方面的統(tǒng)治。 ? 對(duì)于這項(xiàng)新的行業(yè)標(biāo)準(zhǔn),AMD數(shù)據(jù)中心
    的頭像 發(fā)表于 06-03 06:31 ?2527次閱讀
    挑戰(zhàn)<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b><b class='flag-5'>NVLink</b>!英特爾/谷歌等成立聯(lián)盟,推出UALink 1.0

    英偉達(dá)TITAN AI顯卡曝光,性能狂超RTX 4090達(dá)63%!# 英偉達(dá)# 顯卡

    顯卡英偉達(dá)
    jf_02331860
    發(fā)布于 :2024年07月24日 17:18:28

    鴻海再獲AI領(lǐng)域大單,獨(dú)家供貨英偉達(dá)GB200 NVLink交換器

    在人工智能(AI)領(lǐng)域的激烈競(jìng)爭(zhēng)中,鴻海集團(tuán)再次傳來(lái)捷報(bào)。繼成功獲得英偉達(dá)(NVIDIA)GB200 AI服務(wù)器代工訂單的大份額后,鴻海又獨(dú)家攬獲了GB200關(guān)鍵元件——被譽(yù)為“提升算
    的頭像 發(fā)表于 06-19 15:04 ?823次閱讀

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlinkGB200 超級(jí)芯片

    200 NVL72的核心,通過(guò)NVLink C2C接口連接,提供900GB/s的雙向帶寬。該設(shè)計(jì)簡(jiǎn)化編程過(guò)程,支持更大內(nèi)存需求的萬(wàn)億參數(shù)LLM、變壓器模型和大規(guī)模模擬模型。GB200計(jì)
    發(fā)表于 05-13 17:16

    全面解讀英偉達(dá)NVLink技術(shù)

    NVLink是一種解決服務(wù)器內(nèi)GPU之間通信限制的協(xié)議。與傳統(tǒng)的PCIe交換機(jī)不同,NVLink帶寬有限,可以在服務(wù)器內(nèi)的GPU之間實(shí)現(xiàn)高速直接互連。第四代NVLink提供更高的帶寬,每條通道達(dá)到112Gbps,比PCIe Ge
    發(fā)表于 04-22 11:01 ?995次閱讀
    全面解讀<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b><b class='flag-5'>NVLink</b>技術(shù)

    英偉達(dá)發(fā)布最強(qiáng)AI加速卡Blackwell GB200

    英偉達(dá)在最近的GTC開發(fā)者大會(huì)上發(fā)布了其最新、最強(qiáng)大的AI加速卡——GB200。這款加速卡采用了新一代AI圖形處理器架構(gòu)Blackwell,標(biāo)志著英偉
    的頭像 發(fā)表于 03-20 11:38 ?875次閱讀

    英偉達(dá)官宣新一代Blackwell架構(gòu),把AI擴(kuò)展到萬(wàn)億參數(shù)

    基于Chiplet與片間互聯(lián)技術(shù),800Gb/s RNIC,1.8TB/s NVLink英偉
    的頭像 發(fā)表于 03-19 14:22 ?809次閱讀
    <b class='flag-5'>英偉</b>達(dá)官宣新一代Blackwell架構(gòu),把AI擴(kuò)展到萬(wàn)億參數(shù)

    英偉達(dá)AI服務(wù)器NVLink版與PCIe版有何區(qū)別?又如何選擇呢?

    在人工智能領(lǐng)域,英偉達(dá)作為行業(yè)領(lǐng)軍者,推出了兩種主要的GPU版本供AI服務(wù)器選擇——NVLink版(實(shí)為SXM版)與PCIe版。這兩者有何本質(zhì)區(qū)別?又該如何根據(jù)應(yīng)用場(chǎng)景做出最佳選擇呢?讓我們深入探討一下。
    的頭像 發(fā)表于 03-19 11:21 ?4505次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>AI服務(wù)器<b class='flag-5'>NVLink</b>版與PCIe版有何區(qū)別?又如何選擇呢?

    英偉達(dá)市值超過(guò)2.3萬(wàn)億美元

    英偉達(dá)(NVIDIA)近日在美股市場(chǎng)表現(xiàn)出色,市值再創(chuàng)新高。上周四,英偉達(dá)股價(jià)收高4.47%,成功突破900美元大關(guān),市值更是達(dá)到驚人的23
    的頭像 發(fā)表于 03-11 11:12 ?632次閱讀

    英偉達(dá)H200性能怎么樣

    英偉達(dá)H200性能卓越,集成了高性能CPU和GPU,通過(guò)高速NVLink連接,消除了傳統(tǒng)計(jì)算瓶頸。其配備了高達(dá)141GB的HBM3e高帶寬內(nèi)存,大幅提升了數(shù)據(jù)處理能力。H200能輕松應(yīng)
    的頭像 發(fā)表于 03-07 16:39 ?784次閱讀

    全球最小英偉達(dá)GH200服務(wù)器發(fā)布:永擎制造

    該服務(wù)器搭載英偉達(dá)Grace及Hopper人工智能GPU,并通過(guò)NVLink實(shí)現(xiàn)互聯(lián)功能以提升整體效能。其中,CPU部分采用72個(gè)Arm Neoverse V2核心以及480
    的頭像 發(fā)表于 02-27 15:29 ?525次閱讀

    英偉達(dá)推出為中國(guó)大陸定制的H20 AI GPU芯片

    盡管英偉達(dá)H20降低了AI算力,但其具有更低的售價(jià)、支持NVLink高速互聯(lián)技術(shù)以及CUDA等優(yōu)勢(shì)。
    的頭像 發(fā)表于 01-03 14:30 ?1625次閱讀

    英偉達(dá)和華為/海思主流GPU型號(hào)性能參考

    一句話總結(jié),H100 vs. A100:3 倍性能,2 倍價(jià)格 值得注意的是,HCCS vs. NVLINK的GPU 間帶寬。 對(duì)于 8 卡 A800 和 910B 模塊而言,910B HCCS 的總帶寬為392GB/s
    發(fā)表于 12-29 11:43 ?4163次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>和華為/海思主流GPU型號(hào)性能參考

    NVLink的演進(jìn)

    2014年,NVLink 1.0發(fā)布,并應(yīng)用在P100芯片上,如下圖所示。兩顆GPU之間有4條NVlink, 每個(gè)link中包含8個(gè)lane, 每條lane的速率是20Gb/s, 因此
    的頭像 發(fā)表于 10-11 15:32 ?1984次閱讀
    <b class='flag-5'>NVLink</b>的演進(jìn)

    XPC-3399規(guī)格書

    在電子產(chǎn)品的世界中,性能是個(gè)永恒的話題,世界各大廠家使出渾身解數(shù)交替拋出殺手锏來(lái)證明自己的實(shí)力。而在這些廠家中,不能不提到
    發(fā)表于 10-09 06:21