精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用NVIDIA H100 CNX構(gòu)建人工智能系統(tǒng)

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:About Charu Chaubal ? 2022-03-31 14:49 ? 次閱讀

人們對能夠以更快的速度將數(shù)據(jù)從網(wǎng)絡(luò)傳輸?shù)?GPU 的服務(wù)器的需求不斷增加。隨著人工智能模型不斷變大,訓(xùn)練所需的數(shù)據(jù)量需要多節(jié)點訓(xùn)練等技術(shù)才能在合理的時間范圍內(nèi)取得成果。 5G信號處理比前幾代更復(fù)雜, GPU 可以幫助提高這種情況發(fā)生的速度。機器人傳感器等設(shè)備也開始使用 5G 與邊緣服務(wù)器通信,以實現(xiàn)基于人工智能的決策和行動。

專門構(gòu)建的人工智能系統(tǒng),比如最近發(fā)布的 NVIDIA DGX H100 ,是專門為支持?jǐn)?shù)據(jù)中心用例的這些需求而設(shè)計的。現(xiàn)在,另一種新產(chǎn)品可以幫助企業(yè)獲得更快的數(shù)據(jù)傳輸和更高的邊緣設(shè)備性能,但不需要高端或定制系統(tǒng)。

NVIDIA 首席執(zhí)行官 Jensen Huang 上周在 NVIDIA 公司 GTC 宣布, NVIDIA H100 CNX 是一個高性能的企業(yè)包。它結(jié)合了 NVIDIA H100 的能力與 NVIDIA ConnectX-7 SmartNIC 先進的網(wǎng)絡(luò)能力。這種先進的體系結(jié)構(gòu)在 PCIe 板上提供,為主流數(shù)據(jù)中心和邊緣系統(tǒng)的 GPU 供電和 I / O 密集型工作負載提供了前所未有的性能。

H100 CNX 的設(shè)計優(yōu)勢

在標(biāo)準(zhǔn) PCIe 設(shè)備中,控制平面和數(shù)據(jù)平面共享相同的物理連接。然而,在 H100 CNX 中, GPU 和網(wǎng)絡(luò)適配器通過直接 PCIe Gen5 通道連接。這為 GPU 和使用 GPUDirect RDMA 的網(wǎng)絡(luò)之間的數(shù)據(jù)傳輸提供了專用的高速路徑,并消除了通過主機的數(shù)據(jù)瓶頸。

通過將 GPU 和 SmartNIC 組合在一塊板上,客戶可以利用 PCIe Gen4 甚至 Gen3 上的服務(wù)器。通過高端或?qū)iT構(gòu)建的系統(tǒng)實現(xiàn)一次性能水平可以節(jié)省硬件成本。將這些組件放在一塊物理板上也可以提高空間和能源效率。

將 GPU 和 SmartNIC 集成到單個設(shè)備中,通過設(shè)計創(chuàng)建了一個平衡的體系結(jié)構(gòu)。在具有多個 GPU 和 NIC 的系統(tǒng)中,聚合加速卡強制 GPU 與 NIC 的比例為 1:1 。這避免了服務(wù)器 PCIe 總線上的爭用,因此性能會隨著附加設(shè)備線性擴展。

NVIDIA 的核心加速軟件庫(如 NCCL 和 UCX )自動利用性能最佳的路徑將數(shù)據(jù)傳輸?shù)?GPU 。現(xiàn)有的加速多節(jié)點應(yīng)用程序可以在不做任何修改的情況下利用 H100 CNX ,因此客戶可以立即從高性能和可擴展性中受益。

H100 CNX 用例

H100 CNX 提供 GPU 加速,同時具有低延遲和高速網(wǎng)絡(luò)。這是在較低的功耗下完成的,與兩個分立的卡相比,占用空間更小,性能更高。許多用例可以從這種組合中受益,但以下幾點尤其值得注意。

5G 信號處理

使用 GPU 進行 5G 信號處理需要盡快將數(shù)據(jù)從網(wǎng)絡(luò)移動到 GPU ,并且具有可預(yù)測的延遲也是至關(guān)重要的。 NVIDIA 聚合加速器與 NVIDIA Aerial SDK 相結(jié)合,為運行 5G 應(yīng)用程序提供了性能最高的平臺。由于數(shù)據(jù)不經(jīng)過主機 PCIe 系統(tǒng),因此處理延遲大大減少。在使用速度較慢的 PCIe 系統(tǒng)的商品服務(wù)器時,甚至可以看到這種性能的提高。

加速 5G 以上的邊緣人工智能

NVIDIA AI on 5G 由 NVIDIA EGX 企業(yè)平臺、 NVIDIA 公司的 SDK 軟件定義的 5G 虛擬無線局域網(wǎng)和企業(yè) AI 框架組成。這包括像 NVIDIA ISAAC 和 NVIDIA Metropolis 這樣的 SDK 。攝像機、工業(yè)傳感器和機器人等邊緣設(shè)備可以使用人工智能,并通過 5G 與服務(wù)器通信。

H100 CNX 可以在單個企業(yè)服務(wù)器中提供此功能,而無需部署昂貴的專用系統(tǒng)。與NVIDIA 多實例 GPU 技術(shù)相比,應(yīng)用于 5G 信號處理的相同加速器可用于邊緣 AI 。這使得共享 GPU 用于多種不同目的成為可能。

多節(jié)點人工智能訓(xùn)練

多節(jié)點培訓(xùn)涉及不同主機上 GPU 之間的數(shù)據(jù)傳輸。在一個典型的數(shù)據(jù)中心網(wǎng)絡(luò)中,服務(wù)器通常會在性能、規(guī)模和密度方面受到各種限制。大多數(shù)企業(yè)服務(wù)器不包括 PCIe 交換機,因此 CPU 成為這種流量的瓶頸。數(shù)據(jù)傳輸受主機 PCIe 背板的速度限制。雖然 GPU:NIC 的比例為 1:1 是理想的,但服務(wù)器中 PCIe 通道和插槽的數(shù)量可能會限制設(shè)備的總數(shù)。

H100 CNX 的設(shè)計緩解了這些問題。從網(wǎng)絡(luò)到 GPU 有一條專用路徑,供 GPUDirect RDMA 以接近線路速度運行。無論主機 PCIe 背板如何,數(shù)據(jù)傳輸也會以 PCIe Gen5 的速度進行。主機內(nèi) GPU 功率的放大可以以平衡的方式進行,因為 GPU:NIC 的比例是 1:1 。服務(wù)器還可以配備更多的加速能力,因為與離散卡相比,聚合加速器所需的 PCIe 通道和設(shè)備插槽更少。

NVIDIA H100 CNX 預(yù)計可在今年下半年購買。如果你有一個用例可以從這個獨特而創(chuàng)新的產(chǎn)品中受益,請聯(lián)系你最喜歡的系統(tǒng)供應(yīng)商,詢問他們計劃何時將其與服務(wù)器一起提供。

關(guān)于作者:About Charu Chaubal

Charu Chaubal 在NVIDIA 企業(yè)計算平臺集團從事產(chǎn)品營銷工作。他在市場營銷、客戶教育以及技術(shù)產(chǎn)品和服務(wù)的售前工作方面擁有 20 多年的經(jīng)驗。 Charu 曾在云計算、超融合基礎(chǔ)設(shè)施和 IT 安全等多個領(lǐng)域工作。作為 VMware 的技術(shù)營銷領(lǐng)導(dǎo)者,他幫助推出了許多產(chǎn)品,這些產(chǎn)品共同發(fā)展成為數(shù)十億美元的業(yè)務(wù)。此前,他曾在 Sun Microsystems 工作,在那里他設(shè)計了分布式資源管理和 HPC 基礎(chǔ)設(shè)施軟件解決方案。查魯擁有化學(xué)工程博士學(xué)位,并擁有多項專利。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    46859

    瀏覽量

    237571
  • 5G
    5G
    +關(guān)注

    關(guān)注

    1353

    文章

    48367

    瀏覽量

    563382
  • H100
    +關(guān)注

    關(guān)注

    0

    文章

    31

    瀏覽量

    282
收藏 人收藏

    評論

    相關(guān)推薦

    嵌入式和人工智能究竟是什么關(guān)系?

    嵌入式和人工智能究竟是什么關(guān)系? 嵌入式系統(tǒng)是一種特殊的系統(tǒng),它通常被嵌入到其他設(shè)備或機器中,以實現(xiàn)特定功能。嵌入式系統(tǒng)具有非常強的適應(yīng)性和靈活性,能夠根據(jù)用戶需求進行定制化設(shè)計。它
    發(fā)表于 11-14 16:39

    英偉達H100芯片市場降溫

    隨著英偉達新一代AI芯片GB200需求的不斷攀升,其上一代明星產(chǎn)品H100芯片卻遭遇了市場的冷落。據(jù)業(yè)內(nèi)人士透露,搭載H100的服務(wù)器通常以8卡的形式進行出售或出租,而在去年,這類服務(wù)器的售價普遍
    的頭像 發(fā)表于 10-28 15:42 ?365次閱讀

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    的發(fā)展機遇。同時,這也要求科研人員、政策制定者和社會各界共同努力,構(gòu)建一個健康、包容的AI科研生態(tài)系統(tǒng)。 總之,《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》的第一章為我打開了一個全新的視角,讓我
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    人工智能推薦系統(tǒng)中強大的圖形處理器(GPU)一爭高下。其獨特的設(shè)計使得該處理器在功耗受限的條件下仍能實現(xiàn)高性能的圖像處理任務(wù)。 Ceremorphic公司 :該公司開發(fā)的分層學(xué)習(xí)處理器結(jié)合了
    發(fā)表于 09-28 11:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    首批1024塊H100 GPU,正崴集團將建中國臺灣最大AI計算中心

    中國臺灣當(dāng)?shù)卣思瘓F5月27日宣布,將與日本公司Ubitus共同打造人工智能(AI)計算中心,其中第一期將導(dǎo)入128個機柜,共計1024張英偉達H100旗艦計算卡,旨在構(gòu)建臺灣最大的AI計算中心。
    的頭像 發(fā)表于 05-29 10:05 ?1039次閱讀

    德克薩斯大學(xué)將創(chuàng)建一個學(xué)術(shù)界最強大的生成性人工智能研究中心

    近日,美國德克薩斯大學(xué)宣稱他們將創(chuàng)建一個學(xué)術(shù)界最強大的生成性人工智能(AI)研究中心,該中心將配備600個Nvidia H100 GPU用于AI模型的訓(xùn)練,該計算機集群被命名為Vista,目前由德克薩斯高級計算中心(TACC)負
    的頭像 發(fā)表于 05-28 09:06 ?695次閱讀

    進一步解讀英偉達 Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    架構(gòu)在高性能計算方面的應(yīng)用有哪些? **1. **人工智能訓(xùn)練和推理 Blackwell 架構(gòu)的 GPU 核心在訓(xùn)練性能上相較前代 Hopper H100 GPU 提升了四倍,推理性能提升最高可達
    發(fā)表于 05-13 17:16

    英特爾發(fā)布人工智能芯片新版,對標(biāo)Nvidia

    為應(yīng)對AI行業(yè)對高性能芯片的巨大需求,英特爾推出了全新Gaudi 3芯片,據(jù)稱這一款芯片在訓(xùn)練大語言模型方面的速度較之NVIDIA最新H100處理器要快50%。而且,其推理運算速度也超過了部分H100芯片。
    的頭像 發(fā)表于 04-10 09:26 ?336次閱讀

    英偉達H200和H100的比較

    英偉達H200和H100是兩款不同的AI芯片,它們各自具有獨特的特點和優(yōu)勢。以下是關(guān)于這兩款芯片的一些比較。
    的頭像 發(fā)表于 03-07 15:53 ?4280次閱讀

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時代背景下,嵌入式人工智能成為國家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級的核心驅(qū)動力。同時在此背景驅(qū)動下,眾多名企也紛紛在嵌入式人工智能領(lǐng)域布局
    發(fā)表于 02-26 10:17

    扎克伯格的Meta斥資數(shù)十億美元購買35萬塊Nvidia H100 GPU

    萬個NvidiaH100GPU,以幫助Meta構(gòu)建具有類人智能的下一代人工智能產(chǎn)品。扎克伯格今天在宣布公司長期致力于開發(fā)通用人工智能(AGI
    的頭像 發(fā)表于 01-26 08:26 ?721次閱讀
    扎克伯格的Meta斥資數(shù)十億美元購買35萬塊<b class='flag-5'>Nvidia</b> <b class='flag-5'>H100</b> GPU

    Meta計劃至2024年末購買35萬張H100加速卡

    扎克伯格并未披露BIN為應(yīng)對日益增加的人工智能需求添購的具體數(shù)量。市場研究機構(gòu)雷蒙德詹姆斯的分析師根據(jù)推測,每顆H100系列芯片單價可能在2.5萬至3萬美金之間,若按照最低標(biāo)準(zhǔn)計算,購置成本將超過10億美金。
    的頭像 發(fā)表于 01-19 10:25 ?710次閱讀

    AI計算需求激增,英偉達H100功耗成挑戰(zhàn)

    根據(jù)預(yù)測,若H100的年利用率保持在61%,那么單臺設(shè)備每年將耗電3740千瓦小時左右。如果英偉達在2023年售出150萬塊H100,2024年再增加至200萬塊,那么到2024年底,將有350萬塊H100芯片投入使用,其總年用
    的頭像 發(fā)表于 12-28 09:29 ?2248次閱讀

    谷歌TPU v5p超越Nvidia H100,成為人工智能領(lǐng)域的競爭對手

    TPU v5p已在谷歌“AI超級計算機”項目中發(fā)揮重要作用,這并非專業(yè)科研型超算平臺,而是面向各類人工智能應(yīng)用。與Nvidia開放GPU購買策略不同,谷歌高端TPU主要供自家產(chǎn)品和服務(wù)運用。
    的頭像 發(fā)表于 12-26 15:20 ?2074次閱讀