精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

了解NVIDIA首款服務(wù)器CPU

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-08-25 15:23 ? 次閱讀

新的芯片設(shè)計反映了 NVIDIA 在 AI、高性能計算和邊緣計算領(lǐng)域平臺創(chuàng)新的廣度和深度。

在為期兩天的四場演講中,NVIDIA 高級工程師介紹了現(xiàn)代數(shù)據(jù)中心網(wǎng)絡(luò)邊緣系統(tǒng)在加速計算方面的創(chuàng)新。

虛擬 Hot Chips 大會是處理器和系統(tǒng)架構(gòu)師的年度聚會。NVIDIA 高級工程師在演講中披露了 NVIDIA 首款服務(wù)器 CPU、Hopper GPU、新版 NVSwitch 互連芯片和 NVIDIA Jetson Orin 系統(tǒng)模塊 (SoM) 的性能數(shù)據(jù)和其他技術(shù)細(xì)節(jié)。

這些演講就 NVIDIA 平臺如何在性能、效率、規(guī)模和安全性方面達(dá)到更高水平提供了新見解。

具體來說,演講展示了某種設(shè)計理念,即在 GPU、 CPU 和 DPU 充當(dāng)對等處理器的整個芯片、系統(tǒng)和軟件堆棧中進(jìn)行創(chuàng)新。他們共同創(chuàng)建的平臺已經(jīng)在云服務(wù)提供商、超級計算中心、企業(yè)數(shù)據(jù)中心和自主系統(tǒng)內(nèi)運行 AI、數(shù)據(jù)分析和高性能計算工作。

了解 NVIDIA 首款服務(wù)器 CPU

數(shù)據(jù)中心需要靈活的 CPU、GPU 和其他加速器集群共享海量內(nèi)存池,以提供當(dāng)今工作負(fù)載所需的高效性能。

為滿足這一需求,NVIDIA 的杰出工程師兼 15 年資深員工 Jonathon Evans 介紹了 NVIDIA NVLink-C2C。它以每秒 900 GB 的速度連接 CPU 和 GPU,歸功于每比特僅消耗 1.3 皮焦耳的數(shù)據(jù)傳輸,其能效是現(xiàn)有 PCIe 5.0 標(biāo)準(zhǔn)的 5 倍。

NVLink-C2C 連接兩個 CPU 芯片,可創(chuàng)建具有 144 個 Arm Neoverse 核心和 512 GB 內(nèi)存的 NVIDIA Grace CPU——用于解決全球大型計算問題的處理器。

為更大限度地提高效率,Grace CPU 使用 LPDDR5X 內(nèi)存。它可實現(xiàn)每秒 1 TB 的內(nèi)存帶寬,同時將整個復(fù)合體的功耗保持在 500 瓦。

一個鏈接,多種用途

NVLink-C2C 還在 NVIDIA Grace Hopper 超級芯片中將 Grace CPU 和 Hopper GPU 芯片作為內(nèi)存共享對等體關(guān)聯(lián),更大限度地加速像 AI 訓(xùn)練這樣對性能要求很高的作業(yè)。

任何人都可以使用 NVLink-C2C 構(gòu)建定制小芯片,以協(xié)調(diào)地連接 NVIDIA GPU、CPU、DPU 和 SoC,擴(kuò)展這一新的集成產(chǎn)品類別。互連將支持 Arm 和 x86 處理器各自使用的 AMBA CHI 和 CXL 協(xié)議。

Grace 和 Grace Hopper 的首個內(nèi)存基準(zhǔn)測試

為了在系統(tǒng)層面進(jìn)行擴(kuò)展,新的 NVIDIA NVSwitch 將多臺服務(wù)器連接到一臺 AI 超級計算機(jī)。它使用 NVLink,互聯(lián)速度為每秒 900 GB,是 PCIe 5.0 帶寬的 7 倍以上。

NVSwitch 使用戶能夠?qū)?32 個 NVIDIA DGX H100 系統(tǒng)連接到一臺 AI 超級計算機(jī)中,這臺超級計算機(jī)可以提供百億億次級峰值 AI 性能。

NVIDIA 的兩位資深工程師 Alexander Ishii 和 Ryan Wells 介紹該交換機(jī)如何助力用戶構(gòu)建可支持多達(dá) 256 個 GPU 的系統(tǒng),以處理要求嚴(yán)苛的工作負(fù)載,例如訓(xùn)練具有超過 1 萬億參數(shù)的 AI 模型。

該交換機(jī)包括使用 NVIDIA SHARP 技術(shù)加速數(shù)據(jù)傳輸?shù)囊妗HARP 是網(wǎng)絡(luò)計算功能,最初在 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)上使用。它可以使通信密集型 AI 應(yīng)用的數(shù)據(jù)吞吐量翻倍。

NVSwitch 系統(tǒng)支持百億億次級 AI 超級計算機(jī)

Jack Choquette 是在 NVIDIA 任職 14 年的杰出高級工程師,他詳細(xì)介紹了 NVIDIA H100 Tensor Core GPU(也稱為 Hopper)。

除使用新的互連技術(shù)擴(kuò)展到新的高度外,它還包括許多先進(jìn)功能,可提升加速器的性能、效率和安全性。

與上一代相比,Hopper 的新 Transformer 引擎和升級版 Tensor Core 可在使用全球大型神經(jīng)網(wǎng)絡(luò)模型進(jìn)行 AI 推理時,將速度提升 30 倍。此外,它采用全球首款 HBM3 內(nèi)存系統(tǒng),可提供高達(dá) 3 TB 的內(nèi)存帶寬,這是 NVIDIA 有史以來幅度超大的代際提升。

其他新功能包括:

Hopper 添加了針對多租戶、多用戶配置的虛擬化支持。

新的 DPX 指令集可加快選定映射、DNA 和蛋白質(zhì)分析應(yīng)用的遞歸循環(huán)速度。

Hopper 還支持通過機(jī)密計算增強(qiáng)安全性。

Choquette 在職業(yè)生涯早期曾是任天堂 64 游戲機(jī)的首席芯片設(shè)計師,他還介紹了一些 Hopper 進(jìn)步背后的并行計算技術(shù)。

Michael Ditty 是 Orin 的首席架構(gòu)師并在 NVIDIA 任職 17 年,他講解了 NVIDIA Jetson AGX Orin(適用于邊緣 AI、機(jī)器人開發(fā)和高級自主機(jī)器的引擎)的新性能規(guī)格

NVIDIA Jetson AGX Orin 集成了 12 個 Arm Cortex-A78 核心和一個 NVIDIA Ampere 架構(gòu) GPU,可為 AI 推理作業(yè)提供每秒高達(dá) 275 萬億次運算。相較上一代,能效提升 2.3 倍,性能提升高達(dá) 8 倍。

新的生產(chǎn)模塊包含高達(dá) 32 GB 的內(nèi)存,是兼容系列的一部分,可縮小至口袋大小的 5W Jetson Nano 開發(fā)者套件。

NVIDIA Orin 的性能基準(zhǔn)測試

所有新芯片都支持 NVIDIA 軟件堆棧,該堆棧可加速 700 多個應(yīng)用,為 250 萬名開發(fā)者所用。

它基于 CUDA 編程模型,包含數(shù)十個面向垂直市場的 NVIDIA SDK,例如汽車 (DRIVE) 和醫(yī)療健康 (Clara),以及推薦系統(tǒng) (Merlin) 和對話式 AI (Riva) 等技術(shù)。

各大云服務(wù)和系統(tǒng)制造商均提供 NVIDIA AI 平臺。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10825

    瀏覽量

    211150
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4940

    瀏覽量

    102815
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    9021

    瀏覽量

    85184
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30146

    瀏覽量

    268417

原文標(biāo)題:Hot Chips | NVIDIA 分享關(guān)于 Grace CPU、Hopper GPU、NVLink Switch 最新細(xì)節(jié)

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    SMTP服務(wù)器配置教程

    1. 了解SMTP服務(wù)器 SMTP服務(wù)器是用于發(fā)送電子郵件的服務(wù)器。它使用SMTP協(xié)議來處理郵件的發(fā)送。配置SMTP服務(wù)器需要
    的頭像 發(fā)表于 10-30 16:16 ?468次閱讀

    服務(wù)器cpu占用率高怎么解決

    服務(wù)器CPU占用率高是一個常見的問題,它可能會導(dǎo)致服務(wù)器性能下降,甚至影響用戶體驗。 一、了解服務(wù)器CP
    的頭像 發(fā)表于 10-10 15:14 ?727次閱讀

    服務(wù)器cpu和臺式機(jī)cpu區(qū)別

    服務(wù)器CPU和臺式機(jī)CPU的區(qū)別是一個復(fù)雜的話題,涉及到多個方面,包括設(shè)計、性能、功耗、可靠性、成本等。 服務(wù)器CPU和臺式機(jī)
    的頭像 發(fā)表于 10-10 15:12 ?851次閱讀

    香港服務(wù)器選擇CPU需要考慮的因素

    選擇適合香港服務(wù)器CPU是一項細(xì)致的工作,涉及到多方面的考量。正確的選擇不僅能夠滿足當(dāng)前的業(yè)務(wù)需求,還能為未來的發(fā)展預(yù)留空間。以下是選擇香港服務(wù)器CPU時需要考慮的一些重要因素:
    的頭像 發(fā)表于 09-30 09:50 ?170次閱讀

    NVIDIA AI服務(wù)器領(lǐng)域重大革新:預(yù)計明年首推插槽式設(shè)計

    在科技界引起廣泛關(guān)注的最新動態(tài)中,里昂證券于9月26日發(fā)布了一份引人注目的報告,揭示了NVIDIA在AI服務(wù)器領(lǐng)域的一項重大變革。據(jù)該報告透露,NVIDIA即將在AI服務(wù)器領(lǐng)域引入插槽
    的頭像 發(fā)表于 09-26 14:25 ?767次閱讀

    gpu服務(wù)器cpu服務(wù)器的區(qū)別對比,終于知道怎么選了!

    gpu服務(wù)器cpu服務(wù)器的區(qū)別主要體現(xiàn)在架構(gòu)設(shè)計、性能特點、能耗效率、應(yīng)用場景、市場定位等方面,在以上幾個方面均存在顯著差異。CPU服務(wù)器
    的頭像 發(fā)表于 08-01 11:41 ?442次閱讀

    ai服務(wù)器是什么架構(gòu)類型

    AI服務(wù)器,即人工智能服務(wù)器,是專門為人工智能應(yīng)用設(shè)計的高性能計算服務(wù)器。AI服務(wù)器的架構(gòu)類型有很多種,以下是一些常見的架構(gòu)類型: CPU
    的頭像 發(fā)表于 07-02 09:51 ?938次閱讀

    ai服務(wù)器和通用服務(wù)器的區(qū)別在哪

    AI服務(wù)器和通用服務(wù)器的區(qū)別主要體現(xiàn)在以下幾個方面: 硬件配置 AI服務(wù)器和通用服務(wù)器在硬件配置上有很大的區(qū)別。AI服務(wù)器通常需要更強(qiáng)大的計
    的頭像 發(fā)表于 07-02 09:46 ?887次閱讀

    龍芯中科CPU服務(wù)器中標(biāo)中國移動服務(wù)器集采項目

    近日,中國移動發(fā)布《中國移動2024年P(guān)C服務(wù)器產(chǎn)品集中采購(標(biāo)包21)中標(biāo)候選人公示》,浪潮龍芯3C5000 CPU服務(wù)器成功中標(biāo)2400臺,這是龍芯助力運營商行業(yè)實現(xiàn)自主可控的又一突破。
    的頭像 發(fā)表于 05-24 14:24 ?617次閱讀

    使用NVIDIA Triton推理服務(wù)器來加速AI預(yù)測

    這家云計算巨頭的計算機(jī)視覺和數(shù)據(jù)科學(xué)服務(wù)使用 NVIDIA Triton 推理服務(wù)器來加速 AI 預(yù)測。
    的頭像 發(fā)表于 02-29 14:04 ?547次閱讀

    服務(wù)器cpu和普通電腦cpu的區(qū)別

    服務(wù)器CPU和普通電腦CPU之間存在許多區(qū)別。在以下文章中,我們將詳細(xì)介紹服務(wù)器CPU和普通電腦CPU
    的頭像 發(fā)表于 02-01 11:14 ?6475次閱讀

    gpu服務(wù)器是干什么的 gpu服務(wù)器cpu服務(wù)器的區(qū)別有哪些

    gpu服務(wù)器是干什么的 gpu服務(wù)器cpu服務(wù)器的區(qū)別 GPU服務(wù)器是一種專門用于處理圖形運算的服務(wù)器
    的頭像 發(fā)表于 01-30 15:31 ?817次閱讀

    物理服務(wù)器對ai發(fā)展的應(yīng)用

    物理服務(wù)器在AI發(fā)展中扮演著重要的角色。傳統(tǒng)的以CPU為計算部件的服務(wù)器架構(gòu)已難以滿足人工智能的新需求,因此,"CPU+ GPU/FPGA/ASIC"的異構(gòu)計算架構(gòu)成為人工智能
    的頭像 發(fā)表于 12-22 09:19 ?428次閱讀

    gpu服務(wù)器是干什么的 gpu服務(wù)器cpu服務(wù)器的區(qū)別

     相比于傳統(tǒng)的CPU服務(wù)器,GPU服務(wù)器支持同時計算大量相似的計算操作,可以實現(xiàn)更強(qiáng)的并行計算性能。GPU服務(wù)器通常配備多個高性能的GPU,可以有效地支持大規(guī)模數(shù)據(jù)并行處理,提高了計算
    的頭像 發(fā)表于 12-02 17:20 ?1861次閱讀