NVIDIA Grace Hopper超級芯片橫掃MLPerf推理基準測試

從云端到網絡邊緣，NVIDIA GH200、H100和L4 GPU以及Jetson Orin模組在運行生產級 AI 時均展現出卓越性能。
?
?
?
NVIDIA GH200 Grace Hopper超級芯片首次亮相 MLPerf 行業基準測試，其運行了所有數據中心推理測試，進一步擴大了NVIDIA H100 Tensor Core GPU的領先優勢。
?
總體測試結果表明，NVIDIA AI 平臺無論是在云端還是網絡邊緣均展現出卓越的性能和通用性。
?
此外，NVIDIA宣布推出全新推理軟件，該軟件將為用戶帶來性能、能效和總體擁有成本的大幅提升。
?
GH200 超級芯片在 MLPerf 一騎絕塵

GH200將一顆Hopper GPU和一顆Grace CPU連接到一個超級芯片中。這種組合提供了更大內存、更快帶寬，能夠在CPU和GPU之間自動切換計算所需要的資源，????實現性能最優化。
?
具體而言，內置8顆H100 GPU 的 NVIDIA HGX H100系統，在本輪每項MLPerf推理測試中均實現了最高吞吐量。
?
Grace Hopper? 超級芯片和H100 GPU在所有MLPerf數據中心測試中均處于領先地位，包括針對計算機視覺、語音識別和醫學成像的推理，以及應用于生成式AI的推薦系統和大語言模型（LLM）等對性能要求更高的用例。
?
總體而言，此次測試結果延續了自2018年MLPerf基準測試推出以來，NVIDIA在每一輪AI訓練和推理中都處于領先性能的紀錄。
?
最新一輪MLPerf 測試包括一項更新的推薦系統測試，并新增首個GPT-J上的推理基準測試。GPT-J是一個由60億個參數組成的大語言模型（LLM），而AI模型的大小通常根據它有多少參數來衡量。
?
TensorRT-LLM 大幅提升推理能力

為了應對各類復雜的工作負載，NVIDIA開發了一款能夠優化推理的生成式AI軟件——TensorRT-LLM。該開源庫使客戶能夠在不增加成本的情況下將現有H100 GPU的推理性能提升兩倍以上。由于時間原因，TensorRT-LLM沒有參加8月的MLPerf提交。
?

?
NVIDIA的內部測試表明，在運行 GPT-J? 6B 模型時，相較于沒有使用TensorRT-LLM的上一代GPU，在H100 GPU上使用TensorRT-LLM能夠實現高達8倍的性能提升。
?
該軟件始于NVIDIA在對Meta、AnyScale、Cohere、Deci、Grammarly、Mistral AI、MosaicML（現為Databricks的一部分）、OctoML、Tabnine和Together AI等領先公司進行加速和優化LLM推理時所做的工作。
?
MosaicML在TensorRT-LLM 的基礎上添加了所需的功能，并將這些功能集成到他們現有的服務堆棧中。Databricks工程副總裁Naveen Rao表示：“這已成為相當輕而易舉的事情。”
?
Rao補充說：“TensorRT-LLM 簡單易用、功能豐富且高效。它為正在使用NVIDIA GPU的 LLM服務提供了最先進的性能，并使我們能夠將節省的成本回饋給我們的客戶。”
?
TensorRT-LLM 是NVIDIA全棧AI平臺持續創新的最新實例。這類持續的軟件進步為用戶帶來了無需額外成本即可實現隨著時間不斷提升的性能，并且廣泛適用于多樣化的AI工作負載。
?
L4為主流服務器增強推理能力

在最新MLPerf基準測試中，NVIDIA L4 GPU 運行了所有工作負載，并全面展現了出色的性能。
?
例如，在緊湊型72W PCIe 加速器中運行時，L4 GPU的性能比功耗超出其近5倍的CPU提高了6倍。
?
此外，L4 GPU具有專用媒體引擎，與CUDA軟件搭配使用，在NVIDIA的測試中為計算機視覺提供了高達120倍的加速。
?
谷歌云和許多系統制造商現已支持L4 GPU，為從消費互聯網服務到藥物研發各行業的客戶提供服務。
?
大幅提升邊緣性能

此外，NVIDIA采用了一種全新模型壓縮技術來展示在一個L4 GPU上運行BERT LLM的性能提升高達4.7倍。該結果體現在MLPerf的“開放分區”中，這個類別旨在展示新能力。
?
這項技術有望應用于所有AI工作負載。它尤其適用于在空間和功耗受限的邊緣設備上運行模型。
?
在另一個體現邊緣計算領導力的例證中，NVIDIA Jetson Orin模塊化系統將邊緣AI和機器人應用場景中常見的計算機視覺用例——目標檢測的性能比上一輪測試提升高達84%。
?

?
Jetson Orin性能的提升得益于軟件可以充分利用該芯片的最新核心，如一個可編程視覺加速器、一顆NVIDIA Ampere架構GPU和一個專用深度學習加速器等。
?
靈活的性能與龐大的生態

MLPerf基準測試是透明且客觀的，因此用戶可以根據其結果做出明智的購買決定。該測試還涵蓋了豐富的用例和場景，能夠讓用戶獲得可靠且可以靈活部署的性能。
?
本輪提交測試結果的合作伙伴包括微軟 Azure和Oracle Cloud Infrastructure 等云服務提供商以及華碩、Connect Tech、戴爾科技、富士通、技嘉、惠與、聯想、QCT、超微等系統制造商。
?
總體而言，MLPerf 已得到70多家機構的支持，包括阿里巴巴、Arm、思科、谷歌、哈佛大學、英特爾、Meta、微軟和多倫多大學等。
?
請閱讀技術博客，詳細了解我們如何實現這些最新的成果。
?
NVIDIA在基準測試中使用的所有軟件均可從 MLPerf 軟件庫中獲得，因此每個人都能實現全球領先的結果。我們不斷將這些優化措施整合到NVIDIA NGC軟件中心的容器中供GPU應用使用。
?

閱讀全文

NVIDIA(101457) NVIDIA(101457)

多家領先廠商采用全球首批基于NVIDIA Grace CPU的系統設計

? 加利福尼亞州圣克拉拉 —— COMPUTEX?——?太平洋時間2022年5月23日 —— NVIDIA于今日宣布，多家領先的計算機制造商將發布首批基于 NVIDIA Grace? CPU超級芯片

2022-05-24 16:05:24

2062

NVIDIA創下6項人工智能性能

在最新公布的業內首套人工智能基準測試中，NVIDIA創下6項人工智能性能記錄。NVIDIA在其提交的 6個 MLPerf 基準測試結果中均取得了最佳表現。這些測試涵蓋了多種工作負載和基礎架構規模 – 從單節點上的16顆GPU到跨80節點上的多達640顆GPU。

2018-12-17 08:32:30

2346

NVIDIA擴大AI推理性能領先優勢，首次在Arm服務器上取得佳績

最新MLPerf基準測試表明，NVIDIA已將其在AI推理性能和能效方面的高標準擴展到Arm以及x86計算機。

2021-09-23 14:18:06

2518

云服務、OEM 借助 NVIDIA AI讓AI訓練更上層樓

借助 NVIDIA AI，戴爾、浪潮、Microsoft Azure 和 Supermicro 在今天發布的新 MLPerf 基準測試中創下快速訓練 AI 模型的記錄。

2021-12-03 10:19:52

1469

MLPerf V2.0推理結果放榜，NVIDIA表現搶眼

不久前，AI性能基準評測平臺MLPerf公布了2022年首次推理（Inference v2.0）測試成績，NVIDIA的AI平臺表現依然搶眼。

2022-04-15 22:12:00

2738

NVIDIA Grace CPU迎來首批玩家，多家廠商將推出基于它的全新數據中心系統

NVIDIA在Computex前夕宣布，多家計算機制造廠商將發布首批基于NVIDIA Grace CPU超級芯片和Grace Hopper超級芯片的系統，這些系統主要用于數字孿生、AI、HPC、云圖形和游戲等各類工作負載。

2022-05-24 11:54:46

2524

Supermicro為業界領先的高性能計算、數據分析和云游戲應用組合添加搭載NVIDIA Grace CPU超級芯片的服務器

和綠色計算技術等領域的全球領導者，計劃將NVIDIA Grace CPU 超級芯片部署至針對AI、HPC、資料分析、數字孿生（Digital Twins）和計算密集型應用優化的各種服務器中。隨著人工智能

2022-05-25 18:26:00

3049

全球領先系統制造商加速采用NVIDIA Grace和Grace Hopper

芯片和NVIDIA Grace Hopper?超級芯片的服務器。 ? 所有這些新系統都得益于剛剛發布的NVIDIA HGXTM平臺中的Grace和

2022-05-31 14:46:33

1024

NVIDIA 如何應對會話式AI帶來的推理挑戰？

NVIDIA Turing GPU和Xavier 芯片系統在首個獨立AI推理基準測試 ——MLPerf Inference 0.5中取得第一名。

2019-11-08 16:53:29

5053

性能提升20倍！NVIDIA A100 GPU打破16項AI芯片性能記錄

年5月的行業基準測試組織，致力于機器學習硬件、軟件和服務的訓練和推理性能測試，囊括行業中幾乎所有知名企業和機構，比如Intel、NVIDIA、Google、微軟、阿里巴巴等。 DGX Su

2020-07-31 08:03:00

5270

NVIDIA打破AI推理性能記錄

　NVIDIA憑借A100進一步擴大了在MLPerf基準測試中的領先優勢，實現了比CPU快237倍的AI推理性能，助力企業將AI研究轉化為生產力。

2020-10-22 14:07:58

714

寧暢AI服務器X640 首登MLPerf 斬獲30項世界第一

寧暢工程師介紹，參加MLPerf Inference（推理）基準測試的X640 G30 AI服務器，最高可支持10張NVIDIA A100 PCIe卡或21張NVIDIA T4 PCIe卡，堪稱“性能猛獸”。

2020-10-23 10:48:37

644

進入容器，即開即用：NVIDIA和VMware為企業提供大規模AI服務

戴爾科技EMC PowerEdge R7525服務器近期在MLPerf基準測試中使用三個NVIDIA A100 Tensor Core GPU運行NVIDIA AI Enterprise和VMware vSphere，取得了94.4%至100%的等效裸機性能。

2021-10-08 10:10:47

1487

NVIDIA宣布推出 Hopper 架構，掀起新一代加速計算浪潮

為推動 AI 數據中心的新一輪發展，NVIDIA 于今日宣布推出采用 NVIDIA Hopper? 架構的新一代加速計算平臺。與上一代產品相比，該平臺實現了數量級的性能飛躍。

2022-03-23 11:15:41

716

NVIDIA推出DGX GH200 AI超級計算機

——2023年5月29日—— NVIDIA今天宣布推出一款新型大內存AI超級計算機——由NVIDIA? GH200 Grace Hopper超級芯片和NVIDIA NVLink? Switch System

2023-05-30 14:15:36

422

大家都在爭相超過A100，無人對標的Grace Hopper性能幾何？

電子發燒友網報道（文/周凱揚）作為英偉達在CPU與GPU技術開發上的集大成之作，Grace Hopper很大程度上象征著復雜計算領軍產品。盡管英偉達竭盡所能地去堆這一“超級芯片”的性能，但英偉達還是

2023-09-06 01:10:00

1137

NVIDIA 在首個AI推理基準測試中大放異彩

Turing GPU、Xavier芯片系統在MLPerf基準測試中展現了巨大優勢加利福尼亞州圣克拉拉市 —— 2019年11月6日 ——相信很多關注AI的人都知道，NVIDIA GPU曾于去年12

2019-11-08 19:44:51

Arm Neoverse NVIDIA Grace CPU 超級芯片：為人工智能的未來設定步伐

NVIDIA 的基準測試顯示 Grace CPU Superchip 在 SPECrate ? 2017_int_base 基準測試中達到了 740 的估計性能。NVIDIA Grace Hopper 超級

2022-03-29 14:40:21

是否有來自NVIDIA的基準測試

是否會有來自NVIDIA的基準測試，以檢查我是否完全正確實現了這些卡，以及我的調整是否正確？以上來自于谷歌翻譯以下為原文Will there be Benchmarks from NVIDIA

2018-09-29 14:28:32

軟硬件協同優化，平頭哥玄鐵斬獲MLPerf四項第一

4月7日，全球權威AI基準測試MLPerf發布最新榜單，在聚焦低功耗、高能效的IoT領域Tiny v0.7榜單中，基于平頭哥玄鐵RISC-V C906處理器的軟硬件聯合優化方案，取得了全部4個指標

2022-04-08 14:47:36

NVIDIA 創下六項人工智能性能記錄

Tensor Core GPU 在每一項 MLPerf 基準測試結果中均實現最佳表現；用戶可通過 NGC 使用加速堆棧。在最新公布的業內首套人工智能基準測試中，NVIDIA 創下 6 項人工智能

2018-12-17 22:34:02

NVIDIA下下代GPU核心架構將是Hopper

來自國外的最新爆料稱，NVIDIA的下一代GPU核心架構是Ampere（安培），下下代將是Hopper，用于紀念Grace Hopper（格蕾絲·赫柏）。

2019-06-12 15:53:20

1853

NVIDIA在最新AI推理基準測試中大獲成功

MLPerf Inference 0.5是業內首個獨立AI推理基準套件，其測試結果證明了NVIDIA Turing數據中心GPU以及 NVIDIA Xavier 邊緣計算芯片系統的性能。

2019-11-29 14:45:02

2694

谷歌計劃部署一條名為Grace Hopper的海底光纜系統

互聯網巨頭谷歌公司近日宣布了一項新的計劃，即計劃部署一條新的海底光纜系統，連接美國紐約、英國布德、西班牙畢爾巴鄂，全稱Grace Hopper系統。

2020-08-03 17:14:50

364

最新測試：NVIDIA的安培GPU測試性能是最先進 CPU的237倍

MLPerf組織今天發布最新的推理基準測試（Benchmark）MLPerf Inference v0.7結果，總共有23個組織提交了結果，相比上一個版本（MLPerf Inference v0.5）的12個提交者增加了近一倍。

2020-10-23 09:49:58

2917

浪潮AI服務器NF5488A5一舉創造18項性能紀錄

美國東部時間10月21日，全球備受矚目的權威AI基準測試MLPerf公布今年的推理測試榜單，浪潮AI服務器NF5488A5一舉創造18項性能紀錄，在數據中心AI推理性能上遙遙領先其他廠商產品

2020-10-23 16:59:44

1614

NVIDIA A100 GPU推理性能237倍碾壓CPU

MLPerf組織今天發布最新的推理基準測試（Benchmark）MLPerf Inference v0.7結果，總共有23個組織提交了結果，相比上一個版本（MLPerf Inference v0.5

2020-10-23 17:40:02

3929

Nvidia擴大了在MLPerf Benchmark上進行AI推理的領先優勢

弗洛伊德說：“英偉達在競爭激烈的競爭者中表現出色。” 與（Nvidia）V100（GPU）相比，他們的A100效果驚人，證明了其增強的Tensor核心架構的價值。我贊揚MLPerf添加了新的基準，這些基準越來越代表快速增長的推理機會，例如推薦引擎。

2020-10-24 09:17:15

1995

英偉達再次稱霸MLPerf AI基準競賽

2020-10-28 14:58:42

1590

機器學習記錄：NVIDIA再次打破MLPerf基準測試的性能記錄

由人工智能專家和計算機公司組成的聯盟MLPerf發布了一組新的機器學習記錄。這些記錄是在一系列衡量推理速度的基準上設定的：一個已經訓練過的神經網絡能多快地用新數據完成任務。手機和平板電腦的基準測試

2020-11-17 17:47:12

1682

NVIDIA下一代GPU曝光：5nm Lovelace、Hopper被延后

圖靈（Turing）和安培（Ampere）之后，很早就有爆料NVIDIA的下一代GPU將以“Hopper（赫柏）”知名，Hopper被譽為編譯之母，是偉大的女性程序員。不過，爆料好手

2020-12-21 18:07:53

1704

NVIDIA宣布其AI推理平臺的重大更新

Capital One、Microsoft、Samsung Medison、Siemens Energy、Snap等全球行業領導者都在使用該平臺 NVIDIA宣布其AI推理平臺的重大更新，目前

2021-11-12 14:42:53

1684

NVIDIA贏得四項最新行業指標

基準測試，而 NVIDIA 賦能的系統在該基準的五項測試中勝出四項。 MLPerf 是用于深度學習的行業基準測試，首次發布于 2018 年 5 月。上述戰績是 MLPerf 基準測試的最新結果

2021-11-21 10:57:47

1452

浪潮信息MLPerf單機系統測試：7項性能第一

日前,國際權威AI基準測試MLPerf公布了最新一期訓練(Training)榜單V1.1,浪潮信息憑借旗下AI服務器NF5688M6和NF5688M6的出色表現,在單機系統測試的全部8項固定任務

2021-12-08 10:35:20

578

MLPerf訓練性能測試榜單發布，浪潮信息刷新多項紀錄

,成為本次訓練榜單中的最大贏家。 MLCommons每年組織2次MLPerf 推理性能測試和2次MLPerf 訓練性能測試,其中固定任務由于要求使用相同模型和優化器測試標準十分嚴格,因而廣受廠商和客戶看重。MLPerf最新一次訓練性能基準評測涵蓋了8類極具代表性的機器學習任

2021-12-14 10:25:42

1936

MLPerf評測完美收官，浪潮信息44項冠軍成功領跑

的出色表現,成功摘得其中的7項性能第一。至此,浪潮信息2021年在MLPerf測試數據中心AI推理、邊緣AI推理和單機AI訓練三大場景下的冠軍總數達到了44項。 MLPerf是影響力最廣的國際AI性能基準

2021-12-15 10:05:59

1605

NVIDIA為需要加速計算的企業客戶運行測試服務器

借助 NVIDIA AI，戴爾、浪潮、Microsoft Azure 和 Supermicro 在今天發布的新 MLPerf 基準測試中創下快速訓練 AI 模型的記錄

2021-12-15 15:35:44

1269

NVIDIA 推出 Grace CPU 超級芯片

NVIDIA Grace? CPU 超級芯片由兩個 CPU 芯片組成，它們之間通過NVLink?-C2C互連在一起。NVLink?-C2C 是一種新型的高速、低延遲、芯片到芯片的互連技術。

2022-03-23 11:25:41

1860

GTC2022大會亮點：Grace超級芯片將是最強大CPU

GTC2022大會亮點：Grace超級芯片將是最強大CPU，將在AI、數據分析、科學計算和超大規模計算領域有著驚人的表現，擁有144個CPU核心。

2022-03-24 16:36:15

2020

NVIDIA發布最新Hopper架構的H100系列GPU和Grace CPU超級芯片

今日凌晨，NVIDIA(英偉達)發布了基于最新Hopper架構的H100系列GPU和Grace CPU超級芯片!

2022-03-26 09:07:05

2380

英偉達發布采用NVLink-C2C技術的Grace Superchip芯片

電子發燒友網報道（文/周凱揚）英偉達在GTC22上發布了全新的Grace Superchip，該芯片中用到了NVLink-C2C技術，而去年公開的Grace Hopper Superchip同樣用到

2022-03-26 11:20:53

2577

英偉達推出NVIDIA Grace CPU

NVIDIA Grace CPU是首款面向AI基礎設施和高性能計算的基于Arm Neoverse的數據中心專屬CPU，是當今領先服務器芯片內存帶寬和能效的兩倍。

2022-03-30 14:11:31

1489

通過全堆棧優化提升MLPerf v1.1的性能

所有用于 NVIDIA 提交的軟件都可以從 MLPerf 存儲庫中獲得，以使您能夠重現我們的基準測試結果。我們不斷地將這些尖端的 MLPerf 改進添加到?NGC?上提供的深度學習框架容器中，這是我們針對 GPU 優化應用程序的軟件中心。

2022-04-02 11:23:02

865

NVIDIA發布最新Orin芯片提升邊緣AI標桿

在首次參加行業 MLPerf 基準測試時，基于 NVIDIA Ampere 架構的低功耗系統級芯片 NVIDIA Orin 就創造了新的AI推理性能紀錄，并在邊緣提升每個加速器的性能。

2022-04-08 10:14:44

4199

利用MLPerf 推理 1.1提升NVIDIA績效領導力

　　NGC 可通過您首選的云提供商的市場免費獲得。在那里，您可以找到 TensorRT 和 NVIDIA Triton 的最新版本，這兩個版本都有助于生成最新的 MLPerf 推斷 1.1 結果。

2022-04-08 16:03:01

988

NVIDIA Jetson AGX Orin提升邊緣AI標桿

最新發布的 NVIDIA Jetson AGX Orin 提升邊緣 AI 標桿，使我們在最新一輪行業推理基準測試中的領先優勢更加明顯。

2022-04-09 08:24:14

1192

工業富聯采用基于英偉達的超級芯片NVIDIA Grace CPU

5月24日，工業富聯宣布采用基于英偉達NVIDIA HGX、OVX和CGX系統設計的超級芯片NVIDIA Grace CPU和NVIDIA Grace Hopper Superchip，以滿足超級數據中心及邊緣運算等更高的算力需求。

2022-05-26 15:17:55

3292

NVIDIA Grace超級芯片為HPC及AI工作負載提速

NVIDIA于今日宣布，多家全球領先的計算機制造商正在采用全新NVIDIA Grace?超級芯片打造新一代服務器，為超大規模時代的AI和HPC工作負載提速。

2022-05-31 19:28:41

2205

計算機制造商采用全新NVIDIA Grace超級芯片打造新一代服務器

源訊、戴爾科技，技嘉科技、慧與、浪潮、聯想和超微成為首批將基于 NVIDIA Grace 的 HGX 系統用于 HPC 和 AI 的制造商。

2022-06-01 10:32:42

945

通過NVIDIA超級芯片和軟件實現性能突破

超級計算機、儀器和不斷擴展的量子計算生態系統將通過 NVIDIA 超級芯片和軟件實現性能突破。

2022-06-01 10:46:38

1045

如何對推理加速器進行基準測試

　　客戶對基準推理學習曲線的最后階段是開發自己的模型，使用通常來自 Nvidia 或數據中心的訓練硬件/軟件，然后在可能的目標推理加速器上對該模型進行基準測試。

2022-06-06 16:02:21

1044

NVIDIA AI平臺在MLPerf基準測試實現飛躍

NVIDIA AI 仍是唯一能夠運行 MLPerf 行業基準測試中所有測試的平臺， A100 GPU 自發布以來連續兩年一直保持著獲勝次數最多的紀錄。

2022-07-01 10:52:08

743

MLPerf是邊緣AI推理的新行業基準

　　最新的 AI 推理基準顯然具有重要意義，因為它是目前可用的最接近真實世界 AI 推理性能的衡量標準。但隨著它的成熟和吸引更多的提交，它也將成為成功部署技術堆棧的晴雨表和新實施的試驗場。

2022-07-08 15:37:55

1246

MLPerf 擴展 AI 推理基準測試，Nvidia 在所有測試中名列前茅

英偉達在所有六個應用領域的 MLPerf AI 推理基準測試中均名列前茅，其中包括針對數據中心和邊緣計算系統的四個新測試。

2022-08-18 15:41:58

570

為NVIDIA MLPerf Training v2.0性能提供動力的全堆棧優化

　　NVIDIA MLPerf v2.0 提交基于經驗證的 A100 Tensor Core GPU 、 NVIDIA DGX A100 系統以及 NVIDIA DGX SuperPOD 參考架構。許多合作伙伴還使用 A100 Tensor Core GPU 提交了結果。

2022-08-15 16:43:18

1053

英偉達Grace Hopper CPU架構

英偉達SCF 在各種 Grace 芯片單元（如 CPU 內核、內存和 I/O）之間提供 3.2 TB/s 的雙向帶寬，更不用說將芯片連接到主板上其他單元（無論是另一個Grace CPU還是Hopper GPU）的NVLink-C2C接口。

2022-08-23 16:02:31

1415

NVIDIA即將推出首批基于開創性 NVIDIA Hopper 架構的產品和服務

NVIDIA 于今日宣布 NVIDIA H100 Tensor Core GPU 全面投產，NVIDIA 全球技術合作伙伴計劃于 10 月推出首批基于開創性 NVIDIA Hopper 架構的產品和服務。

2022-09-22 10:45:01

956

NVIDIA Grace Hopper超級芯片賦能推薦系統

借助 Grace Hopper 超級芯片，有助于用戶個性化互聯網的大規模 AI 模型的性能更加準確。

2022-09-23 11:32:08

1066

NVIDIA為HPC和AI加強超級芯片工程

NVIDIA Grace CPU 是 NVIDIA 開發的第一個數據中心 CPU 。它是從頭開始建造的，以創建世界上第一個超級芯片。

2022-10-11 09:40:05

1032

MLPerf：邊緣AI推理的新行業基準

這些數字重要嗎？它們中的大多數都是在實驗室類型的環境中生產的，其中理想的條件和工作負載允許被測設備（SUT）產生用于營銷目的的最高分數。另一方面，大多數工程師可能不太關心這些理論可能性。他們更關心的是技術如何影響其推理設備的準確性、吞吐量和/或延遲。

2022-10-14 09:41:38

465

深度解讀英偉達最強異構平臺：NVIDIA Grace Hopper Superchip

NVIDIA Grace Hopper Superchip 架構是第一個真正的異構加速平臺，適用于高性能計算(HPC) 和AI工作負載。它利用 GPU 和 CPU 的優勢加速應用程序，同時提供迄今為止最簡單、最高效的分布式異構編程模型。

2022-11-14 10:13:52

830

深入解讀NVIDIA Grace Hopper Superchip架構

NVIDIA NVLink-C2C 是一種 NVIDIA 內存一致性、高帶寬和低延遲的超級芯片互連。它是 Grace Hopper Superchip 的核心，提供高達 900 GB/s 的總帶寬。這比加速系統中常用的 x16 PCIe Gen5 通道高 7 倍。

2022-11-18 10:15:18

559

深入解讀Grace CPU芯片架構

NVIDIA Grace CPU 超級芯片是使用兩個通過 NVLink-C2C 連接的 Grace CPU 構建的。該超級芯片建立在現有 Arm 生態系統的基礎上，為 HPC、要求苛刻的云工作負載以及高性能和高能效的密集基礎設施創建了首個毫不妥協的 Arm CPU。

2023-02-02 11:47:09

857

GTC 2023直播：英偉達推出Hopper GPU，速度比PCIE快7倍

Grace Hopper非常適合處理大型數據集，例如適用于推薦系統和大型語言模型的AI數據庫。

2023-03-22 12:40:54

1395

NVIDIA推出用于大型語言模型和生成式AI工作負載的推理平臺

軟件與最新的NVIDIA Ada、Hopper和Grace Hopper處理器相結合，包括今天推出的NVIDIA L4 Tensor Core GPU和NVI

2023-03-22 14:48:39

256

NVIDIA GTC 2023:GPU算力是AI的必需品

愿景的期待，也帶來了多款重磅硬件新品。包括全新的GPU推理平臺L4 Tensor Core GPU、L40 GPU、H100 NVL GPU和Grace Hopper超級芯片。這

2023-03-22 15:23:28

2899

GTC 2023上英偉達發布NVIDIA DGX Cloud人工智能云服務

GPU和Grace Hopper超級芯片。 GTC 2023上，英偉達發布NVIDIA DGX Cloud人工智能云服務。NVIDIA DGX Cloud是一項人工智能超級計算服務，它可以讓企業快速訪問

2023-03-22 19:16:44

3114

GTC23 | NVIDIA 推出用于大型語言模型和生成式 AI 工作負載的推理平臺

的全棧推理軟件與最新的 NVIDIA Ada、Hopper 和 Grace Hopper 處理器相結合，包括今天推出的 NVIDIA L4 Tensor Core GPU 和

2023-03-23 06:55:02

654

NVIDIA 在 MLPerf 測試中將推理帶到新高度

的第三方基準測試，MLPerf 仍是衡量 AI 性能的權威標準。自 MLPerf 誕生以來，NVIDIA 的 AI 平臺在訓練和推理這兩個方面一直展現出領先優勢，包括最新發布的 MLPerf

2023-04-08 00:30:08

389

MLPerf 3.0最新發榜，戴爾AI和邊緣服務器拿下歷史最好成績

計算基準測試，包含Training（訓練）和Inference（推理）兩大領域。MLPerf選擇AI各個熱門領域的經典模型，在滿足技術規范前提

2023-04-12 18:55:35

1494

NVIDIA Grace 掀起新型節能 Arm 超級計算機的新浪潮

公布了一個基于 NVIDIA Grace CPU 超級芯片的超級計算機，為基于 Arm Neoverse 平臺的新型節能超級計算機掀起了一輪新的浪潮。 Isambard 3 超級計算機位于英國布里斯托和巴斯科學

2023-05-23 07:10:02

352

COMPUTEX2023 | NVIDIA 推出 DGX GH200 AI 超級計算機

—2023 年 5 月 29 日— NVIDIA 今天宣布推出一款新型大內存 AI 超級計算機——由 NVIDIA GH200 Grace Hopper 超級芯片和 NVIDIA NVLink

2023-05-30 01:40:01

1458

NVIDIA 與軟銀公司合作，利用 Grace Hopper 超級芯片建設面向生成式 AI 和 5G/6G 的軟銀下一代數據中心

宣布，雙方正在合作打造一個基于 NVIDIA GH200 Grace Hopper 超級芯片、面向生成式 AI 和 5G/6G 應用的開創性平臺。軟銀計劃在日本各地的全新分布式 AI 數據中心采用

2023-05-30 01:40:02

417

COMPUTEX2023 | 為加速生成式 AI 而設計的 NVIDIA Grace Hopper 超級芯片全面投產

年 5 月 29 日 — ?NVIDIA 于今日宣布 NVIDIA GH200 Grace Hopper 超級芯片全面投產，將為全球各地即將上線的系統提供運行復雜 AI 和 HPC 工作負載所需的動力。這些

2023-05-30 01:40:02

634

COMPUTEX 2023 NVIDIA 重磅發布一覽

性的技術 —— 生成式 AI。其中，多數產品由 Grace Hopper 超級芯片提供支持。 NVIDIA 創始人兼首席執行官黃仁勛表示，“加

2023-06-01 09:05:01

644

NVIDIA為加速生成式AI而設計的超級芯片全面投產

5 月29 日，英偉達在 2023 臺北電腦展大會推出了DGX GH200 AI超級計算機，這是配備256顆Grace Hopper超級芯片和NVIDIA NVLink交換機系統的尖端系統，具有1 exaflop性能和144TB共享內存。

2023-06-01 15:59:23

377

如何使用NVIDIA Triton 推理服務器來運行推理管道

使用集成模型在 NVIDIA Triton 推理服務器上為 ML 模型管道提供服務

2023-07-05 16:30:34

1080

NVIDIA Hopper GPU上的新cuBLAS12.0功能和矩陣乘法性能

NVIDIA Hopper GPU 上的新 cuBLAS 12.0 功能和矩陣乘法性能

2023-07-05 16:30:38

1583

NVIDIA Grace Hoppper所帶來的性能突破

深度了解 NVIDIA Grace Hopper 超級芯片架構

2023-07-05 16:30:42

253

新的 MLPerf 推理網絡部分展現 NVIDIA InfiniBand 網絡和 GPUDirect RDMA 的強大能力

在 MLPerf Inference v3.0?中，NVIDIA 首次將網絡納入了 MLPerf 的評測項目，成為了 MLPerf 推理數據中心套件的一部分。網絡評測部分旨在模擬在真實的數據中心

2023-07-19 19:10:03

603

字節跳動AI開啟測試代號“Grace”

字節跳動AI開啟測試代號“Grace” 字節跳動AI開啟測試；目前在內測階段，需要邀請或授權的相關賬號登錄后才可使用。代號為Grace；這是一個對話類AI項目，支持文本生成圖片等需求。

2023-08-07 16:58:05

871

SIGGRAPH主題演講：NVIDIA首席執行官帶來生成式AI多項創新

黃仁勛發布最新GH200 Grace Hopper 超級芯片和NVIDIA AI Workbench，并宣布更新NVIDIA Omniverse，使其支持生成式AI

2023-08-09 14:20:09

684

英偉達全球首發超級AI芯片訓練大模型成本更低

黃仁勛向數千名開發者和圖形專業人士發表講話，宣布更新 GH200 Grace Hopper 超級芯片、英偉達 AI Workbench，并將把生成式 AI 引入英偉達 Omniverse。

2023-08-09 14:42:55

787

NVIDIA CPU+GPU超級芯片大升級！

NVIDIA官方宣布了新一代GH200 Grace Hopper超級芯片平臺，全球首發采用HBM3e高帶寬內存，可滿足世界上最復雜的生成式AI負載需求。

2023-08-10 09:37:12

892

英偉達全球首發HBM3e 專為生成式AI時代打造

2023年8月8日，NVIDIA創始人兼CEO黃仁勛在計算機圖形年會SIGGRAPH上發布了HBM3e內存新一代GH200 Grace Hopper超級芯片。這款芯片被黃仁勛稱為“加速計算和生成式AI時代的處理器”，旨在用于任何大型語言模型，以降低推理成本。

2023-08-11 16:29:17

766

全球GPU呈現“一超一強”競爭格局

目前英偉達產品 DGX GH200 已發布，互連技術強大，算力進一步升級。5月 29 日，英偉達在其發布會上，正式發布最新的 GH200 Grace Hopper 超級芯片，以及擁有 256 個 GH200 超級芯片的 NVIDIA DGX GH200 超級計算機。

2023-08-14 11:51:56

1249

NVIDIA最強CPU芯片架構——NVIDIA Grace CPU

NVIDIA Grace Hopper Superchip將節能、高帶寬的 NVIDIA Grace CPU 與功能強大的 NVIDIA H100 Hopper GPU 結合使用 NVLink-C2C，以最大限度地提高強大的高性能計算 (HPC) 和巨型 AI 工作負載的能力。

2023-08-30 10:45:44

915

NVIDIA Grace Hopper 超級芯片橫掃 MLPerf 推理基準測試

超級芯片首次亮相 MLPerf 行業基準測試，其運行了所有數據中心推理測試，進一步擴大了 NVIDIA H100 Tensor Core GPU 的領先優勢。總體測試結果表明，NVIDIA AI

2023-09-12 20:40:04

249

英偉達分享Grace CPU Superchip的新基準

? Nvidia 分享了該公司Grace CPU Superchip的新基準。下一代基于 Arm Neoverse 的芯片將為數據中心提供動力，在相同功耗下，其性能是 AMD 第四代EPYC Genoa和英特爾第四代Sapphire Rapids Xeon處理器的兩倍。

2023-09-18 15:57:03

251

NVIDIA 為全球領先的 AI 計算平臺 Hopper 再添新動力

NVIDIA HGX? H200，為 Hopper 這一全球領先的 AI 計算平臺再添新動力。NVIDIA HGX H200 平臺基于 NVIDIA Hopper? 架構，搭載 NVIDIA H200

2023-11-14 14:30:01

SC23 | 新型加速節能 AI 系統開創超級計算的新時代

世界各地的研究人員將在配備最新 NVIDIA Hopper GPU 和 NVIDIA Grace Hopper 超級芯片的系統上，借助生成式 AI 和 HPC 來應對科學和工業領域的重大挑戰。 11

2023-11-15 18:45:01

314

亞馬遜云科技與 NVIDIA 宣布開展戰略合作，為生成式 AI 提供全新超級計算基礎架構、軟件和服務

亞馬遜云科技將提供首款搭載 NVIDIA Grace Hopper 超級芯片和亞馬遜云科技可擴展性 UltraCluster 的云? AI 超級計算機。首款采用 NVIDIA GH200

2023-11-29 21:00:01

360

AWS成為第一個提供NVIDIA GH200 Grace Hopper超級芯片的提供商

2023年的AWS re:Invent大會上，AWS和NVIDIA宣布AWS將成為第一個提供NVIDIA GH200 Grace Hopper超級芯片的云服務提供商。

2023-11-30 09:24:11

291

英偉達Grace-Hopper提供一個緊密集成的CPU + GPU解決方案

英偉達Grace-Hopper提供了一個緊密集成的CPU + GPU解決方案，針對生成式人工智能逐漸成為主導的市場環境。

2024-01-02 15:52:55

283

Arm架構與Neoverse技術在基礎設施領域的應用與發展

Arm的Neoverse系列已有穩定的立足點。例如，英偉達的超級芯片Grace-Hopper就是由兩片獨立的芯片組成，其中 Hopper負責處理所有AI任務，如張量運算，Grace則扮演 CPU角色，利用I/O與內存管理功能與常規云世界相連。

2024-02-22 15:36:15

121

NVIDIA 推出 Blackwell 架構 DGX SuperPOD，適用于萬億參數級的生成式 AI 超級計算

基于先進的 NVIDIA 網絡、NVIDIA 全棧 AI 軟件和存儲技術，可將集群中 Grace Blackwell 超級芯片的數量擴展至數萬個，通過 NVIDIA NVLink可將多達 576

2024-03-19 10:56:35

NVIDIA推出搭載GB200 Grace Blackwell超級芯片的NVIDIA DGX SuperPOD?

NVIDIA 于太平洋時間 3 月 18 日發布新一代 AI 超級計算機 —— 搭載 NVIDIA GB200 Grace Blackwell 超級芯片的 NVIDIA DGX SuperPOD?。

2024-03-21 09:49:29

168

英偉達GH200、特斯拉Dojo超級算力集群，性能爆棚！算力之爭加劇！

等全球最復雜的生成式 AI 工作負載而構建。 ? 日前，這款GH200 Grace Hopper超級芯片首次亮相MLPerf行業基準測試，在此次測試中，具有更高的內存帶寬和更大的內存容量的GH200

2023-09-14 09:10:04

1930

已全部加載完成

搜索歷史

NVIDIA Grace Hopper超級芯片橫掃MLPerf推理基準測試

評論