无码人妻一区二区三区免费看-文中字幕一区二区三区视频播放-成人无号精品一区二区三区-99爱国产精品免费高清在线-亚洲AV片在线观看

基于Chiplet與片間互聯(lián)技術(shù)，800Gb/s RNIC，1.8TB/sNVLink，英偉達(dá)正一步步構(gòu)建出大型AI超算集群。互聯(lián)效率定義LLM效率，互聯(lián)元年正式開啟。

AI春晚GTC開幕，皮衣老黃再次燃爆全場。

時隔兩年，英偉達(dá)官宣新一代Blackwell架構(gòu)，定位直指“新工業(yè)革命的引擎” ，“把AI擴(kuò)展到萬億參數(shù)”。

作為架構(gòu)更新大年，本次大會亮點頗多：

宣布GPU新核彈B200，超級芯片GB200

Blackwell架構(gòu)新服務(wù)器，一個機(jī)柜頂一個超算

推出AI推理微服務(wù)NIM，要做世界AI的入口

新光刻技術(shù)cuLitho進(jìn)駐臺積電，改進(jìn)產(chǎn)能。
……

8年時間，AI算力已增長1000倍。

老黃斷言“加速計算到達(dá)了臨界點，通用計算已經(jīng)過時了”。

我們需要另一種方式來進(jìn)行計算，這樣我們才能夠繼續(xù)擴(kuò)展，這樣我們才能夠繼續(xù)降低計算成本，這樣我們才能夠繼續(xù)進(jìn)行越來越多的計算。

老黃這次主題演講題目為《見證AI的變革時刻》，但不得不說，英偉達(dá)才是最大的變革本革。

GPU的形態(tài)已徹底改變

我們需要更大的GPU，如果不能更大，就把更多GPU組合在一起，變成更大的虛擬GPU。

Blackwell新架構(gòu)硬件產(chǎn)品線都圍繞這一句話展開。

通過芯片，與芯片間的連接技術(shù)，一步步構(gòu)建出大型AI超算集群。

4nm制程達(dá)到瓶頸，就把兩個芯片合在一起，以10TB每秒的滿血帶寬互聯(lián)，組成B200 GPU，總計包含2080億晶體管。

沒錯，B100型號被跳過了，直接發(fā)布的首個GPU就是B200。

兩個超級芯片裝到主板上，成為一個Blackwell計算節(jié)點。

18個這樣的計算節(jié)點共有36CPU+72GPU，組成更大的“虛擬GPU”。

它們之間由今天宣布的NVIDIA Quantum-X800 InfiniBand和Spectrum-X800以太網(wǎng)平臺連接，可提供速度高達(dá)800Gb/s的網(wǎng)絡(luò)。

在NVLink Switch支持下，最終成為“新一代計算單元”GB200 NVL72。

一個像這樣的“計算單元”機(jī)柜，F(xiàn)P8精度的訓(xùn)練算力就高達(dá)720PFlops，直逼H100時代一個DGX SuperPod超級計算機(jī)集群（1000 PFlops）。

與相同數(shù)量的72個H100相比，GB200 NVL72對于大模型推理性能提升高達(dá)30倍，成本和能耗降低高達(dá)25倍。

把GB200 NVL72當(dāng)做單個GPU使用，具有1.4EFlops的AI推理算力和30TB高速內(nèi)存。

再用Quantum InfiniBand交換機(jī)連接，配合散熱系統(tǒng)組成新一代DGX SuperPod集群。

DGX GB200 SuperPod采用新型高效液冷機(jī)架規(guī)模架構(gòu)，標(biāo)準(zhǔn)配置可在FP4精度下提供11.5 Exaflops算力和240TB高速內(nèi)存。

此外還支持增加額外的機(jī)架擴(kuò)展性能。

最終成為包含32000 GPU的分布式超算集群。

老黃直言，“英偉達(dá)DGX AI超級計算機(jī)，就是AI工業(yè)革命的工廠”。

將提供無與倫比的規(guī)模、可靠性，具有智能管理和全棧彈性，以確保不斷的使用。

在演講中，老黃還特別提到2016年贈送OpenAI的DGX-1，那也是史上第一次8塊GPU連在一起組成一個超級計算機(jī)。

從此之后便開啟了訓(xùn)練最大模型所需算力每6個月翻一倍的增長之路。

GPU新核彈GB200

過去，在90天內(nèi)訓(xùn)練一個1.8萬億參數(shù)的MoE架構(gòu)GPT模型，需要8000個Hopper架構(gòu)GPU，15兆瓦功率。

如今，同樣給90天時間，在Blackwell架構(gòu)下只需要2000個GPU，以及1/4的能源消耗。

在標(biāo)準(zhǔn)的1750億參數(shù)GPT-3基準(zhǔn)測試中，GB200的性能是H100的7倍，提供的訓(xùn)練算力是H100的4倍。

Blackwell架構(gòu)除了芯片本身外，還包含多項重大革新：

第二代Transformer引擎

動態(tài)為神經(jīng)網(wǎng)絡(luò)中的每個神經(jīng)元啟用FP6和FP4精度支持。

第五代NVLink高速互聯(lián)

為每個GPU 提供了1.8TB/s雙向吞吐量，確保多達(dá)576個GPU之間的無縫高速通信。

Ras Engine（可靠性、可用性和可維護(hù)性引擎）

基于AI的預(yù)防性維護(hù)來運行診斷和預(yù)測可靠性問題。

Secure AI

先進(jìn)的加密計算功能，在不影響性能的情況下保護(hù)AI模型和客戶數(shù)據(jù)，對于醫(yī)療保健和金融服務(wù)等隱私敏感行業(yè)至關(guān)重要。

專用解壓縮引擎

支持最新格式，加速數(shù)據(jù)庫查詢，以提供數(shù)據(jù)分析和數(shù)據(jù)科學(xué)的最高性能。

在這些技術(shù)支持下，一個GB200 NVL72就最高支持27萬億參數(shù)的模型。

而GPT-4根據(jù)泄露數(shù)據(jù)，也不過只有1.7萬億參數(shù)。

英偉達(dá)要做世界AI的入口

老黃官宣ai.nvidia.com頁面，要做世界AI的入口。

任何人都可以通過易于使用的用戶界面體驗各種AI模型和應(yīng)用。

同時，企業(yè)使用這些服務(wù)在自己的平臺上創(chuàng)建和部署自定義應(yīng)用，同時保留對其知識產(chǎn)權(quán)的完全所有權(quán)和控制權(quán)。

這上面的應(yīng)用都由英偉達(dá)全新推出的AI推理微服務(wù)NIM支持，可對來自英偉達(dá)及合作伙伴的數(shù)十個AI模型進(jìn)行優(yōu)化推理。

此外，英偉達(dá)自己的開發(fā)套件、軟件庫和工具包都可以作為NVIDIA CUDA-X微服務(wù)訪問，用于檢索增強(qiáng)生成 (RAG)、護(hù)欄、數(shù)據(jù)處理、HPC 等。

比如通過這些微服務(wù)，可以輕松構(gòu)建基于大模型和向量數(shù)據(jù)庫的ChatPDF產(chǎn)品，甚至智能體Agent應(yīng)用。

NIM微服務(wù)定價非常直觀，“一個GPU一小時一美元”，或年付打五折，一個GPU一年4500美元。

從此，英偉達(dá)NIM和CUDA做為中間樞紐，連接了百萬開發(fā)者與上億GPU芯片。

什么概念？

老黃曬出AI界“最強(qiáng)朋友圈”，包括亞馬遜、迪士尼、三星等大型企業(yè)，都已成為英偉達(dá)合作伙伴。

最后總結(jié)一下，與往年相比英偉達(dá)2024年戰(zhàn)略更聚焦AI，而且產(chǎn)品更有針對性。

比如第五代NVLink還特意為MoE架構(gòu)大模型優(yōu)化通訊瓶頸。

新的芯片和軟件服務(wù)，都在不斷的強(qiáng)調(diào)推理算力，要進(jìn)一步打開AI應(yīng)用部署市場。

當(dāng)然作為算力之王，AI并不是英偉達(dá)的全部。

這次大會上，還特別宣布了與蘋果在Vision Pro方面的合作，讓開發(fā)者在工業(yè)元宇宙里搞空間計算。

此前推出的新光刻技術(shù)cuLitho軟件庫也有了新進(jìn)展，被臺積電和新思科技采用，把觸手伸向更上游的芯片制造商。

當(dāng)然也少不了生物醫(yī)療、工業(yè)元宇宙、機(jī)器人汽車的新成果。

以及布局下一輪計算變革的前沿領(lǐng)域，英偉達(dá)推出云量子計算機(jī)模擬微服務(wù)，讓全球科學(xué)家都能充分利用量子計算的力量，將自己的想法變成現(xiàn)。

去年GTC大會上，老黃與OpenAI首席科學(xué)家Ilya Sutskever的爐邊對談，仍為人津津樂道。

當(dāng)時世界還沒完全從ChatGPT的震撼中清醒過來，OpenAI是整個行業(yè)絕對的主角。

如今Ilya不知蹤影，OpenAI的市場統(tǒng)治力也開始松動。在這個節(jié)骨眼上，有資格與老黃對談的人換成了8位——

Transformer八子，開山論文《Attention is all you need》的八位作者。

他們已經(jīng)悉數(shù)離開谷歌，其中一位加入OpenAI，另外7位投身AI創(chuàng)業(yè)，有模型層也有應(yīng)用層，有toB也有toC。

這八位傳奇人物既象征著大模型技術(shù)真正的起源，又代表著現(xiàn)在百花齊放的AI產(chǎn)業(yè)圖景。在這樣的格局中，OpenAI不過是其中一位玩家。

而就在兩天后，老黃將把他們聚齊，在自己的主場。

要論在整個AI界的影響力、號召力，在這一刻，無論是“鋼鐵俠”馬斯克還是“奧特曼”Sam Altman，恐怕都比不過眼前這位“皮衣客”黃仁勛。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

英偉達(dá)

英偉達(dá)

+關(guān)注

關(guān)注
22

文章
3637

瀏覽量
89864
GPT

GPT

+關(guān)注

關(guān)注
0

文章
347

瀏覽量
15182
OpenAI

OpenAI

+關(guān)注

關(guān)注
9

文章
988

瀏覽量
6256
chiplet

chiplet

+關(guān)注

關(guān)注
6

文章
404

瀏覽量
12513
AI大模型

AI大模型

+關(guān)注

關(guān)注
0

文章
281

瀏覽量
216

原文標(biāo)題：英偉達(dá)新核彈B200發(fā)布，一臺服務(wù)器頂一個超算，萬億參數(shù)大模型30倍推理加速

文章出處：【微信號：奇異摩爾，微信公眾號：奇異摩爾】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

英偉達(dá)Blackwell可支持10萬億參數(shù)模型AI訓(xùn)練，實時大語言模型推理

電子發(fā)燒友網(wǎng)報道（文/李彎彎）在近日的Hot Chips 2024大會上，英偉達(dá)公布了下一代GPU架構(gòu)Blackwell的更多細(xì)節(jié)信息，以及未來的產(chǎn)品路線圖

發(fā)表于 09-04 09:10 ?2632次閱讀

英偉達(dá)Blackwell架構(gòu),行業(yè)首選

的半導(dǎo)體技術(shù)路徑圖，首度公開了即將面世的下一代芯片——Rubin平臺，旨在接替現(xiàn)有的Blackwell。　　回顧過往，NVIDIA始終保持著每兩年發(fā)布一次全新架構(gòu)的傳統(tǒng)，從20

發(fā)表于 06-05 15:28 ?505次閱讀

英偉達(dá)加速AI芯片迭代，推出Rubin架構(gòu)計劃

在近日舉辦的COMPUTEX 2024展會上，英偉達(dá)CEO黃仁勛再次展現(xiàn)了公司在人工智能（AI）芯片領(lǐng)域的雄心壯志。他公布了下一代AI芯片架構(gòu)

發(fā)表于 06-03 11:36 ?690次閱讀

英偉達(dá)業(yè)績強(qiáng)勁，Blackwell AI芯片助推下一波增長?

　在與分析師的電話會議上，英偉達(dá)首席執(zhí)行官黃仁勛透露，公司即將推出的Blackwell AI芯片將于本季度發(fā)貨，下季度產(chǎn)量將有所提升，“隨著下一代B

發(fā)表于 05-23 15:55 ?394次閱讀

進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

2024年3月19日，[英偉達(dá)]CEO[黃仁勛]在GTC大會上公布了新一代AI芯片架構(gòu)BLACKWELL，并推出基于該

發(fā)表于 05-13 17:16

英偉達(dá)發(fā)布新一代AI芯片架構(gòu)Blackwell GPU

近日，英偉達(dá)首席執(zhí)行官黃仁勛在GTC 2024會議上發(fā)表主題演講，重磅推出全新AI芯片架構(gòu)Blackwell GPU。這一創(chuàng)新技術(shù)的首款芯片

發(fā)表于 03-26 11:19 ?705次閱讀

超微電腦借助英偉達(dá)Blackwell架構(gòu)，打造頂尖生成式AI系統(tǒng)

超微電腦Supermicro近日宣布，其全新一代人工智能系統(tǒng)已正式問世，該系統(tǒng)基于NVIDIA的革命性Blackwell架構(gòu)，展現(xiàn)了前所未有的人工智能性能。該系列新品包括NVIDIA GB200

發(fā)表于 03-25 10:27 ?408次閱讀

英偉達(dá)發(fā)布最強(qiáng)AI加速卡Blackwell GB200

英偉達(dá)在最近的GTC開發(fā)者大會上發(fā)布了其最新、最強(qiáng)大的AI加速卡——GB200。這款加速卡采用了新一代AI圖形處理器架構(gòu)

發(fā)表于 03-20 11:38 ?875次閱讀

英偉達(dá)宣布推出新一代GPU Blackwell，SK海力士已量產(chǎn)HBM3E

在英偉達(dá)GTC 2024大會上，英偉達(dá)CEO黃仁勛宣布推出新一代GPU Blackwell，第一款Bla

發(fā)表于 03-20 11:32 ?921次閱讀

英偉達(dá)發(fā)布新一代AI芯片B200

在美國加州圣何塞舉辦的英偉達(dá)GTC生態(tài)大會上，英偉達(dá)CEO黃仁勛以一場震撼人心的演講，正式推出了公司的新一代GPU——Blackwell。作

發(fā)表于 03-20 10:07 ?787次閱讀

英偉達(dá)官宣下一代ai超算英偉達(dá)最新AI芯片成本能耗降低25倍

BLACKWELL新品的發(fā)布標(biāo)志著人工智能領(lǐng)域的重大突破。在演講中，黃仁勛詳細(xì)介紹了GB200 GPU采用的全新Blackwell架構(gòu)，相較于前代Hopper架構(gòu)，性能實現(xiàn)了質(zhì)的飛躍。

發(fā)表于 03-19 15:42 ?990次閱讀

英偉達(dá)最新一代AI芯片Blackwell GPU，AI算力能力較上代提升30倍！

黃仁勛說："我們已經(jīng)來到了一個臨界點，因此需要一種新的計算方式來加速整個行業(yè)的發(fā)展效率。那么英偉達(dá)能夠做什么？當(dāng)然，答案就是——更大的芯片。”接著，英偉達(dá)

發(fā)表于 03-19 13:39 ?1461次閱讀

今日看點丨英偉達(dá)發(fā)布最強(qiáng) AI 加速卡--Blackwell GB200；三星面臨罷工存儲市場供需引關(guān)注

的 GTC 開發(fā)者大會上，正式發(fā)布了最強(qiáng) AI 加速卡 GB200，并計劃今年晚些時候發(fā)貨。 ? GB200 采用新一代 AI 圖形處理器架構(gòu) Bl

發(fā)表于 03-19 11:08 ?1076次閱讀

NVIDIA 推出 Blackwell 架構(gòu) DGX SuperPOD，適用于萬億參數(shù)級的生成式 AI 超級計算

——? NVIDIA 于今日發(fā)布新一代 AI 超級計算機(jī) —— 搭載 NVIDIA GB200 Grace Blackwell 超級芯片的 NVIDIA DGX SuperPOD?。這臺 A

發(fā)表于 03-19 10:56 ?301次閱讀

英偉達(dá)新一代AI芯片預(yù)計2025年亮相

近日，服務(wù)器制造商戴爾在業(yè)界交流活動中透露了英偉達(dá)即將發(fā)布的新一代人工智能（AI）GPU信息。這款代號為Blackwell的芯片預(yù)計將在功耗上達(dá)到驚人的1000W，較上

發(fā)表于 03-05 10:26 ?650次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

英偉達(dá)官宣新一代Blackwell架構(gòu)，把AI擴(kuò)展到萬億參數(shù)

評論

英偉達(dá)Blackwell可支持10萬億參數(shù)模型AI訓(xùn)練，實時大語言模型推理

英偉達(dá)Blackwell架構(gòu),行業(yè)首選

英偉達(dá)加速AI芯片迭代，推出Rubin架構(gòu)計劃

英偉達(dá)業(yè)績強(qiáng)勁，Blackwell AI芯片助推下一波增長?

進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

英偉達(dá)發(fā)布新一代AI芯片架構(gòu)Blackwell GPU

超微電腦借助英偉達(dá)Blackwell架構(gòu)，打造頂尖生成式AI系統(tǒng)

英偉達(dá)發(fā)布最強(qiáng)AI加速卡Blackwell GB200

英偉達(dá)宣布推出新一代GPU Blackwell，SK海力士已量產(chǎn)HBM3E

英偉達(dá)發(fā)布新一代AI芯片B200

英偉達(dá)官宣下一代ai超算英偉達(dá)最新AI芯片成本能耗降低25倍

英偉達(dá)最新一代AI芯片Blackwell GPU，AI算力能力較上代提升30倍！

今日看點丨英偉達(dá)發(fā)布最強(qiáng) AI 加速卡--Blackwell GB200；三星面臨罷工存儲市場供需引關(guān)注

NVIDIA 推出 Blackwell 架構(gòu) DGX SuperPOD，適用于萬億參數(shù)級的生成式 AI 超級計算

英偉達(dá)新一代AI芯片預(yù)計2025年亮相