NVIDIA發(fā)布重磅最新軟件應(yīng)用、硬件系統(tǒng)以及與寶馬集團(tuán)合作
就在剛剛,NVIDIA提出了下一代計(jì)算的愿景,該愿景將全球信息經(jīng)濟(jì)的重心從服務(wù)器轉(zhuǎn)移到了新型的強(qiáng)大且靈活的數(shù)據(jù)中心。
NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛在其加州住宅的廚房中錄制的六集同時(shí)發(fā)布的主題演講中,介紹了NVIDIA最近對Mellanox的收購,還有重盼所歸的基于NVIDIA Ampere GPU架構(gòu)的新產(chǎn)品以及重要的最新軟件技術(shù)。
這場主題演講原計(jì)劃于3月底在圣何塞舉行的NVIDIA GPU技術(shù)大會上現(xiàn)場直播,但因冠狀病毒疫情而受到影響。
“我要感謝正前線抗擊COVID-19所有勇敢的戰(zhàn)士們。”黃仁勛在開場時(shí)說到,“NVIDIA正在與研究人員和科學(xué)家合作,使用GPU和AI計(jì)算來治療、緩解、控制和追蹤這種大規(guī)模傳染性疾病。”
NVIDIA也宣布了其NVIDIA Clara醫(yī)療平臺的更新,旨在對抗COVID-19新型冠狀病毒。
“研究人員和科學(xué)家們正在使用NVIDIA加速計(jì)算來挽救生命——這完美地詮釋了我們公司的宗旨:通過制造計(jì)算機(jī),解決普通計(jì)算機(jī)不能解決的問題。”黃仁勛說。
演講主要圍繞作為現(xiàn)代全球信息經(jīng)濟(jì)機(jī)房的數(shù)據(jù)中心如何變化,以及在上月完成交易的收購案雙方NVIDIA和Mellanox如何共同推動這些變化的愿景。
“數(shù)據(jù)中心是新的計(jì)算單元,NVIDIA正在加速從芯片到CPU和GPU的連接方式,再到整個(gè)軟件堆棧,以及最終跨整個(gè)數(shù)據(jù)中心的性能提升。”
數(shù)據(jù)中心規(guī)模計(jì)算的系統(tǒng)優(yōu)化
首先,NVIDIA為這種新型的數(shù)據(jù)中心規(guī)模計(jì)算優(yōu)化了新的GPU架構(gòu),集AI訓(xùn)練和推理于一身,并實(shí)現(xiàn)了靈活且彈性的加速。
NVIDIA A100是第一個(gè)基于NVIDIA Ampere架構(gòu)的GPU,提供了在NVIDIA八代GPU里最大的性能提升,它還可用于數(shù)據(jù)分析,科學(xué)計(jì)算和云圖形,并已全面投產(chǎn)并交付給全球客戶。
全球18家領(lǐng)先的服務(wù)提供商和系統(tǒng)構(gòu)建商正在將NVIDIA A100整合到他們的服務(wù)和產(chǎn)品中,其中包括阿里云、AWS、百度云、思科、Dell Technologies、Google Cloud、HPE、Microsoft Azure和甲骨文。
相比上一代,NVIDIA Ampere架構(gòu)的A100將性能提升了20倍。A100的五大關(guān)鍵特性包括:
超過540億個(gè)晶體管,使其成為世界上最大的7納米處理器
帶有TF32的第三代Tensor Core核心,這是一種新的數(shù)值格式,可加速開箱即用的單精度AI訓(xùn)練。NVIDIA廣泛使用的Tensor Core現(xiàn)在更加靈活,快速,且更易于使用
結(jié)構(gòu)稀疏性(Structural sparsity)加速,這是一種新的高效技術(shù),可以利用AI數(shù)學(xué)固有的稀疏性來獲得更高的性能
多實(shí)例GPU(Multi-instance GPU或MIG),允許將一個(gè)A100分割為多達(dá)七個(gè)獨(dú)立的GPU,每個(gè)GPU都有自己的資源
第三代NVLink技術(shù),使GPU之間的高速聯(lián)接能力加倍,從而可以使多個(gè)A100服務(wù)器充當(dāng)一個(gè)巨型GPU
以上這些特性促成了A100性能的提升:與NVIDIA上一代的Volta架構(gòu)相比,訓(xùn)練性能提高了6倍,推理性能提高了7倍。
NVIDIA DGX A100具備5 Petaflops的性能
NVIDIA還將發(fā)售第三代NVIDIA DGX AI系統(tǒng)—基于NVIDIA A100的NVIDIA DGX A100—世界上第一臺5 petaflops服務(wù)器。每臺DGX A100可以分割為多達(dá)56個(gè)獨(dú)立運(yùn)行的實(shí)例。
這使得單個(gè)服務(wù)器可以“縱向擴(kuò)展”以完成諸如AI訓(xùn)練之類的計(jì)算密集型任務(wù),或者“橫向擴(kuò)展”以進(jìn)行AI部署或推理。
該系統(tǒng)的最初使用者是美國能源部的阿貢國家實(shí)驗(yàn)室,該實(shí)驗(yàn)室將利用該集群的AI和計(jì)算能力更好地理解和對抗COVID-19。此外,還有佛羅里達(dá)大學(xué)和德國人工智能研究中心。
美國能源部阿貢國家實(shí)驗(yàn)室,將使用DGX A100賦能的AI和算力更好地了解并抗擊COVID-19
A100也將作為HGX A100提供給云合作伙伴和服務(wù)器制造商。
一套由五臺DGX A100系統(tǒng)提供動力的數(shù)據(jù)中心,其成本僅為100萬美元,功耗僅為28千瓦,但其性能足以媲美一套典型數(shù)據(jù)中心(由50臺用于AI訓(xùn)練的DGX-1系統(tǒng)和600個(gè)總功耗高達(dá)630千瓦的CPU系統(tǒng)構(gòu)成,成本超過1100萬美元)。
NVIDIA還宣布了下一代DGX SuperPOD。它由140臺DGX A100系統(tǒng)和Mellanox網(wǎng)絡(luò)技術(shù)搭建而成,可提供700 petaflops的AI性能,堪比全球20臺最快的計(jì)算機(jī)中的任何一臺。
新一代DGX SuperPOD實(shí)現(xiàn)了強(qiáng)達(dá)每秒70 petaflops的AI算力
NVIDIA正在用四個(gè)DGX SuperPOD來擴(kuò)展自己的數(shù)據(jù)中心,為其內(nèi)部超級計(jì)算機(jī)SATURNV,增加了2.8 exaflops的AI計(jì)算能力(總計(jì)4.6 exaflops),使其成為世界上最快的AI超級計(jì)算機(jī)。
NVIDIA同時(shí)也發(fā)布了NVIDIA EGX A100,將強(qiáng)大的實(shí)時(shí)云計(jì)算功能帶到了邊緣。其NVIDIA Ampere架構(gòu)GPU提供了第三代Tensor Core和新的安全功能。得益于其NVIDIA Mellanox ConnectX-6 SmartNIC,它還具有安全且快速的聯(lián)網(wǎng)功能。
當(dāng)今世界上最重要的應(yīng)用軟件
NVIDIA GPU將為主要軟件應(yīng)用程序提供動力,以加速三個(gè)關(guān)鍵用途:管理大數(shù)據(jù),創(chuàng)建推薦系統(tǒng)和構(gòu)建實(shí)時(shí)會話式AI。
隨著機(jī)器學(xué)習(xí)的有效性推動公司收集了越來越多的數(shù)據(jù),這些新工具應(yīng)運(yùn)而生。積極的反饋使我們體驗(yàn)到的數(shù)據(jù)收集量呈指數(shù)級增長。
為了幫助各類組織順應(yīng)潮流,NVIDIA宣布在Spark 3.0上支持NVIDIA GPU加速,大數(shù)據(jù)分析將成為當(dāng)今世界上最重要的應(yīng)用程序之一。
基于RAPIDS的Spark 3.0,打破了提取,轉(zhuǎn)換和加載數(shù)據(jù)的性能基準(zhǔn)。它已經(jīng)幫助Adobe Intelligent Services將計(jì)算成本降低了90%。
關(guān)鍵的云分析平臺(包括Amazon SageMaker,Azure Machine Learning,Databricks,Google Cloud AI和Google Cloud Dataproc)都將借助NVIDIA加速。
黃仁勛還宣布推出了NVIDIA Merlin,這是一個(gè)用于構(gòu)建下一代推薦系統(tǒng)的端到端框架,該系統(tǒng)正迅速成為更加個(gè)性化互聯(lián)網(wǎng)的引擎。Merlin將創(chuàng)建一個(gè)100 TB數(shù)據(jù)集推薦系統(tǒng)所需的時(shí)間從四天減少到20分鐘。
他還詳細(xì)介紹了NVIDIA Jarvis,這是一個(gè)新的端到端平臺,可以充分發(fā)揮NVIDIA AI平臺的強(qiáng)大功能,創(chuàng)建實(shí)時(shí)多模態(tài)對話式AI。
他通過一個(gè)演示來展示了與名為Misty的AI進(jìn)行交互的過程,Misty可實(shí)時(shí)理解并回答一系列有關(guān)天氣的復(fù)雜問題。
自2018年在SIGGRAPH上發(fā)布NVIDIA RTX以來,NVIDIA在實(shí)時(shí)光線追蹤方面取得了迅猛發(fā)展,當(dāng)時(shí)宣布的NVIDIA Omniverse可以讓位于不同地方使用不同工具的設(shè)計(jì)師,在同個(gè)設(shè)計(jì)的不同部分同時(shí)工作。現(xiàn)在已經(jīng)可供搶先體驗(yàn)客戶使用。
自動駕駛汽車
自動駕駛汽車是我們這個(gè)時(shí)代最大的計(jì)算挑戰(zhàn)之一,NVIDIA將持續(xù)通過NVIDIA DRIVE推動整個(gè)行業(yè)發(fā)展。
NVIDIA DRIVE將使用全新Orin SoC和NVIDIA Ampere GPU,以實(shí)現(xiàn)能效和性能,入門級ADAS系統(tǒng)開發(fā)所需功率僅需5瓦,并為L5級別robotaxi系統(tǒng)提供2,000 TOPS的性能。
現(xiàn)在,汽車制造商僅需單一計(jì)算架構(gòu)和軟件堆棧,即可將AI集成到每一輛車中。汽車制造商可以利用一種架構(gòu)來開發(fā)整個(gè)車隊(duì),并利用整個(gè)車隊(duì)來進(jìn)行軟件開發(fā)。
NVIDIA DRIVE生態(tài)系統(tǒng)現(xiàn)已覆蓋汽車、卡車、一級汽車供應(yīng)商、下一代出行服務(wù)、初創(chuàng)公司、地圖服務(wù)和仿真。NVIDIA將在NVIDIA DRIVE技術(shù)套件中增加用于管理整個(gè)自動駕駛車隊(duì)的NVIDIA DRIVE RC。
機(jī)器人技術(shù)
NVIDIA還將繼續(xù)推進(jìn)其NVIDIA Isaac軟件定義的機(jī)器人平臺,宣布寶馬集團(tuán)已選擇NVIDIA Isaac機(jī)器人技術(shù)為其下一代工廠提供動力。
每56秒鐘,寶馬集團(tuán)在全球的30家工廠就會生產(chǎn)一輛汽車:40種不同型號的汽車,每種都有數(shù)百種不同的選擇,3000萬個(gè)零件來自全球近2,000家供應(yīng)商。
寶馬集團(tuán)加入了一個(gè)龐大的NVIDIA機(jī)器人技術(shù)全球生態(tài)系統(tǒng),該生態(tài)系統(tǒng)涵蓋配送、零售、自主移動機(jī)器人、農(nóng)業(yè)、服務(wù)業(yè)、物流、制造和醫(yī)療保健。
未來,工廠實(shí)際上將成為巨大的機(jī)器人。“里面的所有運(yùn)動部件都會由AI驅(qū)動。”黃仁勛說。“將來,每個(gè)批量生產(chǎn)的產(chǎn)品都將被逐一量身定制。”
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4946瀏覽量
102822 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9028瀏覽量
85199 -
硬件系統(tǒng)
+關(guān)注
關(guān)注
0文章
48瀏覽量
11350
原文標(biāo)題:廚房演講干貨滿滿 | 黃仁勛介紹基于NVIDIA Ampere架構(gòu)首支NVIDIA A100 GPU
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論