NVIDIA宣布推出 Pascal 架構(gòu)深度學(xué)習(xí)平臺(tái)的最新生力軍 Tesla P4 及 P40 GPU 加速器
NVIDIA(英偉達(dá))21 日宣布推出 Pascal 架構(gòu)深度學(xué)習(xí)平臺(tái)的最新生力軍 NVIDIA Tesla P4 及 P40 GPU 加速器與全新軟件,在效能及速度提供大幅度的提升以加速人工智能服務(wù)的推論生產(chǎn)作業(yè)負(fù)載。
語(yǔ)音助理、待過(guò)濾垃圾郵件及電影與產(chǎn)品推薦引擎等現(xiàn)代人工智能(AI)服務(wù)越來(lái)越復(fù)雜,與一年前的神經(jīng)網(wǎng)絡(luò)相比需要高出 10 倍的運(yùn)算。目前以 CPU 為主的技術(shù)無(wú)法提供現(xiàn)代人工智能服務(wù)所需要的即時(shí)回應(yīng)能力,導(dǎo)致不佳的使用者經(jīng)驗(yàn)。
Tesla P4 及 P40 特別針對(duì)推論設(shè)計(jì),使用經(jīng)訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)辨識(shí)語(yǔ)音、影像及文字以回應(yīng)使用者和設(shè)備要求。Pascal 架構(gòu) GPU 具備以 8 位(INT8)運(yùn)算為主的專門推論指令,提供比 CPU 快 45 倍的反應(yīng)速度,與不到一年前推出的 GPU 解決方案相比則提升了 4 倍。
Tesla P4 為數(shù)據(jù)中心帶來(lái)最高的能源效率,其小尺寸及最小 50 瓦特的低功率設(shè)計(jì)可安裝于任何服務(wù)器內(nèi),讓生產(chǎn)作業(yè)負(fù)載推論的能源效率達(dá) CPU 的 40 倍。在進(jìn)行視訊推論作業(yè)負(fù)載時(shí),單一服務(wù)器里安裝單顆 Tesla P4 即可取代 13 臺(tái)僅采用 CPU 的服務(wù)器;而包含服務(wù)器及用電量的總持有成本則能節(jié)省達(dá) 8 倍。
Tesla P40 為深度學(xué)習(xí)作業(yè)負(fù)載帶來(lái)最大的處理量。一臺(tái)搭載 8 顆 Tesla P40 加速器的服務(wù)器擁有每秒 47 兆次運(yùn)算(TOPS)的推論效能及 INT8 指令,可取代 140 臺(tái)以上的 CPU 服務(wù)器的效能。若以每臺(tái) CPU 服務(wù)器約 5,000 美元計(jì)算,可節(jié)省 65 萬(wàn)美元以上的服務(wù)器采購(gòu)成本。
NVIDIA 加速運(yùn)算總經(jīng)理 Ian Buck 表示:“有了 Tesla P100 以及新推出的 Tesla P4 及 P40,NVIDIA 為數(shù)據(jù)中心提供唯一的端對(duì)端深度學(xué)習(xí)平臺(tái),為各大產(chǎn)業(yè)釋放龐大的人工智能潛力。將訓(xùn)練時(shí)間從數(shù)天大幅縮短至數(shù)小時(shí),能立即解析資料,并透過(guò)人工智能服務(wù)即時(shí)對(duì)消費(fèi)者做出回應(yīng)。”
實(shí)現(xiàn)更快速推論的軟件工具
另外與 Tesla P4 及 P40 推出的包含兩項(xiàng)加速人工智能推論的創(chuàng)新軟件:NVIDIA TensorRT 及 NVIDIA DeepStream SDK。
TensorRT 為針對(duì)優(yōu)化生產(chǎn)部署所設(shè)計(jì)的深度學(xué)習(xí)模型函式庫(kù),具有立即回應(yīng)極度復(fù)雜網(wǎng)絡(luò)的能力。透過(guò)訓(xùn)練過(guò)的 32 位或 16 位定義神經(jīng)網(wǎng)絡(luò)以及設(shè)定以降低精度的 INT8 運(yùn)算為目的進(jìn)行優(yōu)化,將深度學(xué)習(xí)應(yīng)用的處理量及效率極大化。
NVIDIA DeepStream SDK 銜接強(qiáng)大的 Pascal 服務(wù)器,與雙 CPU 只能處理 7 個(gè)串流的運(yùn)算能力相比,能即時(shí)同步解碼并分析高達(dá) 93 個(gè) HD 視訊串流。這解決人工智能的其中一項(xiàng)重大挑戰(zhàn):處理大規(guī)模的影音內(nèi)容分析以應(yīng)用到如自駕車、互動(dòng)式機(jī)器人、過(guò)濾及廣告投放等領(lǐng)域。深度學(xué)習(xí)整合至視訊應(yīng)用中讓企業(yè)能提供前所未有、智能且創(chuàng)新的視訊服務(wù)。
協(xié)助客戶向前邁進(jìn)NVIDIA 的客戶提供越來(lái)越多需要最高運(yùn)算效能的創(chuàng)新人工智能服務(wù)。其中中國(guó)***廠商廣達(dá)持續(xù)在服務(wù)器業(yè)務(wù)與 NVIDIA 合作,從世上首座人工智能超級(jí)電腦系統(tǒng) DGX-1、Facebook Big Sur 推論服務(wù)器到搭載 NVIDIA 糖果盒大小 Tesla P4 輕巧 1U 服務(wù)器,皆透過(guò)該公司而得以打造出優(yōu)異的產(chǎn)品陣容。
NVIDIA 共同創(chuàng)辦人暨CEO黃仁勛表示:“廣達(dá)從早期便與我們一同致力于 GPU 服務(wù)器發(fā)展,不論想建造何種類型數(shù)據(jù)中心,透過(guò)我們與廣達(dá)及云達(dá)的合作都能達(dá)成。”
云達(dá)科技總經(jīng)理?xiàng)钋缛A表示:“我們的客戶相當(dāng)倚重云達(dá)在超大規(guī)模 、高密度融合機(jī)架式等級(jí)解決方案中的領(lǐng)導(dǎo)地位,這些解決方案通常都需要高效能的作業(yè)負(fù)載。以深度學(xué)習(xí)的應(yīng)用而言,平行運(yùn)算回應(yīng)之間的延遲性表現(xiàn)十分重要,而 Tesla P40 和 P4 正是能表現(xiàn)出準(zhǔn)確與靈敏效能的新一代 GPU 解決方案。”
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
相關(guān)閱讀:
- [電子說(shuō)] Blackwell GB100能否在超級(jí)計(jì)算機(jī)和AI市場(chǎng)保持領(lǐng)先優(yōu)勢(shì)? 2023-10-24
- [電子說(shuō)] 如何創(chuàng)建FPGA控制的機(jī)器人手臂 2023-10-24
- [電子說(shuō)] 怎樣延長(zhǎng)半導(dǎo)體元器件的壽命呢? 2023-10-24
- [電子說(shuō)] 射頻識(shí)別技術(shù)漫談(27)——CPU卡概述 2023-10-24
- [電子說(shuō)] 講一講Apple Macintosh處理器過(guò)渡的故事 2023-10-24
- [電子說(shuō)] 智能時(shí)代的三大核心技術(shù) 2023-10-24
- [電子說(shuō)] 國(guó)產(chǎn)金融工控機(jī)的廣泛應(yīng)用領(lǐng)域和獨(dú)特優(yōu)勢(shì) 2023-10-24
- [人工智能] 研華推出EPC-B3000系列嵌入式工控機(jī),搭載先進(jìn)X86架構(gòu)CPU,助力邊緣人工智能應(yīng)用 2023-10-24
( 發(fā)表人:steve )