英偉達放大招發布專業級顯卡Quadro系列:人工智能,VR,深度學習都能干
近日(4月12日),英偉達在北京國家會議中心舉行媒體發布會。會上英偉達展示了其發布不久的基于Pascal架構的Quadro系列顯卡,包括:GP100、P2000、P4000、P5000、P6000等。
不同于Geforce的消費級娛樂定位,Quadro立足高端,面向專業級的需求,英偉達的愿景是讓它們能夠將臺式工作站轉變為具有突破性能力的超級計算機,并為不同行業的專業任務提供保障。
Pascal架構的全新NVIDIAQuadro產品陣容致力于為企業提供視覺計算平臺,簡化設計和仿真工作流程。與上一代產品相比,新Quadro產品不僅具有超快速內存,而且速度最多可以提升兩倍(基于SPECviewperf12基準的計算結果)。
其中GP100為該系列的旗艦產品,被科技媒體和粉絲們稱為超當量核彈。
QuadroGP100參數及系列特點
GP100
GP100基于Pascal核心,匹配16GBHBM2顯存,單精度CUDA核心數 3584個,雙精度CUDA核心數1792個,半精/單精/雙精浮點運算性能分別是20TFLOPS、10TFLOPS和5TFLOPS,帶寬高達720GB/s,功耗235W。同其他新發布的專業卡一樣,它的性能提升也是全方面的(比如同步多重投影、VRWorks、IrayVR),同時還強化了虛擬化、SyncII、雙路NVlink等。
這也是NVlink首次在Windows系統上獲得支持,此前僅僅用于IBMPower8系統和基于Linux的DGX-1,帶寬最高80GB/s。
這個系列官方給出的特點如下:
統一仿真、HPC、渲染和設計:GP100將前所未有的雙精度性能與16GB的高帶寬內存(HBM2)相結合,因此用戶可以在設計過程中進行仿真,并以前所未有的速度采集逼真的多物理場仿真??蛻裟軌驅蓚€GP100GPU與NVLink技術相結合,并擴展到32GB的HBM2 ,以在單一工作站上創建龐大的可視化計算解決方案。
擴展后的QuadroP6000(雷鋒網現場拍攝)
探索深度學習:GP100提供超過20TFLOPS的半精度計算,可謂在Windows和Linux環境中進行深度學習的理想開發平臺。
將VR集成到設計和仿真工作流程中:VR認證的QuadroGP100和P4000具有創建詳細、逼真、沉浸式環境的能力,能夠大規模實現更加宏大、更加復雜的設計體驗。
盡享照片級真實感設計的優勢:基于Pascal架構的QuadroGPU渲染照片級真實感圖像的速度為CPU的18倍。
創建廣闊的可視化工作區:可在多達四個5K顯示器上以高分辨率和HDR顏色顯示數據。
經濟高效地構建超高分辨率及多顯示屏配置:通過將多達8個P4000GPU和兩個QuadroSyncII顯卡相結合,可通過單一機箱實現多達32個4K顯示器的配置。
GPU在CAE上的應用
SandeepGupte
CA(ComputerAidedEngineering)指工程設計中的計算機輔助工程。英偉達專業可視化業務高級總監 SandeepGupte 表示:
對于這部分用戶,大部分是使用類似Ansys、ABAQUS等分析軟件求解復雜工程和產品的結構力學性能。大規模的數據計算往往讓設計分析的過程十分漫長,而如果使用CPU+GPU加速的方案將會大大的節省運算時間。
GPU加速計算是指在完成應用任務時,同時利用GPU和CPU。由于GPU出色的并行任務處理能力,將應用程序中計算密集部分的工作負載轉移到GPU,同時仍由CPU運行其余程序代碼。這樣,從用戶的角度來看,應用程序
流言終結者中有一段很有意思的視頻,為我們直觀的展示了相比于CPU,GPU的 的運行速度明顯加快。并行計算為什么有如此令人震撼的優勢。
視頻 :點此觀看
Sandeep舉了個實際的例子,在現場一個集成了一張GP100的工作站里,工作人員使用ABAQUS對一個模型進行了470萬的網格劃分和計算,由于時間關系,現場并未將計算完成。正是因為類似這樣大規模的計算,往往需要運行數十個小時甚至是數十天才能完成。
不過Sandeep告訴雷鋒網,相比僅使用CPU計算的方案,GPU加速可以將計算時間將縮短為原來的1/3。
GPU在真實物理渲染(PBR)上的應用
也許你覺得CAE的栗子還不夠震撼,在圖形渲染方面,英偉達中國區銷售總監何猶卿表示,目前主流的渲染器都已經在做GPU加速平臺,因為一幀4K的電影畫面,如果還使用CPU渲染,需要288小時,而用GPU渲染只需要3個多小時。
GPU在深度學習上的應用
在深度學習領域,也是高性能GPU大展拳腳的地方,近年來深度學習的大發展除了科學家們孜孜不倦的學術探索外,和GPU運算能力的突飛猛進也密切相關。英偉達CEO黃仁勛曾表示:
計算機科學家綜合YannLeCun的卷積神經網絡、GeoffHinton的反向傳播算法,以及Stochastic的梯度下降訓練法,加上吳恩達(AndrewNg)對GPU的大規模應用,來加快深度神經網絡(DNN)的運算速度,才促進「深度學習」這項現代人工智能技術出現大爆炸般的發展局面。
對于人工智能未來將對設計工作產生的影響,Sandeep介紹了一種叫做生成式制造流程的人工智能概念設計方法。比如設計者要設計一把椅子,一般情況下需要通過CAD軟件設計出兩三個方案,然后交由決策者選擇。
而有了人工智能參與后,設計者僅需提出邊界條件,例如承重多少,自重多少,尺寸如何等等,人工智能就可以自動生成出上百種的設計方案供決策者挑選,這不但有助于遴選出最佳的設計方案,還能大大的縮短設計的周期。
GPU在VR上的應用
在VR的應用方面,為消費級玩家所熟知的Geforce系列更多是針對個人娛樂的應用,而Quadro系列則是面向專業級的任務。如果僅僅是游戲,即便畫面的真實感和準確性有些許偏差,也不會造成太嚴重的后果。
但是如果是在工作決策中使用,那么就要求畫面盡可能的逼真,這時候就需要Quadro系列顯卡和IrayVR了。
據Sandeep介紹,Iray是Nvidia的一款逼真的渲染解決方案,現已許可給DassaultSystèmes和Autodesk等軟件廠商。
利用Iray應用,連接至Quadro視覺計算設備(VCA)后,就可以享受逼真的渲染體驗。把多個QuadroVCA結合到一起后,基于光場實時計算,操作模型或場景時還能夠捕捉到細微的光線和反射。
QUEST計劃
Sandeep還提到英偉達首次在國內推出了QUEST計劃(QuadroEmbeddedSystemProgram),即基于Quadro的嵌入式系統計劃,針對高性能嵌入式系統的開發者,開發企業可以申請加入此計劃,英偉達將和他們合作設計適用于他們解決方案的GPU。
除此之外,英偉達還會提供設計包(DesignKit)、SDK、樣本代碼、訓練等。該項目免費,并且沒有設置申請數量的限制,但是由于致力于一同打造品質、可靠性和性能俱佳的高性能嵌入式解決方案,所以英偉達在合作伙伴的遴選上會比較謹慎。
非常好我支持^.^
(1) 50%
不好我反對
(1) 50%
相關閱讀:
- [電子說] Blackwell GB100能否在超級計算機和AI市場保持領先優勢? 2023-10-24
- [電子說] 奧比中光3D相機矩陣助力更強機器人開發 2023-10-24
- [制造/封裝] 2023 NVIDIA 初創企業展示 · 半程展示圓滿收官 2023-10-24
- [制造/封裝] 今日看點丨正面對決英特爾,傳英偉達研發Arm架構PC芯片;郭明錤預估蘋果明年 2023-10-24
- [電子說] NVIDIA AI 現已在 Oracle Cloud Marketplace 推出 2023-10-24
- [機器人] Eureka!NVIDIA 研究突破為機器人學習注入新動力 2023-10-24
- [電子說] 華為最新昇騰芯片910B可對標英偉達A100? 2023-10-23
- [電子說] Nvidia 通過開源庫提升 LLM 推理性能 2023-10-23
( 發表人:劉輝 )