搭載 Tensor Core 的 NVIDIA RTX GPU 正在加速生成式 AI 模型的開發(fā)與部署;即將推出的 Max-Q 低功耗 AI 推理將提高能效比。
生成式 AI 正在迅速開創(chuàng)一個計算的新時代,為生產(chǎn)力、內(nèi)容創(chuàng)作、游戲等多領(lǐng)域帶來了變革。NVIDIA NeMo 和 DLSS 3 幀生成技術(shù)、Meta LLaMa、ChatGPT、Adobe Firefly、Stable Diffusion 等生成式 AI 模型和應(yīng)用能夠使用神經(jīng)網(wǎng)絡(luò)來識別現(xiàn)有數(shù)據(jù)中的模式和結(jié)構(gòu),以此生成新的原創(chuàng)內(nèi)容。
專為 NVIDIA RTX GPU 優(yōu)化的生成式 AI 模型具有高達(dá) 1,400 Tensor TFLOP 的 AI 推理性能,運行速度比同類其他設(shè)備快 5 倍。這要得益于 RTX GPU 中用于加速 AI 計算的專用硬件 Tensor Cores,以及常規(guī)的軟件改進(jìn)。上周在 Microsoft Build 大會上發(fā)布的增強(qiáng)功能等軟件方面的改進(jìn)使得像 Stable Diffusion 這樣充分利用新的 DirectML 優(yōu)化功能的生成式 AI 模型性能翻倍。
隨著越來越多的 AI 推理在本地設(shè)備上運行,工作站將需要強(qiáng)大而高效的硬件以支持這些復(fù)雜的任務(wù)。為了滿足這一需求,RTX GPU 將添加用于 AI 工作負(fù)載的 Max-Q 低功耗推理。在執(zhí)行輕量級的推理任務(wù)時,GPU 將以極低的功耗運行,而在運行繁重負(fù)載如生成式 AI 工作時,則可升至極高的性能水平。
為了創(chuàng)建新的 AI 應(yīng)用,在 Windows 11 上運行的整個 RTX 加速 AI 開發(fā)堆棧現(xiàn)已向開發(fā)者開放,使 AI 模型的開發(fā)、訓(xùn)練和部署變得更容易。開發(fā)者首先會通過Windows Subsystem for Linux(WSL)上經(jīng)過優(yōu)化的深度學(xué)習(xí)框架開發(fā)和微調(diào)模型。
然后開發(fā)者可以無縫上云并在各個主要云服務(wù)商(CSP)提供的相同NVIDIA AI 堆棧上進(jìn)行訓(xùn)練。接下來,開發(fā)者使用全新Microsoft Olive等工具優(yōu)化訓(xùn)練好的模型以實現(xiàn)快速推理,最后面向?qū)?AI 優(yōu)化的系統(tǒng)的 RTX 工作站部署 AI 應(yīng)用和功能。
微軟 Windows 芯片和系統(tǒng)集成副總裁 Pavan Davuluri 表示:“未來幾年,AI 將成為推動 Windows 客戶創(chuàng)新的最大驅(qū)動力。我們正在與 NVIDIA 開展軟硬件優(yōu)化方面的合作,以此為開發(fā)者提供變革性的、高性能的、易于部署的體驗。”
迄今為止,超過 400 款已發(fā)布的應(yīng)用和游戲由 RTX AI 提供加速,該陣容還在持續(xù)壯大中。
在拉開了 Computex 2023 序幕的主題演講中,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛介紹了用于游戲開發(fā)的新生成式 AI——NVIDIA ACE 游戲開發(fā)版(NVIDIA Avatar Cloud Engine (ACE) for Games)。
通過 AI 驅(qū)動的自然語言互動,這項自定義 AI 模型代工服務(wù)使游戲中的非玩家角色(NPC)更加智能,從而徹底改變游戲體驗。中間件、工具和游戲開發(fā)者可以使用 “ACE 游戲開發(fā)版(ACE for Games)” 在他們的軟件和游戲中建立并部署定制化的語音、對話和動畫 AI 模型。
在 RTX 上運行的生成式 AI 無處不在
從服務(wù)器到云,再到設(shè)備,在 RTX GPU 上運行的生成式 AI 無處不在。NVIDIA 的加速 AI 計算具有低時延、全棧式的特點。多年來,我們一直在優(yōu)化 AI 軟硬件架構(gòu)的各個部分,包括 RTX GPU 上的專用 AI 硬件——第四代 Tensor Core。
通過對驅(qū)動的定期優(yōu)化,能夠確保峰值性能。最新 NVIDIA 驅(qū)動在與經(jīng) Olive 優(yōu)化的模型和 DirectML 更新結(jié)合后,能夠在 Windows 11 上大幅提升開發(fā)者的速度。例如在 Stable Diffusion 中,使用 DirectML 優(yōu)化路徑的開發(fā)者將干擾時間縮短了兩倍。
很快,搭載 RTX GPU 的移動工作站就將做到“兩全其美”。純 AI 推理工作負(fù)載將根據(jù) Tensor Core 的性能進(jìn)行優(yōu)化,同時盡可能降低 GPU 的功耗,延長電池續(xù)航時間,并保持系統(tǒng)擁有出色的散熱和降噪表現(xiàn)。GPU 還可根據(jù)工作負(fù)載的需要,動態(tài)提升至最高 AI 性能。
NVIDIA RTX技術(shù)是 NVIDIA 在計算機(jī)圖形領(lǐng)域的重要先進(jìn)技術(shù)之一,可引領(lǐng)新一代應(yīng)用以超快的速度模擬物理世界。借助 AI、光線追蹤和模擬方面的最新增強(qiáng)功能,RTX 技術(shù)以遠(yuǎn)勝以往的速度實現(xiàn)了令人難以置信的 3D 設(shè)計、逼真的模擬和驚人的視覺效果。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4765瀏覽量
100566 -
NVIDIA
+關(guān)注
關(guān)注
14文章
4949瀏覽量
102828 -
AI
+關(guān)注
關(guān)注
87文章
30239瀏覽量
268479 -
生成式AI
+關(guān)注
關(guān)注
0文章
489瀏覽量
460
原文標(biāo)題:NVIDIA 為 Windows RTX 工作站提供全新生成式 AI 功能與突破性性能
文章出處:【微信號:Leadtek,微信公眾號:麗臺科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論