搭載 Tensor Core 的 NVIDIA RTX GPU 正在加速生成式 AI 模型的開發(fā)與部署;即將推出的 Max-Q 低功耗 AI 推理將提高能效比。
生成式 AI 正在迅速開創(chuàng)一個計算的新時代,為生產(chǎn)力、內容創(chuàng)作、游戲等多領域帶來了變革。NVIDIA NeMo 和 DLSS 3 幀生成技術、Meta LLaMa、ChatGPT、Adobe Firefly、Stable Diffusion 等生成式 AI 模型和應用能夠使用神經(jīng)網(wǎng)絡來識別現(xiàn)有數(shù)據(jù)中的模式和結構,以此生成新的原創(chuàng)內容。
專為 GeForce RTX 和 NVIDIA RTX GPU 優(yōu)化的生成式 AI 模型具有高達 1,400 Tensor TFLOP 的 AI 推理性能,運行速度比同類其他設備快 5 倍。這要得益于 RTX GPU 中用于加速 AI 計算的專用硬件 Tensor Cores,以及常規(guī)的軟件改進。上周在 Microsoft Build 大會上發(fā)布的增強功能等軟件方面的改進使得像 Stable Diffusion 這樣充分利用新的 DirectML 優(yōu)化功能的生成式 AI 模型性能翻倍。
隨著越來越多的 AI 推理在本地設備上運行,PC 將需要強大而高效的硬件以支持這些復雜的任務。為了滿足這一需求,RTX GPU 將添加用于 AI 工作負載的 Max-Q 低功耗推理。在執(zhí)行輕量級的推理任務時,GPU 將以極低的功耗運行,而在運行繁重負載如生成式 AI 工作時,則可升至極高的性能水平。
為了創(chuàng)建新的 AI 應用,在 Windows 11 上運行的整個 RTX 加速 AI 開發(fā)堆棧現(xiàn)已向開發(fā)者開放,使 AI 模型的開發(fā)、訓練和部署變得更容易。開發(fā)者首先會通過Windows Subsystem for Linux(WSL)上經(jīng)過優(yōu)化的深度學習框架開發(fā)和微調模型。
然后開發(fā)者可以無縫上云并在各個主要云服務商(CSP)提供的相同 NVIDIA AI 堆棧上進行訓練。接下來,開發(fā)者使用全新 Microsoft Olive 等工具優(yōu)化訓練好的模型以實現(xiàn)快速推理,最后面向專為 AI 優(yōu)化的系統(tǒng)的 1 億多 RTX PC 和工作站部署 AI 應用和功能。
微軟 Windows 芯片和系統(tǒng)集成副總裁 Pavan Davuluri 表示:“未來幾年,AI 將成為推動 Windows 客戶創(chuàng)新的最大驅動力。我們正在與 NVIDIA 開展軟硬件優(yōu)化方面的合作,以此為開發(fā)者提供變革性的、高性能的、易于部署的體驗。”
迄今為止,超過 400 款已發(fā)布的應用和游戲由 RTX AI 提供加速,該陣容還在持續(xù)壯大中。
在拉開了 Computex 2023 序幕的主題演講中,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛介紹了用于游戲開發(fā)的新生成式 AI——NVIDIA ACE 游戲開發(fā)版(NVIDIA Avatar Cloud Engine (ACE) for Games)。
通過 AI 驅動的自然語言互動,這項自定義 AI 模型代工服務使游戲中的非玩家角色(NPC)更加智能,從而徹底改變游戲體驗。中間件、工具和游戲開發(fā)者可以使用 “ACE 游戲開發(fā)版(ACE for Games)” 在他們的軟件和游戲中建立并部署定制化的語音、對話和動畫 AI 模型。
在 RTX 上運行的生成式 AI 無處不在
從服務器到云,再到設備,在 RTX GPU 上運行的生成式 AI 無處不在。NVIDIA 的加速 AI 計算具有低時延、全棧式的特點。多年來,我們一直在優(yōu)化 AI 軟硬件架構的各個部分,包括 RTX GPU 上的專用 AI 硬件——第四代 Tensor Core。
通過對驅動的定期優(yōu)化,能夠確保峰值性能。最新 NVIDIA 驅動在與經(jīng) Olive 優(yōu)化的模型和 DirectML 更新結合后,能夠在 Windows 11 上大幅提升開發(fā)者的速度。例如在 Stable Diffusion 中,使用 DirectML 優(yōu)化路徑的開發(fā)者將干擾時間縮短了兩倍。
借助基于 NVIDIA Ada Lovelace 架構打造的最新一代 RTX 筆記本電腦和移動工作站,用戶可以在任何地方運行生成式 AI。新一代移動平臺的外形尺寸只有 14 英寸,重量僅為 3 磅左右,將性能和便攜性提升至新高。戴爾、惠普、聯(lián)想、華碩等制造商正在 RTX GPU 和 Tensor Cores 的支持下,推動生成式 AI 時代的發(fā)展。
-
“隨著各個行業(yè)繼續(xù)部署 AI,預計到 2030 年,AI 需求的年增長率將超過 37%,企業(yè)和消費者將越來越需要合適的技術以實現(xiàn) AI 的開發(fā)和落地,比如生成式 AI 等。多年來,聯(lián)想一直致力于開發(fā)適用于 AI 工作負載的產(chǎn)品和解決方案,進而助力擴展生成式 AI 的應用范圍——從設備到服務器、再到云。聯(lián)想 ThinkPad、ThinkStation、ThinkBook、Yoga、Legion 和 LOQ 等搭載 NVIDIA RTX GPU 的 PC 正在推動生成式 AI 的變革浪潮,在節(jié)省時間、創(chuàng)作內容、完成工作和游戲等方面提供更好的用戶體驗。”
——聯(lián)想副總裁兼 PC 業(yè)務和智能設備首席技術官 Daryl Cromer
-
“生成式 AI 是一項革命性的技術,同時也是促進各個行業(yè)未來創(chuàng)新的催化劑。惠普與 NVIDIA 共同為開發(fā)者提供卓越的性能、移動性以及運行當前加速 AI 模型所需的可靠性,推動全新生成式 AI 時代的發(fā)展。”
——惠普高級副總裁兼 Z 系列總經(jīng)理 Jim Nottingham
-
“我們近期與 NVIDIA 圍繞 Project Helix 的合作重點是助力企業(yè)更輕松地在本地構建和部署值得信賴的生成式 AI。在這個歷史性時刻,我們進一步將生成式 AI 引入 PC 。想象一下,應用開發(fā)者能夠在完善神經(jīng)網(wǎng)絡算法的同時,在本地控制訓練數(shù)據(jù)和 IP。正是為了實現(xiàn)這個目標,我們設計了搭載 NVIDIA RTX GPU 的強大、可擴展 Precision 工作站。作為工作站領域的全球領導者,戴爾在幫助用戶安全加速從邊緣到數(shù)據(jù)中心的 AI 應用方面具有獨特的優(yōu)勢。”
——戴爾科技客戶產(chǎn)品部總裁 Ed Ward
-
“生成式 AI 的時代正在到來,因此需要強大的處理能力和經(jīng)過全面優(yōu)化的軟硬件。借助 NVIDIA AI 平臺,包括現(xiàn)在已經(jīng)預裝到我們許多產(chǎn)品上的 NVIDIA Omniverse,我們十分高興能看到 AI 的變革在華碩和 ROG 筆記本電腦上持續(xù)不斷地推動著。”
——華碩全球消費業(yè)務市場總監(jiān) Galip Fu
很快,搭載 RTX GPU 的筆記本電腦和移動工作站就將做到“兩全其美”。純 AI 推理工作負載將根據(jù) Tensor Core 的性能進行優(yōu)化,同時盡可能降低 GPU 的功耗,延長電池續(xù)航時間,并保持系統(tǒng)擁有出色的散熱和降噪表現(xiàn)。GPU 還可根據(jù)工作負載的需要,動態(tài)提升至最高 AI 性能。
開發(fā)者可以訪問面向加速應用開發(fā)者的 NVIDIA AI 網(wǎng)頁(訪問地址:https://developer.nvidia.cn/ai-for-creative-applications),了解如何對應用進行端到端優(yōu)化,以充分利用 GPU 加速。
點擊 “閱讀原文”,或掃描下方海報二維碼,觀看 NVIDIA 創(chuàng)始人兼 CEO 黃仁勛為 COMPUTEX 2023 帶來的主題演講直播回放,了解AI、圖形及其他領域的最新進展!
原文標題:NVIDIA 為 1 億臺 Windows RTX PC 和工作站提供全新生成式 AI 功能與突破性性能
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3747瀏覽量
90833
原文標題:NVIDIA 為 1 億臺 Windows RTX PC 和工作站提供全新生成式 AI 功能與突破性性能
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論