国产真人无遮挡作爱免费视频_国产精品理论片在线观看_亚洲人成?片高清在线观看不卡

由 NVIDIA RTX 和 GeForce RTX 技術(shù)驅(qū)動的 AI PC 時代已經(jīng)到來。在這一背景下，一種評估 AI 加速性能的新方法應(yīng)運(yùn)而生，同時還帶來了一套新術(shù)語，這套術(shù)語成了用戶選擇臺式電腦和筆記本電腦的參考標(biāo)準(zhǔn)。

雖然 PC 游戲玩家了解每秒幀數(shù)（FPS）及類似的統(tǒng)計數(shù)據(jù)，但衡量 AI 性能需要新的指標(biāo)。

TOPS 脫穎而出

TOPS，即每秒萬億次運(yùn)算是首要的基準(zhǔn)指標(biāo)。“萬億”是這里的關(guān)鍵詞：生成式 AI 任務(wù)背后的處理運(yùn)算量是巨大的。您可以將 TOPS 視為原始性能指標(biāo)，類似于發(fā)動機(jī)的額定功率。這個數(shù)值自然是越大越好。

例如，比較一下微軟最近發(fā)布的 Windows 11 AI PC，其中就包含每秒至少可執(zhí)行 40 萬億次運(yùn)算的神經(jīng)處理單元（NPU）。40 TOPS 的算力足以勝任一些輕量級 AI 輔助任務(wù)，例如詢問本地聊天機(jī)器人昨天的筆記在哪里。

但許多生成式 AI 的算力需求遠(yuǎn)不止于此。NVIDIA RTX 和 GeForce RTX GPU 可在所有生成式任務(wù)中提供卓越的性能，其中 GeForce RTX 4090 GPU 的算力可達(dá) 1177 TOPS。這就是處理 AI 輔助數(shù)字內(nèi)容創(chuàng)作（DCC）、PC 游戲 AI 超分辨率、根據(jù)文本或視頻生成圖像、與本地大語言模型（LLM）交互等任務(wù)所需的算力。

以 Token 衡量性能

TOPS 只是一項基礎(chǔ)衡量指標(biāo)。LLM 的性能以模型生成的 Token 數(shù)量來衡量。

Token 是 LLM 的輸出，它可以是句子中的一個詞，甚至可以是標(biāo)點符號或空格這類更小的片段。AI 加速任務(wù)的性能可以用“每秒 Token 數(shù)”來衡量。

另一個重要因素則是 batch size，也就是在一次推理過程中可同時處理的輸入數(shù)量。由于大語言模型（LLM）是許多現(xiàn)代 AI 系統(tǒng)的核心，處理多個輸入（例如來自單個應(yīng)用或跨多個應(yīng)用）的能力將成為關(guān)鍵的差異化因素。雖然較大的 batch size 可以提升并發(fā)輸入的性能，但也需要占用更多的內(nèi)存，尤其是運(yùn)行較大的模型時。

RTX GPU 非常適合 LLM，因為它們擁有大量專用的顯存（VRAM）、Tensor Core 和 TensorRT-LLM 軟件。

GeForce RTX GPU 最多可提供 24GB 的高速 VRAM，而 NVIDIA RTX GPU 最多可提供 48GB 的高速 VRAM，可支持更大的模型和更大的 batch size。RTX GPU 還可利用 Tensor Core，這是一種專用的 AI 加速器，可顯著加速深度學(xué)習(xí)和生成式 AI 模型中的計算密集型運(yùn)算。應(yīng)用在使用 NVIDIA TensorRT 軟件開發(fā)套件（SDK）的情況下可輕松實現(xiàn)超高性能。該套件可在超過 1 億臺由 RTX GPU 驅(qū)動的 Windows PC 和工作站上解鎖超高性能生成式 AI。

結(jié)合了大顯存、專用 AI 加速器和優(yōu)化的軟件，RTX GPU 的吞吐量得到了巨大提升，尤其是在 batch size 增加的情況下。

文本生圖像，速度超以往

測量圖像生成速度是評估性能的另一種方法。最直接的一個方法是使用 Stable Diffusion，這是一種基于圖像的熱門 AI 模型，可讓用戶輕松地將文本描述轉(zhuǎn)換為復(fù)雜的視覺畫面。

借由 Stable Diffusion，用戶可以通過輸入關(guān)鍵詞快速獲得想要的圖像相比于 CPU 或 NPU，使用 RTX GPU 運(yùn)行 AI 模型時可以更快生成所需結(jié)果。

在熱門的 Automatic1111 界面使用 TensorRT 擴(kuò)展程序時，相應(yīng)性能表現(xiàn)甚至?xí)谩＝柚?SDXL 模型，RTX 用戶通過提示生成圖像的速度至多可提升至原來的 2 倍，這可大幅簡化 Stable Diffusion 工作流。

另一個熱門的 Stable Diffusion 用戶界面 ComfyUI 在上周也支持了 TensorRT 加速。現(xiàn)在，RTX 用戶文生圖的速度可提升多達(dá) 60%。RTX 用戶還可使用 Stable Video Diffusion 將這些圖像轉(zhuǎn)換為視頻，在 TensorRT 的助力下，轉(zhuǎn)換速度甚至可提升多達(dá) 70%。

全新的 UL Procyon AI 圖像生成基準(zhǔn)測試現(xiàn)已支持 TensorRT 加速。與最快的非 TensorRT 加速狀態(tài)相比，TensorRT 加速可在 GeForce RTX 4080 SUPER GPU 上帶來 50% 的速度提升。

適用于 Stable Diffusion 3 的 TensorRT 加速近期發(fā)布，前者是 Stability AI 備受期待的全新文本轉(zhuǎn)圖像模型。此外，全新的 TensorRT-Model Optimizer 可進(jìn)一步提升性能。與非 TensorRT 加速狀態(tài)相比，它可帶來顯著的速度提升，同時減少顯存消耗。

當(dāng)然，眼見方能為實。真正的考驗來自于不斷迭代提示詞這種真實場景。在 RTX GPU 上，用戶通過改進(jìn)提示詞來優(yōu)化圖像的速度可得到顯著提升，每次迭代只需數(shù)秒即可完成。而在 Macbook Pro M3 Max 上，完成相同的迭代需要耗費(fèi)數(shù)分鐘。此外，如果在由 RTX 驅(qū)動的 PC 或工作站上本地運(yùn)行，用戶可以同時享受到速度和安全性方面的優(yōu)勢，并讓所有內(nèi)容保持私密。

測試結(jié)果出爐，相關(guān)技術(shù)開源

不過，且不要僅聽我們的一面之詞。開源的 Jan.ai 背后的 AI 研究人員和工程師團(tuán)隊最近將 TensorRT-LLM 集成到了其本地聊天機(jī)器人應(yīng)用中，然后親自測試了這些優(yōu)化效果。

研究人員在社區(qū)使用的各種 GPU 和 CPU 上，以開源的 llama.cpp 推理引擎為對照，測試了 TensorRT-LLM 的實際表現(xiàn)。他們發(fā)現(xiàn) TensorRT“在相同硬件上比 llama.cpp 快 30-70%”，并且在進(jìn)行連續(xù)處理時效率更高。該團(tuán)隊還提供了測試方法，邀請其他人親自測試生成式 AI 的性能。

無論是游戲還是生成式 AI，速度才是其致勝法寶。在確定性能冠軍時，TOPS、每秒 Token 數(shù)和 batch size 均需納入考量。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
4949

瀏覽量
102825
PC

PC

+關(guān)注

關(guān)注
9

文章
2067

瀏覽量
154042
內(nèi)存

內(nèi)存

+關(guān)注

關(guān)注
8

文章
3004

瀏覽量
73900
AI

AI

+關(guān)注

關(guān)注
87

文章
30239

瀏覽量
268474

原文標(biāo)題：解碼 RTX AI PC 和工作站上的 AI 性能

文章出處：【微信號：NVIDIA_China，微信公眾號：NVIDIA英偉達(dá)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

NVIDIA RTX AI Toolkit擁抱LoRA技術(shù)

在 RTX AI PC 和工作站上使用最新版 RTX AI Toolkit 微調(diào) LLM，最高可

發(fā)表于 11-20 09:14 ?222次閱讀

NVIDIA <b class='flag-5'>RTX</b> <b class='flag-5'>AI</b> Toolkit擁抱LoRA技術(shù)

NVIDIA NIM在搭載RTX技術(shù)的AI工作站上的應(yīng)用

AI 計算資源的需求正不斷增長。從概念驗證到企業(yè)部署需要針對生成性 AI 工作負(fù)載進(jìn)行優(yōu)化的強(qiáng)大計算基礎(chǔ)設(shè)施。同時，AI 開發(fā)項目需要更多的

發(fā)表于 11-09 11:47 ?304次閱讀

NVIDIA RTX AI套件簡化AI驅(qū)動的應(yīng)用開發(fā)

NVIDIA 于近日發(fā)布 NVIDIA RTX AI套件，這一工具和 SDK 集合能夠幫助 Windows 應(yīng)用開發(fā)者定制、優(yōu)化和部署適用于 Windows 應(yīng)用的 AI 模型。該套件免費(fèi)提供

發(fā)表于 09-06 14:45 ?403次閱讀

寧暢推出自驅(qū)式相變液冷AI工作站

6月25日至6月27日，第五屆中國智算中心全棧技術(shù)大會暨中國數(shù)據(jù)中心綠色能源大會于上海召開。寧暢現(xiàn)場發(fā)布了自驅(qū)式相變液冷AI工作站，并發(fā)表了《人工智能服務(wù)器液冷設(shè)計典型特點及趨勢》主題演講。本次發(fā)布

發(fā)表于 07-01 16:26 ?721次閱讀

AMD Radeon PRO W7900雙槽工作站顯卡發(fā)布上市

的高性能平臺進(jìn)行了優(yōu)化，可為專業(yè)設(shè)計人員以及AI開發(fā)人員提供強(qiáng)大的，可擴(kuò)展的專業(yè)解決方案。 ? 其核心功能特性如下：卓越的性能：配備了96

發(fā)表于 06-29 15:23 ?628次閱讀

技嘉推出全新AMD Radeon PRO W7000系列工作站顯卡

隨著技術(shù)的不斷進(jìn)步，工作站顯卡在專業(yè)人士、創(chuàng)作者和AI開發(fā)人員中的需求日益增長。為了滿足這一市場需求，技嘉于6月22日正式推出了全新的AMD Radeon PRO W7000系列工作站顯卡，兩款主力

發(fā)表于 06-22 11:51 ?1122次閱讀

AI PC:真正的AI PC,敢于下場

在過去的半年里，我們無一不在聆聽關(guān)于人工智能（AI）PC的種種聲音，然而當(dāng)步入現(xiàn)實生活時，恐怕仍有眾多讀者對此感到迷茫：這些AI PC究竟具有哪些A

發(fā)表于 06-11 15:02 ?668次閱讀

寧暢推出首款專業(yè)級AI桌面工作站W350 G50

寧暢近日推出了其首款專業(yè)級AI桌面工作站W350 G50，此舉標(biāo)志著智算中心的概念已延伸至桌面端。這款工作站集成了NVIDIA RTX? Ada架構(gòu)GPU，為用戶

發(fā)表于 06-06 09:25 ?690次閱讀

技嘉科技與英偉達(dá)攜手打造全新高階RTX AI PC體驗

　在科技日新月異的今天，高性能計算與人工智能的結(jié)合已成為行業(yè)發(fā)展的重要趨勢。技嘉科技，作為全球知名的電腦硬件制造商，與英偉達(dá)這一圖形處理器領(lǐng)域的佼佼者，共同布署了全線高階RTX AI PC

發(fā)表于 06-05 16:15 ?790次閱讀

NVIDIA推出用于支持在全新GeForce RTX AI筆記本電腦上運(yùn)行的AI助手及數(shù)字人

RTX 支持的 AI 助手技術(shù)演示 Demo，可為 PC 游戲和應(yīng)用提供上下文感知幫助。G-Assist 項目的技術(shù) Demo 將首度亮相于 Studio Wildcard 推出的《

發(fā)表于 06-04 10:19 ?702次閱讀

惠普推出多款商用AI PC新品

惠普近日發(fā)布了一系列商用AIPC新品及創(chuàng)新AI服務(wù)，以滿足不同企業(yè)的需求。新品陣容中，EliteBook系列高端AI商務(wù)本專為大型企業(yè)用戶量身打造，而針對中小型企業(yè)，惠普推出了戰(zhàn)系列AI商務(wù)本。同時，針對算力需求較高的用戶，惠普

發(fā)表于 05-11 09:21 ?429次閱讀

全新NVIDIA RTX A400和A1000 GPU全面加強(qiáng)AI設(shè)計與生產(chǎn)力工作流

兩款 NVIDIA Ampere 架構(gòu) GPU 為工作站帶來實時光線追蹤功能和生成式 AI 工具支持。

發(fā)表于 04-18 10:29 ?490次閱讀

惠普推出新一代AI游戲本，并計劃推出首個AI PC本地AI解決方案

近日，惠普發(fā)布了新一代AI游戲筆記本電腦，這些新款筆記本在性能和AI功能方面都有顯著提升。其中，14英寸暗影精靈10 SLIM被公認(rèn)為惠普目前最輕的游戲筆記本，它搭載了酷睿Ultra 7-155H處理器和

發(fā)表于 01-22 15:58 ?885次閱讀

全面解析CPU和工作站的大比拼

配備第13代酷睿移動CPU的戴爾Precision 5680。在當(dāng)今的工作站市場中，移動工作站的出貨量超過固定工作站約 45%–55%，這與 2010 年代形成鮮明對比，當(dāng)時固定工作站

發(fā)表于 01-16 11:46 ?1194次閱讀

AI PC是什么？如何變革PC產(chǎn)業(yè)（2023）

AI PC整合了輕量化AI模型，將實現(xiàn)各種生成式AI應(yīng)用的離線穩(wěn)態(tài)運(yùn)行。作為設(shè)備、邊緣計算和云技術(shù)的混合體，AI

發(fā)表于 12-27 17:37 ?1462次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

RTX AI PC和工作站提供強(qiáng)大AI性能

評論

NVIDIA RTX AI Toolkit擁抱LoRA技術(shù)

NVIDIA NIM在搭載RTX技術(shù)的AI工作站上的應(yīng)用

NVIDIA RTX AI套件簡化AI驅(qū)動的應(yīng)用開發(fā)

寧暢推出自驅(qū)式相變液冷AI工作站

AMD Radeon PRO W7900雙槽工作站顯卡發(fā)布上市

技嘉推出全新AMD Radeon PRO W7000系列工作站顯卡

AI PC:真正的AI PC,敢于下場

寧暢推出首款專業(yè)級AI桌面工作站W350 G50

技嘉科技與英偉達(dá)攜手打造全新高階RTX AI PC體驗

NVIDIA推出用于支持在全新GeForce RTX AI筆記本電腦上運(yùn)行的AI助手及數(shù)字人

惠普推出多款商用AI PC新品

全新NVIDIA RTX A400和A1000 GPU全面加強(qiáng)AI設(shè)計與生產(chǎn)力工作流

惠普推出新一代AI游戲本，并計劃推出首個AI PC本地AI解決方案

全面解析CPU和工作站的大比拼

AI PC是什么？如何變革PC產(chǎn)業(yè)（2023）