精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI算法畫小姐姐,AMD顯卡比頂級CPU快30倍!

jf_MYvksKR0 ? 來源:Microcomputer ? 2023-05-18 15:05 ? 次閱讀

從Stable Diffusion這一AI應用出現之后,在極短時間內就迅速走紅,成為眾多玩家口口相傳的“最美小姐姐”生成工具。不過這一AI計算畫圖工具在Stable Diffusion官方推出之初,無論是WEB UI的部署還是模型的訓練生成,都基本是基于NVIDIA CUDA加速的算法,因此A卡最初并不被Stable Diffusion官方支持。不過好在Stable Diffusion算是一個開源的產品,在眾多社區聚集玩家的支持下,也出現了許多支持A卡GPU加速計算的分支,比如我們今天要測試的基于DirectML的部署,就能實現AMD Radeon顯卡的Stable Diffusion AI計算硬件加速。

48019a9c-f4cd-11ed-90ce-dac502259ad0.jpg

如果要自己在本地部署基于DirectML的Stable Diffusion話,相比便捷的基于CUDA的WEB UI部署要相對復雜一些,不過現在網上已經有比較成熟的整合包供玩家適用,玩家們只需要下載相應的整合包,就能一鍵實現在本地的傻瓜式安裝部署,可以為大家節省相當多的時間。

481e2950-f4cd-11ed-90ce-dac502259ad0.png

4876542c-f4cd-11ed-90ce-dac502259ad0.png

▲我們選擇用于測試的這個整合包安裝完畢之后,自動進入AMD GPU加速計算模式,在本地開啟http://127.0.0.1:7860即可打開本地Stable Diffusion的AI畫圖界面。

48c176e6-f4cd-11ed-90ce-dac502259ad0.png

▲在本地WEB UI界面上可以自由設置相關的AI藝術圖生成參數,點擊“生成”即可開始畫圖。具體請參考線上相關教程,在此我們不贅述。

那么,基于DirectML的Stable Diffusion部署分支能不能實現對AMD顯卡的硬件計算加速支持呢?它的效率到底如何?在此前A卡玩家經常只能在Linux系統下運行Stable Diffusion,通過ROCM(Radeon Open Compute)模擬CUDA加速,如今在Windows系統下直接實現A卡的AI加速計算,能否達到我們的預期目標呢?為此,我們選擇了AMD Radeon RX 5000系、RX 6000系以及RX 7000系的數款顯卡,進行了一番詳細的體驗。

體驗平臺

顯卡:AMD Radeon RX 5500XT(8GB)、RX 5700(8GB)、RX 6500XT 4GB、RX 6600(8GB)、RX 6700XT(12GB)、RX 6750XT(12GB)、RX 6800(16GB)、RX 6900XT(16GB)、RX 7900 XT(20GB)、RX 7900 XTX(24GB)

CPU英特爾酷睿i9-13900K

主板:英特爾Z790

內存:DDR5 6000 16GB×2

SSD:AORUS NVMe PCIe SSD 2TB

操作系統:Windows 11 Pro 22H2

驅動程序:AMD Software Adrenalin Edition 23.4.3

通過測試,我們想知道:

AMD Radeon 5000系、6000系和7000系之間,在Stable Diffusion的AI畫圖算力上有多大差別?

相比傳統的CPU AI計算加速,AMD GPU加速性能到底如何?

48e6380a-f4cd-11ed-90ce-dac502259ad0.png

▲我們所采用的網絡開源共享的部署方案可以正確實現AMD顯卡的硬件加速計算,可以看到在圖片生成的過程中GPU的占用率一直保持在100%。

模型為Novel AI Final-runed(CKPT)

測試一:AI生成時尚美女

在第一部分的測試中,我們通過關鍵詞生成一個大眼的時尚美女小姐姐,還要有一定的照片感。關鍵詞設置如下(部分引用自網絡開源共享關鍵詞):

lora0.6> , best quality, ultra high res, (photorealistic:1.4), 1woman, sleeveless white button shirt, black skirt, black choker, cute, (Kpop idol), (aegyo sal:1), (platinum blonde hair:1), ((puffy eyes)), looking at viewer, full body, facing front,fashion,premium

分辨率設置:512×512

采樣步進:20

提示詞引導系數:7

生成批次-每批數量:1-1、4-1

48fc27a0-f4cd-11ed-90ce-dac502259ad0.png

49ba82cc-f4cd-11ed-90ce-dac502259ad0.png

49d8eeba-f4cd-11ed-90ce-dac502259ad0.png

在測試中由于絕大部分顯卡都擁有8GB以上的顯存,因此我們在運行參數上基本設置了正常的高顯存默認模式,只有4GB顯存版的RX 6500XT運行時采用了添加了--lowvram的低顯存運行模式(否則就無法運行)。從整體測試結果來看,AMD從Radeon RX 5000系到RX 7000系的顯卡幾乎都很好地實現了Stable Diffusion應用的AI計算加速性能,尤其是Radeon RX 7000系顯卡性能相比RX 6000系顯卡有了巨大的提升。比如RX 6900XT在該設置與模型算法下的圖片生成率約為8.87張/秒,而RX 7900 XT則可以達到15.76張/秒,性能提升接近100%。

而相比CPU來說,全系AMD顯卡都占有非常明顯的優勢,RX 7900 XT的性能達到了酷睿i9-13900K的30倍左右,即使前兩代的入門級顯卡RX 5500XT,性能上也幾乎接近酷睿i9-13900K的5倍。

唯一有點異常的是RX 6500XT,按照核心規格來看,它應該是要強于RX 5500XT的,不過由于顯存配置僅為4GB,因此在測試中開啟了低顯存運行模式之后,其圖片上生成速度受到了極大影響,遠低于GPU加速的正常表現,僅能達到略高于CPU計算的水準。

測試二:AI生成較為復雜的水邊別墅風景照

在接下來的測試中,我們用一系列相對復雜的關鍵詞來生成一座位于水邊的別墅,同時還伴有陽光、波紋、倒影等效果要求。關鍵詞如下:

‘beautiful render of a Tudor style house near the water at sunset, fantasy forest. photorealistic, cinematic composition, cinematic high detail, ultra realistic, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k,’

分辨率設置:512×512

采樣步進:50

提示詞引導系數:7.5

生成批次-每批數量:1-1、2-1、4-1

49f4b492-f4cd-11ed-90ce-dac502259ad0.png

4a7bb71c-f4cd-11ed-90ce-dac502259ad0.png

4a9a0ad2-f4cd-11ed-90ce-dac502259ad0.png

這部分的測試結果與前一測試基本保持了一致性。仍然是RX 7000系顯卡在性能上獨占鰲頭,相對于RX 6000系顯卡的對位提升在100%左右,與CPU的計算性能相比,GPU加速計算的性能提升仍然非常顯著,RX 7900 XT的性能達到了酷睿i9-13900K的30倍左右,入門級顯卡RX 5500XT,性能上也幾乎接近酷睿i9-13900K的5倍。

4GB顯存配置RX 6500XT由于僅能在低顯存模式下運行,因此圖片上生成速度還是受到了極大影響,遠低于GPU加速的正常表現,大致與酷睿i9-13900K相當。

寫在最后

這是一次簡單但卻比較有趣的測試,通過這次體驗,我們認為有幾點參考意見可以總結給玩家們參考:

1.當前AMD顯卡已經可以通過開源的部署方案實現在Windows系統下的Stable Diffusion AI計算加速,而且網上也有許多的傻瓜式整合包,感興趣的玩家完全可以一試;

2.從測試結果來看,AMD顯卡在Stable Diffusion的AI圖片生成計算中能夠發揮出遠勝于CPU計算的性能增幅,使用GPU加速計算能帶來事倍功半的效果;

3.從測試情況來看,測試中當渲染分辨率設置超過512時(如768×768),就會出現爆顯存的情況,這與部署方案和模型有一定關系,但也反映了在正常模式下運行時,8GB顯存幾乎是Stable Diffusion的硬性入門要求。如果顯存低于8GB,即使在512×512分辨率下渲染,也會出現顯存不足的情況,此時就不得不采用--lowvram的低顯存運行方案,但會極大地拖累計算速度,如測試中的RX 6500XT 4GB。所以要想暢玩Stable Diffusion,我們建議顯卡的顯存為8GB或更高為佳;

4.從整體結果來看,我們認為AMD GPU還有極大的算法優化空間,憑不可靠經驗判斷,從RX 7900 XTX到酷睿i9-13900K的性能差距還不足夠大。這和我們部署的算法方案以及模型都有一定關系,也希望各社區的程序員們能開發出更多更優秀的針對AMD顯卡的計算加速方案。

不管如何,AMD顯卡對Stable Diffusion的硬件加速計算性能已經得到了展現,效果也比較明顯,對AMD顯卡用戶來說毫無疑問是利好的福音消息,剩下的就是玩家與AMD需要堅持的繼續優化之路了。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • amd
    amd
    +關注

    關注

    25

    文章

    5449

    瀏覽量

    133960
  • 算法
    +關注

    關注

    23

    文章

    4601

    瀏覽量

    92677
  • AI算法
    +關注

    關注

    0

    文章

    247

    瀏覽量

    12241

原文標題:AI算法畫小姐姐,AMD顯卡比頂級CPU快30倍!AMD Radeon顯卡Stable Diffusion AI畫圖體驗測試

文章出處:【微信號:Microcomputer,微信公眾號:Microcomputer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AMD確認2025年推出RDNA 4顯卡,光追與AI性能大幅提升

    10月30日,AMD在2024年第三季度財報電話會議上宣布了一個關于GPU的重要信息:其下一代RDNA 4顯卡計劃于2025年初發布。AMD首席執行官蘇姿豐明確表示:“我們計劃在202
    的頭像 發表于 10-30 16:50 ?517次閱讀

    AMD全新處理器擴大數據中心CPU的領先地位

    在Computex 2024 開幕主題演講上,AMD 詳細介紹了全新的 CPU、NPU 和 GPU 領先架構,為從數據中心到個人電腦的端到端 AI 基礎架構帶來強大算力。AMD預覽了將
    的頭像 發表于 09-19 11:01 ?484次閱讀

    簡單認識AMD Radeon RX 6750 GRE系列顯卡

    今日推薦AMD Radeon RX 6750 GRE系列顯卡,它擁有至高12GB GDDR6顯存,多達40個計算單元,以及高達96MB的AMD Infinity Cache無限緩存技術,并且將光線
    的頭像 發表于 09-18 11:02 ?607次閱讀
    簡單認識<b class='flag-5'>AMD</b> Radeon RX 6750 GRE系列<b class='flag-5'>顯卡</b>

    如何維修一張電腦顯卡型號是amd的rx580 燒壞的部位?

    大家好!我在維修一張電腦顯卡型號是amd的rx580 燒壞的部位是一個電感情況如下圖 我覺得應該用飛線方法補焊盤再接電感 但是一直找不到1伏的兩個相連的元器件
    發表于 09-13 03:07

    蘋果 A18 芯片發布:CPU 提升 30%、GPU 提升 40%

    CPU 包括 2 個性能核心和 4 個效率核心, iPhone 15 的 A16 Bionic 30%,能耗降低 30% 。 G
    的頭像 發表于 09-11 12:19 ?576次閱讀
    蘋果 A18 芯片發布:<b class='flag-5'>CPU</b> 提升 <b class='flag-5'>30</b>%、GPU 提升 40%

    AMD將推出Zen5架構CPU,效能Zen440%

    AMD的Zen 5 CPU架構采用了臺積電的3納米制程。雖然目前關于Zen 5 CPU的細節尚不清楚,但預計將提高性能效率,內建人工智能和機器學習優化,并重新管道化前端。據報道,單核心效能將提升15%,多核心效能將提升
    的頭像 發表于 08-08 14:25 ?466次閱讀

    技嘉推出全新AMD Radeon PRO W7000系列工作站顯卡

    隨著技術的不斷進步,工作站顯卡在專業人士、創作者和AI開發人員中的需求日益增長。為了滿足這一市場需求,技嘉于6月22日正式推出了全新的AMD Radeon PRO W7000系列工作站顯卡
    的頭像 發表于 06-22 11:51 ?1122次閱讀

    PROPHESEE 攜手 AMD,推出業界首款兼容 Kria? KV260 視覺 AI 入門套件的事件視覺解決方案

    30 日,中國上海——領先的神經擬態視覺傳感公司 Prophesee 宣布,其 Metavision? HD 事件視覺傳感器和 AI 算法現已支持 AMD Kria? KV260
    發表于 05-30 10:41 ?947次閱讀
    PROPHESEE 攜手 <b class='flag-5'>AMD</b>,推出業界首款兼容 Kria? KV260 視覺 <b class='flag-5'>AI</b> 入門套件的事件視覺解決方案

    AMD披露高效數據中心策略,預計至2027年能效提升超百

    會議期間,蘇姿豐談論了AMD如何通過實施30x25戰略推動2025年計算節點能效提升30的目標。她進一步透露,AMD已找到2026年至20
    的頭像 發表于 05-24 17:37 ?993次閱讀

    AMD CEO蘇姿豐榮膺imec創新獎,30x25計劃將計算節點能效提高30

    近年來,隨著ChatGPT等生成式AI LLM的飛速發展,人工智能功耗問題日益凸顯。然而,早在2021年,AMD便已洞察到此問題,并為此設定了“30x25”目標,旨在提升數據中心計算節點能效,尤其針對
    的頭像 發表于 05-24 15:57 ?413次閱讀

    AMD發布第二代Versal自適應SoC,AI嵌入式領域再提速

    AMD表示,第二代Versal系列自適應SoC搭載全新的AI引擎,相較上一代Versal AI Edge系列,每瓦TOPS功率可實現最多3的性能提升,同時,新款集成Arm
    的頭像 發表于 04-11 16:07 ?752次閱讀

    m3芯片顯卡性能怎么樣 蘋果m3芯片m2強多少

    足以應對大部分的日常使用和輕度游戲需求。它能夠流暢地運行大多數應用程序,包括圖形設計、視頻編輯等需要一定圖形處理能力的軟件。 蘋果m3芯片m2強多少 從已知的信息來看,M3芯片在GPU速度上達到了M2芯片的1.8,M3芯片
    的頭像 發表于 03-12 17:00 ?3818次閱讀

    AMD宣布AMD Radeon RX 7900 GRE顯卡全球發售

    今天,AMD宣布AMD Radeon RX 7900 GRE顯卡在全球同步上市發售,該顯卡致力于為玩家提供高刷新率的2K游戲及更佳的流媒體體驗。
    的頭像 發表于 03-07 10:25 ?947次閱讀

    AMD Radeon RX 7000系列移動顯卡介紹

    AMD Radeon RX 7000系列移動顯卡是專門為移動游戲平臺和高級內容創建打造的卓越筆記本電腦顯卡,采用統一的AMD RDNA 3計算單元,支持人工智能加速的視頻編碼和硬件加速
    的頭像 發表于 12-12 11:19 ?1430次閱讀

    AMD Instinct加速器、AMD EPYC處理器為Microsoft帶來全新AI和計算能力

    VM — ? 近日,在Microsoft Ignite全球技術大會上,AMD和Microsoft共同展示了包括即將到來的AMD Instinct加速器、AMD EPYC(霄龍) CPU
    的頭像 發表于 12-04 13:54 ?585次閱讀