精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AMD全新GPU架構解析 性能提升14%功耗降低23%

旺材芯片 ? 來源:yxw ? 2019-06-12 14:23 ? 次閱讀

E3 2019游戲大會期間,AMD正式發布了基于7nm新工藝、Navi新核心、RDNA新架構的新一代顯卡Radeon RX 5700系列,包括RX 5700 XT、RX 5700兩款型號,均面向規模最為龐大的甜點級市場和主流游戲玩家。

AMD發布的新一代RX 5700系列顯卡基于7nm新工藝和Navi新核心,而在底層是全新的RDNA架構,已經走過七年半的GCN架構就此揮手作別。

這些年來,很多用戶玩家尤其是A飯一直期待一個全新的GPU架構,但這種事兒的難度遠超一般人想象,某種程度上設計一個新的GPU架構甚至要比設計一個新的CPU架構還要難。RDNA架構就花費了AMD研發團隊長達四年的時間,凝聚了無數人的心血,也開啟了AMD顯卡歷史上第五代重大架構的新時代。

2000年前,R100核心是A卡的第一代架構,用的還是固定單元設計,3D幾何轉換和光照效果如今看起來都極為原始。

2001-2007年的R200-R500是第二代架構,簡單的VS紋理著色器、PS像素著色器分離式設計,不同的只是比例不同,整個渲染流水線就像一個單通道的單行道。

2008-2011年的第三代TeraScale架構(代表核心R600)實現了一個飛躍,VS、PS融合為統一著色器,也就是我們常說的流處理器,支持VLIW(超長指令字),然后就是2011-2019年的GCN架構(代表核心Southern Islands),統一著色器加獨立的標量、矢量單元,二者比例為1:4。

如今,迎來了全新的RDNA(Radeon DNA),還是統一著色器,但標量和矢量單元走向融合,支持SIMT(單指令多線程) ILP(指令集并行),類似CPU處理器的SIMD(單指令多數據流),單線程性能和指令集執行效率大大提升。

需要強調的是,RDNA是一個全方位重新設計的架構,并不是GCN的又一個升級版,也不是與GCN的混合體,只是集成了GCN架構的指令以保持向下兼容,現有技術仍然可以在RDNA架構上得到支持。

RDNA架構將是AMD GPU顯卡未來多年的基石,接下來我們將看到采用7nm+工藝的第二代版本RDNA 2,看路線圖有望明年初和我們見面。

除了RDNA新架構,Navi核心還有7nm工藝、GDDR6顯存、PCIe 4.0總線、Radeon媒體引擎、Radeon顯示引擎等諸多全新特性。

Navi 10核心集成了103億個晶體管,相比Vega 64 125億個少了大約18%,而核心面積只有251平方毫米,相比Vega 64 495平方毫米更是小了足足一半,因此單位面積性能提升了足足1.3倍。

盡管晶體管更少、面積更小,Navi 10核心的性能相比于Vega 64卻提升了14%,同時功耗降低了23%,能效比因此大漲50%。

純架構性能上,Navi相比于Vega在同等功耗、同等配置下提升多達50%,反應到實際產品上,這貢獻了產品性能提升的60%左右,另外有大約25%來自7nm新工藝的加持,還有約15%來自頻率以及功耗的改進。

AMD表示,RDNA架構的設計理念主要有四個方面,性能上要滿足在現代游戲負載需求,能效上要充分優化功耗和帶寬利用率,功能上要壯大生態,擴展性上要從移動到桌面到云端通吃。

為實現上述目標,RDNA架構主要從三大方面進行了變革,包括CU計算單元、緩存、流水線,接下來我們逐一和大家分享,但鑒于GPU架構的技術性太強,我們只是蜻蜓點水地大致看一下,最后還有AMD關于光線追蹤的規劃。

新的計算單元設計一共分為40組,每組2個標量處理器、64個流處理器、4個64位雙線性過濾單元,總計80個、2560個、160個,執行延遲更低,單線程性能更強,緩存效率更高,整體計算能效比GCN架構有著巨大的提升,而且可適應從游戲到計算各種負載。

多級緩存一致性可以帶來更低的延遲、更高的帶寬、更低的功耗,包括各處零級緩存、512KB一級緩存、4MB二級緩存。

整個圖形引擎也做了重新調整,更加順暢高效,包括幾何引擎、64個紋理單元、4個異步計算引擎(ACE),負載分配更加均衡,可以在更低的功耗下達成更高的頻率,能效更高。

CU計算單元方面,雖然看起來每一組還是64個流處理器,數量沒變,但這個數字是AMD反復設計后與處理資源最為平衡的的組合,同時整個計算單元的結構進行了徹底重組,和GCN時代完全不一樣了。

RDNA架構下,每個CU計算單元的標量解碼和發射單元、矢量解碼和發射單元、調度器的數量都增加了一倍來到兩個,指令處理率因此也提升一倍。

同時,四個SIM16矢量單元、四個SIMD4特殊功能單元變為兩個SIMD32、兩個SIMD8,比如64個線程可組合為兩個Wave32,然后由兩個SIMD32執行兩個Wave32,實現單時鐘周期指令發射(之前需要四個),SIMD ALU單元的利用率也從25%來到了100%,而且支持Wave32、Wave64兩種執行模式,以應對不同負載需求。

此外,為了強化資源調度和利用的效率,RDNA架構還將每兩個CU計算單元緊密地捆綁在了一起,組成一個工作組處理器(Work Group Processor),使得可用ALU單元、寄存器數量翻番,緩存帶寬更是之前的四倍。

緩存方面,RDNA架構設計了一套多級一致性結構,每個雙CU組合內都有自己的零級緩存,與ALU單元的載入帶寬翻番,增加了四組新的一級緩存(都是16-way 128KB),降低了二級緩存(16-way 4MB)的擁堵,整體延遲和功耗大大減低。

按照AMD的說法,零級緩存的延遲降低了21%,一二級緩存降低24%,內存延遲也低了7%。

另外在一致性多級緩存下,到處都支持Delta數據壓縮(DCC/圖中箭頭黃色部分),提高傳輸率,同時還改進了色彩壓縮算法,可供顯示引擎讀取,著色器也能同時讀寫壓縮的色彩數據。

圖形引擎流水線方面進行了大刀闊斧的重組,包括四個增強的ACE異步計算引擎,地位更加中心化的結合處理器(包含四個原語單元),64個像素單元。

異步計算一直是A卡的獨門絕技,也是起在DX12、Vulkan API下表現更好的關鍵,如今得到增強后,可以更精準地實時控制其他模塊。

有趣的是,RDNA GPU架構設計也借鑒了Zen CPU架構設計的一些先進理念,尤其是在時鐘門控方面,效率和能效極高,同時還減少了達到更高頻率所需要的邏輯層級。

Radeon顯示引擎也大幅躍進,支持FreeSync 2 HDR、HDMI 2.0/DisplayPort 1.4 HDR,針對高分辨率HR顯示器優化,可輸出4K/240Hz、8K/60Hz,而且都只需一根數據線即可達成,同時還優化了VR頭顯顯示。

Radeon多媒體引擎則大大改進了視頻編解碼,增加了新的H.265 HDR/WCG編碼器,全面支持H.264 1080p600、4K150、8K30解碼和1080p360、4K90編碼,H.265 1080p360、4K90、8K24解碼和1080p360、4K60編碼,VP9 4K90、8K24解碼,整體編碼速度加快40%。

對于大家非常關注的光線追蹤支持,GCN、RDNA架構都沒有專門的硬件單元加速,不過事實上,AMD ProRender、Radeon Rays都早就支持了光線追蹤,分別面向內容創作渲染和游戲開發。

在下一代RDNA架構上,AMD會通過硬件單元,支持特定的光線追蹤效果在游戲中實時渲染,而即便到了更遙遠的未來,AMD也不會將光線追蹤全部一股腦扔給硬件來本地處理,否則效率會非常低下,而是將借助云計算,實現全場景的光線追蹤,保證畫面效果的同時,不會給本地硬件太大的壓力。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19160

    瀏覽量

    229121
  • amd
    amd
    +關注

    關注

    25

    文章

    5441

    瀏覽量

    133937
  • 顯卡
    +關注

    關注

    16

    文章

    2423

    瀏覽量

    67460
  • GPU架構
    +關注

    關注

    0

    文章

    15

    瀏覽量

    8452

原文標題:四年研發,終成正果!AMD 全新GPU架構解析:相比 Vega 64 面積更小,性能提升14%,功耗降低23%

文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AMD最強AI芯片,性能強過英偉達H200,但市場仍不買賬,生態是最大短板?

    。 ? 其中,全新旗艦AI芯片的型號為AMD Instinct MI325X GPU,雖然仍然是采用CDNA 3架構,但是相較于AMD In
    的頭像 發表于 10-14 01:32 ?3238次閱讀
    <b class='flag-5'>AMD</b>最強AI芯片,<b class='flag-5'>性能</b>強過英偉達H200,但市場仍不買賬,生態是最大短板?

    《算力芯片 高性能 CPUGPUNPU 微架構分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    在數據挖掘工作中,我經常需要處理海量數據的深度學習任務,這讓我對GPU架構和張量運算充滿好奇。閱讀《算力芯片》第7-9章,讓我對這些關鍵技術有了全新認識。 GPU
    發表于 11-24 17:12

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--了解算力芯片GPU

    本篇閱讀學習第七、八章,了解GPU架構演進及CPGPU存儲體系與線程管理 █從圖形到計算的GPU架構演進 GPU圖像計算發展 ●從三角形開始
    發表于 11-03 12:55

    AMD與NVIDIA GPU優缺點

    在圖形處理單元(GPU)市場,AMD和NVIDIA是兩大主要的競爭者,它們各自推出的產品在性能功耗、價格等方面都有著不同的特點和優勢。 一、性能
    的頭像 發表于 10-27 11:15 ?459次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    GPU、NPU,給我們剖析了算力芯片的微架構。書中有對芯片方案商處理器的講解,理論聯系實際,使讀者能更好理解算力芯片。 全書共11章,由淺入深,較系統全面進行講解。下面目錄對全書內容有一個整體了解
    發表于 10-15 22:08

    AMD全新處理器擴大數據中心CPU的領先地位

    在Computex 2024 開幕主題演講上,AMD 詳細介紹了全新的 CPU、NPU 和 GPU 領先架構,為從數據中心到個人電腦的端到端 AI 基礎
    的頭像 發表于 09-19 11:01 ?478次閱讀

    名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構分析

    和像素統一的G80到現在重金難求的H100;AMD的Zen系列CPU和RDNA系列GPU兩線作戰;中國的高性能計算芯片逐步獲得更多TOP500排名;華為Ascend 910 NPU芯片也成為AI時代
    發表于 09-02 10:09

    GPU云服務器架構解析及應用優勢

    GPU云服務器作為一種高性能計算資源,近年來在人工智能、大數據分析、圖形渲染等領域得到了廣泛應用。它結合了云計算的靈活性與GPU的強大計算能力,為企業和個人用戶提供了一種高效、便捷的計算解決方案。下面我們將從
    的頭像 發表于 08-14 09:43 ?325次閱讀

    AMD推出全新AMD銳龍和EPYC處理器,擴大數據中心和PC領域領先地位

    、游戲、內容創造和工作效率提供領先性能 ?在Computex 2024 開幕主題演講上,AMD?(納斯達克股票代碼: AMD) 詳細介紹了全新的?CPU、NPU 和?
    的頭像 發表于 06-04 19:21 ?955次閱讀
    <b class='flag-5'>AMD</b>推出<b class='flag-5'>全新</b><b class='flag-5'>AMD</b>銳龍和EPYC處理器,擴大數據中心和PC領域領先地位

    進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    冷卻技術,提高計算密度,減少占地面積,并通過高帶寬、低延遲的GPU通信,有效減少數據中心的碳足跡和能源消耗。相較于傳統的NVIDIA H100風冷基礎設施,GB200在相同功耗下實現25倍的性能
    發表于 05-13 17:16

    天璣9300旗艦芯:全大核CPU架構性能與能效的提升

    “全大核”CPU 架構設計打破常規,摒棄小核,采用超大核(Arm Cortex-X)與大核(Arm Cortex-A)的組合,以更高時鐘頻率提升性能和能效,同時降低功耗,延長電池壽命。
    的頭像 發表于 05-06 10:22 ?574次閱讀

    深入解讀AMD最新GPU架構

    GCN 取代了 Terascale,并強調 GPGPU 和圖形應用程序的一致性能。然后,AMD 將其 GPU 架構開發分為單獨的 CDNA 和 RDNA 線路,分別專門用于計算和圖形。
    發表于 01-08 10:12 ?1147次閱讀
    深入解讀<b class='flag-5'>AMD</b>最新<b class='flag-5'>GPU</b><b class='flag-5'>架構</b>

    AMDGPU架構GCN現代化解讀

    隨著HD 5000和6000系列的發展,AMD的Terascale(萬億級)架構變得非常具有競爭力。
    的頭像 發表于 01-08 09:58 ?1116次閱讀
    <b class='flag-5'>AMD</b>的<b class='flag-5'>GPU</b><b class='flag-5'>架構</b>GCN現代化解讀

    揭秘GPU: 高端GPU架構設計的挑戰

    在計算領域,GPU(圖形處理單元)一直是性能飛躍的代表。眾所周知,高端GPU的設計充滿了挑戰。GPU架構創新,為軟件承接大模型訓練和推理場
    的頭像 發表于 12-21 08:28 ?856次閱讀
    揭秘<b class='flag-5'>GPU</b>: 高端<b class='flag-5'>GPU</b><b class='flag-5'>架構</b>設計的挑戰

    性能提升功耗降低!,這樣的MOSFET是你的最愛么?

    性能提升功耗降低!,這樣的MOSFET是你的最愛么?
    的頭像 發表于 12-04 15:09 ?293次閱讀
    <b class='flag-5'>性能</b><b class='flag-5'>提升</b>,<b class='flag-5'>功耗</b><b class='flag-5'>降低</b>!,這樣的MOSFET是你的最愛么?