一、前言:安培頂級旗艦降臨 價格達1.2萬
或許很多同學對于這一次RTX 3080/3090在流處理器數量上翻倍的提升感到不可思議。畢竟從2013年的GTX 780 Ti到2019年的Titan RTX,流處理器數量僅僅只是從2880個提升到了4608個。也就是整整6年的時間,流處理器數量僅僅只是增加了60%而已。
而此次完整的GA102核心竟然有10752個流處理器,相當于 Titan RTX的2.33倍,如此巨大的提升的確是很多年沒有出現過了!
PS:上一次N卡大幅提升流處理器是8年前的GTX 680,1536個流處理器數量是GTX 580的三倍,性能則提升了30%!
相較上一代圖靈構架的RTX 20系列顯卡,安培構架主要帶來的如下改進:
1、8nm制程工藝:
圖靈構架使用的三星12FFN工藝,在754mm2的面積內集成了186億只晶體管。安培構架使用的是三星8N工藝,在628mm2的芯片內部集成了280億只晶體管。算下來晶體管密度提升了83%之多。
2、整合INT32與FP32單元:
圖靈的INT32單元只能做整數運算,閑置率很高。為了解決這個問題,提升INT32單元的利用率,NVIDIA改進了INT32單元,使之不僅可以運行整數運算,也能進行單精度浮點運算,相當于整合了INT32和FP32單元,因而使得以FP32單元計數的GPU流處理器數量直接翻倍,單精度浮點性能也同樣翻倍。
3、將ROP單元從內存控制器中分離:
傳統的ROP單元被集成在內存控制器中,閹割GPU位寬會降低ROP單元數量。而安培構架將ROP單元變成了GPC的一部分,每個GPC含有16個ROP單元,只要GPC數量不被閹割,ROP單元數量就不會減少。
比如即將發布的RTX 3070與RTX 3080一樣都有6組GPC,ROP單元數量同樣都是96個。
4、第二代RT Core:
NVIDIA通過提升插值算法,提升了光線追蹤技術在動態模糊效果下的精確度,使得安培構架的光追性能得到了翻倍提升。第一代RT Core可以提供10Giga Rays/s的性能,第二代RT Core可以達到20Giga Rays/s。
第三代Tensor Core的效率是第二代的4倍,即便安培構架將每個SM中的Tensor Core減半,它依然能達到圖靈2倍的效能。
6、RTX IO技術:
這項技術可以讓游戲在加載時完全規避CPU,直接將游戲數據包從SSD寫入到GPU的顯存中,由GPU替代CPU進行數據解包。GPU的整數/浮點性能數十倍于CPU,可以瞬間完成數據的解包工作。
不過這項技術需要微軟DirectStorage API的支持,預計2022年會正式開始應用。
除了以上技術之外,安培構架還支持PCIe 4.0、NVIDIA Reflex等技術,就不再一一敘述了。
9月初,NVIDIA一共發布了3款GA10X核心的顯卡型號,此前已經解禁了RTX 3080,今天我們將向大家展示位于頂端的RTX 3090的詳盡性能評測。
RTX 3090基于GA102-300-A1核心,擁有7組GPC,82組SM單元共計10496個流處理器、112個ROP、328個紋理單元、328個第三代Tensor Cores、82個第二代RT Cores。搭配24GB GDDR6X顯存,顯存頻率19.5GHz、位寬384Bit、帶寬936GB/s。
由于此次NVIDIA并未提供公版的RTX 3090 Founder Edition,我們拿規格與之完全一致的影馳RTX 3090金屬大師來進行測試。
影馳RTX 3090金屬大師GPU-Z截圖
RTX 3090的詳細規格如下:
對比RTX 3080,RTX 3090的流處理器數量、Tensor Core、 ROP單元、顯存帶寬、紋理單元都提升了20%左右。
TDP也從RTX 3080的320W進一步提高到了350W,這恐怖是有史以來TDP最高的單芯片N卡。
而價格,也達到了史無前例的11999元起。
二、影馳RTX 3090金屬大師圖賞:鋁合金壓鑄上蓋 + 18相供電設計
金屬大師卡如其名,整個卡充斥了濃厚的金屬氣息,高強度鋁合金壓鑄一體式上蓋頂部勾勒著錯落有致的不規則線條,銀灰色的金屬表面看上去比很多RGB顯卡更有高端的感覺。
一體化的合金金屬背板可以加固顯卡防止PCB板變形,背板的尾端做了開孔處理,可以加速空氣的流通。
3個90mm風扇,每個風扇11片扇葉。
底部視角圖。
與RTX 3080一樣,都是3個DP 1.4a與1個HDMI 2.1接口。
雙8Pin供電接口,加上PCIe插槽的供電,一共可以提供375W的功耗。
寒光星散熱器,內置6條6mm鍍鎳復合熱管,大面積的純銅散熱底座。顯存與MOSFet散熱部分采用一體化壓鑄方式與主散熱器連接在一起。
市面上的頂級非公顯卡大多是10層PCB,RTX 3090金屬大師采用的是12層PCB板,可以大大減少各個電子元件之間的信號干擾,提升顯卡的電氣性能,增加高頻高負載下的穩定性,同時也有利于GPU沖擊更高的頻率。
GA102-300-A1核心,10496個流處理器,核心面積628.4mm2,擁有283億個晶體管。
另外還設計了9+5+4相供電電路設計。
美光的GDDR6X顯存,一共有24顆(正反各一半),單顆容量1GB,總容量24GB。頻率19.5GHz,位寬384Bit,顯存帶寬936GB/s。
PCB板背面也有12顆GDDR6X顯存。
三、測試平臺:5.2GHz的i9-10900K + XPG 850W 金牌電源
測試平臺如下:
為了降低CPU的瓶頸效應,我們將i9-10900K的核心頻率超頻到了5.2GHz,Ring頻率超頻到了4.8GHz。
主板用的是ROG MAXIMUS XII EXTREME。這款主板采用16+0供電,16相供電全部給了CPU核心,0相給核顯。MosFET升級為TDA21490,這是目前最高規格的一體化MOSFET,導通電流也從55A提高到了90A,可以輕易提供超過1000W的輸出功率。
芝奇皇家戟F4-4000C15D 8GBx4套裝,不僅擁有4000MHz的頻率,15-16-16-36的時序也是低的嚇人,比絕大部分3000MHz頻率的內存都要低,不過默認電壓1.5V也算是比較高的了。
長江存儲致鈦PC005 Active 512GB SSD,順序讀寫速度分別為3500MB/s,2900MB/s。不依賴模擬SLC緩存也能保持550MB/s的穩定寫入速度,同時壽命遠遠高于市面上絕大多數TLC SSD。
酷冷至尊P360 ARGB水冷散熱器,應該是市面上顏值最高也最易安裝的水冷散熱器,可以很輕松的壓制5.2GHz的i9-10900K處理器。
為了應對RTX 3090高達350W的TDP,我們將電源換成了XPG CORE REACTOR 850 GOLD,單路12V輸出電流70.8A,12V輸出功率達到了850W。
120mm FDB液體動態軸承風扇。
全模塊化設計。
華碩玩家國度PG27UQ ROG 27英寸IPS電競顯示器。
4K UHD(3840*2160)分辨率、4ms響應時間、144Hz刷新率、G-Sync 技術、IPS+量子點面板、10bit色彩、DisPlay HDR1000認證。依舊是目前市面上頂級的電競顯示器。
四、理論性能測試:領先RTX 3080 12%左右 默頻可達1950MHz
1、3DMark Time Spy
在2K分辨率3DMark Time Spy測試中,RTX 3090圖形分數達到了19599分,核心溫度最高68℃,核心運行最高頻率為1920MHz,最高風扇轉速1516RPM,最高功耗355W。
在4K分辨率3DMark Time Spy Extreme測試中,RTX 3090圖形分數達到了9968分,核心溫度最高67℃,核心運行最高頻率為1920MHz,最高風扇轉速1515RPM,最高功耗336W。
在3DMark Time Spy測試中,2K分辨率下,RTX 3090的分數只比RTX 3080多了11%,相比RTX 2080 Ti多了39%。到了4K分辨率下的測試,這2項領先幅度分別提升到了12%和50%。
2、3DMark
在2K分辨率3DMark Fire Strike Extreme測試中,RTX 3090圖形分數達到了23388分,核心溫度最高64℃,核心運行最高頻率為1950Hz,最高風扇轉速1528RPM,最高功耗361W。
在4K分辨率3DMark Fire Strike Ultra測試中,RTX 3090圖形分數達到了12126分,核心溫度最高65℃,核心運行最高頻率為1935MHz,最高風扇轉速1519RPM,最高功耗358W。
3DMark的結果也同樣類似,在2K與4K分辨率下,RTX 3090比RTX 3080分別強了11%、12%。不過相比RTX 2080 Ti,RTX 3090在2K分辨率下能有43%的優勢,4K分辨率下則能領先51%。
五、4K游戲性能測試:比RTX 3080快了11% 比RTX 2080 Ti強44%
1、APEX英雄
在4K分辨率下,RTX 3090的幀率依然突破了百幀,比RTX 3080多了13幀,領先幅度為10%;相比RTX 2080 Ti多了46幀,強了48%。
2、使命召喚16:戰區
在《使命召喚:戰區》中,RTX 3090達到了117幀,比RTX 3080多了14幀,領先幅度為14%;比RTX 2080 Ti高出43幀,領先幅度超過了58%。
3、GTA V
在4K分辨率下,《GTA V》才能發揮出顯卡的真正性能,RTX 3090跑出了103幀,比RTX 3080多了10幀,領先幅度為11%;相比RTX 2080 Ti則多出了31幀,領先幅度為43%。
4、刺客信條:奧德賽
《刺客信條:奧德賽》這個游戲不愧是顯卡殺手,在4K分辨率下,RTX 3090也這是剛好過了60幀,比RTX 3080多了13幀,領先幅度為25%;相比RTX 2080 Ti則能多出22幀,領先幅度為52%。
5、德軍總部:新血脈
NVIDIA最新的GeForce 456.38驅動在這個游戲中的測試有了比較明顯的下降,因此我們沖洗測試了所有的顯卡。
RTX 3090在《德軍總部:新血脈》中跑出了161FPS的成績,比RTX 3080多了16幀,比RTX 2080 Ti多了44幀。
6、地平線:零之曙光
在《地平線:零之曙光》這個游戲中,RTX 3090的幀率為81FPS,比RTX 3080高了12幀,領先幅度為17%;和RTX 2080 Ti相比,能多出26幀,領先幅度為47%。
7、孤島驚魂5
在《孤島驚魂5》中,RTX 3090的幀率為107FPS,比RTX 3080多了9幀,領先優勢為9%;比RTX 2080 Ti則多了30幀,領先幅度為39%。
8、古墓麗影:暗影
在《古墓麗影:暗影》中,RTX 3090的幀率為91FPS,比RTX 3080多了8幀,領先幅度為10%;相比RTX 2080 Ti則多了28幀,領先優勢為44%。
9、絕地求生
《絕地求生》中,RTX 3090在4K分辨率下依然能跑出148FPS,比RTX 3080強了10%,比RTX 2080 Ti則要強了48%。
10、微軟模擬飛行
《微軟模擬飛行2020》果然是真硬件殺手,RTX 3090在4K分辨率下也沒能超過60FPS(雖然只差了一幀),但是比RTX 3080強了9%,比RTX 2080 Ti則要快了44%。
11、死亡擱淺
RTX 3090在《死亡擱淺》能夠很輕松的跑出123FPS,比RTX 3080的112FPS高了11幀,領先幅度為10%;和RTX 2080 Ti相比則多了38幀,強了45%。
12、巫師3
在《巫師3》中,RTX 3090依然能在4K分辨率下測得103FPS的幀率,比RTX 3080高了11幀,領先幅度為12%;和RTX 2080 Ti相比則多出了31幀,領先優勢為43%。
13、無主之地3
《無主之地3》是RTX 3090第二款沒能到65幀的游戲,和RTX 3080相比能夠有10%的優勢,與RTX 2080 Ti相比優勢幅度接近38%。
14、戰地5
在4K分辨率下,RTX 3090在《戰地5》中依然跑出了130FPS,但是只比RTX 3080多了7幀,只領先了6%;比RTX 2080 Ti多了41幀,領先優勢為46%。
15、戰爭機器5
在《戰爭機器5》中,RTX 3090的幀率為91FPS,比RTX 3080多了11幀,領先幅度為14%;與RTX 2080 Ti相比則能多出27幀,領先了42%。
綜合測試數據來看,在4K分辨率下,影馳RTX 3090金屬大師的性能比RTX 3080強了11%,這個幅度比規格之間的差異低了不少,不過和RTX 2080 Ti相比,RTX 3090金屬大師能高出44%的幀率。
比起2年前的旗艦GTX 1080 Ti,RTX 3090金屬大師性能提升了整整1倍。
很顯然,RTX 3090這個級別的顯卡并不是為1080P或者2K而準備的,不過我們還是測試了這2個分辨率的幀數。
1080P分辨率完全無法發揮RTX 3090的性能,即便是i9-10900K超頻到全核5.2GHz依舊也存在著巨大的瓶頸。在這個分辨率下,RTX 3090只比RTX 3080強了6%,比RTX 2080 Ti也就高了22%。
2K分辨率的表現稍微好了一點,RTX 3090相對RTX 3080的領先優勢略微提升到了8%;比起RTX 2080 Ti,領先幅度也升到了36%。
六、超頻測試:能超的核心都給了RTX 3090 最高運行頻率可達2160MHz
此前RTX 3080的超頻能力的確是令人失望,來看看影馳RTX 3090金屬大師的表現如何。
RTX 3090金屬大師的規格與公版完全相同,不過其超頻能力實在是令人驚訝,在GPU頻率提升了220MHz,顯存頻率從19.5GHz超頻到21GHz的情況下,依然能夠通過各種測試。
另外,GDDR6X顯存超頻到21GHz之后,帶寬也超過了1000GB/s。
稍顯可惜的是,顯卡鎖了350W的功耗上限。
先將核心頻率超頻到1915MHz,顯存不超。測得的3DMark Time Spy Extreme圖形分數為10442,比默頻的9968高了474分,提升幅度約為5%。
GPU的最高頻率達到了2160MHz,最高功耗355W,最高溫度也只有70度,風扇轉速1552RPM。
接著我們將GPU核心頻率超頻到1915MHz,顯存頻率從19GHz超頻到21GHz之后,3DMark Time Spy Extreme的圖形分數提高到了10504,提升了60分,可以看出超顯存并沒有太好的效果。
七、溫度與功耗測試:單烤FurMark整機505W 溫度70度
1、溫度測試
使用Furmark來對RTX 3090進行烤機測試,測試是室溫為26度。
將Furmark的參數設定為1920*1080分辨率、0AA。運行22分鐘之后,影馳RTX 3090金屬大師的溫度穩定在70度附近,沒有上升的跡象,顯卡的功耗穩定在330~350W區間跳動。滿載時1604RPM的轉速將噪音控制得不錯。
即便是將TDP提升到了350W,影馳RTX 3090金屬大師的散熱器系統也能夠比較輕松的應對。
2、功耗測試
分別測試待機、與Furmark烤機功耗,另外我們還會加上游戲功耗測試,測試的游戲項目為《巫師3》。
測試所用的電源為威剛XPG CORE REACTOR 850 GOLD金牌電源。
在5.2GHz i9-10900K + 皇家戟F4-4000C15D 8GBx4平臺上,幾款顯卡的待機功耗都差不多,在90W左右,影馳RTX 3090金屬大師稍高一些,達到了95W。
在運行《巫師3》時,影馳RTX 3090金屬大師的平臺功耗達到了496W,比RTX 3080高了45瓦,比RTX 2080 Ti高了正好100W。
在進行FurMark烤機時,RTX 3090金屬大師的整機功耗為505W,比RTX 3080高了40W,比RTX 2080 Ti高出95W。
八、光線追蹤與DLSS測試:光追效率強于圖靈
為了方便與此前的測試結果進行對比,我們依然選擇《堡壘之夜》、《德軍總部:新血脈》、《古墓麗影:暗影》、《光明記憶:無限》、《控制》、《戰地5》這6款游戲進行光線追蹤與DLSS性能測試。
1、堡壘之夜
RTX 3090在默認情況下能達到104FPS的幀率,開啟光線追蹤之后,幀率會暴跌至31FPS。開啟DLSS技術之后幀率又回升到了71FPS。
2、德軍總部:新血脈
《德軍總部》開啟光追之后,RTX 3090的幀率從161FPS掉到了93FPS,開啟DLSS能讓幀率回升到147FPS。
3、古墓麗影:暗影
《古墓麗影:暗影》開啟光追對于幀率沒有太大的影響,RTX 3090只是從91FPS掉到了56FPS,打開DLSS后幀率提升到了80FPS。
4、光明記憶:無限
《光明記憶:無限》應該算是目前為止光追效果最好的游戲之一,開啟光錐之后幀率跌的也比較厲害。RTX 3090開啟光追之后直接從滿幀120FPS掉到了48FPS。開啟DLSS之后,游戲幀率又回到了112FPS。
5、控制
《控制》支持DLSS 2.0技術,RTX 3090開啟DLSS之后游戲的幀率達到了82FPS,甚至超過了默認的71FPS。
6、戰地5
《戰地5》開啟光追之后幀率下降的并不多,RTX 3090只是從130FPS掉到了81FPS,不過開啟DLSS之后幀率提升也非常有限,僅有20%左右。
開啟光追之后,2塊圖靈顯卡的幀率都是從220%調到了100%,跌幅約為55%;而RTX 3
080的降幅則是52%,RTX 3090的降幅是51%。從這里可以看出新一代的RTX 3080/3090逛追效率要稍高于RTX 2080/2080 Ti。
與光追相反,RTX 3080/3090開啟DLSS之后幀率提升為80%左右,低于RTX 2080/2080 Ti的90%。由此看來即便是使用了第三代Tensor Core,但是在單元數減半之后,多少會對DLSS性能造成一些影響。
PS:《德軍總部:新血脈》在最新GeForce 456.38-WHQL驅動中幀率都有不同幅度的降低,我們重新測試了所有顯卡的成績。
九、總結:RTX 3090能打又能超、RTX 3070也值得期待
在整個測試過程中,RTX 3090給筆者印象最深的就是它的超頻能力。此前我們曾經測試過多快RTX 3080顯卡,將GPU頻率提升40MHz都無法通過穩定性測試。而RTX 3090就能在將核心頻率超頻220MHz,顯存頻率從19.5GHz提升大21GHz的情況下通過各種測試,實在是令人驚訝。
出現這種情況,比較合理的解釋就是NVIDIA將體質最好的GA-102核心用來制造更加高端的RTX 3090,而RTX 3080能超的只是極少部分,想要超頻只能憑用戶自己的運氣了。
從規格上來說,不論是流處理器數量、顯存位寬、ROP以及紋理單元上來看,RTX 3090的規模都比RTX 3080高了整整20%,此前我們預計RTX 3090的性能應該能有15%的提升。
不過實際測試情況多少還是有一點不及預期!在4K分辨率下,RTX 3090的游戲性能只是剛好比RTX 3080強了11%,相比RTX 2080 Ti則有著44%的提升。
至于光線追蹤,RTX 3090搭載了82個第二代RT Core,在開啟光線追蹤之后,性能損失要低于上一代的RTX 2080 Ti。就我們測試的6款光追游戲來看,在關閉RTX的情況下,RTX 3090的性能比RTX 2080 Ti強43%左右,而在都打開光線追蹤技術之后,RTX 3090的領先幅度會提升到54%。
與光追相反,雖然RTX 3090集成了第三代Tensor Core,不過由于數量爆減,DLSS的性能提升幅度并不是太理想。RTX 2080 Ti在開啟DLSS技術之后游戲的幀率能夠有87%的提升,而RTX 3090則只有78%的提升。
在溫度方面,我們手上這塊影馳RTX 3090金屬大師在進行了FurMark 22分鐘的烤機測試之后,GPU的核心溫度被控制在70度,而功耗也非常接近于滿載。
對于電源的選擇,由于NVIDIA嚴格限制了8Pin供電接口與PCIe x16接口的供電功率,因此雙8pin供電接口的顯卡整卡功率是很難超過375W的。我們在單烤GPU的時候,RTX 3090的整機功耗在500W左右,考慮到威剛XPG CORE REACTOR 850 GOLD金牌電源的轉換效率,此時電源的實際輸出功率約在470W左右。
對于大多數同學來說,一款單路供電750W的金牌電源足以滿足日常使用需求。雙路12V電源則至少要求單路12V電流值能超過36A,也即是至少需求額定900W以上的雙路電源。
對比RTX 3080與RTX 3090,對于大多數沒有特殊需求的游戲玩家而言,毫無疑問5499元的RTX 3080擁有無與倫比的性價比。而11999元的RTX 3090擁有24GB GDDR6X顯存,可以用來完成很多圖形設計相關的工作。
最后是對RTX 3070的一些期待!
或許有很多同學根據RTX 3080的8704個流處理器是RTX 3070 5888個流處理器 數量的1.5倍來推斷RTX 3080的性能也是RTX 3070的1.5倍。而RTX 3080性能是RTX 2080 Ti的1.3倍,從而得出結論RTX 3070的性能比RTX 2080 Ti差了20%,與RTX 2080 Super相當。
其實這種算法是錯的,對于高端顯卡而言規格提升50%并不能帶來50%的游戲幀率提升。
從RTX 3090的測試數據我們也看到了,它的規格參數方面比RTX 3080高了20%,但實際游戲性能只有11%的提升。因此RTX 3080的游戲幀率是不可能比RTX 3070高1.5倍的。
更合理的算法是,RTX 3080的流處理器數量是RTX 2080 Ti的2倍,性能高了30%。非常巧合的是RTX 3070的流處理器數量也是RTX 2080的2倍整,由此換算,RTX 3070的性能應當比RTX 2080強30%,與RTX 2080 Ti相當。
考慮到RTX 3070在ROP方面沒有被閹割,與RTX 3080同樣是96個,因此在抗鋸齒性能方面會有比較亮眼的表現。但由于其顯存帶寬只有448GB/s,與RTX 2080 Ti的616GB/s存在著較大差距,因而在4K分辨率下的表現相對RTX 2080 Ti可能會稍有不如。
由此得出的結論就是,在1080P/2K分辨率下,RTX 3070的性能可以媲美RTX 2080 Ti,但在4K分辨率下可能會有一些差距。不過對于3888元售價的RTX 3070來說,它本身就是一塊針對2K144Hz而設計的GPU,如果你是在2K甚至1080P分辨率下進行游戲,RTX 3070將是非常合適的選擇。
當然如果你有4K需求,傳說中提升了帶寬的RTX 3070 Ti應該是能完全戰勝RTX 2080 Ti的。
我們將會在10月的某一天解禁NVIDIA GeForce RTX 3070的評測,希望能給大家帶來一些驚喜!
責任編輯:haq
-
處理器
+關注
關注
68文章
19164瀏覽量
229123 -
NVIDIA
+關注
關注
14文章
4940瀏覽量
102815 -
gpc
+關注
關注
0文章
5瀏覽量
1334
發布評論請先 登錄
相關推薦
評論