首款256Bit位寬的RTX 4070系列顯卡
2022年9月,RTX 4070 Ti在發布前爆出了個烏龍,由于其性能可以媲美RTX 3090 Ti,NVIDIA有意將它命名為RTX 4080 12GB。
但是192Bit位寬的RTX 4080玩家是絕對無法接受的(就算性能再強也無濟于事),NV最終順應民意做出了妥協,這才有了售價6488元的RTX 4070 Ti。
2024年1月9日,NVIDIA發布了GeForce RTX 40 SUPER系列顯卡,包括RTX 4070 SUPER、RTX 4070 Ti SUPER和RTX 4080 SUPER三款型號。
首先上市的是RTX 4070 SUPER,現在輪到了RTX 4070 Ti SUPER,這是首款擁有256Bit顯存位寬的RTX 4070系列顯卡,同時還采用了更高一級的AD 103核心,但售價依舊維持6488元不變。
這是完整的AD103核心,是為RTX 4080 SUPER準備的,芯片面積378.6平方毫米,集成了多達459億個晶體管。
AD103核心內部組成可以分為7組GPC、40組TPC、80-組SM,每一組SM 128個CUDA核心,整個核心總計10240個CUDA核心。
AD103-275核心,也就是RTX 4070 Ti SUPER,直接屏蔽掉了下面一組GPC,一共還剩6組GPC、33組TPC、66個SM單元共8448個流處理器。
另外,它還有264個第四代Tensor張量核心、66個第三代RT光追核心、264個紋理單元、96個ROP單元以及48MB二級緩存。
RTX 4070 Ti SUPER詳細規格參數如下:
可以看到,RTX 4070 Ti SUPER與其他4070相比,顯存位寬從192Bit升級到了256Bit,帶寬達到了672GB/s,再配合48MB二級緩存,應付4K游戲不會有太大問題。
RTX 4070 Ti SUPER和RTX 4070 Ti一樣沒有FE公版,本次首發采用的是影馳大將版本,價格6488元。
整卡大小為333*140*62mm,三槽厚度。
正面有3個特制靜霜風扇,風扇直徑92mm,支持智能啟停,在溫度低于60度時停轉。
全尺寸金屬背板,尾部還采用了鏤空設計,氣流可直接吹透,提升散熱效率。
標準的一個HDMI、三個DisplayPort接口。
兩段式散熱器,一共有8條6mm復合熱管,這熱管數量在RTX 4070 Ti SUPER應該是最多的一檔。
GeForce RTX 4070 Ti SUPER 大將為8層PCB,緊湊設計嚴謹合理,電氣性能更好。
11+2相供電電路設計,滿足285W整卡功耗非常富余。
RTX 4080采用的是AD103-275核心,芯片面積378mm2,擁有459億晶體管。
GPU旁邊是8顆美光GDDR6X顯存,單顆2GB,總容量16GB,等效頻率21GHz,帶寬672GB/s。
測試平臺:i9-14900K + ROG MAXIMUS Z790 DARK HERO主板
測試平臺如下:
1、i9-14900K
在銳龍7 7800X3D與i9-14900K之間,選了后者。
2、ROG MAXIMUS Z790 DARK HERO主板
這塊主板設計了20+1+2的供電電路,每相供電配備一個日系富士通 MIL 系列10K黑金固態電容,一個MICRO FINE粉末化超合金電感,以及一個90A的DrMOS。
整個供電電路可以提供超過1500W的功率輸出,就算是使用液氮極限超頻也沒問題。
理論性能測試:3DMark最高運行頻率2760MHz 風扇轉速不超過1300RPM
1、3DMark Fire Strike
在2K分辨率3DMark Fire Strike Extreme測試中,RTX 4070 Ti SUPER圖形分數達到了28577分,核心溫度最高62℃,熱點溫度最高75℃,核心運行最高頻率為2760MHz,最高風扇轉速1207PM,整卡最高功耗283W。
在4K分辨率3DMark Fire Strike Ultra測試中,RTX 4070 Ti SUPER圖形分數達到了14155分,核心溫度最高63℃,核心運行最高頻率為2760MHz,最高風扇轉速1285RPM,最高功耗291W。
2、3DMark Time Spy
在2K分辨率3DMark Time Spy測試中,RTX 4070 Ti SUPER圖形分數達到了24024分,核心溫度最高64℃,核心運行最高頻率為2745Hz,最高風扇轉速1305RPM,最高功耗289W。
在4K分辨率3DMark Time Spy Extreme測試中,RTX 4070 Ti SUPER圖形分數達到了11878分,核心溫度最高64℃,核心運行最高頻率為2760Hz,最高風扇轉速1215RPM,最高功耗291W。
五、1080P游戲性能測試:比RTX 3090 Ti強8%
1、刺客信條:英靈殿
2、地平線:零之曙光
3、孤島驚魂5
4、孤島驚魂6
5、古墓麗影:暗影
6、霍格沃茨之遺
7、極限競速:地平線5
8、賽博朋克2077
9、巫師3
10、無主之地3
11、星空
12、戰爭機器5
測試結果匯總如下:
1080P分辨率下,RTX 4070 Ti SUPER的幀率基本能跑到140FPS以上,比起RTX 3090 Ti要快了8%,比RTX 4070 Ti則快了5%。
六、2K游戲性能測試:比RTX 3090 Ti強5%
1、刺客信條:英靈殿
2、地平線:零之曙光
3、孤島驚魂5
4、孤島驚魂6
5、古墓麗影:暗影
6、霍格沃茨之遺
7、極限競速:地平線5
8、賽博朋克2077
9、巫師3
10、無主之地3
11、星空
12、戰爭機器5
測試結果匯總如下:
七、4K游戲性能測試:與RTX 3090 Ti不分勝負
1、刺客信條:英靈殿
2、地平線:零之曙光
3、孤島驚魂5
4、孤島驚魂6
5、古墓麗影:暗影
6、霍格沃茨之遺
7、極限競速:地平線5
8、賽博朋克2077
9、巫師3
10、無主之地3
11、星空
12、戰爭機器5
測試結果匯總如下:
4K分辨率下,RTX 4070 Ti SUPER只有2款游戲幀率不足60FPS,但他們都能支持DLSS 3。
與RTX 4070 Ti相比,能夠領先9%;至于RTX 3090 Ti,二者互有勝負,差距僅有0.3%。
八、StableDiffusion體驗:SDXL可將生圖速度提升200%
2023年9月,NVIDIA推出了用于Stable Diffusion Web UI 的TensorRT 加速插件,能讓具備Tensor單元的GeForce顯卡在Stable Diffusion Web UI?中獲得翻倍的性能。
本次我們將對比SDXL加速方法與PyTorch xFormers(常規加速方法)的性能差異。
我們生成20張太空大戰圖像,分辨率1024*1024,使用PyTorch xFormers加速時,耗時8分鐘。
使用SDXL加速之后,耗時僅為2分59秒。
結合終端數據,可以看到RTX 4070 Ti SUPER使用默認加速器時,生圖速度只有2.2it/s,而在TensorRT加持下,生圖速度直接到了6.9it/s,提升幅度為200%。
九、DLSS3游戲測試之一:4款DLSS3游戲
此次我們一共測試了8款游戲,包括4款支持DLSS 3的游戲:《3DMark》、《毀滅全人類》、《星空》、《微軟模擬飛行》。
另外還有4款同時支持DLSS與光追的游戲:《光明記憶》、《生死輪回》、《賽博朋克2077》、《霍格沃茨之遺》。
所有DLSS 3以及光追測試都是在2K分辨率下進行。
1、星空
最高畫質下,RTX 4070 Ti SUPER幀率81FPS。
開啟DLSS 3之后,幀率為159FPS,提升幅度將近100%。
2、微軟模擬飛行
2K分辨率最高畫質下,RTX 4070 Ti SUPER的幀率為122FPS。
開啟DLSS 3之后,幀率達到了257,提升111%。
3、毀滅全人類2:重新探測
最高畫質下,RTX 4070 Ti SUPER的幀率為154FPS。
開啟DLSS 3之后,幀率來到了276FPS,近乎翻倍。
4、3DMark
DLSS 2模式下幀率為164FPS,比默認的71FPS提升了131%。
DLSS 3的成績為172FPS,相比默認提升了142%。
十、DLSS3游戲測試之一:4款支持DLSS3的光追游戲
1、光明記憶:無限
開啟光追時,游戲的幀率為126FPS。
開啟DLSS 3之后,幀率提升到了258FPS,提升了105%。
2、生死輪回
開啟光追之后,游戲的幀率僅有78FPS。
打開DLSS 3之后,幀率提升到了225FPS,提升幅度為158%。
3、賽博朋克2077
開啟光追時,幀率為49FPS。
這是DLSS 3的畫面,與原生畫面的差距難以分辨,但是幀率提升到了174FPS。
4、霍格沃茨之遺
開啟光追時,幀率為73FPS。
打開DLSS 3之后,幀率來到了204FPS,提升幅度高達179%。
測試數據匯總如下:
十一、實際功耗測試:2K游戲平均功耗232W
1、烤機測試
將Furmark的參數設定為1920*1200分辨率、0AA。
運行13分鐘之后,影馳RTX 4070 Ti SUPER大將的溫度穩定在66度附近,功耗穩定在285W,烤機時GPU頻率為2085MHz,CPU風扇轉速只有1705RPM。
2)、真實游戲功耗測試
1、GTA V
1080P分辨率下,RTX 4070 Ti SUPER的功耗為119W,而RTX 3090 Ti則高達218W。
2K分辨率下,RTX 4070 Ti SUPER功耗是162W,運行頻率2760MHz,溫度45度。
RTX 3090 Ti的功耗為277W,運行頻率2040MHz,溫度50度。
到了4K分辨率,RTX 4070 Ti SUPER的功耗是2277W,而RTX 3090 Ti功耗為378W。
2、絕地求生
1080P分辨率下,RTX 4070 Ti SUPER的功耗為234W,而RTX 3090 Ti則高達394W。
2K分辨率下,RTX 4070 Ti SUPER功耗是230W,運行頻率2730MHz,溫度59度。
RTX 3090 Ti的功耗為404W,運行頻率2010MHz,溫度86度。
到了4K分辨率,RTX 4070 Ti SUPER的功耗是277W,而RTX 3090 Ti功耗為433W。
3、古墓麗影:暗影
1080P分辨率下,RTX 4070 Ti SUPER的功耗為251W,而RTX 3090 Ti則高達374W。
2K分辨率下,RTX 4070 Ti SUPER功耗是2560W,運行頻率2730MHz,溫度61度。
RTX 3090 Ti的功耗為400W,運行頻率20250MHz,溫度65度。
到了4K分辨率,RTX 4070 Ti SUPER的功耗是270W,而RTX 3090 Ti功耗為432W。
測試數據匯總如下:
RTX 4070 Ti SUPER在1080P、2K與4K分辨率下的游戲功耗分別為214W、232W、263W,大約是RTX 3090 Ti的60%。
十二、總結:眼饞RTX 4080的可以下手了
本次測試小結如下:
1、性能
受制于192Bit顯存位寬,RTX 4070 Ti在1080P和2K分辨率下的性能表現雖然可以媲美甚至超越RTX 3090 Ti,但是受制于192Bit位寬,它在4K分辨率下表現不盡如人意,與RTX 3090 Ti慢了大概10%。
現在,擁有256Bit位寬的RTX 4070 Ti SUPER則是全面戰勝了RTX 3090 Ti,也完全可以應付運行4K游戲的幀率需求。
我們所測試的12款3A游戲,僅有《賽博朋克2077》與《星空》這2款游戲幀率沒達到60幀,而剛好這2款游戲都能支持DLSS 3,在開啟此功能之后,幀率可以從56FPS提升到120FPS以上。
至于其他10款游戲,幀率都在70FPS以上。
在1080P分辨率下,RTX 4070 Ti SUPER比RTX 3090 Ti強了8%,比RTX 4070 Ti強了5%,比起RTX 38080 Ti則是強了15%之多。
2K分辨率下,RTX 4070 Ti SUPER依舊能夠領先RTX 3090 Ti約5%,比RTX 4070 Ti快了6%,比起RTX 3080 Ti則有15%的優勢。
4K分辨率下,RTX 4070 Ti SUPER與RTX 3090 Ti互有勝負,二者性能差異不到0.5%,相比RTX 4070 Ti則能領先9%。
2、功耗
進入RTX 40系之后,TGP不再代表顯卡的真實功耗,而是指功耗墻,正常情況下的運行功耗會遠低于TGP數字。
總體來看,RTX 4070 Ti SUPER的游戲功耗約為RTX 3090 Ti的60%,考慮到性能上的提升,因而在能效比方面,RTX 4070 Ti SUPER幾乎是前代卡皇的2倍。
?
我們測試了6款3A大作的真實游戲功耗,在1080P分辨率下RTX 4070 Ti SUPER的平均功耗是214W,而RTX 3080 Ti是314W,RTX 3090 Ti則是356W。
2K分辨率下,RTX 4070 Ti SUPERi在6款游戲中的平均功耗是232W,RTX 3080 Ti和RTX 3090 Ti則分別是332W、390W。
4K分辨率下,RTX 4070 Ti SUPER在6款游戲中的平均功耗為263W,而RTX 3080 Ti已經跑到了350W的TGP上限,RTX 3090 Ti則高達428W。
4、DLSS 3和光追
目前可玩的DLSS 3游戲已有60余款,此次我們測試了9款。
在開啟DLSS 2之后,游戲幀率提升幅度為81%。打開DLSS 3,游戲幀率提升幅度達到了140%。
由于RTX 3090 Ti不支持DLSS 3技術,因此在這些游戲中的幀率已經是全面落后于RTX 4070 Ti SUPER。
至于光追,RTX 4070 Ti SUPER擁有66個第三代RT Core,開啟光追之后,游戲幀率平均下跌53%,而RTX 3090 Ti下降幅度達到了60%,新一代的光追單元運算效率比前輩要高了不少。
5、AI性能
如今RTX GPU的AI性能已經獨步天下,即便是不適用TensorRT 加速插件,RTX 40系列GPU也是Stable Diffusion畫圖首選,而今在TensorRT加持下,RTX 4070 Ti SUPER的生圖速度可以直接提升200%以上,至此已無任何對手。
至于價格,也許你曾經對于RTX 4080強悍的性能心動不已,但面對其9499元的售價只能望而卻步。
現在RTX 4070 Ti SUPER同樣擁有256Bit位寬以及16GB大容量顯存,在性能上的差距有只有15%左右,但是價格只有6499元,足足便宜了3000元之多。
眼饞RTX 4080的玩家可以動手了,而這就是RTX 4070 Ti SUPER誕生的意義。
審核編輯:黃飛
?
評論
查看更多