北京時間2023年8月18日,在位于深圳市的英特爾大灣區(qū)科技創(chuàng)新中心內(nèi),英特爾舉辦了一場線下技術(shù)分享會。作為受邀媒體之一,《微型計算機》也參加了本次技術(shù)分享會。在這次會議上,英特爾除了帶媒體人員參觀了大灣區(qū)科技創(chuàng)新中心之外,還將重點放在了銳炫顯卡的性能與功能更新進(jìn)化上,并由英特爾中國區(qū)技術(shù)部總經(jīng)理高宇先生向我們講解了銳炫顯卡驅(qū)動在DX11方面的性能更新、全新概念GPU Busy的登臺,以及加入了Frametime、GPU Busy監(jiān)測的PresentMon Beta軟件的新亮相。接下來,就請跟隨《微型計算機》的鏡頭,一起來看看這場有料的線下技術(shù)分享會吧!
眾所周知,盡管憑借CPU的強勢地位,英特爾在集顯市場風(fēng)生水起,但除去“遠(yuǎn)古時代”曾曇花一現(xiàn)的個別產(chǎn)品之外,英特爾其實還真算得上是現(xiàn)代獨顯市場的新生力量。嚴(yán)格意義上要說起來,可能2022年10月左右Arc銳炫顯卡的發(fā)布才是英特爾正式進(jìn)入獨顯市場的標(biāo)志。不過不可否認(rèn)的是,在聯(lián)合了以藍(lán)戟科技為首的AIC廠商的共同努力下,過去的10個月時間里,Arc獨顯的市場與性能表現(xiàn)也算是有目共睹,也收獲了比較不錯的成績。
其實玩家們都看得到,從Arc銳炫顯卡發(fā)布以來,英特爾在驅(qū)動更新方面一直都是兢兢業(yè)業(yè),更新的步調(diào)非常頻繁。在差不多10個月的時間里,銳炫顯卡驅(qū)動已經(jīng)更新超過了30個版本,針對DX 9和DX 11游戲做了大量的優(yōu)化,也使得銳炫顯卡每過一段時間就能取得性能上的猛漲。同時英特爾也與時俱進(jìn),為57款新游戲提供了首發(fā)日的優(yōu)化支持。這一切都說明英特爾這次在Arc獨顯上寄予了厚望,不只是雷聲大,更是想要為現(xiàn)在的獨顯市場注入一場“暴雨”。
更新優(yōu)化的步伐不會停歇,隨著Arc獨顯驅(qū)動新版本的發(fā)布,Arc獨顯又從新驅(qū)動上獲得了19%以上的DX 11性能提升,同時英特爾還提出了GPU Busy的概念來闡釋了驅(qū)動優(yōu)化的核心方向,并為玩家?guī)砹薖resentMon Beta這一款直觀好用的GPU狀況及游戲幀率監(jiān)測軟件。
驅(qū)動優(yōu)化更新再前行,DX 11游戲性能提升可達(dá)19%
在銳炫獨顯發(fā)布之初,英特爾將驅(qū)動性能優(yōu)化的重點放在了DX 9游戲性能的提升上,事實上我們也看到在2023年Q1~Q2 的幾個月時間內(nèi),英特爾陸續(xù)發(fā)布的多版銳炫顯卡驅(qū)動將DX 9游戲性能表現(xiàn)提升達(dá)到了平均約43%的恐怖程度。而同時,英特爾還在前幾個月內(nèi)針對銳炫顯卡的價格進(jìn)行了大調(diào)整,1799元的銳炫A750顯卡也因此獲得了非常優(yōu)秀的性價比表現(xiàn)。在當(dāng)時的4086版驅(qū)動與3490版首發(fā)驅(qū)動的比較中(《微型計算機》當(dāng)時也有實測驅(qū)動性能對比,感興趣的玩家可以參考我們之前的文章),包括《英雄聯(lián)盟》《CS:GO》等熱門游戲在內(nèi)的性能提升都是非常明顯的。
顯然,從Q2開始,英特爾就已經(jīng)著手于DX 11游戲性能的驅(qū)動優(yōu)化工作。在英特爾看來,目前市場內(nèi)受眾最多的熱門游戲,仍然是DX 11的天下,如《CS:GO》《DOTA 2》《PUBG》等莫不如此。因此英特爾認(rèn)為為這些受歡迎的DX 11游戲提供優(yōu)化解決方案是當(dāng)下的重點所在。
為此,從Q2開始,英特爾陸續(xù)在驅(qū)動更新上朝著DX 11性能的優(yōu)化發(fā)力,到現(xiàn)在最新的驅(qū)動對比,相對于首發(fā)驅(qū)動,新版本的新驅(qū)動程序在DX 11游戲方面有了平均數(shù)十幀的提升幅度,同比增長幅度達(dá)到了5%~33%,平均幀率增長幅度約為19%。
在除去決定游戲卡頓程度的1%L fps的低幀分布集之外,99 Percentile代表了游戲流暢度的直觀體現(xiàn)。從英特爾給出的資料來看,新舊驅(qū)動的99 Percentile也有了顯著的提升,相較于3490版驅(qū)動,新版本驅(qū)動的提升幅度達(dá)到了9%~45%,平均達(dá)到了20%以上。這也意味著玩家能夠獲得更加絲滑順暢的游戲體驗。
看得出,英特爾想要表達(dá)的意思就是新驅(qū)動在DX 11游戲性能上提升了19%,在游戲流暢性上提升了20%。當(dāng)然,我們相信在未來的一段時間內(nèi),DX 11游戲性能的持續(xù)優(yōu)化,都將是銳炫顯卡驅(qū)動更新的主要努力方向,未來相信也應(yīng)該會有更多的DX 11游戲加入優(yōu)化列表,持續(xù)提升銳炫顯卡的價值。
FrameTime與GPU Busy,用驅(qū)動優(yōu)化平衡CPU與GPU以提升性能
在會上,英特爾給出了一個比較有意思的數(shù)據(jù),那就是同樣在新驅(qū)動的優(yōu)化支持下,同樣在基于銳炫A750顯卡的平臺上,他們發(fā)現(xiàn)酷睿i9處理器的提升幅度反而小于酷睿i5處理器的提升幅度。從上圖中我們也可以看出,酷睿 i9處理器平臺性能提升平均約12%,這也算是相當(dāng)大的提升,但比起酷睿 i5來說,提升幅度還是稍微遜色一些。
有個很簡單的道理,決定水桶容量的是最短的那塊木板。集顯的游戲性能受限于iGPU自身,而對于大多數(shù)主流獨顯來說,不少時間內(nèi)的游戲性能表現(xiàn)反而受限于CPU的性能及優(yōu)化。
這是一個簡化了的圖形渲染輸出的示意圖。在這一工作流程中CPU會將游戲想要呈現(xiàn)的效果畫面進(jìn)行物理層面的邏輯計算,以“Present”指令發(fā)給DirectX API再向GPU發(fā)出渲染指令,驅(qū)動程序就在DirectX API和GPU執(zhí)行之間充當(dāng)了橋梁作用,它將DirectX(或是Vulkan等) API的命令轉(zhuǎn)換為GPU能執(zhí)行的指令并通知GPU渲染輸出,此時“Present”再次返回GPU,通知開始下一個“Present”循環(huán)。
從圖中可以看出,CPU準(zhǔn)備渲染命令發(fā)送給GPU每一幀渲染畫面指令都存在一個時間,也就是前后兩次“Present”的時間間隔,即圖中的Frametime(每幀時間),某種意義上,它代表的是“CPU有多忙”。而在GPU渲染部分,GPU渲染的每幀時間英特爾將其稱為“GPU Busy”,代表的是“GPU有多忙”。
詳細(xì)的原理講起來比較話長,簡單且形象地說,CPU相關(guān)的Frametime可以理解為CPU準(zhǔn)備每一幀畫面的渲染指令所需要的時間,而GPU Busy則可以簡單理解為GPU渲染每一幀畫面所需要的時間,驅(qū)動程序要做的事情,就是解釋CPU指令、轉(zhuǎn)換DirectX命令給GPU渲染。所以Frametime越低、波動越小,說明CPU處理每一幀渲染指令的時間越短,也就代表CPU能處理的游戲fps(每秒幀數(shù),即幀率)能力越強。對GPU Busy時間來說也是如此。因此最理想的情況就是二者完全同步,實現(xiàn)最佳的性能平衡。
編者注:Frametime和GPU Busy不與游戲最終fps呈現(xiàn)直接掛鉤,僅是瓶頸參考數(shù)據(jù)。
在3490版老驅(qū)動程序下,可以看到Frametime較高,抖動比較厲害,也就意味著它每秒能處理的畫面幀數(shù)相對較低,會影響游戲的整體fps表現(xiàn),此時CPU應(yīng)該是性能瓶頸。(藍(lán)色為Frametime,黃色為GPU Busy)
新的銳炫獨顯驅(qū)動專門針對Frametime進(jìn)行了優(yōu)化,顯著改善了Frametime??梢钥闯鯢rametime排列更加緊密,而且大幅度減少了抖動,使得Frametime與GPU Busy無限接近,顯著改善了游戲幀率表現(xiàn)。(藍(lán)色為Frametime,黃色為GPU Busy)
在CPU受限的系統(tǒng)中,GPU較為悠閑,它的處理非常迅速,此時游戲整體幀率表現(xiàn)受限于CPU的處理能力。
英特爾展示的這兩幅比較圖表比較有意思。在1080p低畫質(zhì)設(shè)置下,游戲整體受限于CPU處理能力,可以看到Frametime與GPU Busy'差距很大,抖動厲害。而將畫質(zhì)設(shè)置為超高時,顯著增加了GPU的負(fù)荷,此時游戲的整體性能表現(xiàn)上CPU與GPU基本達(dá)到了較好的平衡。相信很多玩家這時就會想,我怎么去直觀地看到,我的系統(tǒng)游戲性能是CPU受限、GPU受限還是能很好地平衡呢?英特爾在本次溝通會上推出的PresentMon Beta或許能解決玩家的疑慮。
監(jiān)控一目了然,PresentMon Beta
在本次分享會上,英特爾也向媒體介紹了換新出鏡的PresentMon軟件。這是一款可以查看GPU的功耗、溫度、電壓或任何獨立硬件供應(yīng)商提供的其他信息。PresentMon Beta支持多個硬件廠商, 同時兼容Intel、NVIDIA、AMD的GPU和CPU相關(guān)產(chǎn)品。同時,它也提供了對DirectX 11、12、OpenGL、Vulkan等API的全面支持。這是一個可配置的工具,可以疊加顯示在游戲畫面上,提供多個可監(jiān)控參數(shù),包括之前討論的Frametime和GPU Busy。
和GFE、Radeonsoftware的Overlay界面非常相似,PresentMon Beta可以提供fps平均幀率、99 Percentile等游戲幀率指標(biāo)的實時顯示,同時特別的是,它還提供了Frametime和GPU Busy這兩個參數(shù)的監(jiān)控顯示。通過這兩個參數(shù)的實時變化曲線,玩家就可以很清楚地看到自己的系統(tǒng)瓶頸是在CPU或是GPU,又或者二者處于非常美妙的平衡狀態(tài)下。跟蹤這兩個參數(shù)的變化曲線,也能方便玩家針對自己的系統(tǒng)情況做出實時的調(diào)整。假如你看到Frametime波動巨大,且與GPU Busy相差較大,那么毫無疑問是CPU受限,二者如果基本重合則說明系統(tǒng)較為平衡或是處于GPU受限狀況。
▲在主界面上還可以進(jìn)行自定義需要PresentMon Beta跟蹤的程序及快捷鍵等操作。
▲Overlay游戲內(nèi)疊加顯示的配置界面,可以自定義界面顯示效果、數(shù)據(jù)刷新頻率等參數(shù),同時英特爾表示PresentMon Beta的資源占用非常低,對游戲體驗幾乎沒有實質(zhì)性影響。
從這次的線下分享會來看,英特爾確實在獨顯領(lǐng)域做出了自己最大可能的努力。持續(xù)不斷地驅(qū)動更新優(yōu)化為銳炫顯卡帶來了持續(xù)的活力與高保值,讓銳炫顯卡每隔一段都能產(chǎn)生“物超所值”的感想。同時,本次分享會上亮相的PresentMon Beta也很好地解決了銳炫顯卡玩家對性能的DIY訴求,知其然且知其所以然,這樣才是DIY最大的樂趣。在分享會之后,與會媒體也就一些玩家比較關(guān)心的問題和英特爾的相關(guān)負(fù)責(zé)人進(jìn)行了溝通。在這里,我們也摘錄了部分問題放在這里,以饗讀者。
Q:PresentMon Beta軟件是否支持其他顯卡和CPU?
英特爾:目前PresentMon Beta支持所有類型的CPU和GPU,也支持包括DX、Vulkan和OpenGL在內(nèi)的絕大多數(shù)API。
Q:PresentMon Beta是集成在Arc Control(英特爾銳炫獨顯控制面板)里還是單獨下載?
英特爾:目前不會集成到Arc Control中,大家可以自由下載和自由使用。
Q:能否再為玩家詳細(xì)講講新的驅(qū)動如何讓Frametime和GPU Busy更適配?
英特爾:優(yōu)化的目的是怎么讓GPU Busy部分和Frametime盡量接近。我們知道,CPU部分前面有等待的時間,CPU轉(zhuǎn)成所有DX的命令以后,就要在那兒等,發(fā)出第一個Present就要等,我們的目標(biāo)是如何讓等的時間更少。過去驅(qū)動更新時DX 9和DX11大幅提升,我們攻堅的核心困難點就是CPU 受限。其實英特爾GPU的渲染能力是非常強的,在跑3D Mark的結(jié)果就已經(jīng)能看到這點,那是比較真實地反映基本渲染能力的。但是我們過去的驅(qū)動效率不夠高。在過去的八個月里,我們把CPU的等待效率提升了N倍。這就解釋了為什么在i5上看到收益最大,因為i5 CPU肯定比i9弱一點,CPU效率越低端的CPU收益肯定越大。我們想不斷地通過擠壓CPU側(cè)的效率,從而把銳炫獨立顯卡的潛能徹底發(fā)揮出來。
審核編輯 黃宇
-
英特爾
+關(guān)注
關(guān)注
60文章
9886瀏覽量
171502 -
cpu
+關(guān)注
關(guān)注
68文章
10825瀏覽量
211146 -
gpu
+關(guān)注
關(guān)注
28文章
4700瀏覽量
128700
發(fā)布評論請先 登錄
相關(guān)推薦
評論