作為人們日常數字生活中不可或缺的一部分,Arm GPU 賦能了從當今智能手機上的沉浸式游戲,到各類邊緣側人工智能 (AI) 體驗的方方面面。目前,Arm 合作伙伴的 GPU 出貨量已超過 100 億顆,而這一卓越成就歸功于我們業界領先的生態系統。這些 GPU 廣泛應用于包括智能手機、平板電腦、智能電視、機頂盒、智能手表和 XR 可穿戴設備在內的各類消費電子設備。
去年此時,我們推出了新的第五代 GPU 架構及一系列新的 GPU,包括 Arm Immortalis-G720 GPU。MediaTek的天璣 9300 系統級芯片 (SoC) 平臺便采用此 GPU。之后,知名手機廠商 vivo 和 OPPO 的旗艦智能手機都先后采用了該芯片。
今年,我們很高興推出第二代基于 Arm 第五代 GPU 架構構建的GPU 產品,成為 Arm 終端計算子系統 (CSS) 的重要組件。其中包括新的 Arm Immortalis-G925 GPU、Arm Mali-G725 GPU 和 Arm Mali-G625 GPU,它們適用于從旗艦智能手機、高端手機,到智能手表、入門級移動設備等各類消費電子設備,這些 GPU 產品的兩大設計重心:
作為手機游戲持續演進的一部分,實現沉浸式視覺體驗。
在主流應用中加速實現 AI 體驗。
出色的游戲性能
去年推出的 Immortalis-G720 在多數的圖形基準測試中都以其峰值性能(每秒幀數, fps)和更長游戲時間的持續性能擊敗對手。通過推出 Arm 目前性能最強、效率最高的 GPU —— Immortalis-G925,我們持續推動這一出色表現。在 Arm 參考平臺上進行比較時,Immortalis-G925 的性能 (fps) 比 Immortalis-G720 提高了 37%。此外,在提供與 Immortalis-G720 相當的游戲性能時,Immortalis-G925 的功耗降低了 30%。
圖:Arm Immortalis-G720 對比其他 SoC在領先的圖形基準測試中的表現情況
這一出色性能延伸到了關鍵的手機游戲領域,與 Immortalis-G720 相比,Immortalis-G925 的性能平均提升了 46%。單看各款游戲,《原神》的性能提升 49%,而《Roblox》的運行速度加快 46%。其他熱門手機游戲的性能提升幅度均在 29% 至 72% 之間,包括《使命召喚手游》、《暗黑破壞神:不朽》、《明日之后》、《堡壘之夜》和《絕地求生手游》。
這些令人驚喜的游戲改進對于開發者和最終的游戲玩家來說都意義非凡。
不斷追求更逼真的游戲體驗
手游內容趨勢的演變是 Arm 持續關注的重點,用以確保我們的 GPU 產品能滿足開發者和生態系統合作伙伴的需求。Immortalis-G925 也不例外,該 GPU 專為最新的游戲技術、功能和趨勢而設計。而正是整個生態系統的協同合作,造就了更優異的游戲體驗。
近年來,場景幾何在手游領域持續發展,其可增加游戲對象的清晰度,有助于創建更逼真的地形,并為游戲角色賦予更高的真實感。事實上,隨著開發者努力創建更多的場景細節和更高的真實感,熱門游戲《堡壘之夜》和《原神》的幾何復雜度同比增長了 9% 至 11%。
復雜的片段著色技術通過為對象和角色賦予紋理感,制作出更逼真的游戲體驗。該技術可實現高質量游戲效果,如光暈、模糊和基于物理的著色。在《堡壘之夜》和《原神》中,片段著色器在 GPU 上花費的時間激增,同比增加 27% 到 43%。
為滿足針對更復雜幾何體的需求,Immortalis-G925 引入了片段預處理 (Fragment Prepass) 的新機制。借助該圖形技術,應用無需進行任何對象或原語排序,并且在處理幾何工作負載時,能夠更高效地減少過度繪制。通過片段預處理,我們觀察到由于無需對象排序,渲染線程周期縮短高達 43%。這不僅提高了性能和能效,也減少了 CPU 的負載。
自從在 Immortalis-G715 GPU 中引入光線追蹤以來,該技術正愈發普遍,其有助于創建更真實的陰影、反射和高級光照效果。Immortalis-G925 持續推動光線追蹤內容的改進,對復雜對象的光線追蹤性能提高了 52%。通過對光線追蹤內容進行內部測試,我們正進一步提高其性能。例如,在游戲場景透明度方面保持相同準確度的同時,性能提升 27%。開發者也可選擇將游戲場景透明度的準確性略微降低,由此帶來高達 52% 的驚人性能提升,并降低 57% 的內存流量。
增加著色器核心,以支持更多的消費市場
為應對筆記本電腦、Chromebook 和游戲手機等各類消費電子設備市場日益增長的性能需求,Immortalis-G925 所支持的著色器核心數量增加了 50%,達到 24 個核心的最大配置,而上一代最多只有 16 個。
為擴展到該性能點,圖塊吞吐量和命令流前端 (Command Stream Front-end, CSF) 均經過更改和優化。我們已經能夠將圖塊吞吐量翻番,并對 CSF 進行了多項改進,包括對關鍵命令的硬件支持和增加硬件接口數量,以加快將作業分配給著色器核心的速度。
在新推出的 GPU 中,著色器核心的數量均已擴展。Immortalis-G925 可配置 10 個以上的核心,適用于旗艦智能手機等高性能消費技術市場。Mali-G725 可在六至九個核心之間擴展,主要針對高端手機市場。此外,它還能提供與 Immortalis-G925 相同的 API 支持,同時為 Immortalis-G925 目標范疇以外的稍低級別設備提供引人入勝的沉浸式游戲體驗。Mali-G625 可在一至五個核心之間擴展,適用于智能手表和入門級移動設備。
圖:Arm Immortalis-G925、Arm Mali-G725 和 Mali-G625 的核心數
AI 性能提升
與前幾代產品一樣,我們不斷提升 AI 工作負載在 GPU 上的性能和效率。作為 Arm 終端 CSS 的重要組件,Immortalis-G925 在 AI 和機器學習 (ML) 網絡中的推理速度比 Arm 2023 全面計算解決方案 (TCS23) 中的 Immortalis-G720 提高了 34%。雖然大多數 AI 處理工作能夠在 CPU 上進行,但 GPU 為各種 AI 用例提供加速功能,包括圖像分類、圖像分割、對象檢測、自然語言處理和語音轉文本等。
與 TCS23 中的 Immortalis-G720 相比,Immortalis-G925 作為 Arm 終端 CSS 的一部分,在關鍵用例中提供一系列 AI 性能改進。在圖像處理方面(包括分割和分類),Immortalis-G925 可實現 41% 的性能提升,表現搶眼。同時,在超級采樣任務中,開發者可以使用神經網絡對圖像進行向上擴展,其性能可提高近 30%,而在自然語言處理和語音轉文本,性能可提高 50%,同樣十分驚艷。
圖:Arm Immoratlis-G925 AI性能提升
此外,Arm 正攜手生態系統合作伙伴,以提高 AI 性能。通過與 Unity 合作,我們幫助將 int8 支持引入面向基于 Unity 應用的 ML 框架 Sentis。采用 int8 后,其性能提升 44%,同時內存占用空間減少,從而改善了基于 ML 的移動游戲體驗。
最后,作為 Arm 終端 CSS 的一部分,我們協同設計并交付 GPU 物理實現。我們攜手領先的代工廠合作伙伴,實現了流片就緒的 Immortalis-G925 三納米工藝的物理實現,助力我們的合作伙伴能夠在三納米工藝上充分發揮功耗、性能和面積 (PPA) 優勢,同時通過生產就緒的芯片解決方案來縮短芯片的開發與部署時間。
生態系統協作推動圖形技術進步
除了推出 GPU 新品,Arm 還致力于與游戲生態系統合作,從而帶來先進的圖形特性和功能。
我們正在與 Epic Games 攜手,在安卓上啟用其虛幻引擎 5 (Unreal Engine 5) 桌面平臺渲染器。對于開發者來說,這將確保 Immortalis 和 Mali GPU 也能在移動設備上提供桌面級質量的渲染和圖形效果。作為虛幻引擎 5 桌面平臺渲染器相關工作的一部分,用于光線追蹤的 Lumen 光照解決方案已針對 Arm GPU 進行了優化,尤其是支持基于硬件光線追蹤的 GPU。使用 Lumen 的開發者可以利用我們的最佳實踐建議來管理場景復雜性、更新頻率和探測器設置,達到游戲主機品質的光照效果。
我們還與 Google 和 MediaTek 圍繞安卓動態性能框架 (Android Dynamic Performance Framework, ADPF) 展開合作。借助這一來自 Google 的強大 API,開發者能夠根據移動設備的實時熱狀態信息來優化其應用的用戶體驗和性能。在手機游戲等高要求應用中,這可以降低功耗、避免過熱并延長游戲時間。通過在 Arm 技術驅動的 Google Pixel 8 智能手機上啟用 ADPF,我們在 2024 世界移動通信大會 (MWC 2024) 上展示了 Steel Arms 手機游戲演示,呈現了 25% 的每幀能耗減低,以及 35% 的幀速率提升。
與此同時,Arm 還通過一系列 GPU 工具和資源,保持對游戲開發者一貫的生態系統支持。Arm Performance Studio 延續 Arm Mobile Studio 的成功,借助擴展分析工具,進一步支持移動設備和 GPU 以外的一系列新工作負載、平臺和設備,包括面向服務器市場的 CPU 和 Arm Linux 平臺。作為 Arm Performance Studio 的一部分,我們新增了 Arm Frame Advisor,使開發者能夠更易實現圖形分析和優化,從而更準確地針對其優化目標,并更快地將軟件推向市場。
為新一代 AI 和游戲體驗而打造
隨著手游和 AI 工作負載的不斷演進,新一代 Arm GPU 可提供出色的性能和效率優勢,帶來無可匹敵的用戶體驗。之前的 Arm GPU 已應用于主要的消費電子設備中,并展現出優異的峰值和持續游戲性能,而新一代 GPU 將延續先前產品的強勁勢頭。
通過 Immortalis-G925、Mali-G725 和 Mali-G625,我們的目標是覆蓋從旗艦到入門等不同級別的廣泛消費電子設備,我們看到越來越多的消費者與合作伙伴要求更加沉浸式的手游和 AI 體驗。我們新的 GPU 能夠滿足這些需求,提供無與倫比的游戲和 AI 性能。這意味著,全球數百萬開發者和數十億用戶與基于 Arm 架構的設備進行交互,將獲得更快、更沉浸式、更智能的視覺體驗。
-
ARM
+關注
關注
134文章
9046瀏覽量
366820 -
人工智能
+關注
關注
1791文章
46859瀏覽量
237582 -
可穿戴設備
+關注
關注
55文章
3807瀏覽量
166848 -
GPU芯片
+關注
關注
1文章
303瀏覽量
5781
原文標題:新的 Arm GPU 助力釋放消費電子設備市場中的游戲和 AI 創新潛能
文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論