?? 雖然Qualcomm在Android手機的Arm SoC市場取得了巨大成功,但他們也在努力將其轉化到其它市場,但迄今為止還沒成功。該公司已經為Windows-on-Arm筆記本電腦生產了幾代芯片,盡管每一代多少都有點改進,但這還不足以撼動Intel絕對的主導地位。雖然Windows-on-Arm成績不理想不僅僅是Qualcomm的問題(對于OS和軟件來說也有很多可說的),但芯片肯定也起到了一定作用。為了在市場上取得突破,僅僅漸進式改進是不夠的。Qualcomm需要在性能上取得重大飛躍。
歷經三年的努力,Qualcomm現在正準備實現這一目標。前兩天,Qualcomm發布了他們即將推出的Snapdragon X Elite SoC,這是他們為Windows設備設計的下一代Arm SoC。基于子公司Nuvia的全新Arm CPU內核,名為“Oryon”。但Snapdragon X Elite也可能只是新一代Qualcomm SoC設計中的冰山一角。它不僅是迄今為止Qualcomm最重要的Windows-on-Arm SoC的核心,且最終將用于智能手機和更多其他設備。
現在讓我們來看下Snapdragon X Elite SoC和支撐它的Oryon內核。
盡管這次發布并并沒有太深入的內容,但這是我們第一次看到Qualcomm的旗艦SoC及其內部的新CPU內核。新款SoC將在2024年中期發布,終端設備大概又會在那之后幾個月才會上市。目前,Qualcomm已經完成了芯片開發工作,隨著芯片的規格確定,現在正在為明年的發布進行最后的打磨。
Snapdragon X Elite中的Oryon CPU內核是Qualcomm在2021年初收購Nuvia后的成果,在被收購之前Nuvia團隊也已經進行了一段時間相應的開發。該團隊的雄心壯志,以及定制的Arm架構CPU內核的重要性,都不可低估。因此,Snapdragon X Elite將在多個層面上成為一個有趣的芯片,因為這為Qualcomm的下一代芯片設計定下了基調。
從高層次看這款芯片,Snapdragon X Elite是一款為Windows-on-Arm筆記本設計的高性能SoC。Qualcomm并沒有列出任何官方TDP(Thermal Design Power)值,但表示Elite設計用于跨越“廣泛范圍”的熱設計。為了充分發揮Elite的性能,需要主動冷卻,但據Qualcomm稱,也有可能使用被動/無風扇的設計。
Qualcomm在一個未知的4nm工藝上制造這款芯片。考慮到他們之前因采用Samsung的4nm工藝出現過性能問題,這次他們很可能會采用TSMC代工(可能是N4P)。芯片本身是一個傳統的單片芯片,所以這里沒有使用chiplet或其他高級封裝(wireless部分是獨立的)。
CPU:12個Oryon
此次發布的主角是Oryon,Qualcomm最新的定制化Arm CPU內核。這是由Qualcomm在2021年收購的Nuvia團隊設計的,Oryon是Qualcomm歷經多年推出的第一款高性能、完全定制的Arm CPU內核。繼基于Arm Cortex-A/X的多代平庸的SoC后,Oryon標志著Qualcomm的一個重大轉向。
由于這只是一個預告,目前我們還不知道Oryon的重要架構細節。我們不知道帶寬、各種buffer大小、執行端口等。但我們確實知道,Qualcomm在這款SoC上給予了厚望。在被收購之前,Nuvia團隊就在研究一個服務器級別的CPU內核,這種激進的設計也延續到了Oryon中。畢竟,這也是Qualcomm收購Nuvia的主要目標之一,因為他們希望有一個高性能的CPU內核來幫助他們超越其它筆記本芯片供應商(當然,最終也會包括移動設備)。
Snapdragon X Elite SoC搭載了12個Oryon CPU內核。與Qualcomm的8cx系列不同,沒有基于不同微架構的明確的“能效”和“性能”核;這是一個同質的CPU設計,更類似于傳統的PC處理器。這意味著Oryon需肩負雙重職責,在重負載下表現出色,而在輕負載下又不能功耗太高。
Oryon CPU內核被分配成三個集群,每集群4個核。當然,我們還需進一步等待更多技術細節,但可以放心地假設每個集群都有自己的電源軌,所以當只需要少量核時,不需要的集群可以被關閉。
僅這一點,Snapdragon X Elite看起來就比8cx性能要強得多。8cx Gen 3只提供了4個性能核(Cortex-X1)和4個能效核(Cortex-A78)。Snapdragon X Elite的CPU內核多出了50%,更不用說那些核的性能也更高。對于一個筆記本芯片來說,Qualcomm竟然投入了這么多CPU內核。
至于時鐘速度,在all-core turbo負載中,所有12個Oryon CPU內核在功耗和熱管理容量允許的情況下可達到3.8GHz。而在較輕的負載中,芯片支持2個核的turbo速度高達4.3GHz。Qualcomm在PPT上每個集群只顯示了其中一個核,但目前尚不清楚這是否是某種主核的意思(即只有某些部分核才是這個速度)。
無論如何,Qualcomm都計劃為該芯片設計很高的時鐘速度,這與8cx形成了顯著差別。雖然時鐘速度高本身并不直接代表芯片速度快,但8cx芯片的性能瓶頸之一就是時鐘速度,所以如果Oryon提供的IPC速率如我們所猜測的那樣高,這將極大地提高Qualcomm的CPU性能,使其能夠與行業最強的玩家競爭。
內存:128位LPDDR5x
為強大的Oryon CPU內核(以及其他部分)提供支持的是一個128位的LPDDR5x內存總線。這與芯片的CPU部分相比并不那么引人注目,但仍然很重要。之前的8cx只支持LPDDR4x,采用LPDDR5x讓Qualcomm在內存技術支持方面重新與最新的PC芯片持平。并且支持的數據速率高達LPDDR5x-8533,這是目前市面上最快的內存控制器之一。
Qualcomm還表示,系統中42MB的緩存位于各種處理器模塊和系統內存之間。考慮到明確說到是“total cache”,這幾乎肯定是L2+L3。先前的芯片是6MB共享的L3。如果這次也是這種情況,意味著每個CPU內核有3MB的L2緩存,或者有某種排列組合。
Snapdragon X Elite集成了最新一代的Adreno GPU。對于GPU,Qualcomm的慣例是幾乎不談架構細節,但這應該是Qualcomm內部GPU設計的最新的迭代。
從功能的角度看,這是一個支持ray tracing的DirectX 12級GPU,與Qualcomm去年推出的Snapdragon 8 Gen 2 SoC的功能相呼應。在Windows生態系統中,它幾乎肯定會被認為是DirectX 12 Ultimate(feature level 12_2)設計。
Qualcomm為這款設計提供了一個單一的吞吐量數據:在未指定的位深/格式下達到4.6TFLOPS(猜測是FP32)。Qualcomm之前的8cx沒有披露過類似數據,所以很難說怎么比較。或者,與其他公司的GPU相比如何,因為真實世界的GPU性能不僅僅是純粹的FLOPS。
該GPU的顯示控制器部分支持最多4個DisplayPort顯示器。除了筆記本內部顯示器外,它還可以驅動另外3個外部顯示器(全部為DP 1.4),其中一個輸出支持5K,其余的支持4K。
最后,這塊SoC還搭載了Qualcomm的最新VPU(Video Processing Unit)。這種最新設計不僅支持AV1解碼,而且首次支持Qualcomm SoC的AV1編碼。
NPU:Hexagon發揮出色
除了使用Oryon CPU核心外,Qualcomm在Snapdragon X Elite SoC上的另一個大賭注與他們最新一代的Hexagon NPU有關。Qualcomm預計AI的使用將在未來幾年內繼續迅速增長,下一個大的推動力將是在用戶的系統上本地運行的AI模型。因此,他們在這一代的芯片(X Elite和8 Gen 3)的Hexagon NPU上投入了大量資源。
因此這一代NPU的性能應該大大超過8cx Gen 3。Qualcomm在這里引用了相對低精度INT4的45 TOPS性能,而8cx Gen 3則為未指定的數據格式的15 TOPS。
與他們的CPU和GPU不同,Qualcomm在這里分享了關于NPU的一些架構細節,以及他們為提高其性能所做的努力。用于最密集的矩陣數學的tensor加速器模塊,速度直接比以前快了2.5倍。支持它(以及NPU的其他部分)的是一個2倍大的共享內存/緩存(盡管Qualcomm沒有披露實際的大小)。Qualcomm這一變化主要是針對LLM,因為LLM高度依賴內存。據Qualcomm稱,該芯片將有足夠的資源來在本地運行一個擁有130億參數的Llama 2模型。
Qualcomm還做了一些電源供應的變化,以幫助從NPU中獲得更多的性能/效率。功耗大的tensor模塊現在有自己的電源軌道,而NPU的其余部分位于一個單獨的共享軌道上。該公司還對他們處理推斷工作負載的微切片方式做了一些改進,直接影響了他們如何拆分工作負載以盡可能地保持NPU的各種子模塊忙碌,同時最小化中間內存操作。
再來說說Snapdragon X Elite的I/O部分。
在內部I/O方面,SoC為NVMe存儲提供PCIe 4.0連接。在其它地方,使用PCIe 3為其modem和Wi-Fi解決方案提供連接。尚未提及是否有任何空閑的PCIe通道可用于其它外圍設備。
對于外部I/O,SoC支持USB4。據Qualcomm稱,它可以驅動多達3個此類Type-C端口,還有一對USB 3.2 Gen2輸出以及一個供內部使用的USB 2.0輸出。
如前所述,該SoC的Wi-Fi和modem都是獨立的。這款芯片旨在與Qualcomm的FastConnect 7800芯片組成的M.2卡配對。7800是他們最新一代的Wi-Fi 7解決方案,支持4個空間流以及Bluetooth 5.4。Modem配對是Snapdragon X65,這是一款高性能的5G modem,也適用于8cx Gen 3。
Wireless系統沒有集成到SoC中對于Qualcomm來說是不尋常的,但鑒于他們希望盡快推出Elite,也不意外。集成這些模塊需要更多時間,而作為一款筆記本SoC,Qualcomm不需要那么節省空間。無論如何,Qualcomm的官方立場是,獨立的modem是為了為OEM提供靈活性(可選是否包含modem)。當然,Qualcomm當然會強烈鼓勵OEM選擇這款差異化的選項。
性能
???????????????????????????????
由于沒有足夠的架構細節來做有意義的性能預測,目前只有Qualcomm與競爭對手的模糊比較。這也是Qualcomm為該芯片提供的與能效數據最接近的東西(盡管,如往常一樣,SKU的目標時鐘速度在其中起到了巨大的作用)。
憑借12個性能核,Qualcomm正在大力推進多線程性能。事實上,多線程性能是Qualcomm做出的唯一CPU性能比較,因為沒有單線程比較可言。對此你可以有自己的看法。
相對于一個暗示是Intel的12核CPU設計,Qualcomm報道稱Snapdragon X Elite在Geekbench 6中的多線程性能提供了2倍的提升。或者說,在相同的性能下,它們的功耗只有對方的1/3。
即使與Intel最好的14核(H-class)芯片相比,Qualcomm仍然說他們在性能上領先60%,而且在相同的性能下功耗還是只有1/3。無疑,這很大程度上歸因于工藝節點,因為TSMC N4應該相較于Intel現有的Intel 7工藝提供了顯著的優勢。但Snapdragon X Elite應該在明年發布時與基于Intel 4的Meteor Lake系列競爭。
更有趣的是,Qualcomm說與一個“基于Arm的競爭者”在多線程性能上有50%的優勢。這可能是在暗指Apple,另外MTK確實也提供一些基于Windows-on-Arm的芯片。
Qualcomm還預計會在3DMark Wildlife Extreme中在GPU性能上領先。再次,憑借工藝節點優勢和制造更大iGPU的整體趨勢,這也不足為奇。
當然,我們對這些聲明還是要保持謹慎態度,尤其是對于一個仍然距離發布還有幾個月的平臺。
2024年中旬出貨
總結一下,Qualcomm目前正在為Snapdragon X Elite做最后的準備。公司認為這是“公司近期歷史上最關鍵的平臺公告”之一,而且理由充分。Oryon CPU內核最終將會擴展到更多產品,所以Oryon的競爭力將決定Qualcomm未來幾代設計的成敗。
基于Snapdragon X Elite的設備預計將在2024年中期上市。按照這個時間表,同期的競品Snapdragon X Elite應該會與Intel的Meteor Lake(Core Ultra)、AMD的Phoenix(Ryzen Mobile 7000)以及Apple M系列的最新版本競爭。
-
soc
+關注
關注
38文章
4124瀏覽量
217964 -
Qualcomm
+關注
關注
8文章
673瀏覽量
52027 -
CPU內核
+關注
關注
0文章
5瀏覽量
2590
原文標題:Qualcomm收購Nuvia終于要開花結果
文章出處:【微信號:Astroys,微信公眾號:Astroys】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論