在利潤豐厚的服務(wù)器和HPC(高性能計算)處理器市場,英特爾的市場份額在很長一段時間都超過九成,但市場不總是一成不變。隨著AMD Epyc處理器的推出,以及Arm架構(gòu)處理器進入這一市場,2020年英特爾難以避免他們帶來的競爭。但是,市場份額并不會迅速變化,英特爾x86處理器在未來五年甚至更長時間仍將主導(dǎo)這一市場,面對強有力的競爭者,能否守住這一市場,新產(chǎn)品變得更加重要。
高性能計算(HPC)市場已經(jīng)連續(xù)多年增長。目前至少有三種架構(gòu)的CPU可用于HPC任務(wù),包括X86、Arm和Power,有超過六家可靠的供應(yīng)商,還有兩種(即將成為三種)GPU架構(gòu)。不過,目前該領(lǐng)域的絕大多數(shù)HPC系統(tǒng)還是由英特爾 CPU(有時是Nvidia GPU)提供算力。從今年開始,情況將開始改變。
近期內(nèi)的變化可能會來自x86領(lǐng)域,AMD Epyc的勢頭將使英特爾面臨自O(shè)pteron(皓龍,AMD 2003年推出的64位處理器)時代以來最激烈的競爭。特別是,幾乎可以確定第二代Epyc芯片(又名“羅馬”)將搶占英特爾在服務(wù)器領(lǐng)域(包括HPC)的市場份額。
羅馬令人印象深刻的性價比無疑是促使美國、英國、德國和芬蘭等超級計算機系統(tǒng)選擇它的關(guān)鍵,大多數(shù)系統(tǒng)將于今年上線。現(xiàn)在的關(guān)鍵問題是,更新的至強處理器(14納米“ Cooper Lake”至強可擴展處理器),尤其是未來的10納米“ Ice Lake”至強可擴展處理器,能在多大程度減少市場份額的流失。
Arm也在緩慢地進入HPC市場,我們認(rèn)為,緩慢的主要原因是,從技術(shù)角度看,與x86或任何其它通用處理器相比,該架構(gòu)沒有任何特殊的優(yōu)勢。Arm的優(yōu)勢在于其IP是可授權(quán)的,因此該架構(gòu)可以滿足不同市場定制處理器的需求,這和全球軟件生態(tài)系統(tǒng)捆綁在一起。
需要說明,這種可延展性是長期的優(yōu)勢,而不是短期的優(yōu)勢。富士通花了至少五年的時間設(shè)計和開發(fā)了A64FX,這是第一個基于Arm架構(gòu)的HPC專用處理器。它即將在RIKEN Lab的“ Fugaku” 400 petaflops超級計算機中首次亮相,將測試Arm架構(gòu)在高端HPC中的可行性以及相應(yīng)的生態(tài)系統(tǒng)。巧的是,它也將展示沒有加速器或外部存儲器系統(tǒng)的優(yōu)缺點。
Cavium(凱為半導(dǎo)體2017年已經(jīng)被Marvell收購)的ThunderX2 SoC是一種更普通的芯片,其目標(biāo)是在低級別的HPC領(lǐng)域,這款處理器于2018年推出,很快就獲得了Marvell的訂單,并成為了英國和其它地區(qū)為數(shù)不多的第一批基于Arm處理器構(gòu)建HPC集群的基礎(chǔ)。盡管ThunderX2不是超高性能,但由其較好的集成內(nèi)存控制器分配,在受內(nèi)存帶寬限制的應(yīng)用中表現(xiàn)出色。Marvell希望在ThunderX2成功的基礎(chǔ)上再推出ThunderX3,該產(chǎn)品有望在今年年初發(fā)布。
Marvell預(yù)測,第三代產(chǎn)品將基于7納米制程,將與AMD的“羅馬” Epyc 7002和英特爾的Ice Lake至強可擴展處理器競爭,性能將比ThunderX2高出兩倍以上,時鐘頻率也更快,能源效率更高。
今年,基于Arm的高性能計算將有另一個重要選擇——基于A64FX的商用系統(tǒng)。例如,由于與富士通達成了合作協(xié)議,客戶現(xiàn)在可以從Cray / HPE選擇支持A64FX的CS500集群。對于日本或者歐洲市場,富士通還將提供基于A64FX的FX700和FX1000系統(tǒng)。
如果這些系統(tǒng)在各自的地區(qū)能夠吸引足夠的客戶,其他OEM也可能與富士通達成類似的協(xié)議。
基于A64FX的商業(yè)系統(tǒng)的前景也可以預(yù)測。Isambard 2是布里斯托大學(xué)最初由ThunderX2驅(qū)動的Isambard集群的迭代版本,將采用A64FX Cray CS500。盡管還沒有宣布任何消息,但是如果歐洲三臺E級超級計算機(每秒可進行百億億次數(shù)學(xué)運算)中的一臺(或更多臺)也都采用A64FX芯片,這也不會令人感到驚訝。
我們認(rèn)為,用戶和供應(yīng)商當(dāng)前對基于Arm的群集的熱情是基于以下事實,即變化似乎已達到拐點。Hyperion Research一直在跟蹤HPC中Arm的銷售情況,他們預(yù)計在未來五年中,該領(lǐng)域Arm處理器收入的復(fù)合年增長率為64.7%。
盡管在2019年僅有50,000顆Arm芯片被用于HPC,但Hyperion預(yù)計該數(shù)字到2020年將超過233,000,到2024年將超過610,000。其中許多系統(tǒng)將在美國以外,這一事實反映出所有最初的基于Arm的億兆級系統(tǒng)都將在歐洲、中國和日本構(gòu)建和部署。這些地區(qū)占高性能計算一半以上的市場。也就是說,盡管Arm在這一領(lǐng)域可以維持較高的增長率,但x86處理器在未來五年甚至更長時間內(nèi)仍將主導(dǎo)這一市場。
Power架構(gòu)方面,盡管有OpenPower計劃,IBM仍然是游戲的唯一玩家。Power10處理器原定于今年推出,但現(xiàn)在看來它將在2021年問世,該公司并沒有依靠HPC來增加出貨。盡管Power10可以成為高性能計算領(lǐng)域令人印象深刻的芯片,但尚無大型系統(tǒng)由該芯片提供算力(能源部通過了IBM和Power10的CORAL-2合同)。
一個潛在的增長點是,歐洲開放計算機體系結(jié)構(gòu)實驗室(LOCA)計劃選擇OpenPower作為開發(fā)開源HPC處理器的三種架構(gòu)之一。
在可預(yù)見的未來,Power架構(gòu)似乎注定在高性能計算中扮演次要角色。
GPU和更廣泛的加速器肯定會增長,特別是如果考慮到中國(中科曙光的DCU和Matrix-3000 DSP),歐洲(RISC-V和其他特定領(lǐng)域的加速器)追求定制設(shè)計(歐洲處理器計劃)的產(chǎn)品,以及無數(shù)的AI加速器進入市場,例如英特爾最近推出的神經(jīng)網(wǎng)絡(luò)處理器:NNP-T和NNP-I。當(dāng)然,還有Xilinx和英特爾的各種FPGA迭代產(chǎn)品,可用于在芯片中實現(xiàn)硬件半定制化的HPC應(yīng)用。
但是,對于主流HPC使用者,GPU仍將是首選的加速器平臺。英偉達主導(dǎo)了這個領(lǐng)域,但AMD及其Radeon Instinct準(zhǔn)備搶占該市場的部分市場份額。頂級的MI60通過Infinity Fabric提供7.4 teraflops的64位性能,32 GB的HBM2內(nèi)存以及與GPU之間的200 GB /秒的連接性能。在將來的迭代中,連接性能將擴展到AMD的Epyc CPU,以便GPU和CPU可以在同一結(jié)構(gòu)上進行通信。這個功能將在Oak Ridge National Lab的“ Frontier”百億級超級計算機中進行大規(guī)模測試,將通過Infinity Fabric在每個節(jié)點中連接四個Radeon Instinct GPU和一個Epyc CPU,F(xiàn)rontier計劃于2021年啟動。
同年,“ Aurora”E級超算有望在Argonne國家實驗室上線。該系統(tǒng)將配備英特爾的Xe GPU,這是一個協(xié)處理器,旨在加速HPC和神經(jīng)網(wǎng)絡(luò)訓(xùn)練,就像Nvidia的V100和T4一樣。因此,Aurora將是針對此處理器進行HPC和AI負載的第一個大型測試。由于現(xiàn)在沒有Xe處理器(定于今年晚些時候發(fā)布),因此它們的性能以及可編程性未知。
在這方面,英偉達具有優(yōu)勢,因為該公司十多年來一直在圍繞其CUDA硬件有條不紊地擴展其CUDA軟件,并已擁有數(shù)量龐大的開發(fā)人員和用戶。事實證明,該公司的GPU也有些難以捉摸,而且隨著可能在今年晚些時候推出的新一代(“安培”)架構(gòu)的出現(xiàn),英偉達可能再次體現(xiàn)出優(yōu)勢。
但現(xiàn)在,至少是一場三雄爭霸的比賽。隨著新十年的開始,這將使加速器市場變得更加有趣。
來源:雷鋒網(wǎng)
評論
查看更多