(文章來源:半導體投資聯盟)
Ampere公司是一家專注于ARM架構服務器芯片的新生公司。在2019年,甲骨文公司向Ampere公司投資4000萬美元。此前,Ampere也獲得了ARM公司的注資。能接連得到科技巨頭的青睞,因為這家處理器新貴肩負一個重大使命,將代表ARM陣營繼續挑戰X86架構在服務器芯片領域的霸權。
Ampere的前身是Applied Micro公司旗下的ARM處理器部門,在2017年由私募股權投資公司Carlyle Group從Macom中收購而得。而Ampere的CEO Renee James在2016年2月離開英特爾后便加入Carlyle Group,最后促成Carlyle Group投資及創立Ampere公司。
成立后的Ampere很快就推出了產品:基于ARM v8.0架構的32核芯片eMAG 芯片,采用TSMC 臺積電16FF +工藝構建,運行頻率為3.3 GHz。該芯片已經交付了聯想等一批客戶。在一年半之后,2020年3月,Ampere的最新產品Altra誕生了,這款芯片被定義為世界上首款“云原生處理器”。
在介紹Altra的特性之前,要先談到大背景:云計算。這個已經為人熟知的概念,是由企業級計算演進而來的。但是,云計算對處理器的需求已經相比原來發生了翻天覆地的變化。用Ampere 產品高級副總裁Jeff Wittich的話來說,光是從軟件角度,現在的需求更多的是朝向云原生如容器、微服務這類的計算模型快速轉變,而不是面向以前那種企業級內部的計算模型。
加之越來越多的邊緣數據中心加入,帶來了與以往不同的延時、散熱、功耗等需求。“超大規模的云,包括邊緣的云計算的需求的增長,使得我們對于像CPU的部署密度和能耗的要求越來越高。”Jeff Wittich表示。還有兩個重要的變化:機器學習和AI功能增強以及基礎設施的定制化。前者使得算力的需求在各個地方都與日俱增,后者要求各種為客戶定制的異構型基礎設施也有云計算的能力。
“所以我們需要一種新型的計算能力,專門針對云的。”Jeff Wittich總結道:“我們需要很多非常高效的CPU的內核,需要整個基礎設施都非常低的功耗,而且需要非常好的擴展性。”Altra就是這種新型計算能力的代表。這款芯片是從一開始設計、制造就面向云,為滿足云計算需求而生的CPU。Jeff Wittich將當代云計算的要求歸結為三種:可預測性、跨平臺的可擴展性和高能效及部署密度。
Altra擁有80個64位ARM核,采用了Monolithic die(即單芯片設計)工藝,所有的核都在Mesh網絡下連接在一起,具備了非常高的內存帶寬和內存密度,能提供很高的可預測性。基于行業中最領先的每核功耗,Altra可以提供極大的可擴展性,在從邊緣到超大規模云的不同部署環境下可提供多種處理器配置。同時,Altra還提供多路的支持,非常靈活的I/O連接及高帶寬。
Jeff Wittich強調:“我們這個處理器最大一個優點是功耗非常低,同時單核功耗更低或者說每瓦性能是業內最高的。”“我們這款CPU,特別適用于現在云計算所需要的計算模型,包括像容器、微服務,函數即服務等這些計算模型當中。”Jeff Wittich表示。
Altra的一大特色是采用了單核單線程的設計,通過消除單物理核多線程設計中,多用戶共享資源的爭奪引起的“相鄰干擾”問題,可以實現提供100%的可預測性能核心。Jeff Wittich認為,單核單線程的設計,能夠保證在運算或者執行的時候有一個具備一致性的、可預測的性能。“從執行角度來說,設計單核單線程,第一能夠降低延遲,第二能夠保持可預測的性能一致性。”
Altra還具有兩個128BT的SIMD單元用于浮點計算。現在推理越來越重要,并且在所有基礎設施上都運行,所以Altra提供int8和FP16的支持,提高AI推理加速性能。緩存方面,Altra也“出手闊綽”。其具有單核64KB L1 I/D-cache,單核1MB L2 cache 和 32MB 系統級緩存。
內存子系統也經過精心設計。Altra擁有8個DDR4通道,頻率3200Hz,每一個通道能插兩個DIMM,運行的時候能夠提供單路200GB/s的傳輸速度。“此外,我們還有非常好的I/O子系統,單路128條PCIe Gen4通道,兩路是192條PCIe Gen4,這個是行業里最高的。X16的控制器可分為x8或者x4或者x2不同的設計選擇。Altra可以連接高帶寬GPU,還可以連接高fan-out及NVME存儲設備。“Jeff Wittich補充道。
“我們的處理器除了擁有最多的80核以外,性能也是行業內最好的。我們要比AMD的64核EPYC處理器,28核的Intel 至強(Xeon)處理器的性能好。”Jeff Wittich指出,對于一些基于云特別多的這些應用,比如說像搜索、AI推理、解碼、數據庫等等,Altra不僅僅性能更高,功耗也更低,每瓦特的性能比AMD的EPYC和Intel至強要高。從Calxeda到Applied Micro再到高通,ARM體系沖擊服務器CPU的嘗試都折戟了,反而是Intel逐漸占據了90%的市場份額。
背后的原因是多方面的,主要一個就是過往的服務器生態對ARM不太友好。但是這個局面已經發生改變了。Jeff Wittich指出,ARM架構目前已經具有領先的數據中心的性能和能效。此外,ARM軟件的生態現在基本上已經成熟了,所有運行數據中心的這些軟件都是可以基于在ARM上進行運行的。更重要的一點,臺積電現在已經有7納米的先進工藝制程技術。
據Jeff Wittich介紹,所有大型的操作系統,如Linux、BSD、windows都可以得到ARM架構的支持。容器化,包括虛擬化工具如docker、VMware、KVM和Kubernetes都可以在ARM架構運行。編程語言,包如CUDA和Java也都可以得到ARM的支持。
重要的一點,現在有大概有1200億左右ARM的設備在部署,主要分布在移動端、物聯網以及消費電子領域中。這樣的一個大規模的設備部署,使得ARM體系已經成為最大的處理器生態系統。從TCO考量來說,同樣的總體應用成本下所帶來的性能,Altra比AMD的EPYC高41%。“如果和Intel至強相比,包括與2月24號公布最新的版本相比較,我們單位的總體應用成本要比其高63%。”Jeff Wittich表示。
Ampere的團隊經驗非常豐富,做服務器這塊已經平均干了二十多年了。Jeff Wittich認為這也是Altra的優勢所在。“我們這個團隊曾設計過很多代的服務器處理器,出貨量在市場上都是非常大的。我們這個團隊在整個行業當中有非常廣泛的合作伙伴生態環境,包括IP供應商的,也包括軟件供應商的。”
Jeff Wittich告訴記者,去年NVIDIA宣布完全支持ARM生態,這是一個大進展。“我們也在自己建設軟件生態,和所有的開源社區包括軟件開發商一起,進一步地完善我們的生態。”據Jeff Wittich透露,Ampere在過去一年和最主要的云服務商一直在合作,像微軟、甲骨文(Oracle)等等,包括其他一些廠商,都在測試這款Altra處理器。他預計2020年下半年會有廠商進行部署,規模量產則將在年中進行。
對于未來的規劃,Ampere已經制定完畢。“我們計劃2021年推Mystique這個新的產品。Mystique核數更多,性能更好,和現在的Altra平臺能夠兼容。我們在2022年將推出叫做Siryn的新產品。Siryn要比之前的兩款產品核數更多,性能更好,功耗更低,而且還有更多基于云的設計的特點。”Jeff Wittich最后表示。
(責任編輯:fqj)
-
ARM
+關注
關注
134文章
9056瀏覽量
366846 -
cpu
+關注
關注
68文章
10827瀏覽量
211175
發布評論請先 登錄
相關推薦
評論