在2017年年底,專注于數據存儲設備芯片的巨頭Marvell宣布,以60億美元的價格收購Cavium。后者作為通信和網絡芯片專家,所提供的芯片和解決方案能夠與Marvell的產品緊密結合,為隨后幾年到來網絡和大數據時代提供覆蓋廣泛的基礎設施支持。
其中,Arm服務器芯片絕對是Marvell這單收購的一個不可忽視的重點。
眾所周知,過去多年里,服務器就一直是Intel的“禁臠”,他們也憑借在這個市場近乎壟斷的市場份額大掙特掙。有見于此,Arm在2008年就動了進軍這個市場的心。并在當年投資了一家名為Smooth Stone(后改名為Calxeda)的初創公司,自此開啟了服務器芯片領域的十數年征程。
按照行業專家Winnie Shao在其題為《Arm服務器芯片編年史》的文章中介紹,Arm服務器芯片在過去多年里經歷了三波潮流,Marvell則是第一波Arm服務器浪潮的“幸存者”。早在2013年,他們就推出了其基于Arm定制內核研發的Armada XP四核系列。Cavium則是第二波浪潮的參與者,他們在2016年推出了其第一個ARMv8服務器處理器Thunder X。
現在,站在Cavium的肩膀上的Marvell推出了全新一代的Arm 服務器芯片Thunder X3,力爭成為第三波Arm服務器芯片潮流的勝利者。
Arm服務器芯片的最好時機
可以肯定的是,在現在X86生態如此成熟,Intel市場號召力如此強大的現狀下,Arm服務器芯片想在市場上站穩一席之地,絕不是一件輕而易舉的事情。過去多年里那么多參與者來來去去就是一個強有力的證明。
但在Marvell半導體公司副總裁及服務器處理器部總經理Gopal Hegde看來,現在Arm服務器芯片迎來了新的機遇。
首先從應用場景上看,Gopal Hegde指出,在十幾年前,數據中心還不是很熱門,很多應用的用戶相對較少。但現在,每個應用都有龐大的用戶,這就對服務器提出了更多的要求。“過去,因為技術不到位,只在一個線程上處理,并行的業務要求也不高。現在,除了強調單線程性能,還強調并行處理器能力,后者在今天尤其重要”,Gopal Hegde舉例說到。
他進一步指出,隨著服務器規模做的越來越大,大家對成本、功耗非常敏感,所以很多數據中心都需要成本最低的解決方案,這也是市場上推Arm這樣低功耗、低成本設計處理器感興趣的原因。
其次從架構需求上看。Gopal Hegde告訴記者,隨著GPU、異構計算架構不斷涌現,大家對Arm架構的服務器處理器的興趣也是越來越高。
“之前傳統的軟件有很多都是由第三方提供的,比如Oracle提供數據庫,但很多客戶沒有源代碼。但是今天不一樣,一些超大規模數據中心工作負載的應用都是有源代碼的,能夠很快的解決問題,而且還允許改變源代碼來改變程序來加速創新能力。這就給ARM服務器的引入帶來了方便,且能更輕松應對兼容的問題。”
第三,X86兩大巨頭的的現狀給Arm服務器芯片提供了一個機會。
按照Gopal Hegde所說,英特爾之所以能雄霸服務器芯片巨頭多年,其領先的晶圓制造能力是很重要的一部分。但進入最近幾年,他們在制造工藝上落后了。反觀Arm服務器芯片開發者的合作伙伴臺積電,則勇猛向前。拉開了與Intel的差距,帶給了Arm服務器機會。
至于AMD,雖然憑借EPYC架構重返服務器市場,他們的ROME系列在推出以來,也受到了客戶的高度認可。但在和當前的Arm服務器芯片玩家相比,他們的架構帶來了延遲、帶寬和功耗等方面的先天硬傷。
“還有一點,X86架構擁有了數十年的歷史,它的CPU核紀要解決服務器市場問題,也要解決電腦市場的問題,這就使得架構本身在平衡兩邊需求的時候,有了一些限制。但是Arm服務器芯片的內核是專為服務器市場所設計的,因此在集成度和性能上都優于X86。這就是為什么今天Arm服務器在這個市場上有很大優勢的原因”,Gopal Hegde補充說。
雖然Arm服務器有諸多的優勢,但正如Gopal Hegde所說,并不是每個市場他們都會涉足。例如在企業級市場就是Marvell不會進入的。“Arm服務器并沒有跟x86全線競爭”,Gopal Hegde強調。
他繼續指出,雖然未來很多企業會買很多服務器,但這個市場是戰略性的,且在這個市場,Arm服務器的生態并不如X86成熟的。在這,這個市場的成長性是比較慢的。為此Marvell抓的是生態成熟、而且成長非常快的HPC、云和運和邊緣端的Arm原生應用這三個市場。
Marvell的底氣
為了迎接這個新時代的到來,Marvell已經做好了充分準備,而這一切都是基于他們前幾年的積累。在前面我們講到了Marvell(包括Cavium)在Arm服務器芯片的投入。這也幫助他們在其第二代Arm服務器芯片Thunder X2上取得了不錯的成績。
據Gopal Hegde介紹,Marvell現在已經在HPC和云計算市場取得了比較不錯的成績,也獲得了包括包括 Microsoft Azure 、惠普、CRAY、Atos、勞倫斯·利弗莫爾(Lawrence Livermore)國家實驗室,桑迪亞(Sandia)國家實驗室,和橡樹嶺(Oak Ridge)國家實驗室等客戶的認可。
從Gopal Hegde的介紹我們得知,微軟希望將40%-50%的量遷移到Arm服務器上,他們內部也正為Microsoft Azure部署基于Marvell ThunderX2 服務器處理器的量產級服務器。
但Gopal Hegde也指出,微軟不一定會全全部選擇Marvell的方案,不過微軟公司 Microsoft Azure資深工程師Leendert van Doorn博士曾表示:“微軟Project Olympus云硬件與Marvell ThunderX2服務器處理器的結合是一個里程碑。因為這提升了Azure云基礎設施中 Arm64產品的開發能力,這將有助于推動平臺創新。而與Marvell和鴻佰科技的合作為我們的內部使用帶來了最完整、性能最強的Arm服務器解決方案”。
而為了推動Arm服務器芯片更好地應用,Marvell與超過100個合作伙伴建立打造生態,希望助力Arm服務器芯片快速成長。而新一代的Thunder X3則是他們為這個市場帶來的新一代“動力”。
據介紹,這是一顆使用臺積電7nm工藝打造的芯片,擁有96個內核,每個核心擁有四個線程,那就意味著他們每個插槽的總計算能力達到了384線程。“這是我們與其他競爭對手非常不同的一個點”,Gopal Hegde強調。他指出,X86競爭對手的一個核只有兩個線程,而其他Arm服務器芯片友商都只有一個線程,這就讓他們無論是在云或者HPC應用上,都擁有其他競爭對手所不具備的優勢。
“在云計算應用中,Thunder X3目標工作負載(如大數據、數據庫、流媒體、Web 層、彈性搜索和云存儲)的本質上都是高度并行。那么芯片本身每個核對4個超線程的支持,就能夠為此應用帶來顯著的性能提高。”,Gopal Hegde舉例說到。
而從Gopal Hegde提供的數據我們可以看到,Thunder X3的多線程也的確給他們帶來了多方面的提升和領先。
來到DDR 存儲方面,Thunder X還是延續了上一代的DDR4,內存接口支持 8 通道 DDR4-3200,每個通道可搭載 2 個 DIMM;在外部接口方面則升級到64個PCle 4.0,并搭載 了16個控制器,這就使得芯片擁有了更強的擴展能力;在浮點運算方面,Thunder X3每個核里面搭載四個 128 位 SIMD (Neon) 單元,比上一代提升一倍,這對超算、AI和機器學習來說非常重要;此外,Thunder X3還支持單節點和雙節點配置,這都讓這個處理器增色不少。
據Gopal Hegde透露,ThunderX3 中微架構的改進使得 IPC 的整體性能較 ThunderX2 提高 25%。結合處理器頻率和 DDR 頻率的提升,單線程總體性能則較上一代提高了60%以上。在單顆處理器層面,相較于 ThunderX2,ThunderX3 的整數運算性能也提升 3 倍以上,浮點運算性能更是提升了 5 倍以上。
在介紹的過程中,Gopal Hegde特別強調了Marvell Thunder X3對Arm終端上原生Arm應用程序的支持。他指出,現在廠商開始逐漸把游戲和應用放到服務器上,考慮到現在的終端基本都是一樣基于Arm芯片設計的,那就意味著X86在相關的支持上會有先天的缺陷,而這正是Arm服務器芯片所擅長的。
為了更好地服務這個市場的客戶,Marvell正在持續更新迭代產品,他表示,公司新一代的Thunder X處理器已經在研發當中,在差不多兩年的時間內我們就能看到產品的更新。而在談到下一代產品的發展的時候,他強調,公司會根據市場的發展需求提升芯片的規格。例如在chiplet方面,雖然現在Marvell沒有采用,但他表示,按照現在的發展,芯片性能提升必然會碰到瓶頸,屆時他們也會考慮轉到這上面來。
在沉寂了幾年之后,Arm服務器芯片終于在今年又一次熱鬧起來,除了Marvell外,Ampere Computing、華為和亞馬遜也都在近期推出了新產品,歐洲也有廠商開始進入這個市場。他們在相關市場的競爭也激烈了起來,再加上AMD Rome系列和Intel Cascade-Lake-SP的虎視眈眈。對于Marvell來說,這段征程并不會是坦途。
但從Gopal Hegde的言語看來,他們充滿了信心。
責任編輯:tzh
-
芯片
+關注
關注
453文章
50396瀏覽量
421793 -
ARM
+關注
關注
134文章
9046瀏覽量
366810 -
服務器
+關注
關注
12文章
9020瀏覽量
85182
發布評論請先 登錄
相關推薦
評論