6月23日消息,今天早上最新一期2020年6月全球超級計算機top500榜單公布,令人比較意外的是奪得冠軍的是一臺日本超級計算機。近年來,基于ARM架構的服務器在HPC高性能運算、云計算及邊緣計算中的應用日趨廣泛,以MARVELL為代表的廠商都在深度耕耘ARM服務器市場。
獲得第一的這臺日本超算名為Fugaku( 富岳),其Linpack(HPL)結果達到415.5 petaflops,比目前排名第二的Summit系統高出2.8倍。Fugaku由富士通的48核A64FX SoC提供支持,成為名單上第一個由ARM處理器提供支持的系統。以單精度或進一步降低的精度(通常在機器學習和AI應用中使用),Fugaku的最高性能超過1,000 petaflops(1 exaflops)。新系統安裝在日本神戶的理研計算科學中心(R-CCS)。
第二名是Summit,這是IBM制造的超級計算機,可在HPL上提供148.8 petaflops。該系統有4,356個節點,每個節點配備兩個22核Power9 CPU和六個NVIDIA Tesla V100 GPU。節點與Mellanox雙軌EDR InfiniBand網絡連接。Summit在田納西州的橡樹嶺國家實驗室(ORNL)運行,并且仍然是美國最快的超級計算機。
排在第三位的是Sierra,這是位于加利福尼亞州的勞倫斯·利弗莫爾國家實驗室(LLNL)的系統,在HPL上達到94.6 petaflops。它的體系結構與Summit十分相似,在其4,320個節點中的每個節點中均配備了兩個Power9 CPU和四個NVIDIA Tesla V100 GPU。Sierra使用與系統互連相同的Mellanox EDR InfiniBand。
由中國國家并行計算機工程與技術研究中心(NRCPC)開發的系統神威。太湖Sunway TaihuLight跌至第四位。該系統完全由Sunway 260核SW26010處理器支撐。自2016年6月在中國無錫國家超級計算機中心安裝以來,其93 petaflops的HPL值保持不變。
排名第五的是天河2A(銀河系2A),這是由中國國防科技大學(NUDT)開發的系統。它的HPL性能為61.4 petaflops是采用Intel Xeon CPU和定制的Matrix-2000協處理器的混合架構的結果。它部署在中國廣州的國家超級計算機中心。
意大利HPC5排名第六,HPL性能達到35.5 petaflops。HPC5是由Dell制造并由意大利能源公司Eni SpA安裝的PowerEdge系統,是歐洲最快的超級計算機。它由Intel Xeon Gold處理器和NVIDIA Tesla V100 GPU供電,并使用Mellanox HDR InfiniBand作為系統網絡。
另一個新系統Selene以27.58 petaflops的HPL標志位居第七。它是DGX SuperPOD,由NVIDIA的新“ Ampere” A100 GPU和AMD的EPYC“ Rome” CPU驅動。Selene已安裝在美國的NVIDIA。它也使用Mellanox HDR InfiniBand作為系統網絡。
Frontera是安裝在美國德克薩斯州高級計算中心(TACC)的Dell C6420系統,在該列表中排名第八。它的23.5 HPL petaflops通過448,448個Intel Xeon內核實現。
第九名是意大利的Marconi-100系統,由IBM Power9處理器和NVIDIA V100 GPU組成,采用雙軌Mellanox EDR InfiniBand作為系統網絡。Marconi-100以21.6 petaflops登上榜單第九位。
排名第十的是瑞士的Piz Daint(19.6 petaflops),采用Cray XC50系統同時配備了Intel Xeon處理器和NVIDIA P100 GPU。
在超算領域,最近幾年的榜首位置基本都是中國和美國輪流,日本曾經在2011年憑借K(京)超算拿下了TOP500冠軍。去年K退役之后,日本理研計算科學中心聯合富士通打造了代號為Post-K的新一代超級計算機,最終命名為Fugaku(富岳),基于ARM架構,由富士通的48核A64FX SoC提供支持,峰值浮點性能高達513PFLOPS(51.3億億次)。
其Linpack(HPL)結果達到415.5 petaflops,比目前排名第二的Summit系統高出2.5倍,不過功耗也達到了28MW,是Simmit的2.8倍。以單精度或進一步降低的精度(通常在機器學習和AI應用中使用),Fugaku的最高性能超過1,000 petaflops(1 exaflops)。
Fugaku超算的浮點部分是與ARM合作的SVE指令擴展,使用了512bit浮點運算單元,每個節點使用48核+4輔助核,IO及計算節點則是48核+4輔助核結構。目前的性能還不是完整版,后續還會繼續升級到1000PFLOPS,也就是百億億次。
前十名的榜單中,由中國國家并行計算機工程與技術研究中心(NRCPC)開發的神威·太湖之光(Sunway TaihuLight)排名第四,該系統由Sunway 260核SW26010處理器供電,2016年6月在中國無錫國家超級計算機中心安裝,HPL性能為93 petaflops。由中國國防科技大學(NUDT)開發的天河2A排名第五。
中國制造商在安裝數量上搖搖領先,在500臺超算系統中,聯想集團(00992)以180臺占據絕對主導地位,繼續排名全球超算提供商第一名,相比上次榜單增加了六套系統。
另外,曙光68臺和浪潮64臺,中國制造商合計占312臺。
責任編輯:gt
-
ARM
+關注
關注
134文章
9056瀏覽量
366845 -
計算機
+關注
關注
19文章
7428瀏覽量
87727 -
服務器
+關注
關注
12文章
9027瀏覽量
85194
發布評論請先 登錄
相關推薦
評論