電子發燒友網報道(文/周凱揚)在今年的ISC2024上,新一期的TOP500全球超算榜單發布。除了瑞典超級計算機Alps空降第六之外,此次TOP500的前十名在排名上并沒有太大變化,但我們還是從新的成績中找到了一些別的亮點。
AMD實現TOP500近三成覆蓋率
首先是衛冕成功的Frontier,這個由HPE打造的大規模超算系統部署在美國橡樹嶺國家實驗室,此次拿下了1.206 Exaflop/s的HPL算力成績,在開發人員的優化下,相較上次提交的1.194 Exflop/s成績還有所提升。Frontier集成了9472塊AMD Epyc 7713 64核2GHz CPU和37888塊AMD Instinct MI250X GPU。
Frontier超算 / 美國橡樹嶺國家實驗室
憑借AMD頂級Epyc CPU和Instinct GPU的搭配,Frontier可以說是當下已公開系統中,兼顧HPC和AI的最強超算。不僅如此,其能效表現同樣不俗,52.93Gflops/W的成績居于GREEN500能效榜單的第13位。
如果我們觀察余下的TOP500超算,就會看到搭載了MI300A系列GPU的超算系統開始逐漸顯現,比如美國勞倫斯利弗莫爾國家實驗室的三臺新系統,分別拿下了46、47和48的排名。而這三臺均為El Capitan超算的子系統,今年部署完成后預計HPL算力可突破2 Exaflop/s。
根據AMD的說法,在新發布的TOP500超算系統中,由AMD硬件驅動的超算系統增加了29%,達到了156臺。在能效榜單GREEN500上,由AMD硬件驅動的超算系統也達到了157臺。雖然這與英特爾60%以上的份額還有不小差距,但其增長速度要遠超英特爾。
英特爾首臺E級超算出爐,性能還沒到頂
去年拿下第二的Aurora超算在今年的TOP500上再進一步,獲得了1.012 Exaflop/s的HPL算力成績,成為TOP500歷史上第二臺E級超算,也是基于英特爾硬件的首臺E級超算。由于去年Aurora尚未完成全面部署,所以只是勉強超過第三名的Eagle超算,HPL算力為585.34 PFlop/s。
Aurora超算 / 美國阿貢國家實驗室
如今的Aurora離硬件全面到位還差一點,所以此次提交成績只用到了80%到90%左右的節點,要在下一次TOP500榜單公布才能完成全面部署。但即便如此,Aurora的成績依然成功突破了E級大關。如果按照這一規模來估算,加上阿貢實驗室開發人員的優化,Aurora未來也有可能完成逆襲,超過Frontier,不過屆時第一名很有可能會是同樣完成部署的El Capitan。
另外值得一提的是,無論是Aurora還是Frontier,在測試混合精度算力的HPL-MxP上,兩者都獲得了超過10 Exaflop/s的成績。其中Aurora憑借89%的系統拿下了10.6Exaflop/s的成績,位列第一。但這一測試并不能代表絕對的AI性能,尤其是用于新一代的AI負載,因此在這一屆ISC2024上,行業也在呼吁推出新的AI測試榜單。
由于Aurora部署進度經歷了一再推遲,其能效相比其他超算系統略有遜色,只有26.15GFlops/w,這也是為何其系統功耗從去年的24.687MW提升至今年的38.698MW。相較之下算力還要高于Aurora的Frontier系統功耗只有22.786MW。
從目前前十名的榜單來看,基于英特爾Xeon處理器的系統依舊占據了一半席位,這足以說明英特爾在HPC上的持續統治地位。這還是在其HPC產品發布推遲的前提下,未來隨著工藝的推進和發布計劃重回正軌,英特爾依然有機會找回被奪去的份額。
英偉達開始發力,Arm CPU+GPU性能與能效雙管齊下
此次TOP500最令人意想不到的應該是英偉達的全面發力,此前英偉達出現在TOP500榜單上主要是因為其GPU,在TOP500榜單中,半數帶有加速器的系統都用到了英偉達的GPU。而此次TOP500上,則一共有8臺系統基于英偉達的Grace Hopper處理器。
Alps超算 / 瑞士超算中心
這次空降的第六名是來自瑞士超算中心的Alps超算系統,該系統集成了英偉達的GH200超級芯片,算力成績達到了270 PFlop/s。該系統從2021年開始計劃部署,用于氣候、物理和生命科學研究等HPC應用的同時,提供強大的AI算力。
我們如果觀察同期發布的GREEN500能效榜單就會發現,基于英偉達Grace Hopper打造的超算系統包攬了前三的位置。這三臺系統分別是德國超算JEDI、英國超算Isambard-AI和波蘭超算Helios GPU,能效分別為72.733Gflops/W、68.835Gflops/W和66.948Gflops/W。即便是TOP500排名第六的Alps,其能效比也有51.98Gflops/W,在GREEN500上排名第14.
結合TOP500上也有不少x86超算使用英偉達的GPU,側面反映了Arm架構在HPC系統上的能效優勢。結合未來對于超算能效更加嚴格的要求,英偉達的CPU+GPU超級芯片方案的吸引力會越來越大。
超算的市場格局迎來新一輪劇變
可以看出,超算行業已經不再是過去英特爾一家獨大的場面了,無論是AMD、英偉達等都在迎頭趕上,甚至是以更快的速度奪取市場份額。在x86系統上,AMD的CPU與GPU組合已經成為不少超算中心和商業公司的首選,而且由于供貨較為穩定,其部署速度也要快于其他超算系統。
在Arm系統上,英偉達已經開始發力,依仗Grace Hopper提供的性能和能效雙重優勢,與HPC方案商合作貢獻了多臺TOP500系統。未來隨著GB200投入市場,憑借Blackwell架構在FP64精度上比Hopper架構高出30%的性能表現,相信會有更多的超算系統選擇英偉達的硬件方案。
至于IBM的Power架構,目前前十名中只有老牌榜首Summit采用IBM的Power9 CPU,除此之外就只剩采用自研Arm核心和處理器的富岳超算系統這一特例了。鑒于目前具備自研HPC處理器的廠商并不多,未來各種眾核處理器的HPC系統數量預計還是維持在個位數,但其性能往往都不容小覷。
與此同時,中國超算系統今年出現了銷聲匿跡的局面,今年的TOP500超算榜單上,沒有一個來自中國的新超算系統,位列TOP500的中國超算系統,也從104臺減少至80臺。但實際上國內也有三臺值得關注的新超算,分別是620 Pflop/s的天河星逸,以及神威海洋之光和天河三號,后兩者的預估性能分別為2.05 Exaflop/s和1.5 Exaflop/s。但很有可能出于地緣政治的原因,國內超算紛紛選擇了停止提交HPL成績。
來自美國的超算系統從171臺減少至160臺,從這幾年的趨勢來看,美國更加致力于打造頂級超算。反倒是來自歐洲的超算系統從143臺提升至160臺,正式超過亞洲成為第二名,僅次于北美地區,足見歐盟對于HPC系統的投入。
在系統制造商上,HPE和聯想依然是最大的兩家制造商,尤其是聯想,占據了32.4%的份額。但在總系統算力上,HPE打造的系統占據了36.1%的份額。這也說明了得益于HPE提供的HPE Cray OS操作系統以及Singshot-11互聯方案,其在高端系統上更受歡迎。
隨著摩爾定律的放緩或者說終止,在速度的提升上,我們已經看到了減緩的跡象,曾經在2030年實現10 Exascale的目標已經不太可能實現了,如今的能效指標也不允許我們一味地擴大超算規模。
-
amd
+關注
關注
25文章
5441瀏覽量
133933 -
英特爾
+關注
關注
60文章
9880瀏覽量
171482 -
摩爾定律
+關注
關注
4文章
632瀏覽量
78930 -
HPC
+關注
關注
0文章
311瀏覽量
23682 -
超算
+關注
關注
1文章
114瀏覽量
9053
發布評論請先 登錄
相關推薦
評論