6月25日報道,新一期全球超級計算機500強榜單25日發布,美國超級計算機“頂點”超過中國的“神威·太湖之光”名列第一。這是美國超級計算機多年后重回榜首。不過,排行榜上中國的超算系統總數仍居第一。美國橡樹嶺實驗室(Oak Ridge National Laboratory)在6月初公布了其新超算“頂點”(Summit),理論速度達到了每秒20億億次,由IBM提供技術采用了9216顆IBM Power 9處理器驅動,27648顆NVIDIA Volta做加速卡。在本周一,全球超算TOP500的新榜單正式發布,正式確認Summit超算為全球最強超算,也是美國在第五年屈居第二后成功超越的中國超算神威-太湖之光,重回第一。
在超算500強榜單的基于Linpack基準測試評定上,Summit的浮點運算速度為每秒12.23億億次,峰值接近每秒18.77億億次。排名第二的是曾4次蟬聯冠軍的中國超算“神威·太湖之光”,其浮點運算速度沒有變化,仍維持在每秒9.3億億次。隨后排在第三至五位的超算依次是美國能源部下屬勞倫斯利弗莫爾國家實驗室的“山脊”,中國超算“天河二號”、日本超算“人工智能橋接云基礎設施”(ABCI)。
盡管美國在超算方面仍然占據主流,但是中國超算數量持續增加,其躋身500強的超算比例逐年增高,由2017年的201臺增加至206臺,仍有更多在建的超算有望再次趕超美國,美國的500強超算數量由143臺跌至124臺。另一個趨勢,全球500強超算中采用加速卡的臺數也由101臺增至110臺。
性能超神威·太湖之光2倍
美國Summit超級計算機現在已經在美國橡樹嶺國家實驗室運行,峰值運算速度達到200 petaflops,是神威·太湖之光的2倍多。如無意外,它將在本月底公布的Top 500榜單中名列第一,讓美國重奪“世界上最強大超算”桂冠。而且,它的設計非常適應人工智能技術,被譽為“最聰明超算”。
備受關注的美國Summit超級計算機現在已經在美國橡樹嶺國家實驗室(ORNL)運行。這臺新的超級計算機被非官方地稱為“世界上最強大的計算機”。而且,它的設計部分是為了擴大人工智能技術的應用范圍。
自2013年6月“世界最強超算”的桂冠被中國的神威·太湖之光超級計算機摘取以來,美國一直沒有擁有奪回這個稱號。Summit超算預計在本月晚些時候正式發布,屆時國際“TOP 500”組織將正式發表世界超級計算機Top 500榜單。除非中國本月爆出大驚喜,否則新的排名公布后,Summit將使美國重回超算Top 500榜單的第一名。
盡管在云計算和大型數據中心的時代,超級計算機已經失去了一些吸引力。但許多棘手的計算問題仍需要大型的機器。美國政府去年發布的一份報告提出,美國應加大對超級計算機的投資,以便在核武器和高超音速飛機等國防項目,以及航空、石油勘探和制藥等領域的商業創新等方面趕上中國。
Summit:比普通筆記本電腦快100萬倍,比神威·太湖之光快2倍
Summit超算由IBM和NVIDIA為美國能源部的橡樹嶺國家實驗室制造,其占地面積相當于兩個網球場大小,為了冷卻其37000個處理器,周圍的循環系統每分鐘要消耗4000加侖的水。盡管美國能源部(DOE)尚未透露Summit的Linpack測試結果,但橡樹嶺國家實驗室表示,Summit的峰值運算速度達到200 petaflops,也就是每秒浮點運算次數達到200千兆次。這比普通筆記本電腦的運算速度快100萬倍,是神威·太湖之光(93.01 PFLOPS)峰值性能的兩倍有多。
200 petaflops是什么概念呢?如《紐約時報》所述,一個人需要花630億年的時間來完成Summit一秒鐘內可以完成的計算。而MIT技術評論說,“地球上的每個人每天每秒鐘進行一次計算,持續305天,才能完成Summit超算眨眼之間可以做完的事情。”
盡管Summit的基本規格已經公開有一段時間了,但這里還是有必要重新介紹一下:Summit由4608個節點組成,每個節點包含兩個Power9 CPU和6個NVIDIA Tesla V100 GPU。節點與Mellanox雙軌EDR InfiniBand網絡連接在一起,為每臺服務器提供200 Gbps的速度。
假設所有這些節點都配備齊全,GPU單獨將以雙精度提供峰值215 petaflops。此外,由于每個V100還提供125 teraflops的混合精度 Tensor Core 操作,系統對深度學習運算的峰值性能大約為3.3 exaflops。
exaflops級的性能也不僅僅是理論上的。根據ORNL主任Thomas Zacharia的說法,在早期的測試中,橡樹嶺國家實驗室的研究人員在一個分析人類基因組序列變化的項目中,使用Summit超算每秒進行了超過10的18次方次的計算。他們聲稱這是科學計算第一次達到這樣的計算規模。
最適合機器學習的超級計算機
美國新推出的這臺最強超算不僅僅對計算力的地緣政治意義重大。它的設計比以前的超級計算機更適合運行谷歌、蘋果等科技公司流行的機器學習技術。
研究人員發現,圖形芯片可以為深度神經網絡技術提供更多計算力,這也是計算機可以在聲音識別、棋盤游戲等方面打敗人類的一個原因。Facebook最近披露,一個使用數十億張Instagram照片的人工智能實驗,在近一個月的時間里占據了數百張顯卡。
Summit擁有近28000個英偉達(Nvidia)生產的圖形處理器,以及IBM生產的9000多個傳統處理器。對于超級計算機來說,使用大量的圖形芯片是不常見的,因此它應該能在部署機器學習以處理艱難的科學問題方面實現突破。橡樹嶺國家實驗室主任Thomas Zacharia說:“我們打造了世界上最強大的超級計算機,但它也是世界上最聰明的超級計算機。”
當然,Summit還將支持美國能源部最感興趣的標準科學規范,特別是那些與核聚變能源、替代能源、材料科學、氣候研究、計算化學和宇宙學等相關的科學規范。但由于這是開放的科學系統,可用于所有類型的研究,可以與能源無關。Summit也將用于醫療保健的應用領域,如藥物發現、癌癥研究、成癮和其他類型的疾病研究。事實上,在宣布該系統投入使用的新聞發布會上,Zacharia表示,他希望橡樹嶺國家實驗室成為“醫療數據分析領域的歐洲核子研究中心”。
“分析”與Summit的深度學習傾向非常吻合,因為前者實際上是后者的疊加。早在2014年,當美國能源部第一次簽約Summit系統時,能源部可能只對他們將得到的AI能力有一個粗略的概念。盡管IBM在將Power9-GPU平臺提交給美國能源部之前一直在宣傳其以數據為中心的超級計算方法,但當時人工智能/機器學習應用領域仍處于初級階段。由于NVIDIA決定將專用的 Tensor Cores 集成到V100中,Summit最終成為了一個AI巨獸,同時也是一個強大的HPC機器。
因此,除了高性能計算的之外,該系統還可能參與大量尖端的人工智能研究。目前,Summit只對經選擇的項目開放。到2019年,該系統將變得更加廣泛可用,包括將用于理論與實驗創新計算項目(INCITE)。
到時,Summit的前任Titan超級計算機很可能會退役。Summit的性能約為Titan的8倍,能效提高5倍。當橡樹嶺在2012年安裝Titan時,它是當時世界上最強大的系統,也是美國最快的超級計算機(現在是第二快)。Titan也擁有NVIDIA GPU,但這些都是K20X圖形處理器,其機器學習能力僅限于每個設備四個單精度teraflops。幸運的是,為Titan開發的所有支持GPU的HPC的代碼都應該能夠輕松移植到Summit上,并且應該能夠充分利用V100更高的計算能力。
伊利諾伊大學厄巴納-香檳分校國家超級計算應用中心的研究員Eliu Huerta將Summit的龐大GPU池描述為“像夢境一樣”。Huerta此前曾在一臺名為Blue Waters的超級計算機上使用機器學習技術,在LIGO天文臺的數據中探測引力波。LIGO天文臺的兩位創始人因此獲得了2017年諾貝爾物理學獎。Huerta希望Summit的成果將有助于分析預計將于2019年啟用的大型天氣觀測望遠鏡每晚接收到的約15 TB的圖像。
Summit還將被用于在化學和生物學的問題中利用深度學習技術。 Zacharia說,這項研究可能有助于能源部的一個項目,該項目使用來自2200萬退伍軍人的醫療記錄,其中包括大約25萬人的完整基因組序列。
有些人擔心美國在超大規模計算機上的競爭力,他們希望,Summit將激發對打造其繼任者的更多興趣。
Summit還將發揮另一個重要作用,即為E級科學應用提供一個發展平臺。作為橡樹嶺國家實驗室的最后一個petascale系統,這臺200 petascale的超算將成為未來幾年一系列HPC代碼向exascale機器轉移的墊腳石。現在,隨著Summit的完成,這似乎不再是一個遙遠的前景了。“畢竟,(E級計算)離我們現在的超算能力只差5倍,”Zacharia笑著說。
-
超級計算機
+關注
關注
2文章
460瀏覽量
41923 -
人工智能
+關注
關注
1791文章
46859瀏覽量
237567 -
機器學習
+關注
關注
66文章
8377瀏覽量
132409 -
運算速度
+關注
關注
0文章
6瀏覽量
2879
發布評論請先 登錄
相關推薦
評論