11月15日,北京,中國超算“放榜日”。
隨著第二屆中國超級算力大會的舉行,2020中國高性能計算機性能排行榜TOP100揭曉。
榜單的前2位已經五年沒有發生更迭,還是熟悉的兩個“前全球第一超算”——“神威·太湖之光”和“天河二號A”,它們分別部署在國家超級計算無錫中心和國家超級計算廣州中心(注!5年間機器有升級)。
榜單的第3、4位是新面孔。
其中,排在第3位的是北京超級云計算中心(A分區)。其設備供應方為戴爾科技集團,Linpack測試性能達3.743PFlops,峰值性能達7.035PFlops,采用AMD最新的霄龍處理器“羅馬”為其提供澎湃算力。北京超級云計算中心由中國科學院與北京市政府共建,位于北京市懷柔科學城。
榜單第4位是部署在內蒙古和林格爾新區的“內蒙古高性能計算公共服務平臺”,建設方為清華同方;5~10位由聯想深騰8800系列占據。排在榜最后一位的機器性能為1.869PFlops,較去年最后一位性能提升33.2%。
此次榜單看起來雖然變化不大,但綜合分析來看,仍有不少亮點。
01
國家超算的大國重器地位不動搖
榜單前兩位無錫超算和廣州超算,是國家超算的杰出代表。
眾所周知,兩臺設備都曾在全球超算TOP500排行榜上排名第一。其中,天河二號(含升級后的天河二號A)在2013年6月~2015年11月,連續六次在TOP500排名第一;神威·太湖之光在2016年6月~2017年12月,連續四次在TOP500排名第一。
當然,兩大國家級超算的貢獻絕不止于TOP500的排名,二者對于推動我國超大規模計算機的研制、部署、軟件開發、應用等方面同樣居功甚偉。
以神威·太湖之光為例。
自2016年該機器奪得全球第一超算的桂冠后,當年,我國科學家楊超等人就憑借運行在其上的千萬核級應用,首次摘得“高性能計算領域的諾貝爾獎”——戈登貝爾獎。這一最高獎項在此前的近30年中,一直被美國和日本壟斷。
此后的2017年,青年科學家付昊桓等人再次憑借基于神威·太湖之光的應用“非線性地震模擬”幫助中國蟬聯“戈登貝爾獎”。
連續兩年將“戈登貝爾獎”收入囊中,對于推動我國超算應用發展、提高我國超算軟實力,甚至提振中國超算士氣方面都有著重要意義。
當然,作為國之重器,國家超算在承擔加速學科交叉和信息化發展、加速產業轉型與融合升級、培養復合型人才等國家使命方面也扮演著重要的角色。
就拿“天河二號A”來說,多年來一直向大氣—海洋環境模擬、天文地球物理、工業設計制造、生物醫藥健康等方面給予算力和計算應用支撐。
02
通用和行業超算是重要補充
國家級超算都是大家伙、重武器,能夠負載萬核、十萬核甚至千萬核以上應用。但是,在“國民經濟主戰場”,更多的應用是無法企及國之重器這樣的高度的,這也要求超算不能只是“王謝堂前燕”,還要“飛入尋常百姓家”。
簡單來說,國家超算是國家戰略計算裝備,不僅要有,還要盡量“大”,和世界一流水平同頻共振;而用于各行各業、作為生產工具的通用超算、行業超算,也同等重要,但這類設備追求的不是“大”,而是要追求通用、易用、好用。
這次Top100榜單排在第三位的北京超級云計算中心(A分區),別看它排名靠前,但它是不折不扣的、服務千行百業的通用超算,是國家超算重要的算力補充。
鑒于這一集群系統的代表性,加之此前該集群非常低調,只有很少的公開信息,今次本文以相對長的篇幅做一些介紹和分析。
北京超級云計算中心(不要被名字迷惑,它不是我們常說的云計算,而是以云服務形式提供超算算力的平臺)于 2011 年依托中科院計算機網絡信息中心成立,北京北龍超級云計算有限責任公司負責運營,位于懷柔科學城。
本次上榜的是北京超級云計算中心的A分區(關于為何“分區”,后文詳述),算力規模為3.743PFlops,全部為通用X86超算。
通用X86超算在圈內又被稱作“純CPU通用算力”,這類算力資源,由于生態完善、代碼可移植性強等原因,用戶友好度非常高。
更值得一提的是北京超級云計算中心提供算力的模式。正如其名,該中心以隨需供應的“超級云計算服務”的模式向用戶提供算力,這是其最大的特點。
前面說超算要從“舊時王謝堂前燕”“飛入尋常百姓家”,怎么飛?北京超級云計算中心的實踐證明,“超級云計算服務模式”就是一種行之有效的方式。
來看幾個例子。
03
“超級云計算”的幾個案例
成立于1998年的“金風科技”,是我國風電事業發展的親歷者和推動者。金風科技打造的仿真軟件“風匠”系統,是一款“更適合中國風資源特征的仿真軟件”。依托北京超級云計算中心支持,金風科技以北京超級云計算中心A分區為主資源,進行風資源評估相關的業務生產和產品研發。
為了滿足金風科技不同業務部門需求,在計算資源方面,北京超級云計算中心為其提供了獨占、包核時等使用方式,同時提供數量和類型豐富的配置資源,這保障其能夠通過彈性擴展,有效支撐高峰—平峰使用需求。
“經在A分區的測試和日常生產使用,總體計算性能和速度,有明顯提升?!?/p>
金風科技相關負責人在用戶試用報告中寫道:“在技術支持和資源效能方面,基于我方系統需求,提供了多種接入方式和技術支持,并提供了專屬的技術支持人員提供資源。在使用A分區資源計算過程中,系統未出現問題。”
提供以獨占、包核時的靈活使用模式來滿足計算資源需求,除金風科技之外的受益者,還有一長串名字。
這其中就有自然資源部海洋環境科學與數值模擬重點實驗室。其首席科學家宋振亞說,A分區計算速度快、節點數量多、通信性能高、并行可擴展性好,而且可通過多種方式使用,高效、便捷。
同時,該實驗室以萬核規模經過一周以上的不間斷運行,系統也沒有出現問題,計算數據經過驗證,結果正確,“說明該系統運行穩定可靠”。宋振亞說,他們有計劃下一步將自主研發的短期氣候預測系統也移植到北京超級云計算中心A分區開展業務運行。
中科院院士、中科院物理所研究員向濤團隊課題組,是我國在凝聚態物理研究方面的重要力量,他們課題組長期致力于“張量重正化群方法”的發展和應用。而要發展和應用這種方法所需的算力,不僅須滿足多核心并行,還要有大的內存支撐。
北京超級云計算中心A分區的計算資源,單節點64核心、內存高達256G,恰能滿足向濤院士課題組對計算資源的要求。很快,A分區就成了該課題組科學研究的有力工具。
“我們體會到了省時省力?!?/p>
向濤院士課題組研究人員評價說,A分區的存在,簡化了計算資源的維護、降低了調試成本,打破了他們一開始對計算資源運維的“心理恐懼”。
上邊這3個案例,都是本次榜單上北京超級云計算中心A分區的“光榮事跡”。
前面也有提到,A分區只是北京超級云計算中心的一個主力分區,除A分區外,北京超級云計算中心還有T分區、M分區、IO分區,還有科技云9分區、12分區、15分區、17分區、19分區等等。
為什么要劃分這么多分區?
對于超算的需求方而言,他們對超算的需求是多種多樣的——有的需要更燃的計算,有的需要更多內存,有的需要更快的數據傳輸。而所有這些分區,都是因向對計算資源有不同需求的用戶提供更便捷高效的服務而存在的。
北京超級云計算中心還在不斷動態擴容、不斷“分蘗”,也顯示了其以用戶服務為核心,“將超級云計算服務模式進行到底”的決心。
04
中國超算既要“捅破天” 還要“接地氣”
超算是重要的基礎工具。沒有“神威·太湖之光”、“天河二號”、“曙光星云”等這些大國重器,我們就無法實現尖端科技的突破,無法不斷向科學技術廣度和深度進軍。
但同時也應看到,我國經濟社會的進步、各行各業升級發展的需求日益迫切,也在呼喚能夠更接地氣的海量計算應用,呼喚北京超級云計算中心、阿里云、華為云等一系列能夠提供超級算力、提供計算服務、提供大數據處理能力的行業貢獻者。
還應指出的是,“計算”作為一種支撐和工具,它還只是先進生產力鏈條中的一個環節。在計算之外,數據的采集與處理、軟件的設計與調優、模型模式的開發等等,需要行業內外更多人的參與。
今天榜單上的所有集群,都只是超算作為硬件形態的一個體現。這一個個的“大家伙”要變成真正的生產力,需要跨越超算硬件與應用之間的“死谷”。
北京超級云計算中心在解決這個問題上想到和實踐的方法是“超級云計算服務模式”,但這就夠了嗎?
美國在超算部署上一直有制定詳盡的計劃。從國家戰略計算計劃(著名的NSCI計劃),到美國能源部制定實施的百億億次計算研發項目(ECP計劃),都強調多部門協同、更重視應用。
特別是ECP計劃,美國計劃5年投入“18億美元+18億美元”,一半用于E級計算機研制,一半用于研發應用。
超算行業專家、中山大學數據科學與計算機學院院長錢德沛曾總結中國超算應用上的弱點:缺乏應用軟件、缺乏人才、缺乏有效合作。說到底,我們更需要一個完善的“超算用起來”的環境。
無論國家超算、通用超算、行業超算、商業超算,存在形態真的無大所謂,可以兼容并收,但要用起來。只有形成了一個健康的應用生態,中國超算,才算真的頂天立地。
責編AJX
-
超級計算機
+關注
關注
2文章
460瀏覽量
41923
發布評論請先 登錄
相關推薦
評論