在歐洲和美國,HPC 開發者正在利用 NVIDIA BlueField-2 DPU 內的 Arm 核和加速器的強大功能為超級計算機提供強大助力。
美國洛斯阿拉莫斯國家實驗室(LANL)正在與 NVIDIA 進行一項為期多年的廣泛合作,這項合作旨在將計算型多物理應用的性能提高 30 倍。
LANL 研究人員預計,使用在 NVIDIA Quantum InfiniBand 網絡上運行的 DPU(數據處理器)可顯著提升性能。這將使利用 BlueField 以及 NVIDIA DOCA 軟件框架在計算存儲、模式匹配等領域實現技術創新。
面向 DPU 的開放式 API
這些努力還將有助于進一步定義 OpenSNAPI ,任何人都可通過該應用接口來控制 DPU 。這是統計計算框架(Unified Communication Framework)的一個項目,Unified Communication Framework 是一個旨在實現 HPC 應用異構計算的聯盟,成員包括 Arm 、IBM 、NVIDIA 、美國國家實驗室和美國的一些大學。
LANL 已經感受到網絡計算的強大功能,這要歸功于其創建的 DPU 賦能的存儲系統。
加速閃存盒(ABoF,如下圖所示)將固態存儲與 DPU 和 InfiniBand 加速器相結合,可為 Linux 文件系統的關鍵性能部分提供加速。它的性能高達同類存儲系統的 30 倍,并將成為 LANL 基礎架構中的關鍵組件。
一位研究人員在近期的 LANL 博客中表示:“ABoF 讓計算靠近存儲,可更大限度減少數據移動,從而提高仿真和數據分析工作流程的效率?!?/p>
德克薩斯州打造出云原生超級計算平臺
德克薩斯高級計算中心(TACC)近期也開始在 Dell PowerEdge 服務器中采用 BlueField-2 。它將在 InfiniBand 網絡上使用 DPU,使其 Lonestar6 系統成為云原生超級計算的開發平臺。
TACC 的 Lonestar6 為德州農工大學、德州理工大學和北德克薩斯大學的眾多 HPC 開發者,以及一些研究中心和教職人員提供服務。
MPI 獲得加速
在距 TACC 東北部 1200 英里的地方,俄亥俄州立大學的研究人員展示了 DPU 如何將一個 HPC 熱門編程模型的運行速度提高 26%。
他們通過卸載消息傳遞接口(MPI)的關鍵部分,加速了 P3DFFT ,這是一個用于眾多大規模 HPC 仿真的數學庫。
俄亥俄州立大學計算機科學與工程專業的教授 Dhabaleswar K. (DK) Panda 在其帶領的 MVAPICH 開源軟件團隊推動 DPU 工作,他表示:“DPU 就像是為忙碌的高管處理工作的助手,它們將成為主流,因為它們可以加速運行各種工作負載?!?/p>
HPC 中心和云中的 DPU
對于運行藥物研發或飛機設計等 HPC 仿真應用的超級計算機而言,高達兩位數的性能加速是驚人的。Panda 表示,云服務可以利用這些加速提高客戶的生產力,他已收到多個 HPC 中心的代碼請求。
Quantum InfiniBand 網絡以及 NVIDIA SHARP 特性,助力他高效完成工作。
他說:“其他人還在談論網絡計算,而 InfiniBand 已經在為它提供支持?!?/p>
達勒姆開發負載均衡
歐洲的多個研究團隊正利用 BlueField DPU 加速 MPI 和其他 HPC 工作負載。
例如,英格蘭北部的達勒姆大學正在開發一款軟件,用于在 16 個節點的 Dell PowerEdge 集群上使用 BlueField DPU 以實現 MPI 作業的負載均衡。該項目的首席調查員 Tobias Weinzierl 表示,該軟件將為全球各地的 HPC 設施更高效地處理更好算法鋪平道路。
劍橋大學和慕尼黑的 DPU 應用
劍橋大學、倫敦和慕尼黑的研究人員也在使用 DPU 。
倫敦大學學院正在探索如何在 BlueField-2 DPU 上為主機系統調度作業。例如,可以使用它的能力在主機處理器之間移動數據,以便在需要時數據已然就位。
Dell PowerEdge 服務器內的 BlueField DPU 可為 Cambridge Service for Data Driven Discovery 服務卸載主機 CPU 的安全策略、存儲框架和其他作業,從而更大限度地提高系統性能。
與此同時,慕尼黑工業大學計算機體系架構和并行系統組的研究人員正在尋找方法,使用 DPU 來卸載 MPI 和操作系統任務,這是 EuroHPC 項目的一部分。
在美國,佐治亞理工學院的研究人員正在與桑迪亞國家實驗室合作,利用 BlueField-2 DPU 加速分子動力學研究。一篇論文描述了他們目前的工作成果,其中表明,算法可以加速高達 20% ,且不會損失模擬的準確性。
不斷擴展的網絡
本月早些時候,日本研究人員宣布將推出一款采用新版 NVIDIA H100 Tensor Core GPU 的系統,該系統將搭載速度更快、更智能的 NVIDIA Quantum-2 InfiniBand 網絡平臺。
NEC 將使用 H100 的為筑波大學計算科學中心構建算力大約為 6 PFLOPS 超級計算機。研究人員將使用該系統實現氣候學、天體物理學、大數據、AI 和更多方面的研究。
與此同時,Panda 等研究人員已經開始考慮如何使用 BlueField-3 DPU 的核心功能。
他打趣道:“這就像雇傭擁有大學學位的行政助理,而不是那些擁有高中文憑的行政助理一樣,所以我希望能夠完成越來越多的工作卸載?!?/p>
-
處理器
+關注
關注
68文章
19178瀏覽量
229201 -
NVIDIA
+關注
關注
14文章
4949瀏覽量
102829 -
軟件
+關注
關注
69文章
4799瀏覽量
87178 -
大數據
+關注
關注
64文章
8864瀏覽量
137310
發布評論請先 登錄
相關推薦
評論