亞馬遜網絡服務公司(Amazon Web Services)不久將擁有一臺由英偉達(Nvidia)制造的新型超級計算機,該公司稱這是世界上速度最快的人工智能系統之一。
在使用 FP8 數據類型測試時,該系統可提供 65 exaflops 的人工智能性能。Nvidia 負責超大規模和 HPC 的副總裁 Ian Buck 在新聞發布會上說,這也是世界上第一臺基于 ARM 的云計算 AI 超級計算機。
新的DGX Cloud Project Ceiba系統圍繞Nvidia組件構建,但經過調整后可連接到AWS的Nitro芯片,后者提供底層網絡、存儲和安全基礎設施。
Project Ceiba將于2024年安裝完畢,屆時可供客戶使用。該系統與其他Nvidia DGX Cloud實施系統不同,后者已被克隆到微軟的Azure、甲骨文云和谷歌云上。
65 exaflops的性能來自5個Grace Hopper超級芯片,機架由AWS的彈性結構適配器連接,用于超級計算應用程序。
Buck說:"這臺新的超級計算機將在 AWS 基礎設施中運行,并由 Nvidia 自己的研究和工程團隊開發用于開發圖形、大型語言模型研究的新人工智能,并用于數字生物學、機器人研究和自動駕駛汽車。
AWS 還發布了搭載英偉達H200、L40S和L4 GPU的新虛擬機。這些產品是在拉斯維加斯舉行的 ReInvent 大會上發布的。
AWS 還發布了其最新 CPU Graviton4,它是 Graviton3 的后繼產品,將被用于 EC2。不過,亞馬遜在一篇博客文章中稱,與 Graviton3 芯片相比,該 CPU 的內核增加了 50%,速度提高了 30%,內存帶寬增加了 75%。
CCS Insight 首席分析師詹姆斯-桑德斯(James Sanders)說,考慮到 Graviton 處理器與 Arm Neoverse 內核設計發布節奏之間的關系,Graviton4 的發布在意料之中。Graviton4 以 Neoverse V2 為藍本,而 Graviton 3 則以 Neoverse V1 為藍本。
"兩者在微架構上的主要變化是升級到了Armv9,從而提高了進程隔離和向量擴展。桑德斯說:"前者在云環境中非常有用,也是對 Spectre 和 Meltdown 等側信道攻擊的一種反應,而后者則對人工智能推理非常有用。
最新的CPU是Graviton 3E,它是AWS用于超級計算的最高性能CPU。桑德斯說,Graviton4全面上市后,將有更多不同價位的實例類型可供選擇。
相比之下,微軟新推出的 Cobalt 100 是基于 Arm 的 Neoverse N2 CSS,也是 Armv9。Neoverse N 系列面向主流數據中心,而 V 系列則面向更高性能的工作負載,這將使 Graviton4 更具優勢。
亞馬遜也終于發布了名為 Trainium2 的下一代訓練芯片,其訓練速度是近三年前發布的首款 Trainium 芯片的四倍。
"亞馬遜在一篇博文中說:"它將能部署在多達 10 萬個芯片的 EC2 UltraClusters 中,使基礎模型和大型語言模型(LLM)的訓練只需極少的時間,同時能效提高達 2 倍。
AWS 現在擁有兩款 ARM CPU,包括 Nvidia 的 Grace 和自己的 Graviton4。Nvidia的Grace提供對GPU的訪問,而Graviton4提供對Trainium的訪問。Graviton4 目前還不能與 Nvidia GPU 協同工作。
由于模型開發和定制的增加,這方面的需求是存在的,盡管這需要對針對 Nvidia CUDA 環境的項目進行一些工具調整。
"桑德斯說:"奇怪的是,[AWS 首席執行官]亞當-塞利普斯基(Adam Selipsky)指出,當谷歌正在使用第四代 TPU 時,其他云計算公司才在談論它們的 AI 芯片。
審核編輯:劉清
-
機器人
+關注
關注
210文章
28231瀏覽量
206614 -
適配器
+關注
關注
8文章
1933瀏覽量
67930 -
超級計算機
+關注
關注
2文章
460瀏覽量
41925 -
HPC
+關注
關注
0文章
312瀏覽量
23689 -
英偉達
+關注
關注
22文章
3749瀏覽量
90856
原文標題:亞馬遜網絡服務與英偉達聯手打造AI超級計算機,達到65 Exaflops的性能新高度!
文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論