隨著云計算技術的進步,數據中心的架構內存安排發生了重大變化。為了增強計算能力和廣泛的數據處理,需要集成擅長處理特定工作負載的加速器。雖然這些設備已經通過PCI Express連接,但計算快速鏈路可以進一步改善優化,因為它允許對各種系統組件進行異構處理。
PCI Express是用于將主機處理器連接到加速器設備的最常見技術。它是一種高性能、行業標準的串行 I/O 接口,專為在企業、桌面和嵌入式應用中使用而開發。
同時,PCIe在具有大型共享內存池和大量需要高帶寬的設備的系統中存在局限性。由于每個 PCIe 層次結構都使用單個 64 位地址空間,因此 PCIe 未提供支持一致性的技術,并且無法充分維護單獨的內存池。此外,PCIe 鏈路具有太多的延遲,無法有效地管理系統中多個設備之間的共享內存。
因此,計算密集型工作負載需要與更快的數據流連接,以有效地擴展數據中心中的異構計算。計算高速鏈路 (CXL) 通過利用 PCI 高速 5.0 的物理和電氣接口來挑戰一些限制。這項新技術提高了內存容量和帶寬,并降低了延遲。它是高速通信的接口,因為加速器越來越多地用于補充CPU以支持新興應用。
什么是斷續器?
計算高速鏈路 (CXL) 是一種開放的行業標準內存互連。它旨在為當今數據中心中使用的許多類型的內存提供高性能連接,例如CPU,TPU,GPU和其他處理器類型。
CXL 利用 PCIe 5.0 的物理層基礎架構在主機和所有設備之間創建公共內存空間。緩存一致性標準可確保主機處理器和 CXL 設備在訪問數據時看到相同的數據。CPU 主機主要負責一致性管理,允許 CPU 和設備共享資源以獲得更高的性能并降低軟件堆棧的復雜性,從而降低設備總成本。
除了原始性能外,CXL還有其他優勢。該技術是開源的,不像美光的3D Xpoint,這是迄今為止最接近高性能內存互連的方法。美光和英特爾現在正在對沖他們對CXL的賭注,而不是專有技術。NVIDIA 和 AMD 的硬件系統還使用 CXL 來互連內存和外部處理單元,以優化性能。NVIDIA的GPU與CXL設計相結合,進行了如此廣泛的計算,并在內存設計中進行了一些更改。
這種轉變的最重要結果將是CXL消除專有內存互連。它是必不可少的,因為有幾種類型的企業存儲,每個處理器都通過專有連接訪問它們。這可能會使企業存儲基礎架構變得復雜,并且無法預測其性能。
現在,由于CXL,每個處理器都將能夠訪問所有類型的內存。這將允許單獨的處理器共享相同的內存池。它不僅對于數據中心至關重要,而且對于開發通常使用CPU,GPU和TPU的AI神經網絡和深度機器學習系統等技術也至關重要。
CXL 事務層協議
憑借與 PCIe 5.0 相似的帶寬,CXL 使用三種動態多路復用的事務層協議:CXL.io、CXL.緩存和 CXL.內存,以在 PCIe 上獲得優勢。
CXL.io 協議幾乎與 PCIe 5.0 相同。它用于設備發現、配置、寄存器訪問、中斷、虛擬化和批量 DMA。
CXL.cache 是一種可選協議,用于定義主機和設備之間的交互。這允許連接的 CXL 設備使用請求和響應方法以極低的延遲高效緩存主機內存。
CXL.memory 是一種可選協議,它使用加載和存儲命令為主機處理器提供對加速器連接的內存的直接訪問。加速器連接的內存被 CPU、GPU 或 TPU 視為額外的地址空間,從而提高效率并降低延遲。
CXL 對存儲的影響
CXL依賴于存儲,并將對其產生影響。它將允許存儲系統使用更大的內存池進行緩存。該技術有利于使用內存作為緩存的存儲應用程序或系統。這一點至關重要,因為雖然許多ISP定期限制帶寬,但臨時數據存儲正在成為數據中心性能的關鍵方面。
商用存儲系統中目前可用的最大 DRAM 緩存為 3 TB。盡管使用 MemVerge 或福爾穆盧斯黑色,但特定的軟件定義存儲可以使用英特爾傲騰 PMem 將該緩存擴展到 4.5 TB。但是,這對除最富有的組織之外的所有組織的緩存內存施加了硬性限制。幸運的是,CXL 通過允許存儲軟件跨多個存儲介質緩存數據來解決此問題。
審核編輯:郭婷
-
處理器
+關注
關注
68文章
19166瀏覽量
229147 -
云計算
+關注
關注
39文章
7736瀏覽量
137205 -
數據中心
+關注
關注
16文章
4691瀏覽量
71956
發布評論請先 登錄
相關推薦
評論