芯片制造商開始在同一個高級封裝中集成多種類型和風格的DRAM,為日益分布式的存儲器和更復雜的設計創造了條件。
盡管多年來一直有人預測DRAM將被其他類型的內存所取代,但它仍然是幾乎所有計算中的基本組件。它的足跡沒有消失,而是在增加,選擇的數量也在增加。
有幾個因素推動著這種擴張。其中包括:
系統中計算元素的數量和密度不斷增加,以更快地處理更多數據,特別是對于AI/ML和數據中心應用。更多的內核需要更多的內存,因為需要有一個地方來存儲和處理數據。
通常情況下,這其中的大部分將在緩存中處理,SRAM一直是L1到L3緩存的首選內存。但是SRAM不再以與數字邏輯相同的速度擴展。因此,它在芯片上占據了更大比例的空間,DRAM速度的提高使得一些類型的緩存適合L3緩存。
來回移動數據受到帶寬和距離的限制,因此僅僅在一個物理位置添加更多內存并不一定會提高性能。事實上,它可能會適得其反。
出于以上種種原因,芯片制造商正在使用更多的DRAM。在某些情況下,DRAM——尤其是高帶寬存儲器(HBM)——正在取代一些SRAM。DRAM在耐用性方面有著良好的記錄,也有成熟的工藝,而且比SRAM便宜得多。Objective Analysis總經理吉姆漢迪(Jim Handy)表示,根據原始數據,同樣容量的SRAM成本可能是DRAM的2500倍以上,具體取決于DRAM的類型。[1]
有一系列的動態隨機存取存儲器當然可以。有些很快,比如英王陛下,而且還貴。其他類型較慢但便宜,如基本DDR DIMMs。不過,有所改變的是,在異構架構中,兩者都可以扮演重要的角色,此外還有多種其他類型的DRAM和更具針對性的內存,例如MRAM或者ReRAM.
“我們正在尋找一種混合模式,在同一個系統中使用不同的DRAM技術,”微軟高級技術營銷經理科斯·吉切夫說節奏。“如果您真的需要非常高的性能,并且愿意為此付費,那么您可能會選擇HBM。您可以將它用于L3緩存,或者您需要立即訪問的任何東西。如果您仍然需要更多的內存,但是有一點延遲,您可以在RDIMM(已注冊的雙列直插式內存模塊)或MRDIMM(多路復用器等級的DIMM)。如果您正在尋找大容量,那么您可能會考慮后面的DRAM巨災超賠分保。該技術開始針對非常特殊的應用,具有真正的高帶寬和低功耗,更大的內存占用,但延遲稍長。將所有這些結合在一起是每個人解決這些問題的方向。“
就像高級節點或高級打包中的幾乎每一項改進一樣,解決一個問題會導致另一個問題。盡管如此,潛在的理論是合理的,在今天的市場上也有證據。例如,可能有必要讓一些功能以最高速度運行,如AI,這將使高帶寬內存成為最佳選擇。但并不是所有的功能都是必不可少的,也不是所有的功能都需要那樣的性能。在某些情況下,GDDR5或GDDR6可能就足夠了。在其他地方,可能是LPDDR,在其他地方可能是DDR4。所有這些都有不同的相關成本,這些成本可以通過來回移動數據的資源以及內存芯片的貨幣價值來衡量。
另一方面,并非所有的DRAM都是一樣的,只是添加不同風格的DRAM而沒有充分了解它們將如何影響其他組件會導致問題。重要的是以避免未來問題的方式集成它們,包括復雜的平面規劃,以避免信號完整性和防止熱量問題。眾所周知,DRAM和heat不太協調。但也有一些以前從未認真考慮過的新問題。
“DRAMs發展的大問題分為兩類——常見的問題(更多的帶寬和容量、管理電源),以及一些新的問題(更具挑戰性的可靠性,導致片內ECC和劃船錘保護),”斯蒂芬吳說,研究員和杰出的發明家蘭布斯。“對于新的挑戰,在芯片上放置更多的電容會增加片內錯誤的發生率,因此您現在看到的DRAMs會在數據返回控制器之前進行一些片內錯誤糾正。并且發生像RowHammer這樣的相鄰單元干擾問題,因為這些單元彼此非常接近,以至于訪問一組單元會導致非常接近的相鄰單元的位翻轉。”
哪里最有效
越來越多的選擇也讓人們很難決定使用哪些內存。DRAM的選擇通常基于性能、功耗、成本、可靠性(糾錯碼,以及充分測試和供應鏈安全)和容量。因此,如果DRAM將用于L3緩存,它可能需要高性能和低功耗。如果它將用于高級封裝中的低級功能,它可能是標準的DIMM。
但這些選擇中的每一種都會影響整體芯片或系統級封裝設計,并帶來特定的設計考慮。
“過去,DDR4和LPDDR4并不復雜,”產品營銷高級經理Graham Allan說新思科技。“一個客戶會啟用DDR4,另一個客戶會啟用LPDDR4,因此存在重疊。隨著DDR5和LPDDR5一代代的發展,這些應用領域已經完全不同,接口協議和物理信號也是如此。DDR5通常希望與成噸成噸的DRAMs(大容量)進行通信,因此您主要是與寄存器DIMMs進行接口。使用LPDDR,您通常只能與一個包裝或設備對話,并且該設備中最多有兩個負載。LPDDR也是地面終端。DDR端接到正電壓軌。這些是非常不同的物理接口和協議,這意味著客戶需要選擇一個或另一個。”
還有一些中間選項可以幫助在多個應用程序中使用相同的設計。例如,根據工作負載的不同,MRDIMMs可以用于將容量或帶寬翻倍。Allan表示:“多路復用器級DIMMs的容量和速度是SDRAM(同步DRAM)的兩倍。“它的美妙之處在于DRAMs不會改變。它以兩種不同的模式運行。它的運行方式類似于負載減少的DIMM,但速度不會翻倍。在這種模式下,您可以使用它來獲得更高的容量。或者它以多路排列模式工作,這使DRAMs和外部接口之間的帶寬加倍。”
那是畫面的一部分。另一部分是PHY或物理層,它為內存提供物理接口。phy因使用的DRAM類型而異,隨著數據量的增加和設計的日益多樣化,phy變得尤為重要。
phy還可以鏈接在一起成為一種主堆棧,以便管理復雜設備中的內存資源,無論該設備是GDDR6還是LPDDR4。這樣,所有類型的DRAM都可以被視為可用資源并進行集中管理。
公司副總裁兼總經理Balaji Kanigicherla表示:“通過管理帶寬的某種結構,一切都是可見和可尋址的瑞薩科技(公司名稱)基礎設施事業部。“這不僅僅是關于提高密度或記憶的物理學,這是材料科學。存儲器的應用架構是行業的發展方向。密度需要提高,因為您希望在相同的帶寬下獲得更大的容量。我們可以根據每美元或每千兆字節的路徑進行混合搭配,并且可以在SSD、DRAM和本地片上SRAM緩存之間使用分層。這將轉變為整個系統的總擁有成本,并考慮我們將為每一層支付的成本。”
這實質上提高了內存管理的抽象級別。Kanigicherla說:“你可以從當前的模式發展到在全球層面解決內存問題,并基本上創建足夠有效的互連來管理緩存或減少延遲。“這就像是全局可尋址內存的一個分區。很明顯,你需要提供帶寬。但好消息是,對于人工智能工作負載,它們對延遲不太敏感,對帶寬更敏感。所以你可以把這項技術放大。在CXL和UCIe之間,應該有一種更漸進的方式來分解內存,可能包括光學互連,并實現內存的完整全局視圖。但這需要整個行業來實現。這可不簡單。”
圖:系統DRAM的集中控制。來源:瑞薩
內存池是另一種選擇,并且在數據中心越來越受歡迎。內存池對DRAM的作用相當于超大規模擴展對處理器內核的作用。當需要額外的內存時,可以通過與額外的計算核心相同的方式獲得,通常通過CXL接口。
Rambus‘ Woo在最近的一次演講中說:“池化背后的想法是,如果我有一組服務器,它們每個都有內存,那么它們每個都不太可能同時使用所有的內存容量。”卡斯帕事件。“更有意義的做法是,將部分容量放入外部機箱,并像資源池一樣對待它。當處理器需要的內存超過機箱內的容量時,它們可以在短時間內取出并配置一些內存,將其用于計算,然后將其放回池中。這是讓很多業內人士感到興奮的新功能之一。再遠一點,一旦你做了這些類型的事情,你就可以開始考慮通過開關連接內存和池。CXL標準也允許多級交換。這種靈活性將有助于提高各種應用的性能和總擁有成本。”
其他記憶方法
除了更傳統的方法之外,DRAM正在向不同的方向發展。這部分是因為向異構集成和高級打包的轉變,以及更多的領域特定設計,部分是因為處理更接近數據源的好處。
“比較計算和DRAM,我們用17%的能量進行計算,用63%的能量將數據從一點移動到另一點,”的內存技術專家Jongsin Yun說西門子數字工業軟件。“這是相當大的能量。我們可以節約成本,提高速度和能效。當前的解決方案是在緩存中增加更多的內存,但這是一個昂貴的解決方案。我們不需要將所有數據都轉移到DRAM。我們可以在內存中進行一些計算,或者使用一些基于GPU的人工智能卷積,這樣我們就可以在不轉移內存的情況下進行計算。”
如今的選擇比以往任何時候都多,處于開發階段的選擇也更多。華邦例如,開發了一些基于DRAM的內存解決方案,但它們超越了傳統的DRAM使用模式。一個是該公司的單模立方體(定制超帶寬元件)架構。另一種是偽靜態DRAM,它介于SRAM和DRAM之間,不需要外部數據重寫。這兩者都是針對可穿戴設備和邊緣服務器等特定市場。
“現在最熱門的話題是生成式人工智能,”華邦電子美國公司的營銷主管CS林說。“但是,數據中心中發生的事情與我們關注的地方有著不同的要求,并且有著非常不同的密度。我們專注于16千兆字節/秒及以下的密度,但該解決方案可擴展至256千字節/秒。它以非常接近HBM2的帶寬運行,但具有非常低的功耗優勢。”
圖:立方體方法,延遲約25ns,5X單位密度高于14納米SRAM。來源:華邦
Lin說,這種方法的好處是能夠使用標準DRAM來提高性能,而不是依賴最先進的處理節點。通常,更高的密度會產生延遲,但CUBE架構使用數千個硅通孔來傳輸數據,這些通孔可以根據對更高帶寬或更高速度的需求進行靈活分配。這允許更細粒度的系統架構,以及更小的占用空間。
另一種方法是均衡化。這個計劃已經醞釀了一段時間,但最終似乎越來越有吸引力。Synopsys的Allan解釋說:“均衡改善了您在信道末端接收的數據。“簡單來說,這就像符號間干擾。當一系列位通過通道傳輸時,當一位完成時,實際上已進入下一位的時域。信號上升和下降以及從1到0的轉換需要超過一個單位的時間間隔。你不是從穩態低電位開始的。你正從一個更高的狀態開始。您使用決策反饋均衡來偏移輸入接收器中的采樣點。那么,我現在如何優化我的輸入接收器,使1和0檢測具有相似的裕量呢?我真的沒有感覺到有什么東西會把基準電壓正好放在中間。”
內存計算也即將出現。雖然已經有一些使用MRAM的商業方法,但普林斯頓大學的研究人員在2019年紙展示了FPGA中的外部DRAM控制器,它可以與現成的DRAM一起使用,以創建大規模并行計算。研究人員聲稱,這種方法克服了所謂的內存墻,即邏輯性能超過了內存帶寬。
權衡
那么,與DRAM相比,SRAM的使用量有多大呢?這沒有簡單的公式,因為這不是蘋果與蘋果的比較。
“真的沒有什么神奇的方法可以做到這一點,”首席技術官和聯合創始人王乘說Flex Logix。“我們的大部分設計權衡來自模擬SRAM帶寬、SRAM容量和DRAM帶寬的性能評估。這是我們的三個主要旋鈕。基本上,我們有四種標準規模的計算,不同數量的SRAM和DRAM帶寬適用于我們的標準IP產品。這是基于我們運行模型的經驗數據,以確定什么更好。如果我們有兩倍的SRAM容量,一些型號可以運行得更好。如果通過將SRAM增加一倍,您的性能幾乎可以增加一倍,并且您將另外20%的面積用于2倍性能,那就太好了。但是,還有許多其他型號無法從額外的SRAM中受益,這樣一來,你就白白增加了那個區域。這就是擁有準確的周期性能評估非常重要的原因。在我們的例子中,它不精確到單個周期,但它精確到8%,這超過了我們所需要的。然后,您可以對適當的SRAM/DRAM計算權衡進行大量架構分析,這可能因工作負載類型而異。”
這是復雜的數學,隨著系統被分解成異構元素,如小芯片,它變得更加復雜。“SRAM需要每比特更多的晶體管來實現。的首席產品經理Takeo Tomine說:“與DRAM相比,它的密度更低,價格更貴,讀寫時的功耗也更高。”Ansys。“目前,SRAM是在CPU通常采用的先進finFET技術節點上設計的,由于finFET器件的熱阻較高,因此更容易受到熱效應(自熱)的影響。”
在某些情況下,使用什么類型的內存,以及在哪里使用,可能會歸結為設備的預期壽命。“有兩個主要的可靠性問題會導致記憶壽命的縮短,”Tomine說。“一個是互連可靠性與技術節點縮小導致存儲器的壽命,因為自熱導致嚴重的電遷移(EM),這是最關鍵的可靠性問題之一。隨著技術的發展,材料和工藝技術不斷提高電磁壽命。第二是來自不同設備架構的可靠性挑戰。在將器件架構從finFETs轉移到納米片再到CFETs的過程中,熱阻率急劇增加,這意味著器件溝道的δT更高。器件自熱將與金屬焦耳熱耦合。器件的自熱會影響柵氧化層擊穿(時間相關的介電擊穿),還會降低HCI(熱載流子注入),這會惡化器件的BTI(偏置溫度不穩定性)。”
可靠性是對存儲器設備在給定時間內無故障運行的能力的度量。智能手機的預期壽命為4年,而汽車、軍事或金融服務器應用的預期壽命可能為10至15年(或更長),因此這一時間框架可能會有很大不同。能夠理解可能影響存儲器壽命的潛在交互是至關重要的,并且它們可能因架構、存儲器類型和使用而異。
這也會影響所使用的內存類型和整個系統架構。因此,如果記憶可以被交換,那么壽命就沒有那些記憶被嵌入某種高級包裝并密封起來那么重要。“這就像有一個DRAM卡池,今天就可以升級,”瑞薩的Kanigicherla說。“使用HBM,如果出現問題,你什么也做不了,所以你扔掉了一個非常昂貴的芯片。在CPU方面,服務器連接得非常緊密,您無法做太多事情來升級任何東西。這就是為什么這個全局共享內存的概念是可行的。其中一些解決方案會自動出現。”
延遲增加了另一個權衡。“尤其是HBM,你把處理器和DRAM放得很近,”Cadence IP Group產品營銷總監Frank Ferro說。“這樣做有很多好處。HBM發展相當迅速。我們幾乎每兩年就會看到性能的提高。所以曲線很陡。但是從系統設計的角度來看,2.5D仍然是一個挑戰。優化內插器并幫助客戶設計,這確實是對話的關鍵部分。”
結論
自1967年發明以來,DRAM一直是計算的關鍵。雖然多年來無數的內存技術對它提出了挑戰,但沒有什么能取代它。鑒于圍繞這項技術的狂熱活動,在可預見的未來,沒有什么能取代它。
現在的DRAM不止一種類型,而是多種類型,每種類型都在不斷發展,并產生新的想法。從內存到處理元件的物理連接,到服務器機架外的內存池,每個層面都有創新。目前正在努力縮短信號在內存和處理器內核之間的傳輸距離,這將減少傳輸數據所需的電量和每個周期所需的時間。
總的來說,DRAM仍然是一個充滿活力和創新的領域,而且還會有更多的創新和不同的方法來整合一個對性能、成本、可靠性和壽命有重大影響的內存解決方案。
審核編輯:黃飛
-
DRAM
+關注
關注
40文章
2282瀏覽量
182972 -
sram
+關注
關注
6文章
757瀏覽量
114450 -
數據中心
+關注
關注
16文章
4517瀏覽量
71637 -
芯片制造
+關注
關注
9文章
597瀏覽量
28685 -
HBM
+關注
關注
0文章
332瀏覽量
14613
發布評論請先 登錄
相關推薦
評論