來自中國閃存市場的統計顯示,2018年全球SSD的出貨量達到2.05億塊,比2017年增長31%,預計2019年總出貨量有望超過2.5億臺。三星、SK海力士、英特爾及美光、東芝及WD等國際巨頭,正在投入96層高容量3D NAND出貨。
而浪潮存儲2018年SSD整體出貨量超過百萬臺,速度較2017年有150%的增長。8月23日,浪潮存儲資深技術專家王杰華在杭州舉行的2019全球閃存峰會(Flash Memory World)上透露,2018年,浪潮SSD的客戶70%為數據中心,僅有30%為行業客戶,但在2019年,行業客戶已經上升到40%。
這意味著,SSD已經從領先者的數據中心市場,滲透到了向電信、金融、能源等通用行業市場。
浪潮的介入,使原本激烈的SSD市場競爭更加白熱化。
深度分析結果顯示,浪潮SSD產品的應用分類在2018年有35%是NVMe,65%為SATA。王杰華在題為《SSD與企業系統的應用和融合》的演講中預測,2019年這個比例將各占一半。
也就是說,NVMe市場占有率仍將持續攀升。
浪潮系統級和部件級兩方面應對措施
針對NVMe市場占有率仍將持續攀升的市場趨勢,王杰華指出,浪潮分別從系統級和部件兩個方面來應對。
在部件級,浪潮經過三年研發推出了全自主軟硬件設計的NVMe SSD,它支持最新協議NVMe1.3,提供一個標準2.5寸單雙端口,容量從2TB可擴至32TB,規格支持64層(標準版可升級到96層),整體擦寫次數提升40%,壽命更長。
得益于一些相關的軟件平臺,浪潮還可以根據客戶的要求提供類似隨機讀寫性能的靈活定制,安全、功耗、支持備份等方面也都滿足客戶數據方面的要求,達到了業界一流的水準。
在系統級,浪潮全閃存儲G5基于一套架構實現NVMe和SAS全支持,未來還可支撐NVMe Optane,在內存和NAND之間增加新的性價比Tier;采用超高速PCIE 3.0互聯架構,最大可擴展48個控制器,可實現6個9的可靠性。此外,浪潮全閃存儲G5具有獨特的異構虛擬化技術,可以異構業界Top10廠商95%以上的主流存儲型號,且異構存儲數據遷移無需停機,實現業務無中斷的全閃存儲切換,也可支撐存儲雙活或提供兩地三中心解決方案。
浪潮SSD的兩大系列
目前,浪潮自研SSD產品有高端和主流兩個系列。
高端SSD容量包括1.6TB、3.2TB、6.4TB,3DWPD規格,接口15毫米的厚盤2.5寸,AIC卡,采用64層NAND,與業界頂級產品完全看齊,其保守的功耗數據為7-25W,實際上最大功耗低于21W。
高端系列將于年底前上市。
在主流SSD方面,浪潮主打容量為1.92TB和3.84TB規格,1.2DWPD,NVMe協議升級到1.3,NAND將支持到96層NAND。
主流系列將于明年年初上市。
浪潮SSD:三個發展階段演變
回顧三年來自身的SSD發展歷程,浪潮總結為三個階段:從性能、功能到業務融合。
在性能方面,NVMe將NAND和PCIe結合在一起,推動性能大幅度上升,將SSD引入性能競爭賽道,迫使友商不得不拉升各種性能標桿。
為了性能,浪潮自研SSD做了大量工作,主要分享兩個技術點:
一個是針對大容量(8TB以上)SSD進行特殊散熱優化。大容量SSD的PCB通常采用疊層設計,當PCB折疊后,上表面和下表面都跟外殼接觸、解決部分散熱問題,但中間層沒有散熱片。浪潮采取在中間加入一個微槽道散熱器貼近內表面上下兩層的NAND傳導熱量,并通過SSD中間風道排出多余熱量。這種方式能夠降低NAND表面溫度8攝氏度左右,優化幅度達到20%。
另一個稱為”場景化的動態閃存管理算法”,是浪潮聯合世界頂級NAND專家創新設計的NAND特性自學習算法模型,目的是提升固態盤性能、延長NAND壽命。
要對NAND基本特性進行分析,就需要將SSD盤運行期間的擦除次數、讀計數、保持時間、溫度等若干指標分解成不同場景。為此,浪潮先后測試了500多個NAND顆粒,原始數據超過1TB,經過各種優化和算法形成的初始NAND特性數據超過200MB。將這些場景數據輸送到中間算法中,然后參考初始特性數據,就會得出不同場景下,不同擦除次數、不同讀計數、不同的溫度等情況下最優的讀取電壓。
這是一個動態的調整過程。經過一系列完整的算法運行后達到兩個效果。一是把整盤NAND壽命從7K P/E提升到10K P/E,提升40%,這意味著未來SSD盤壽命更長,而對客戶來說使用成本更低,二是保證SSD生命末期時QoS不會下降。
在NAND技術成熟、NVMe協議越來越完善之后,功能就取代性能成為第一考慮要素。
在功能方面,浪潮一方面實現了全閃盤控協同生命周期的管理以及非中斷的業務升級。為了適配SSD變化,全閃系統對IO棧進行了一些重構,以便更好利用閃存特性,更好的實現系統級的盤控協同。
為此,浪潮充分發揮控制器的極值,并在軟件方面進行大量優化,體現在豐富原子寫、啟動盤、多Namespace、SMART、帶內帶外管理、NVMe-MI、溫控、異常掉電保護、固件鑒權加密等基本功能,以及各種各樣跟傳統HDD市場實現兼容的新功能,甚至與全閃系統進行適當整合。
在業務融合方面,浪潮從去年開始陸續推出更多新的技術,除了新架構的變化,還有新介質,這些都是為了適配上層應用。
針對SSD的失效模式,浪潮在對全閃進行了相應應對,比如故障預防、數據保護、溫度檢測、風扇轉速調整、壽命預測、故障巡檢等一系列措施,避免同時出現壞塊,導致數據無法恢復的情況。
這些措施可以使SSD的故障率在全閃系統里下降60%,實現自動化壽命管理。
標準SSD功能支持非中斷業務升級,系統不重啟或不中斷業務下,3秒中之內完成對設備固件的升級,整個過程中對于業務完全不感知。
為了實現這個目標,浪潮SSD保證在升級的時候PCle鏈路不中斷,讓SSD依然響應基本PCle操作,同時還要求任何NVMe命令不能超時30秒。
未來SSD三新:新架構、新協議和新介質
王杰華認為,新架構、新協議和新的介質,驅動整個存儲行業架構的軟、硬件交替更新,并且推動了全閃存行業的發展。
新架構
從前兩年FMS(全球閃存峰會)上火熱的Open Channel到剛剛過去的FMS大會上提到的Zone Namespace,呈現出這樣一個明顯的趨勢,即規范越來越標準化,跟業務結合更緊密,跟生態環境更友好。
在Open Channel架構下,SSD只做包括錯誤處理,磨損均衡,介質管理在內的一些基本命令解析。在HOST會運行比較復雜的FTL,做數據排布、垃圾回收,在HOST和SSD之間用PU 并行單元進行交互,中間交互及底層驅動都是非標準的。
ZNS同樣繼承Open Channel的理念,但標準化層面做的更好。SSD側也只運行簡單的FTL,負責基本的錯誤處理,磨損均衡和介質管理,在HOST側有較為復雜的FTL,完成數據排布、垃圾回收這樣的工作。此外,主機側包含了ZBD驅動,構成一個完整的軟件架構。
對比Open Channel和ZNS,從技術角度,后者因為Mapping table以Zone為單位,占用內存更少一些。在主機側可以復用現有的SMR硬盤軟件驅動架構,標準化程度更高。
從應用角度,因為是一個非標設備,Open Channel實際應用中現有的業務和運維面臨的挑戰都比較大,對其推廣使用造成阻力。
從生態環境,目前主要的HDD與SDD廠商并沒有清晰的Open Channel規劃,相反都有類似SMR的硬盤。ZNS的很多軟件架構已經進入到Linux主線版本,具有更好的開發者生態環境,因此更有前途,明年中有可能納入到NVMe的規范中。
新協議
Multi-Namespace在NVMe1.1協議中已經具備,最初用于邏輯資源的劃分以解決SSD盤容量過大的問題。
隨著協議的演進,NVMe1.3中出現了Multi-Stream這樣的概念,本質上是用戶端將很多帶有業務標識的數據IO發送給SSD并跟Namespace綁定。這時一些業務已經開始和Namespace與SSD有比較強的關系。
NVMe1.4中,NVMe Set/IOD在與業務結合方面更加極致,從業務到邏輯層,再到實際物理層進行完整切分,解決了互相干擾的問題,同時保證QS指標。
新介質
TLC、DRAM、SCM、MRAM、PCM這樣的介質各具特點。如何利用這些介質?同樣要跟上層業務數據進行強關聯。
例如,TLC比較適合存放溫數據和通用持久數據,SCM更適合熱數據,浪潮更看好MRAM,原因在于MRAM在性能方面最接近DRAM,有機會取而代之。此外,MRAM也可以在盤上做數據的寫緩存,既可以實現大容量,同時又能保證掉電不丟失。
新介質支持更多Multi-Stream數,目前Multi-Stream支持個數通常為8-16,但一些超大規模數據中心客戶對Multi-Stream要求甚至希望上百,而這是當前Write Buffer方案無法滿足的。MRAM就是最好的選擇。
總結
王杰華總結說,SSD從早期的性能優先,包括低功耗、低延時、長壽命特性到偏重各種各樣的功能,再圍繞著業務價值逐步提升,Multi-stream、NVMe Set、ZNS、異構介質存儲等概念層出不窮,體現出三個不同階段發展趨勢和變化。
浪潮的新存儲之道 “云存智用 運籌新數據” 與SSD密切相關,浪潮的分布式存儲平臺與統一存儲平臺為SSD進行了IO棧重構,實現了SSD健康管理和AIOps。
未來SSD市場,還將會有更多的新技術、新產品和新方案問世。
評論
查看更多