11月1日,在2023云棲大會上,阿里巴巴平頭哥發布旗下首顆為云計算場景深度定制的SSD主控芯片鎮岳510,正式進軍企業級SSD市場!
平頭哥這顆SSD芯片
從性能看,可以支持3400K IOPS的能力,在業界屬于第一梯隊。一枚鎮岳510的性能,相當于1萬塊高性能HDD的性能總和。
從能效比來說,每瓦功耗可提供420K IOPS的性能,是業界領先水平。
從時延角度看,實現了業界領先的超低的時延(4μs),比業界SSD降低30%以上。
從可靠性來說,誤碼率低至10^-18的UBER,相當于每讀取百億億筆數據,才可能有一筆數據糾錯失敗,比業內標桿領先一個數量級。
從第一款當時全球性能最強的AI專用芯片含光800,到高性能RISC-V架構處理器玄鐵910,再到首款CPU芯片倚天710,平頭哥在給自家產品的取名上,就偏愛用中國上古和武俠中的“神兵利劍”來命名。而這次的鎮岳510,更是玄鐵所鑄的高性能、高可靠、高能效及低延時的鎮岳利劍!
阿里盤古遇上鎮岳,必將所向披靡!平頭哥SSD產品負責人周冠鋒透露說,鎮岳510馬上就要進入量產階段,將率先在阿里云數據中心部署。這顆取名鎮岳510的芯片,定位于高端大端口企業級SSD,可應用于AI、在線分析、在線交易、大數據分析、高性能數據庫等云上應用場景。
01
首顆SSD芯片是如何煉成的
為什么這個時間點推出?
算力、網力、存力,共同構筑了云計算的基礎。在云服務和AI計算需求逐漸旺盛的背景下,芯片的布局不僅關系著云廠商的成本,更是企業生態發展的重要一步。
為了滿足云上業務的迅猛發展,網絡正從25GE、100GE、200GE快速演進,并將進入400GE、800GE時代。而以SSD為代表的存力,同樣面臨著新的挑戰和訴求。
SSD是計算機系統的核心存儲部件,涵蓋閃存芯片(數據的最終存儲地)、內存芯片(用于暫存SSD內的眾多管理表項、數據緩存)以及SSD主控芯片。SSD主控芯片是SSD的大腦,負責主機交互、協議解析與執行、數據讀寫、數據糾錯、數據管理、后臺任務、帶外管理等。可以說,SSD的功能、性能與可靠性均由其實現。
SSD每隔三四年會進行一次產品迭代演進。之前會從PCle3.0、 PCle4.0到今天,2023年是SSD從PCle4.0到PCle5.0的一個演進節點。
周冠鋒表示:“因此,平頭哥就提前規劃了這顆PCle5.0的SSD芯片來應對市場上的這個趨勢。”
鎮岳510,是一顆怎樣的芯片?
鎮岳510采用平頭哥自研的芯片架構,內置高性能的玄鐵910 RISC-V多核CPU,采用平頭哥自研緊耦合芯片架構,對SSD任務進行高度抽象,可固化任務硬化為加速算子以提升性能。FTL關鍵任務則運行于玄鐵910CPU以保持靈活性。
整個資源架構里面大量的采用了硬件加速模塊,可以實現非常高的性能,實現了很高的能效比。因為獨創設計了創新的前端IO硬件自動處理機制,由專用硬件模塊自動完成,實現了業界領先的超低的時延(4μs),比業界SSD降低30%以上。不僅如此,鎮岳510芯片內實現了IO/SYS/GC的全鏈路隔離,極大的降低這些任務之間的相互干擾,提供了既低又穩定的時延表現。
此外,鎮岳510內置平頭哥自研的高性能LDPC糾錯算法,編碼效率逼近香農極限,同時ErrorFlow相比業內SSD更優一個數量級;同時借助平頭哥自研閃存電壓預測算法,可以在各種閃存的不同工況、壽命、溫度等條件下,準確預測閃存電壓漂移,進一步降低LDPC解碼器的輸入誤碼率。其實現了低至10^-18的UBER,相當于每讀取百億億筆數據,才可能有一筆數據糾錯失敗。
綠色、減碳是云數據中心的一貫追求。以更低的功耗,提供更高的性能,是SSD的重要挑戰。鎮岳510每秒可處理高達340萬筆IO,一枚鎮岳510的性能,相當于1萬塊高性能HDD的性能總和。
此外鎮岳510擁有極高的能效比,每瓦功耗可提供42萬筆IO訪問。以一個部署了10萬塊SSD的數據中心為例,相比目前主流的PCIe 4.0SSD,鎮岳510在相同的性能下,僅主控芯片即每年節省260萬度電,按照一度電排放0.785千克二氧化碳計算,每年可減少二氧化碳排放2千噸。
平衡靈活性和高效能的關鍵:軟硬件協同發展
SSD主控芯片其實也是一種SOC, 它內部既有硬件模塊,也有CPU核。事實上,SSD主控芯片并不是一種標準化的設計,每一家公司的設計方案都不太相同。業界SSD主控芯片的架構設計有兩大趨勢,一種類似純SOC, 即由軟件主打的設計方案;另一類是軟硬件結合的設計方案。
鎮岳510屬于后者。
周冠鋒介紹說,鎮岳510自2021年上半年立項后,耗費了非常長的時間去反復論證芯片的架構設計。芯片設計其實是一個權衡的過程,如果把過多的功能卸載,使用硬件加速來實現的話,那么這顆芯片的靈活性就會比較差。但如果把過多的功能交由CPU軟件來使用的話,它的靈活性同樣會比較差。如果既能通過硬件加速獲得高效的同時,仍能保留使用CPU來運行一些關鍵的軟件任務,這樣獲得的靈活性將會大大提高。
鎮岳510采用的是平頭哥自研的芯片架構。這顆芯片支持PCle5.0的主機接口,支持DDR5.0的內存接口,內置了高性能的RISC-V CPU。此外,整個資源架構里面采用了比較獨特的硬件加速模塊,在應用中進行大量的卸載加速,能實現高性能與低能耗。
所以鎮岳510可以實現非常高的性能。大批量的硬件加速模塊的使用,極大的提高了產品的能效比,達到每瓦420k IOPS性能。除此之外,鎮岳510還實現了非常低的訪問時延。這也是因為平頭哥獨創的設計了前端IO的硬件自動處理機制。
在EETOP特別針對RISC-V的提問中,周冠鋒最后總結說到:“RISC-V這顆CPU和它的指令集都非常精簡,運行效率也很高,同時它還是開源的,所以平頭哥SSD芯片的設計團隊最終選擇了我們認為一個最平均、最平衡的一個設計方案。”
02
鎮岳510,為云做了哪些定制
首先,在傳統的系統方案中,SSD與存儲系統分離設計。SSD負責底層閃存數據排布,但由于沒有存儲語義而無法達到最佳排布;SSD負責后臺任務,但無法判斷最佳啟停時機;而存儲系統有存儲語義卻無法排布閃存數據,有最佳時機卻無法啟停SSD后臺任務。上下的割裂給整個存儲系統的性能與壽命帶來了額外消耗,這被稱為“SSD接口稅”。
解決辦法就是ZNS。它是一種標準的協議接口,2021年5月被收入NVMe2.0協議中,并得到了SPDK、Linux以及各設備商的支持。ZNS通過將盤內FTL層上移至存儲系統,達到了存儲系統與閃存特性的完美匹配,消減了“SSD接口稅”。
鎮岳510完美實現了ZNS協議,通過靈活的硬件表項加速保持了高IO性能,而Zone分區狀態則交由玄鐵910CPU維護,保留了對新協議的靈活性。此外,鎮岳510定制了Last Sector 隨機寫功能,實現了小報文的多次反復下盤,簡化了ZNS的應用難度。
其次,數據請求可以分為帶寬敏感型與時延敏感型,不同的請求應予以不同的處理策略,才能達到業務最佳SLA。NVMe規范中制定了以隊列為粒度的標準SQ調度機制,但其靈活性較差,對于業務種類復雜、追求靈活可配的云存儲系統來說,它并不是最佳選擇。
鎮岳510在支持NVMe標準的SQ調度機制的同時,額外定制了基于IO粒度的優先級調度機制,允許系統按IO打標,優先級種類多達8級,結合云存儲系統,能夠更好的保障延遲敏感型業務的服務質量。
此外,云存儲系統的完整數據鏈路,從計算端開始,通過網絡到存儲服務器,再通過內部互聯到達SSD。為了保障數據的高可靠,全鏈路應采用語義一致的完整性校驗。但NVMe規范只規定了以Sector為單位按照T10 DIF/DIX的校驗機制,與存儲系統的語義并不相同,因此SSD的校驗與存儲系統的校驗產生了差異。
鎮岳510以IO為粒度,遵循上層存儲語義進行校驗,補齊了整個存儲系統的數據鏈路校驗的最后一環。不僅如此,鎮岳510還支持以存儲語義對內部數據進行后臺巡檢,而無需再讀出至服務器,節省了寶貴的PCIe帶寬、服務器內存帶寬與CPU算力。
周冠鋒介紹說,因為云廠商,尤其是阿里云擁有全棧的軟件的核心技術。所以在這種情況下,平頭哥有機會通過阿里云與軟件棧和底層芯片之間做配合,來實現更好的特性,更好的實現云上應用性能的提升。并且,隨著云技術進入深水區,云開始與底層芯片全方位融合聯合設計,可提供更好的用戶體驗。
不過,鎮岳510的生命力肯定不僅僅在阿里云上止步。鎮岳510其實是為云上應用做優化的,它不僅僅可以適用于阿里云。因其具備的更強存力、更高可靠等特點,可通過為云定制,帶來更優秀的存儲體驗。
周冠鋒表示:“其實在外部的不同的云環境下都是適用的。只是,鎮岳510會首先在阿里云上上線使用!”
03
結束語
平頭哥的業務重心是在數據中心領域的芯片開發。數據中心領域的芯片,一類是純計算類芯片,一類是存儲類芯片。此前平頭哥推出過多款性能強勁的芯片,如含光800 AI專用推理芯片、倚天710首款通用CPU芯片等。但它們都屬于算力芯片,而這一次平頭哥實現對自己的突破,設計出自己的第一顆企業級SSD芯片,補齊其在存儲領域的空白。相信對平頭哥來說,是一次里程碑式的突破。
憶平頭哥初創的決心:要為國內的芯片行業貢獻出自己的一份力量。自2019年成立以來,短短幾年時間,平頭哥一次又一次為***交上力滿意的佳作,刷新業界對平頭哥的認知,更刷新大家對中國芯片企業實力的認知!
平頭哥已經掌握了SSD主控芯片設計的全部技術。一顆芯片要想有更強的生命力,就需要對它的應用場景有深入的理解,才能更好的用在用戶場景下。平頭哥對阿里巴巴的業務,尤其是阿里云業務有更深刻的理解。平頭哥跟阿里云聯合定制,使得這顆芯片在云上應用的時候,可以讓整個存儲系統的性能、能效和服務質量更好。
對于平頭哥在SSD領域未來的發展,周冠鋒表示:“我們還將繼續沿著高端企業級這條路線進行演進,不過不會拓展到消費級和車規工規級。”
-
SSD
+關注
關注
20文章
2851瀏覽量
117247 -
芯片行業
+關注
關注
1文章
28瀏覽量
7868 -
平頭哥
+關注
關注
0文章
64瀏覽量
9034
原文標題:平頭哥發布首顆PCle5.0 SSD主控芯片鎮岳510!4μs超低時、誤碼率領先行業標桿一個數量級!
文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論