01什么是框級冗余策略
普通RAID模式(盤級冗余)是把CHUNK打散到不同的硬盤上,支持不超過RAID冗余能力的硬盤故障,不能直接支持硬盤框故障。
金融核心交易系統等核心業務場景對存儲系統的可靠性提出了更為苛刻的訴求,要求存儲設備能容忍單個硬盤框故障。
基于此,存儲系統的框級冗余策略應運而生。當存儲池具備框級冗余能力時,可以實現:
RAID 6和RAID 10支持單硬盤框故障,業務不中斷、數據不丟失。
RAID-TP支持單硬盤框故障后,其他硬盤框再故障單塊硬盤,業務不中斷、數據不丟失。
故障的單盤在熱備重構完成后,支持再故障單個硬盤框。
故障硬盤框恢復后,自動恢復框級冗余的能力。
02框級冗余策略的實現原理
框級冗余是在滿足盤級冗余的前提下,考慮硬盤和框的歸屬關系。這里,我們以系統配有4個框,每個框配置3塊硬盤為例進行介紹。
框級冗余策略的實現原理如圖1所示。圖中,相同顏色的CK組成一個CKG。
為了支持單硬盤框故障不斷業務,在選盤組RAID時,需要保證每個CKG的CK盡量來自于不同的框,并且來自每個框的CK列數不能超過RAID冗余。因此,配置RAID6時每框最多選2列,這樣即使框故障后,每個CKG只丟失2份數據,未超出CKG的冗余數量,業務不中斷。同時,為了使RAID-TP能支持單框故障后再故障單塊硬盤,我們讓RAID-TP每框最多也只能選2列。
即存儲系統在組CKG時會優先跨框分配Block,保證CKG在每框選盤不超過2盤。
為了支持故障的單盤在重構完成后不縮列,還能繼續支持單框故障,我們讓CKG的分條長度再減一,即RAID列數(N+M) = 2*K - 1。其中,K為組成存儲池的硬盤所屬的框(控制框+硬盤框)的個數。例如,上圖中的RAID列數 = 2*4 - 1 = 7,即每個CKG的分條長度為7。
03存儲池的冗余能力
存儲池為框級冗余策略時,存儲池的冗余能力狀態可以是框級冗余、盤級冗余和無冗余。
框級冗余能力
框級冗余策略的存儲池在正常運行時,具備框級冗余能力,支持單硬盤框故障,業務不中斷、數據不丟失。
盤級冗余能力
由于框掉電、多盤故障等導致存儲池不能繼續保持框級冗余能力時,存儲池將變為盤級冗余能力,此時支持不超過RAID冗余能力的盤故障。
當故障恢復且存儲系統完成冗余恢復后臺任務后,存儲池將恢復具備框級冗余能力,重新支持單硬盤框故障,業務不中斷、數據不丟失。
無冗余能力
處于盤級冗余能力的存儲池,若盤故障再超過RAID冗余能力,存儲池將變為無冗余能力。
原文標題:閃存存儲如何通過框級冗余策略提升設備可靠性
文章出處:【微信公眾號:華為產品資料】歡迎添加關注!文章轉載請注明出處。
審核編輯:湯梓紅
-
硬盤
+關注
關注
3文章
1292瀏覽量
57243 -
存儲
+關注
關注
13文章
4266瀏覽量
85686 -
冗余
+關注
關注
1文章
109瀏覽量
20187 -
RAID
+關注
關注
0文章
273瀏覽量
35061
原文標題:閃存存儲如何通過框級冗余策略提升設備可靠性
文章出處:【微信號:huaweidoc,微信公眾號:華為產品資料】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論