磁盤陣列(raid)是一種將多塊物理硬盤整合成一個虛擬存儲的技術。raid模塊相當于一個存儲管理中間層,上層接收并執行操作系統及文件系統的數據讀寫指令,下層管理數據在各個物理硬盤上的存儲及讀寫。相對于單獨的物理硬盤,raid可以為用戶提供更大的獨立存儲空間,更快的讀寫速度,更高的數據存儲安全及更方便的統一管理模式。磁盤陣列的正常運行是保障服務器中數據正常讀寫的關鍵。
服務器raid常見的故障表現:
1、Raid中多塊物理硬盤的指示燈報警。
2、Raid中多塊硬盤離線。
3、Raid信息丟失,物理硬盤不是online狀態。
4、無法進入raid管理界面或查看raid相關信息時死機。
服務器磁盤陣列故障原因分析:
1、Raid中的單塊硬盤出現物理故障。
2、Raid數據傳輸通道不暢或者數據傳輸模塊老化。
3、服務器系統更新、重啟或服務器意外斷電導致raid信息丟失或raid模塊損壞。
4、Raid模塊升級或重裝系統導致raid信息丟失或被重建。
5、錯誤插拔Raid中的物理硬盤或者強制硬盤online/rebuild。
服務器raid常見的故障的數據恢復方案:
1、將磁盤陣列中所有運行狀態良好的非熱備盤完整鏡像備份到帶有冗余功能的安全存儲中,對于存在物理故障的硬盤則按照相應故障類型的解決方案處理,盡可能將故障物理硬盤中的數據鏡像備份至安全存儲中。
2、基于所有硬盤鏡像文件分析,確定故障raid的原結構參數(raid級別、條帶塊大小、硬盤盤序、數據校驗方式等),還需要判斷故障raid中各硬盤的離線情況。
3、根據分析所獲取到的raid參數及硬盤離線情況在只讀環境中重新構建raid,并對新建raid進行邏輯校驗。確定文件系統結構無誤后將raid生成完整鏡像。
4、對生成的raid鏡像進行完整的邏輯分析和校驗,若文件系統仍存在不一致的情況則依據相應文件系統損壞情況的解決方案進行修復,直至遷移出所有需要的數據。
服務器Raid出現故障后的關于數據安全的Tips:
1、切忌再次讓硬盤磕碰或者受到其他物理傷害。服務器raid中任何一塊硬盤對于數據恢復都非常重要,如果有硬盤出現嚴重物理損壞,數據恢復難度將呈幾何倍數上升,甚至無法恢復raid數據。
2、切忌重新創建raid或者強制online/rebuild。
3、切忌非專業人士對故障raid的模塊進行拆卸、更換等操作,不當操作很有可能對服務器raid中的數據造成嚴重破壞,甚至導致數據無法恢復。
審核編輯 黃宇
-
服務器
+關注
關注
12文章
8704瀏覽量
84577 -
RAID
+關注
關注
0文章
263瀏覽量
34982 -
數據恢復
+關注
關注
10文章
507瀏覽量
17211
發布評論請先 登錄
相關推薦
評論