hbase+hive分布式存儲數據恢復環境:
16臺某品牌R730XD服務器節點,每臺物理服務器節點上有數臺虛擬機,虛擬機上配置的分布式,上層部署hbase數據庫+hive數據倉庫。
hbase+hive分布式存儲故障&初檢:
數據庫文件被誤刪除,數據庫無法使用。
通過現場對該分布式環境的初步檢測,發現虛擬機還可以正常啟動,虛擬機里面的數據庫塊文件丟失。好在塊文件丟失之后沒有對集群環境寫入數據,底層數據損壞可能性比較小。
hbase+hive分布式存儲數據恢復方案:
1、備份。
A、從物理服務器底層做備份,將設備斷電、關機。將所有磁盤編號后從服務器/存儲中取出。
B、從虛擬機層面備份,通過網絡直接備份虛擬機底層磁盤文件。
C、北亞企安數據恢復中心準備一臺服務器以只讀方式掛載服務器硬盤,對所有磁盤進行扇區對扇區的全盤鏡像備份。
D、備份完成后提供詳細報告,內容涉及所有磁盤的健康狀態和存在的壞道列表。
E、將服務器硬盤按照編號還原到原服務器/存儲設備中,之后數據分析和數據恢復操作都基于鏡像文件進行,避免對原始磁盤數據造成二次破壞。
2、基于鏡像文件分析塊文件結構。
A、分析每個虛擬機磁盤的塊文件。
B、分析文件底層的聚合方式。
C、分析磁盤中數據分布情況。
3、分析Block文件key。
A、定位數據庫文件中的key信息。
B、提取并解析數據庫文件中key信息。
C、整合數據庫文件key信息。
4、拼接Block文件。
A、根據Block文件的key信息提取文件片段。
B、拼接Block文件的片段。
C、校驗拼接后的Block文件的正確性。
5、導入Block文件。
A、校驗提取出來的Block文件完整性和正確性。
B、把提取出來的Block文件導入到hbase和hive數據倉庫中。
6、驗證數據。
由用戶對數據進行詳細驗證。如果發現問題則重新檢驗上面的恢復流程。
審核編輯 黃宇
-
數據恢復
+關注
關注
10文章
507瀏覽量
17202 -
分布式
+關注
關注
1文章
824瀏覽量
74396
發布評論請先 登錄
相關推薦
評論