分布式存儲數(shù)據(jù)恢復環(huán)境:
16臺物理服務器,每臺物理服務器上有數(shù)臺虛擬機;
虛擬機上配置分布式,上層部署hbase數(shù)據(jù)庫和hive數(shù)據(jù)庫。
分布式存儲故障&分析:
誤刪除數(shù)據(jù)庫底層文件,數(shù)據(jù)庫不能使用。需要恢復hbase和hive數(shù)據(jù)庫。
通過現(xiàn)場對用戶環(huán)境的檢測,數(shù)據(jù)恢復工程師發(fā)現(xiàn)虛擬機還可以正常啟動,虛擬機上的數(shù)據(jù)庫塊文件丟失。塊文件丟失之后沒有新的數(shù)據(jù)寫入操作,底層的數(shù)據(jù)損壞可能性比較小。
分布式存儲數(shù)據(jù)恢復過程:
1、備份。
對物理服務器底層做備份。通過網(wǎng)絡直接備份虛擬機底層磁盤文件。
準備一臺服務器,以只讀方式掛載所有服務器硬盤,使用磁盤備份工具進行扇區(qū)級別的備份。
2、分析塊文件結(jié)構(gòu)。
分析每個虛擬機磁盤的塊文件&文件底層的聚合方式&每個磁盤中數(shù)據(jù)的分布情況。
3、分析Block文件key。
定位&提取并解析數(shù)據(jù)庫文件中key信息,整合數(shù)據(jù)庫文件key信息。
4、拼接Block文件。
根據(jù)Block文件的key信息提取文件片段,拼接提取出來的Block文件片段并校驗拼接出來的Block文件的正確性。
5、導入Block文件。
校驗提取出的Block文件完整性及正確性并把提取出來的Block文件導入到hbase和hive數(shù)據(jù)庫中。
6、驗證數(shù)據(jù)。
在北亞數(shù)據(jù)恢復工程師的協(xié)助下,由用戶對恢復出來的數(shù)據(jù)進行驗證。如果發(fā)現(xiàn)問題,重新檢驗上述所有過程。
北亞數(shù)據(jù)恢復服務:
1、整個過程不會對原盤進行任何寫入操作。
2、盡可能保證操作可逆,確保人力可控范圍內(nèi)操作可回溯。
3、提供后期數(shù)據(jù)保管和服務跟蹤。
4、所有操作都是在有備份的情況下進行,若不成功不影響其他方案。
審核編輯:湯梓紅
-
服務器
+關注
關注
12文章
9237瀏覽量
85666 -
數(shù)據(jù)恢復
+關注
關注
10文章
582瀏覽量
17526 -
數(shù)據(jù)庫
+關注
關注
7文章
3827瀏覽量
64515
發(fā)布評論請先 登錄
相關推薦
評論