服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
一臺(tái)服務(wù)器中有一組由數(shù)塊SAS硬盤(pán)組建的RAID5陣列,陣列中有1塊熱備盤(pán),上層部署OA以及Oracle數(shù)據(jù)庫(kù)。
服務(wù)器故障:
該磁盤(pán)陣列中有2塊硬盤(pán)出現(xiàn)故障先后離線,RAID5陣列癱瘓,上層LUN無(wú)法正常使用。經(jīng)過(guò)檢測(cè)發(fā)現(xiàn)硬盤(pán)無(wú)物理故障,無(wú)壞道。
服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、將故障服務(wù)器中所有磁盤(pán)編號(hào)后取出,以只讀方式做全盤(pán)鏡像,備份完成后將磁盤(pán)按照編號(hào)還原到原服務(wù)器中。后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始磁盤(pán)數(shù)據(jù)造成二次破壞。
北亞企安數(shù)據(jù)恢復(fù)——vxfs數(shù)據(jù)恢復(fù)
2、基于鏡像文件分析底層數(shù)據(jù)獲取RAID條帶大小、磁盤(pán)順序及數(shù)據(jù)走向等RAID相關(guān)信息,根據(jù)獲取到RAID信息重組RAID5。
3、分析LUN在RAID中的分配情況和LUN分配的數(shù)據(jù)塊MAP。提取每一個(gè)LUN的數(shù)據(jù)塊分布MAP,北亞企安數(shù)據(jù)恢復(fù)工程師編寫(xiě)程序解析所有LUN的數(shù)據(jù)MAP,根據(jù)數(shù)據(jù)MAP導(dǎo)出所有LUN的數(shù)據(jù)。
北亞企安數(shù)據(jù)恢復(fù)——vxfs數(shù)據(jù)恢復(fù)
4、對(duì)導(dǎo)出的LUN的數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)所有LUN中均包含HP-Unix的LVM信息。通過(guò)解析每個(gè)LUN中的LVM信息,發(fā)現(xiàn)共有三套LVM:一個(gè)LVM劃分了一個(gè)LV來(lái)存放OA服務(wù)器端的數(shù)據(jù);第二個(gè)LVM中也劃分了一個(gè)LV來(lái)存放臨時(shí)備份數(shù)據(jù);剩下的4個(gè)LUN組建了一個(gè)LVM,劃分了一個(gè)LV來(lái)存放Oracle數(shù)據(jù)庫(kù)文件。5、北亞企安數(shù)據(jù)恢復(fù)工程師編寫(xiě)程序解釋每套LVM中的LV卷,但在解釋的過(guò)程中程序報(bào)錯(cuò)。經(jīng)過(guò)分析發(fā)現(xiàn)報(bào)錯(cuò)原因是raid5癱瘓導(dǎo)致LVM信息損壞。人工修復(fù)損壞區(qū)域后,同步修改解釋程序后成功解釋LVM邏輯卷。
6、搭建HP-Unix環(huán)境,將解釋出來(lái)的LV卷映射到HP-Unix并嘗試掛載文件系統(tǒng)。但是掛載文件系統(tǒng)時(shí)出錯(cuò),嘗試使用“fsck –F vxfs” 命令修復(fù)vxfs文件系統(tǒng),但修復(fù)完成后還是無(wú)法掛載。
7、分析解釋出來(lái)的LV,根據(jù)VXFS文件系統(tǒng)的底層結(jié)構(gòu)校驗(yàn)此文件系統(tǒng)的完整性。經(jīng)過(guò)分析發(fā)現(xiàn)VXFS文件系統(tǒng)果然有問(wèn)題,出現(xiàn)問(wèn)題的原因是:當(dāng)raid5癱瘓時(shí)VXFS文件系統(tǒng)正在執(zhí)行IO操作,導(dǎo)致部分文件系統(tǒng)元文件沒(méi)有更新以及損壞。手工修復(fù)這些損壞的元文件直至能夠正常解析VXFS文件系統(tǒng)。
8、將修復(fù)好的LV卷掛載到HP-Unix小機(jī)上,嘗試Mount文件系統(tǒng),這次沒(méi)有報(bào)錯(cuò),成功掛載。
9、在HP-Unix小機(jī)上成功mount文件系統(tǒng)后,將所有用戶數(shù)據(jù)均備份至指定的磁盤(pán)空間。部分文件目錄截圖如下:
北亞企安數(shù)據(jù)恢復(fù)——vxfs數(shù)據(jù)恢復(fù)
10、使用Oracle數(shù)據(jù)庫(kù)文件檢測(cè)工具檢測(cè)數(shù)據(jù)庫(kù)文件的完整性,檢測(cè)無(wú)誤后使用北亞企安自主研發(fā)的Oracle數(shù)據(jù)庫(kù)檢測(cè)工具進(jìn)行檢測(cè),經(jīng)過(guò)檢測(cè)發(fā)現(xiàn)部分?jǐn)?shù)據(jù)庫(kù)文件和日志文件校驗(yàn)不一致。數(shù)據(jù)庫(kù)工程師對(duì)這部分文件進(jìn)行修復(fù)后并再次校驗(yàn),直至所有數(shù)據(jù)庫(kù)文件均通過(guò)校驗(yàn)。
11、將恢復(fù)出來(lái)的Oracle數(shù)據(jù)庫(kù)附加到原始生產(chǎn)環(huán)境中,嘗試啟動(dòng)Oracle數(shù)據(jù)庫(kù),啟動(dòng)成功。
北亞企安數(shù)據(jù)恢復(fù)——vxfs數(shù)據(jù)恢復(fù)
數(shù)據(jù)驗(yàn)證:
在用戶方的配合下啟動(dòng)Oracle數(shù)據(jù)庫(kù)和OA服務(wù)端。在本地電腦上安裝OA客戶端,通過(guò)OA客戶端驗(yàn)證新舊數(shù)據(jù)記錄,安排不同部門(mén)人員進(jìn)行遠(yuǎn)程驗(yàn)證。經(jīng)過(guò)反復(fù)驗(yàn)證確認(rèn)數(shù)據(jù)完整無(wú)誤。本次數(shù)據(jù)恢復(fù)工作完成。
-
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
585瀏覽量
17580 -
RAID5
+關(guān)注
關(guān)注
0文章
122瀏覽量
12751 -
文件系統(tǒng)
+關(guān)注
關(guān)注
0文章
287瀏覽量
19937
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論