本案例需要進(jìn)行數(shù)據(jù)恢復(fù)機(jī)器是一臺IBM某型號存儲,故障為vdisk丟失,操作系統(tǒng)中的Oracle數(shù)據(jù)庫無法正常使用。管理員重建MDisk,把故障存儲中的raid10重建為了raid6,然后又再次重建為riad10,這番操作導(dǎo)致服務(wù)器對應(yīng)的存儲池中的VDisk丟失,上層Solaris操作系統(tǒng)中的Oracle數(shù)據(jù)庫無法正常使用。用戶聯(lián)系我們數(shù)據(jù)恢復(fù)中心要求恢復(fù)服務(wù)器Solaris操作系統(tǒng)中的Oracle數(shù)據(jù)庫。
北亞數(shù)據(jù)恢復(fù)——VDisk丟失的數(shù)據(jù)恢復(fù)
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將所有涉及到Oracle數(shù)據(jù)庫的VDisk以只讀模式連接到備份服務(wù)器,使用數(shù)據(jù)備份工具對映射過來的VDisk做只讀模式的備份。
2、把所有成員盤排好序做標(biāo)記,然后做只讀模式的全盤鏡像。
3、判斷管理員的Mdisk重建操作對數(shù)據(jù)的破壞程度。
4、分析重建后的raid6的數(shù)據(jù)分布規(guī)則,計算出RAID6的雙校驗(yàn)寫到硬盤的具體位置。由于raid6的雙校驗(yàn)會破壞數(shù)據(jù)區(qū)域,針對被破壞的區(qū)域,服務(wù)器數(shù)據(jù)恢復(fù)工程師結(jié)合raid10的分布規(guī)則盡可能的還原出原來的Mdisk。
5、對恢復(fù)出來的Mdisk進(jìn)行底層卷分析,取出精簡模式的數(shù)據(jù)MAP并校驗(yàn)數(shù)據(jù)MAP是否正常。根據(jù)精簡模式的算法結(jié)合數(shù)據(jù)MAP盡可能的還原VDisk。
6、數(shù)據(jù)庫文件恢復(fù)及數(shù)據(jù)庫文件修復(fù)。完成了VDisk的數(shù)據(jù)恢復(fù)后,結(jié)合未損壞的VDisk做Oracle數(shù)據(jù)庫頁特征掃描,生成相應(yīng)的數(shù)據(jù)庫文件的特征集。分析出數(shù)據(jù)庫在所有VDisk中的數(shù)據(jù)分布MAP來進(jìn)行數(shù)據(jù)庫文件的恢復(fù)。借助北亞自研的軟件對數(shù)據(jù)庫文件做一致性檢測,檢測結(jié)果文件正常,結(jié)構(gòu)完整。嘗試啟動數(shù)據(jù)庫實(shí)例并監(jiān)控狀態(tài),一切正常,導(dǎo)出數(shù)據(jù)庫。本次數(shù)據(jù)恢復(fù)成功。
北亞數(shù)據(jù)恢復(fù)——VDisk丟失的數(shù)據(jù)恢復(fù)
服務(wù)器數(shù)據(jù)恢復(fù)分析:
由于故障存儲中某個MDisk被重建,上層VDisk及Oracle數(shù)據(jù)庫無法正常使用。如果MDisk重建后的raid類型為RAID6(之前為RAID10),部分?jǐn)?shù)據(jù)就會被破壞。最壞情況會有2塊盤(RAID6的雙校驗(yàn))的數(shù)據(jù)被損壞。本案例中,從VDisk層面來看,數(shù)據(jù)完整度超過75%。上層Oracle又由多個VDisk組成,上層Oracle層面的數(shù)據(jù)完整度超過95%。
北亞數(shù)據(jù)恢復(fù)——VDisk丟失的數(shù)據(jù)恢復(fù)