有客户和我们反馈,由于运维人员操作错误,对一个磁盘组的asm disk进行了dd操作,导致部分数据丢失(客户数据文件存放在两个磁盘组中,其中一个被dd掉[误以为只是存放归档,其实由于第一个磁盘组空间不足,把部分数据文件放进该磁盘组])
通过对asm 日志进行分析发现被dd的磁盘是一个磁盘组,以前恢复过类似的asm 磁盘被dd的案例(asm磁盘头全部损坏数据0丢失恢复,上次因为dd破坏较少,所以可以通过修复磁盘组直接恢复出来里面数据,但是这次被dd了50M,直接修复磁盘头恢复数据基本上不太可能.通过工具对其进行磁盘扫描,参考:asm disk header 彻底损坏恢复,对扫描结果进行分析,发现不少数据块是重复,无法较好的实现重组效果.
类似出现这样的情况一般是由于该asm磁盘组中有同一个文件号的数据多份(比如一个磁盘组中有两个库,同一个数据文件存储多份),通过方面分析,该库没有文件多份存储而且该磁盘组中只有一个数据库.进一步分析仅有的asm alert日志(大部分日志被清除),发现类似信息
Sun Mar 14 05:25:40 CST 2020 NOTE: F1X0 found on disk 0 fcn 0.60289025 NOTE: cache opening disk 0 of grp 2: HIS_FLASH00 label:HIS_FLASH00 NOTE: cache opening disk 1 of grp 2: HIS_FLASH01 label:HIS_FLASH01 NOTE: cache opening disk 2 of grp 2: HIS_FLASH02 label:HIS_FLASH02 NOTE: cache opening disk 3 of grp 2: HIS_DATA03 label:HIS_DATA03 NOTE: cache mounting (first) group 2 /0xCCD84BCB (HIS_FLASH) * allocate domain 2, invalid = TRUE kjbdomatt send to node 0 Sun Mar 14 05:25:40 CST 2020 NOTE: attached to recovery domain 2 Sun Mar 14 05:25:40 CST 2020 NOTE: starting recovery of thread=1 ckpt=405.816 group=2 NOTE: advancing ckpt for thread=1 ckpt=405.819 NOTE: cache recovered group 2 to fcn 0.65493064 Sun Mar 14 05:25:40 CST 2020 NOTE: LGWR attempting to mount thread 1 for disk group 2 NOTE: LGWR mounted thread 1 for disk group 2 NOTE: opening chunk 1 at fcn 0.65493064 ABA NOTE: seq =406 blk=820 Sun Mar 14 05:25:40 CST 2020 NOTE: cache mounting group 2 /0xCCD84BCB (HIS_FLASH) succeeded SUCCESS: diskgroup HIS_FLASH was mounted Sun Mar 14 05:25:42 CST 2020 NOTE: recovering COD for group 2 /0xccd84bcb (HIS_FLASH) SUCCESS: completed COD recovery for group 2 /0xccd84bcb (HIS_FLASH) Sun Mar 14 05:25:47 CST 2020 Starting background process ASMB ASMB started with pid=17, OS id =14599 |
初步可以定位,很可能是由于在3月份对该磁盘组进行了扩容,从而发生了数据文件的rebalance操作,从而出现了某些block有重复现象,对于这类情况,通过结合asm字典信息进行分析可以完全规避该问题,对数据文件进行恢复,dbv进行检查,一切正常
对所有文件类似处理,结合正常磁盘组中数据文件,对数据库进行直接open,实现完美恢复.
如果您遇到此类情况,无法解决请联系我们,提供专业ORACLE数据库恢复技术支持
这次数据能够完美恢复属于侥幸,因为asm disk被dd了50M(正常情况下4个磁盘的磁盘组每个磁盘dd 50M之后,很可能有部分数据文件被覆盖,该客户该磁盘组最初是存储归档日志,因此数据文件写入位置相对比较靠后,从而没有被dd破坏)