zoukankan      html  css  js  c++  java
  • asm磁盘dd破坏恢复

    有客户和我们反馈,由于运维人员操作错误,对一个磁盘组的asm disk进行了dd操作,导致部分数据丢失(客户数据文件存放在两个磁盘组中,其中一个被dd掉[误以为只是存放归档,其实由于第一个磁盘组空间不足,把部分数据文件放进该磁盘组])

    20200603221148


    通过对asm 日志进行分析发现被dd的磁盘是一个磁盘组,以前恢复过类似的asm 磁盘被dd的案例(asm磁盘头全部损坏数据0丢失恢复,上次因为dd破坏较少,所以可以通过修复磁盘组直接恢复出来里面数据,但是这次被dd了50M,直接修复磁盘头恢复数据基本上不太可能.通过工具对其进行磁盘扫描,参考:asm disk header 彻底损坏恢复,对扫描结果进行分析,发现不少数据块是重复,无法较好的实现重组效果.
    20200612002025


    类似出现这样的情况一般是由于该asm磁盘组中有同一个文件号的数据多份(比如一个磁盘组中有两个库,同一个数据文件存储多份),通过方面分析,该库没有文件多份存储而且该磁盘组中只有一个数据库.进一步分析仅有的asm alert日志(大部分日志被清除),发现类似信息

    Sun Mar 14 05:25:40 CST 2020
    NOTE: F1X0 found on disk 0 fcn 0.60289025
    NOTE: cache opening disk 0 of grp 2: HIS_FLASH00 label:HIS_FLASH00
    NOTE: cache opening disk 1 of grp 2: HIS_FLASH01 label:HIS_FLASH01
    NOTE: cache opening disk 2 of grp 2: HIS_FLASH02 label:HIS_FLASH02
    NOTE: cache opening disk 3 of grp 2: HIS_DATA03 label:HIS_DATA03
    NOTE: cache mounting (first) group 2/0xCCD84BCB (HIS_FLASH)
    * allocate domain 2, invalid = TRUE
    kjbdomatt send to node 0
    Sun Mar 14 05:25:40 CST 2020
    NOTE: attached to recovery domain 2
    Sun Mar 14 05:25:40 CST 2020
    NOTE: starting recovery of thread=1 ckpt=405.816 group=2
    NOTE: advancing ckpt for thread=1 ckpt=405.819
    NOTE: cache recovered group 2 to fcn 0.65493064
    Sun Mar 14 05:25:40 CST 2020
    NOTE: LGWR attempting to mount thread 1 for disk group 2
    NOTE: LGWR mounted thread 1 for disk group 2
    NOTE: opening chunk 1 at fcn 0.65493064 ABA
    NOTE: seq=406 blk=820
    Sun Mar 14 05:25:40 CST 2020
    NOTE: cache mounting group 2/0xCCD84BCB (HIS_FLASH) succeeded
    SUCCESS: diskgroup HIS_FLASH was mounted
    Sun Mar 14 05:25:42 CST 2020
    NOTE: recovering COD for group 2/0xccd84bcb (HIS_FLASH)
    SUCCESS: completed COD recovery for group 2/0xccd84bcb (HIS_FLASH)
    Sun Mar 14 05:25:47 CST 2020
    Starting background process ASMB
    ASMB started with pid=17, OS id=14599

    初步可以定位,很可能是由于在3月份对该磁盘组进行了扩容,从而发生了数据文件的rebalance操作,从而出现了某些block有重复现象,对于这类情况,通过结合asm字典信息进行分析可以完全规避该问题,对数据文件进行恢复,dbv进行检查,一切正常
    20200612000805


    对所有文件类似处理,结合正常磁盘组中数据文件,对数据库进行直接open,实现完美恢复.
    如果您遇到此类情况,无法解决请联系我们,提供专业ORACLE数据库恢复技术支持
    这次数据能够完美恢复属于侥幸,因为asm disk被dd了50M(正常情况下4个磁盘的磁盘组每个磁盘dd 50M之后,很可能有部分数据文件被覆盖,该客户该磁盘组最初是存储归档日志,因此数据文件写入位置相对比较靠后,从而没有被dd破坏)

  • 相关阅读:
    这是阿里技术专家对 SRE 和稳定性保障的理解
    阿里四年技术 TL 的得失总结:如何做好技术 Team Leader
    深度 | 阿里云蒋江伟:什么是真正的云原生?
    亲历者说 | 完整记录一年多考拉海购的云原生之路
    Seata RPC 模块的重构之路
    对容器镜像的思考和讨论
    20 行代码:Serverless 架构下用 Python 轻松搞定图像分类和预测
    怎么提升写代码的能力
    云原生 DevOps 的 5 步升级路径
    dubbo-go 白话文 | 从零搭建 dubbogo 和 dubbo 的简单用例
  • 原文地址:https://www.cnblogs.com/xifenfei/p/14992797.html
Copyright © 2011-2022 走看看