zoukankan      html  css  js  c++  java
  • 出现事故后我们怎么复盘分析

     背景:
    当正式环境修复完事故后,我们要对事故进行复盘,目的是 清楚知道为什么会发生这个事故?是否有建立防范机制?下次是否可以避免在犯同样的问题?
    一、分析过程
            分析事故我们分3步:(可用白板进行)
    • 1.阐述事实
    • 2.逻辑推理
    • 3.改善措施
    1. 阐述事实
                   以时间节点,对故障发生过程进行追溯,记录每个时间节点、哪些人在做哪些事、产出是什么。
              2. 逻辑推理
      
                   对每个问题点(如时间节点有疑惑),进行一个分析推理,也可以进行一个反向矩阵,如难以查找引发事故的原因,可通过 推理,在细致还原事故过程,在提供论据来验证你的推理,直到查找到根本原因。

            3. 结论总结

              证明了推理的正确性,在对每隔根本原因做有对应的改善措施,最少有7项
  • 相关阅读:
    typescript 箭头表达式
    typescript 参数类型
    ts介绍
    pm2
    koa2安装
    linux 搭建ftp
    CENTOS6.5 安装 mysql5.6 以及搭建双主
    bzoj 3043 (差分序列运用)
    poj 3277 City Horizon
    NOI2015 程序自动分析
  • 原文地址:https://www.cnblogs.com/chongyou/p/11040087.html
Copyright © 2011-2022 走看看