zoukankan      html  css  js  c++  java
  • nagios准确报警时间

    准确报警时间是指nagios检测完某一服务后,该服务立即发生故障,从此刻起到你收到报警的时间。
    如果是你的服务down掉,nagios立即发现,那nagios发出报警的时间就会变为”(“max_check_attempts  -1”乘以“retry_interval ”)。如max_check_attempts设置为1,nagios会立即报警。



    关于max_check_attempts、normal_check_interval、retry_check_interval三个参数。
    首先要说明两个概念,一、软态:被监控项处于retry_check检测周期内的非正常状态;二、硬态:被监控项达到max_check_attempts最大次数后的非正常状态;除此之外的状态,我们估且称之为“常态”。
    我们试着看看设置如下参数时,Nagios是怎么做状态检测及告警的:
    引用
            max_check_attempts      3
            normal_check_interval      3
            retry_check_interval        2
            notification_interval         3

    首先,Nagios每三分钟检测一次服务,当某次检测到服务状态为异常时,直接进入软态(1/3 soft state),此后,以每2分钟(retry_check_interval)的检测频率,再进行2次(一共进行3次检测,从而达到 max_check_attempts)检测,如果这三次检测服务都为异常,则直接进入硬态(hard state)。进入硬态后,Nagios以每3分钟(normal_check_interva)一次的频率检测服务,这与常态时是一样的;同时每3分钟(notification_interval)进行一次告警。

    注意:修改这些参数后并不是即时生效。首先要重启nagios,然后等待下一次检测完成,nagios才会按新的参数计算检测时间与报警次数。

  • 相关阅读:
    JS中的继承(上)
    一篇文章理解JS继承——原型链/构造函数/组合/原型式/寄生式/寄生组合/Class extends
    JS 装饰器,一篇就够
    理解 JavaScript 的 async/await
    JS正则表达式入门,看这篇就够了
    JavaScript的几种循环方式
    全解跨域请求处理办法
    下班后的时间精力生活管理办法(时间管理)
    hexo上部署博客到Github失败
    11
  • 原文地址:https://www.cnblogs.com/wowchky/p/3286832.html
Copyright © 2011-2022 走看看