zoukankan      html  css  js  c++  java
  • zabbix删除dashboard无用的报警信息issue



    zabbix出现性能问题,于是清理了一下数据表,在 zabbix_server 端出现性能问题的时候,有大量的插入数据库操作无法执行,触发了大规模服务器不可达的报警
    经过搜索发现这些信息是跨表联合查询出来的,涉及: triggers 和 events 两个表
    于是truncate events和problem两个表,发现悲剧了

    last 20 issue 中有大量的报警条目无法删除掉,实际机器报警已经过去,机器现在是OK状态,这样显示在dashboard中严重影响报警的查看


    触发条件: 在早前报警时候,在web管理页面内点过 acknowledged 标记,以后抓取triggers 条目是 就会每次将 这个标记机器的报警抓取出来了.

    处理办法:

    在events 表中 将acknowledged=1条目删除掉,在triggers中将对应的频繁报警条目相关内容删除掉.(因为有些表字段含义不清楚,所有将相关条目都删除了,操作之前最好备份操作的表,免得悲剧)

    delete from events where acknowledged=1;

    # 删除在issue中出现最多的条目
    delete from triggers where description like '%is unreachable for 8 minutes%' ;

    delete from triggers where description like '%Host information was changed on%' ;

    删除后效果:



    记录操作记录:

    mysql> use zabbix;
    Database changed
    mysql> delete from events where acknowledged=1;
    Query OK, 0 rows affected (0.20 sec)

    mysql> delete from triggers where description like '%is unreachable for 8 minutes%';
    Query OK, 2 rows affected (0.03 sec)

    mysql> delete from triggers where description like '%is unreachable for 15 minutes%';
    Query OK, 0 rows affected (0.01 sec)

    mysql> delete from triggers where description like '%Queue data status issue%';
    Query OK, 1 row affected (0.02 sec)

    到此还没有结束,刚才删除的时候连带模板中的触发器一起删除了,需要我们重新在对应的模板中重新添加触发器,否则可能导致某些问题无法触发报警

  • 相关阅读:
    记录锁
    linux多线程同步pthread_cond_XXX条件变量的理解
    设置创建文件掩码遇到的问题
    函数的可重入和线程安全
    sigemptyset,sigfillset,sigaddset,sigdelset,sigismember,sigprocmask,sigpendmask作用
    嵌入式中断服务函数的一些特点
    linux alarm函数解除read write等函数的阻塞
    孤儿进程,僵死进程
    标准IO的缓冲问题
    《实用技巧》——让你的网站变成响应式的3个简单步骤
  • 原文地址:https://www.cnblogs.com/reblue520/p/11855332.html
Copyright © 2011-2022 走看看