zoukankan      html  css  js  c++  java
  • prometheus监控VShereClient7.0_EXSi7.0主机状态

    prometheus监控VShereClient7.0_EXSi7.0主机状态这篇文章就够了,网上一些菜鸡那文章简直辣眼睛,就是瞎几把炒文章。

    我用的docker的方式监控的,方便不需要编译。我监控的是:

    VShereClient7.0_EXSi7.0主机状态

    VShereClient7.0_EXSi7.0主机状态

    VShereClient7.0_EXSi7.0主机状态

    重要的事情说三遍。下面贴一张监控展示图,下面开始部署。

    前提是把单台的EXSi7.0通过VShereClient7.0组成集群,vmware_exporter采集的数据是VShereClient7.0的数据,如下图。注意!!!!

    第一步、编写docker-compose
    [root@monitor vmware_exporter]# ls
    docker-compose.yaml
    [root@monitor vmware_exporter]# cat docker-compose.yaml
    services:
    vmware-exporter:
    image: pryorda/vmware_exporter:v0.11.1
    container_name: vmware-exporter
    restart: unless-stopped
    ports:
    - '9272:9272'
    expose:
    - 9272
    environment:
    VSPHERE_HOST: "10.0.10.210"
    VSPHERE_IGNORE_SSL: "True"
    VSPHERE_USER: "administrator@vsphere.local"
    VSPHERE_PASSWORD: "1qazXSW@"
    labels:
    org.label-schema.group: "monitoring"
    第二、使用docker-compose将容器运行起来。
    使用docker-compose将该容器运维起来。docker ps 查询该容器是否运行起来。如果没有请自行排查原因。

    docker-compose up -d


    第三、浏览该问监控所在服务器的ip+端口。
    访问ip+端口发现vmware_exporter可以正常采集到数据,说明这就成功了80%了,剩下的就是配置监控项报警规则。

    第四、配置监控项报警规则
    添加监控项,并浏览器查看,满足监控规则就会报警。报警途径有许多请自行设置。

    [root@monitor rules]# cat VsphereAlert.yml
    groups:
    - name: EXSi主机状态监控告警
    rules:
    - alert: EXSi主机状态
    expr: vmware_host_power_state ==0
    for: 5m
    labels:
    type: lost
    severity: fatal
    annotations:
    summary: "EXSi主机 {{$labels.host_name}} 失联"
    description: "EXSi任务 {{$labels.job}} 下的主机 {{$labels.host_name}} 已经超过五分钟没有数据了."
    monitor_url: "http://10.0.10.120:3000/d/q1yCDNbWz/vmware-stats?orgId=1"

    - alert: EXSi主机CPU使用情况
    expr: (vmware_host_cpu_usage / vmware_host_cpu_max) * 100 >80
    for: 5m
    labels:
    type: cpu
    severity: warning
    annotations:
    summary: "EXSi主机 {{ $labels.host_name }} 的 CPU 使用率告警"
    description: "EXSi主机 {{ $labels.host_name }} CPU 使用率超过 80%, 当前值为: {{ $value }}"
    monitor_url: "http://10.0.10.120:3000/d/q1yCDNbWz/vmware-stats?orgId=1"

    - alert: EXSi主机内存使用
    expr: (vmware_host_memory_usage/ vmware_host_memory_max) * 100 >85
    for: 5m
    labels:
    type: mem
    severity: warning
    annotations:
    summary: "EXSi主机 {{ $labels.host_name }} 的内存使用率告警"
    description: "EXSi主机 {{ $labels.host_name }} 的内存使用率超过 85%, 当前值为: {{ $value }}"
    monitor_url: "http://10.0.10.120:3000/d/q1yCDNbWz/vmware-stats?orgId=1"

    - alert: EXSi主机磁盘容量
    expr: ((vmware_datastore_capacity_size- vmware_datastore_freespace_size) / vmware_datastore_capacity_size) * 100 >70
    for: 5m
    labels:
    type: cpu
    severity: warning
    annotations:
    summary: "EXSi主机 {{ $labels.host_name }} 的磁盘使用率告警"
    description: "EXSi主机 {{ $labels.host_name }} 的磁盘使用率超过 70%, 挂载点: {{ $labels.mountpoint }} 当前值为:{{ $value }}%"
    monitor_url: "http://10.0.10.120:3000/d/q1yCDNbWz/vmware-stats?orgId=1"


    第五、添加Grafana展示模板。

    请自行添加模板(连接地址https://grafana.com/grafana/dashboards/11243)模板ID:11243,添加时模板数据源选择promethus。最终展示如下图。

    这是报警截图。

    感谢大家不足之处请指出,谢谢。

     
    ————————————————
    版权声明:本文为CSDN博主「遥襟」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    原文链接:https://blog.csdn.net/weixin_46396833/article/details/118021606

  • 相关阅读:
    Java 8 stream的详细用法
    SpringBoot启动异常 Process finished with exit code 1
    GIT-版本管理-初阶使用
    升级 kubeadm 集群
    antdv 获取 axios文件上传实时进度
    Ant Design Vue 实现文件上传 (通过点击提交按钮后开始上传)
    Ant Design Vue 实现菜单栏根据url变化自动高亮和展开
    Do not access Object.prototype method 'hasOwnProperty' from target object
    Nginx配置WebSocket (包含nginx-ingress-controller)
    Django ORM 常用字段和参数/关系字段/ForeignKey操作/数据库查询优化(重要)/事务初识
  • 原文地址:https://www.cnblogs.com/cheyunhua/p/14922881.html
Copyright © 2011-2022 走看看