prometheus监控VShereClient7.0_EXSi7.0主机状态

zoukankan html css js c++ java

prometheus监控VShereClient7.0_EXSi7.0主机状态

prometheus监控VShereClient7.0_EXSi7.0主机状态这篇文章就够了，网上一些菜鸡那文章简直辣眼睛，就是瞎几把炒文章。

我用的docker的方式监控的，方便不需要编译。我监控的是：

VShereClient7.0_EXSi7.0主机状态

VShereClient7.0_EXSi7.0主机状态

VShereClient7.0_EXSi7.0主机状态

重要的事情说三遍。下面贴一张监控展示图，下面开始部署。

前提是把单台的EXSi7.0通过VShereClient7.0组成集群，vmware_exporter采集的数据是VShereClient7.0的数据，如下图。注意！！！！

第一步、编写docker-compose
[root@monitor vmware_exporter]# ls
docker-compose.yaml
[root@monitor vmware_exporter]# cat docker-compose.yaml
services:
vmware-exporter:
image: pryorda/vmware_exporter:v0.11.1
container_name: vmware-exporter
restart: unless-stopped
ports:
- '9272:9272'
expose:
- 9272
environment:
VSPHERE_HOST: "10.0.10.210"
VSPHERE_IGNORE_SSL: "True"
VSPHERE_USER: "administrator@vsphere.local"
VSPHERE_PASSWORD: "1qazXSW@"
labels:
org.label-schema.group: "monitoring"
第二、使用docker-compose将容器运行起来。
使用docker-compose将该容器运维起来。docker ps 查询该容器是否运行起来。如果没有请自行排查原因。

docker-compose up -d

第三、浏览该问监控所在服务器的ip+端口。
访问ip+端口发现vmware_exporter可以正常采集到数据，说明这就成功了80%了，剩下的就是配置监控项报警规则。

第四、配置监控项报警规则
添加监控项，并浏览器查看，满足监控规则就会报警。报警途径有许多请自行设置。

[root@monitor rules]# cat VsphereAlert.yml
groups:
- name: EXSi主机状态监控告警
rules:
- alert: EXSi主机状态
expr: vmware_host_power_state ==0
for: 5m
labels:
type: lost
severity: fatal
annotations:
summary: "EXSi主机 {{$labels.host_name}} 失联"
description: "EXSi任务 {{$labels.job}} 下的主机 {{$labels.host_name}} 已经超过五分钟没有数据了."
monitor_url: "http://10.0.10.120:3000/d/q1yCDNbWz/vmware-stats?orgId=1"

- alert: EXSi主机CPU使用情况
expr: (vmware_host_cpu_usage / vmware_host_cpu_max) * 100 >80
for: 5m
labels:
type: cpu
severity: warning
annotations:
summary: "EXSi主机 {{ $labels.host_name }} 的 CPU 使用率告警"
description: "EXSi主机 {{ $labels.host_name }} CPU 使用率超过 80%, 当前值为： {{ $value }}"
monitor_url: "http://10.0.10.120:3000/d/q1yCDNbWz/vmware-stats?orgId=1"

- alert: EXSi主机内存使用
expr: (vmware_host_memory_usage/ vmware_host_memory_max) * 100 >85
for: 5m
labels:
type: mem
severity: warning
annotations:
summary: "EXSi主机 {{ $labels.host_name }} 的内存使用率告警"
description: "EXSi主机 {{ $labels.host_name }} 的内存使用率超过 85%, 当前值为： {{ $value }}"
monitor_url: "http://10.0.10.120:3000/d/q1yCDNbWz/vmware-stats?orgId=1"

- alert: EXSi主机磁盘容量
expr: ((vmware_datastore_capacity_size- vmware_datastore_freespace_size) / vmware_datastore_capacity_size) * 100 >70
for: 5m
labels:
type: cpu
severity: warning
annotations:
summary: "EXSi主机 {{ $labels.host_name }} 的磁盘使用率告警"
description: "EXSi主机 {{ $labels.host_name }} 的磁盘使用率超过 70%, 挂载点: {{ $labels.mountpoint }} 当前值为：{{ $value }}%"
monitor_url: "http://10.0.10.120:3000/d/q1yCDNbWz/vmware-stats?orgId=1"

第五、添加Grafana展示模板。

请自行添加模板（连接地址https://grafana.com/grafana/dashboards/11243）模板ID：11243，添加时模板数据源选择promethus。最终展示如下图。

这是报警截图。

感谢大家不足之处请指出，谢谢。

————————————————
版权声明：本文为CSDN博主「遥襟」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/weixin_46396833/article/details/118021606

查看全文

相关阅读:
工作之余
 用MFC如何高效地绘图
 C++运算符优先级
 CentOS5.9下用Kate
3G门户网（3G.cn）招聘软件测试工程师
 深圳市东润信息咨询有限公司招聘职位： 3G无线产品经理
 广州杰赛科技股份有限公司招聘技术中心3G协议软件工程师
 3G门户网（3G.cn）招聘手机游戏开发工程师
 3G门户网（3G.cn）招聘技术支持工程师
 3G工程师：三大热门的3G职业资格培训认证

原文地址：https://www.cnblogs.com/cheyunhua/p/14922881.html