模板的管理与使用
一 模板
模板是zabbix的核心,因为模板继承了所有要监控的内容,以及所要展示的图形等等,zabbix的安装部署完成之后,自带了很多模板(网络设备模板,操作系统模板,常用应用软件模板),这些模板足够满足日常百分之八十左右的应用需求.
模板的组成: 应用集, 监控项, 触发器, 图形, 聚合图形,自动发现, Web检测,
模板的重要组成: 监控项, 触发器, 自动发现, 图形
1.1.1 模板的分类
1) 监控系统状态的模板
# 对 Linux 系统的监控模板 Template OS Linux # 对 Windows 系统的监控模板 Template OS Windows # 对 Mac OS X 系统的监控模板 Template OS Mac OS X # 对 VM VMware 系统的监控模板 Template VM VMware
2) 监控网络和网络设备的模板
#开启SNMPv1监控的模板 Template Module Generic SNMPv1 #开启SNMPv2监控的模板 Template Module Generic SNMPv2 Template Module Interfaces Simple SNMPv2 emplate Net Cisco IOS SNMPv2 Template Net Juniper SNMPv2 Template Net Huawei VRP SNMPv2</p>
3) 监控应用软件和服务的模板
#对HTTPD服务的监控模板 Template App HTTP Service #对MySQL服务的监控模板 Template DB MySQL #对SSH服务的监控模板 Template App SSH Service #对主机Ping的监控模板 Template Module ICMP Ping #对Java服务的监控模板 Template App Generic Java JMX #对Zabbix Agent状态的监控模板 Template App Zabbix Agent #对Zabbix Server状态的监控模板 Template App Zabbix Server
二 创建应用集
1) 操作步骤
配置 --->> 模板 ---> (新建模板/打开现有模板) --->> 应用集 --->> 创建应用集 --->> 输入要创建的应用集名称
创建应用集可以理解为一个群组,部门,列如要对CPU属性监控,那么就可以创建一个CPU的应用集,在这个应用集下面可以创建多个监控CPU的监控项.
应用集的主要作用: 便于对监控项管理,对监控项进行分类
三 创建监控项
1) 操作步骤
配置 --->> 模板 ---> (新建模板/打开现有模板) --->> 监控项 --->> 创建监控项 --->> .....
2) 参数说明
1. 名称
名称是创建的监控项的名称,自定义即可,
2. 类型
类型是设置此监控项通过什么方式进行监控,zabbix可选的监控类型有很多,常用的有 zabbix 客户端,zabbix客户端(主动模式),简单检查, SNMP客户端, zabbix采集器等,zabbix 客户端监控,也称为zabbix客户端(被动式)监控,这个需要根据需求进行选择.
2. 键值
键值可以自己定义,也可以使用zabbix 自带的键值,简单来说,键值就是获取数据的方式.
可以使用: [zabbix_get -s 192.168.10.53 -k "agent.ping"] 工具进行测试
3. 信息类型
信息类型看具体返回的值,此信息类型为 浮点数,所以选择浮点数.
4. 单位
范围就是数据的返回单位,百分比还是什么
5. 更新间隔时间
数据获取更新的事件
6. 自定义时间间隔
灵活的在指定的时间段进行更新数据
7. 历史数据保留时长
历史数据的保留时间,自动删除
8. 趋势储存时间
趋势图的保留时间
9. 应用集
在那个应用集,
四 创建触发器
触发器是用于故障告警的一个设置,将一个监控项,添加触发器后,此监控项如果出现问题,就会激活触发器,然后触发器将自动连接告警动作,最后触发告警.
触发器函数(diff,avg,last,nodata)
1) diff
# 参数:不需要参数 # 支持值类型:float,int,str,text,log # 作用:返回值为1表示最近的值与之前的值不同,即值发生变化,0表示无变化。
2) last
参数:#num 支持值类型:float,int,str,text,log 作用:获取最近的值,“#num”表示最近第N个值,请注意当前的#num和其他一些函数的#num的意思是不同的, 例如:last(0)或last()等价于last(#1),表示获取最新的值,last(#3)表示最近第3个值(并不是最近的三个值), 注意,last函数使用不同的参数将会得到不同的值,#2表示倒数第二新的数据。例入从老到最新值为1,2,3,4,5,6,7,8,9,10,last(#2)得到的值为9,last(#9)得到的值为2。 另外,last函数必须包含参数。
3) avg
参数:秒或#num 支持类型:float,int 作用:返回一段时间的平均值 例如,avg(5)表示最后5秒的平均值,avg(#5)表示最近5次得到值的平均值,avg(3600,86400)表示一天前的一个小时的平均值。 如果仅有一个参数,表示指定时间的平均值,从现在开始算起,如果有第二个参数,表示漂移,从第二个参数前开始算时间,#n表示最近n次的值。
4) change
参数:无需参数 支持类型:float,int,str,text,log 作用:返回最近获得值与之前获得值的差值,返回字符串0表示相等,1表示不同。 例如,change(0)>n表示最近得到的值与上一个值的差值大于n,其中,0表示忽略参数。
5) nodata
参数:秒 支持值类型:any 作业:探测是否能接收到数据,当返回值为1表示指定的间隔(间隔不应小于30秒)没有接收到数据,0表示其正常接收数据
6) count
参数:秒或#num 支持类型:float,int,str,text,log 作用:返回指定时间间隔内数值的统计。 例如:count(600):表示最近10分钟得到值的个数 count(600,12):表示最近10分钟得到值的个数等于12其中,第一个参数是指定时间段,第二个参数是样本数据。
7.) sum
参数:秒或#num 支持值类型:float,int 作用:返回指定时间间隔中收集到的值的总和,时间间隔作为第一个参数支持秒或收集值的数目(以#开始)。 例如:sum(600):表示在600秒之内接收到所有值的和。sum(#5):表示最后5个值的和。