ZABBIX 使用
Written by: Jane.Hoo
1.zabbix监控概念介绍
项目(iterm)定义收集被监控的数据项,如收集被监控机内存使用情况
应用集(application)一些项目的汇总,目录与文件的关系
触发器(trigger)通过项目获得的数据或通过计算来判断主机状态的定义
图形(graph)通过项目获得数据,以图形方式展示
模板(template)可将项目,集合,触发器,图形汇总为一个模板,直接连接到一类主机,实现批量定义
主机(host)被监控对象,服务器或其他网络设备
主机组(host group)一类主机可以定义到一个主机组
动作(action)触发器,自动发现或自动注册状态改变触发的动作
自动发现(discovery)通过定义自动发现条件,配合动作批量加监控主机
维护(maintenace)定义主机什么时候处于维护状态
拓扑图(map)可以绘画出主机的拓扑
屏幕(screen)多种类型显示到一个screen里
IT服务(IT service)有时一台主机宕掉可能不会影响服务,IT服务定义服务容忍额限度
仪表盘(dashboard)监控的整体状态显示
总览(overview)显示所有的机器的数据或者触发器状态
web:通过定义场景监控web服务器
最新数据(last data)可查看主机项目获得的最新数据
事件(event)触发器状态改变的记录
报表(reports)创建事件报表
资产记录(Inventory)可以记录相关服务器的硬件信息等
告警类型(media types)定义相关告警方式
2.configuration
2.1 Host groups
Host groups、主机组,是主机的一个集合,定义主机组所包含的模板及主机列表。
注意点:1、建主机链接到主机组后,可以继承主机组所包含的所有模板;
2、一个主机可以隶属于多个主机组;
3、组名必须唯一,不得与其它组名重复;
4、新建的组允许不包含任何模板和主机;
5、zabbix内置的主机组不允许删除;
6、建议根据应用模块划分主机组;
2.2 Templates
Templates 模板,一系列监控项、触发器、图、场景的集合
注意点:
1、 模板定义的时候可以定义此模板应用到哪些主机主和模板;模板修改后,对应的主机监控项目也会改变;
2、 模板定义时可以嵌套模板,嵌套模板是一个继承的关系,会继承被嵌套模板的所有子项;
3、 如果模板间有相互冲突的项目(使相同键值的项目),做相互关联或一同应用到同一主机的时候,报错。
4、 模板可以克隆,只需修改模板名称就可以在其基础上做修改,很快地完成一个新模板;完全克隆,比clone多一点东西,例如screen;
5、 Delete:删除模板,如果主机有嵌套当前模板,那么item依旧保留在主机上,主机不受影响;
6、 Delete and clear:删除模板,如果主机有嵌套当前模板,那么item也会被删除掉;
7、 模板可以外部导入也可以内部新建;
2.3 Hosts
Hosts是zabbix监控的基本载体,所有监控项目都是基于hosts的。
注意点:1、主机可以外部导入也可以内部新建;
2、主机名(hostname)不允许重复,由字母、下划线、数字,标点符号组成,必须和客户端配置文件中的hostname保持一致;
3、unlink:取消和模板的关联,但是已有的监控项目不会删除;
4、unlink and clear: 取消和模板的关联并删除已有的监控项目;
5、hostname必须与客户端配置文件内的hostname一致。
但也可以通过在服务器端的/etc/hosts文件里添加对应的ip 主机名配置,实现即使和客户端hostname不一致也不影响监控,但此时hostname必须和服务器端/etc/hosts中的hostname保持一致。
2.3.1 Items
Items可以在单台机器上添加,也可以在templates上面添加,然后再通过模板连接到主机上。定义Items需要先定义key。
在zabbix agentd端查看配置文件zabbix_agentd.conf查看记录,如:
include=/usr/local/zabbix/etc/zabbix_agentd.conf.d/
修改对应目录下的参数定义文件:
----------------------------------------------------------------------------
| key的格式为:UserParameter=,
| key的组成:数字、字母、下划线
| 传递参数UserParameter=wc[*],grep -c "$2" $1
| zabbix_get -s 127.0.0.1 -k wc[/etc/passwd,root]
----------------------------------------------------------------------------
UserParameter=count.line.passwd,wc -l /etc/passwd|awk '{print $1}'
修改配置文件后,需要重启客户端:
service zabbix_agentd restart
key创建成功后,通过如下命令来检测:
zabbix_get -s 127.0.0.1 -k count.line.passwd
注意:1、可以定义该值得更新频率(upate interval)、历史数据保留天数,整体变化趋势保留时间段;
2、定义完成后,点击status启动/禁用该监控项;
2.3.2 Triggers
Triggers是触发器,当Items采集值满足trigger触发条件时,就会产生actions。每一个trigger必须对应一个trigger,但一个item可以对应多个trigger。通过设置多个trigger,实现触发条件不同,达到不同级别的告警。
Expression:选择对应的item、触发方式及触发值
---------------------------------------------------------------------------
| last value 最近一次采集
| maximal value for period of time:一段时间内的最大值
| sum(600) 600秒内所有值的和
| sum(#5) 最近5秒值得和 //可以用#表示一个变量有不同的意思
| last(#5) 返回第5个值
|avg,count,last,minand max 支持在某个时间段之前的。avg(1h,1d),
| 表示1小时之前的1天的平均值
| 触发器表达式中支持单位符号,5m(分钟)代替300s(秒)
----------------------------------------------------------------------------
severity:告警级别
注意:1、引用自template的trigger触发值是不能单独修改的,必须在template中修改,或是复制一个同样的trigger再修改,然后禁用掉之前的。
2.3.3 Graphs
新建图表选项的各项参数说明:
Items属性展示:
在创建图表的过程中,我们可以随时预览修改的配置图表,点击标签preview即可。备注:如果是template预览时没有意义的,毕竟没有任何数据。关于触发器限制:如果图表的高度小于120像素,那么图标上将不会展示触发器相关信息。
2.4 web
web monitoring 是用来监控web程序的,可以监控到web程序的下载速度、返回码及响应时间,还支持一组连续的web动作作为一个整体来监控。
scenaria:必须选择host后才能创建,zabbix的所有items都必须创建在hosts上
Application:选择这个scenario所在的application组
Name: scenario(方案)的名字
status: 默认为active
variables: 变量定义,这里定义的变量可以在后续的steps中使用
steps: web程序的各个步骤,选择add新增一个Login的step,来模拟用户登录
URL:监控的web页面
POST:传递给页面的参数,多个参数用&相连
Timeout:超时时间
Required:页面中能匹配到字符,匹配不到即认为错误
Status codes:页面返回码
定义完成后,就可以在web页面看到监控的状态和图示,可以给对应的scenaria建立对应的触发器
2.4 Actions
action是告警动作,当触发器条件被满足时,就会执行指定的action
action支持如下事件:触发器事件、发现事件、自动注册时间、内部事件
action的conditions配置:
----------------------------------------------------------------------------------------
| Type of calculation:各种条件之间的关系
| condition:机器不在维护状态
| 触发器状态为problems
| new condition:可以定位到某个、某些或全部触发器
----------------------------------------------------------------------------------------
action的operations配置:
2.5 Medias
一般使用scripts媒介,可以实现邮件、微信、短信告警方式
2.6 Users
创建用户时可以根据用户的不同作用划分到不同的组,media中天入告警接受地址及告警接受时间等信息。
user: 用户姓名、所属组别、密码、语言集、每页显示行数及首页设置
media:一个用户可以有多个媒介,接收地址,接收时间段,状态
permissions: 对应主机组、主机、模板的读写权限
2.6 Screens
将多种信息放在一起展示,便于集中展示某个host的多个信息,或者比较多个host的同一种信息。这些信息可以是graphs、maps、server infos等等,几乎涵盖zabbix所有的监控信息。
选择建立几行几列的screens
点击change,添加响应信息,设置对齐方式
2.7 Maps
添加关于主机的拓扑图,configuration-maps,在右上角可以create maps或者import map
创建图中的+-可以增加主机,link说明主机的连接 情况。
2.8 Discovery
通过zabbix的discovery功能自动添加主机并附加相应模版到制定的主机组内
http://blog.chinaunix.net/uid-26204366-id-4318443.html
本文转载自:http://blog.itpub.net/30109892/viewspace-1815185/