我这里有两种方法,感觉都不错。我这里主要是写一下监控的脚本。
1、使用iostat命令监控
1)首先打开配置文件的自定义脚本功能,然后编写脚本。
#!/bin/bash
if [ $# -ne 1 ];then
echo "Follow the script name with an argument"
fi
case $1 in
rrqm)
iostat -dxk 1 2|grep -w vda |tail -1 |awk '{print $2}'
;;
wrqm)
iostat -dxk 1 2|grep -w vda |tail -1 |awk '{print $3}'
;;
rps)
iostat -dxk 1 2|grep -w vda |tail -1 |awk '{print $4}'
;;
wps)
iostat -dxk 1 2|grep -w vda |tail -1 |awk '{print $5}'
;;
rKBps)
iostat -dxk 1 2|grep -w vda |tail -1 |awk '{print $6}'
;;
wKBps)
iostat -dxk 1 2|grep -w vda |tail -1 |awk '{print $7}'
;;
avgrq-sz)
iostat -dxk 1 2|grep -w vda | tail -1 |awk '{print $8}'
;;
avgqu-sz)
iostat -dxk 1 2|grep -w vda |tail -1 |awk '{print $9}'
;;
await)
iostat -dxk 1 2|grep -w vda|tail -1 |awk '{print $10}'
;;
svctm)
iostat -dxk 1 2|grep -w vda |tail -1 |awk '{print $13}'
;;
util)
iostat -dxk 1 2|grep -w vda |tail -1 |awk '{print $14}'
;;
*)
echo -e "e[033mUsage: sh $0 [rrqm|wrqm|rps|wps|rKBps|wKBps|avgqu-sz|avgrq-sz|await|svctm|util]e[0m"
esac
2)添加至agent的脚本路径里面。
完成之后就可以在zabbix里面添加items了
2、第二种方法,
第二种是使用iotop命令来获取数据
#!/bin/bash
#Date: 2016/11/11
#Author:zhangjie
disk_read(){
NUM=`/usr/bin/sudo iotop -b -n 3 -d 1| grep "Total DISK READ" | grep -v grep | awk -F "|" '{print $1}' | awk -F ":" '{print $2}' | tail -n1 | awk -F "/" '{print $1}'`
NUM2=`echo $NUM | awk '{print $1}'`
UNIT=`echo $NUM | awk '{print $2}'`
if [ $UNIT == "B" ];then
echo $NUM2
elif [ $UNIT == "K" ];then
NUM3=$(echo "$NUM2 * 1024" | bc)
echo $NUM3
elif [ $UNIT == "M" ];then
NUM3=$(echo "$NUM2 * 1024 * 1024" | bc)
echo $NUM3
elif [ $UNIT == "G" ];then
NUM3=$(echo "$NUM2 * 1024 * 1024 * 1024" | bc)
echo $NUM3
fi
}
disk_write(){
NUM=`/usr/bin/sudo iotop -b -n 3 -d 1 | grep "Total DISK WRITE :" | grep -v grep | awk -F "|" '{print $2}' | awk -F ":" '{print $2}' | tail -n1 | awk -F "/" '{print $1}'`
NUM2=`echo $NUM | awk '{print $1}'`
UNIT=`echo $NUM | awk '{print $2}'`
if [[ $UNIT == "B" ]];then
echo $NUM2
elif [[ $UNIT == "K" ]];then
NUM3=$(echo "$NUM2 * 1024" | bc)
echo $NUM3
elif [[ $UNIT == "M" ]];then
NUM3=$(echo "$NUM2 * 1024 * 1024" | bc)
echo $NUM3
elif [[ $UNIT == "G" ]];then
NUM3=$(echo "$NUM2 * 1024 * 1024 * 1024" | bc)
echo $NUM3
fi
}
main(){
case $1 in
disk_read)
disk_read;
;;
disk_write)
disk_write;
;;
esac
}
main $1
编写完脚本以后,我们还需要再做一件事情,修改sudoers文件
把这个添加注释,去掉此功能。
完成之后就可以进行监控了。
上面是两个脚本,选择任意一个都是可以的,接下来就是按照下面的步骤添加items,可能稍有出入,需酌情修改。
3、接下来开始进行测试:在server端使用zabbix_get命令测试脚本是否正确:
[root@ELK-chaofeng zabbix_agentd.d]# zabbix_get -s 127.0.0.1 -p 10050 -k io_check['wKBps']
40.00
[root@ELK-chaofeng zabbix_agentd.d]# zabbix_get -s 127.0.0.1 -p 10050 -k IO_check['disk_write']
87.00
3、看的出来没有什么问题,那么此时我们在zabbix的监控界面进行添加。
4、添加item
5、填写内容即可
填写完之后点击“update”保存
6、添加graph
还是在这个界面点击“graph”
7、添加graph
8、填写内容
添加成功后我们就可以查看了。
9、最后我们看看效果(我这里以上面的第二个脚本为例)
可以看到没有什么问题。
疑难总结:之前的脚本中,出来的图像是断断续续的,感觉挺是奇怪的。感觉像是时间间隔采集数据的问题。
就是出现上面的这种情况。items里面的监控项是没有问题,显示是正常的。
然后我换一种方式查看,发现确实read上有很长一段时间没有数据出现。感觉很不对劲。
后来在脚本中的iotop命令中,将iotop命令后面的参数修改了一下成功了:“iotop -b -n 3 -d 1” ,-d表示多长时间采集一次数据,-n表示采集数据的次数。之前我设置的是0.2秒采集一次数据,现在看来是不合适的。可能这个数值最好与zabbix界面的items里面的“update inteval”保持一致最好,都是1s。
此外,iotop命令第三次采集的数据是稍微稳定点的。所以最好采集3次以上的数据。
修改好之后,我们再次来看看效果:
发现这个时候是正常的了。
再来看看时间间隔:
发现时间间隔也是有序的,看来就没有什么毛病了。整个监控搭建成功了。