本文纯属个人见解,是对前面学习的总结,如有描述不正确的地方还请高手指正~
1,媒介
对于系统员来说,监控服务器各种运行状态是任务之一,对于数量较少服务器来说,采取人工方式观察未尝不可,但是对于服务器集群来说,太麻烦,于是很多人采用了一些自动化工具,比如脚本之类,但是今天介绍的是一个非常有名的开源项目nagios。
Nagios精确来是只是一个监控平台,全部的监控任务由插件来实现,自在定制化水平非常高,可配置性也很好,NRPE就是一个流行的插件,负责监控近程服务器运行状态,包括磁盘空间,CPU负载率等一些可定制内容。
2,Nagios配置
这是一台安装nagios平台的呆板,接受其他被监控服务器的相关信息。
环境:Centos系统
按本指南安装,安装目录如下:
Nagios和插件安装到/usr/local/nagios
将被配置为监控当地系统的几个主要服务(CPU负荷、磁盘利用率等)
Nagios的Web接口:http://localhost/nagios/
2.1 准备工作
应确认你的服务器上安装有:
Apache
GCC编译器
GD库以及开辟库
可以通过以下命令安装
yum install httpd
yum install gcc
yum install glibc glibc-common
yum install gd gd-devel
2.2
切换root用户
su -l
创建一个nagios帐号并给定登录口令
/usr/sbin/useradd nagios
passwd nagios
创建一个用户组名为nagcmd用于WEB接口(主要是WEB权限的问题)。将nagios用户和apache用户都加到这个组中。
/usr/sbin/groupadd nagcmd
/usr/sbin/usermod -G nagcmd nagios
/usr/sbin/usermod -G nagcmd apache
2.3 下载Nagios安装包
mkdir ~/downloads
cd ~/downloads
从http://www.nagios.org/download/下载最新版本,nagios以及nagios-plugins
2.4 编译与安装
cd ~/downloads
tar xzf nagios-**.tar.gz
cd nagios-*
./configure --with-command-group =nagcmd
make all
make install
make install-init
make install-config
make install-commandmode
2.5 客户化配置
编辑/usr/local/nagios/etc/objects/contacts.cfg配置文件,修改其中的邮箱地址,这个地址是nagios系统发邮件报警的地址。
2.6 配置WEB接口
安装nagios的WEB配置文件到Apache的conf.d目录下:
make install-webconf
创建一个nagiosadmin用户用于Nagios的WEB接口登录。记下你输入的密码:
htpasswd -c /usr/local/nagios/etc/htpasswd.users nagiosadmin
重启Apache服务使设置生效
service httpd restart
2.7 编译并安装Nagios插件
cd ~/downloads
tar xzf nagios-plugins-*.tar.gz
cd nagios-plugins-*
编译安装插件
./configure --with-nagios-user=nagios --with-nagios-group=nagios
make
make install
2.8 启动Nagios
chkconfig --add nagios
chkconfig nagios on
验证Nagios的样例配置文件
/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg
没有报错的话,可以启动Nagios服务
service nagios start
2.9 变动SELiux设置
RED HAT系列系统有SELINUX增强安全性,但在有些时候,这个货色很让人麻烦,这里须要开设一下权限,如果嫌麻烦,可以直接关闭SElinux。
如果SELinux处于强制安全模式时候,须要先
get enforce
令SELinux处于容许模式
set enforce 0
不过提议还是修改SELINUX的文件强制目标模式:
chcon -R -t httpd_sys_content_t /usr/local/nagios/sbin/
chcon -R -t httpd_sys_content_t /usr/local/nagios/share/
2.10 登录WEB接口
当初就可以登录http://localhost/nagios/来查看本机的服务信息了,要输入前面刚录入的用户名和口令。
到此,基本上实现了nagios的配置
3.0 NRPE插件的配置
当初监控机已配置好了,但是近程服务器须要插件才能与这个平台停止联系,好在开源的货色比拟全面,现成的有NRPE插件,可以实时监控服务器磁盘空间问题,CPU负载问题,而且可以自己定制监控项目
3.1 创建账户
su -l
/usr/sbin/useradd nagios
passwd nagios
3.2 下载插件
下载nagios-plugins和nrpe插件,注意下载新的版本。
tar xzf nagios-plugins-1.4.6.tar.gz
cd nagios-plugins-1.4.6
./configure
make
make install
chown nagios.nagios /usr/local/nagios
chown -R nagios.nagios /usr/local/nagios/libexec
3.3 安装xinetd
由于nrpe是通过xinetd进程加载的,所以须要安装xinetd,在RED HAT系统中默认没有安装xinetd.
yum install xinetd
3.4
安装NRPE
tar xzf nrpe-2.8.tar.gz
cd nrpe-2.8
./configure
make all
make install-plugin
make install-daemon
make install-daemon-config
make install-xinetd
3.5 编辑nrpe文件
编辑/etc/xinetd.d/nrpe文件,添加你的监控平台呆板的IP地址在下面这行后面,用空格离隔。
only_from = 127.0.0.1 <你的监控呆板IP>
添加 nrpe的端口到服务:
编辑 /etc/service文件,记得先复制一份service文件做备份
添加这一行:
nrpe
5666/tcp
#NRPE
3.6 启动xinetd服务
当初可以启动xinetd,使NRPE进程正常启动。
3.7 验证服务启动
我们可以通过
netstat -at |grep nrpe
来验证进程的启动与否,如果正常启动,返回信息如下:
tcp 0 0 *:nrpe *:* LISTEN
同时验证NRPE进程功能正常,可以用下面命令验证:
/usr/local/nagios/libexec/check_nrpe -H localhost
返回结果:
NRPE v2.8
3.8 创建命令
实现上述工作以后,须要配置check_nrpe命令,这个模板是分歧的,照抄就好了:
define command{
command_name
check_nrpe
command_line
$USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
}
这个目标是定义监控主机的命令。。。
未完待续。。。
文章结束给大家分享下程序员的一些笑话语录:
现在社会太数字化了,所以最好是有一个集很多功能于一身的设备!