zoukankan html css js c++ java

Nagios安装与配置

安装包获取

Nagios	https://sourceforge.net/projects/nagios/files/
Nagios Plugins	https://www.nagios.org/downloads/nagios-plugins/
nagios.zip	百度网盘-Linux-安装包-nagios

规划

主机名	角色	IP地址
nagios	nagios监控服务器	192.168.233.160
RS01	nagios客户（被监控）端	192.168.233.159
RS02	nagios客户（被监控）端	192.168.233.158

服务器端安装

准备工作

调整字符集	echo 'export LC_ALL=C'>> /etc/profile echo $LC_ALL source /etc/profile cd ~
关闭防火墙
关闭selinux	setenforce 0 getenforce

时间同步	echo '/10 * * * /usr/sbin/ntpdate pool.ntp.org >/dev/null 2>&1'>>/var/spool/cron/root
安装所需基础软件包	yum install gcc glibc glibc-common -y yum install gd gd-devel -y yum install httpd php php-gd –y yum install mysql* -y 【非必须，如果要监控数据库会用到，不安这个的话无法安监控数据库的插件，也就无法监控数据库】
创建nagios需要的用户和组	useradd -m nagios useradd apache groupadd nagcmd usermod -a -G nagcmd nagios usermod -a -G nagcmd apache

安装配置

开始安装	cd /home/zhang/tools unzip oldboy_training_nagios_soft.zip tar xf nagios-3.5.1.tar.gz cd nagios ./configure --with-command-group=nagcmd make all make install make install-init && make install-config && make install-commandmode
安装nagios web配置文件	make install-webconf 执行后显示： [root@zhang nagios]# make install-webconf /usr/bin/install -c -m 644 sample-config/httpd.conf /etc/httpd/conf.d/nagios.conf * Nagios/Apache conf file installed * # 就是这个文件/etc/httpd/conf.d/nagios.conf
创建nagios web监控界面登入时需要的用户名和密码	# -b：非交互 nagios配置文件把密码路径指定在了这个文件下 htpasswd -cb /usr/local/nagios/etc/htpasswd.users zhang 123456
添加监控报警的邮件地址	yum install sendmail -y /etc/init.d/sendmail start vi /usr/local/nagios/etc/objects/contacts.cfg nagios@localhost = 15666661331@163.com chkconfig sendmail on
安装nagios插件软件包	cd ../ yum install -y perl-devel tar xf nagios-plugins-1.4.16.tar.gz cd nagios-plugins-1.4.16 ./configure --with-nagios-user=nagios --with-nagios-group=nagios --enable-perl-modules --with-mysql=/usr/local/mysql make 此编译如遇到make :***[all] Error 2 则configure加：--with-mysql=/usr/local/mysql;指定mysql路径亲测，这个解决方法不对。应是perl-devel的问题。建议重新安装下所需基础包。 make install
查看插件个数	cd ../ ls /usr/local/nagios/libexec/\|wc -l
配置nagios开机自启	chkconfig --add nagios chkconfig nagios on
验证nagios配置文件（检查语法）2种	/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg [root@zhang tools]# /etc/init.d/nagios checkconfig Running configuration check... OK.
浏览器端：	http://192.168.233.160/nagios oldboy 123456
安装NRPE	之所以服务端也安装NRPE 一是是因为要在…/nagios/libexec/目录下生成check_nrpe命令；二是服务端也要通过NRPE进行监控： http://down.51cto.com/data/165101 tar xf nrpe-2.12.tar.gz cd nrpe-2.12 ./configure make all make install-plugin make install-daemon make install-daemon-config cd ..
启动	Nagios是不会监听端口的，因为不会有程序发数据给它。 /etc/init.d/httpd start /etc/init.d/nagios start lsof -i :80 ps aux \|grep nagios
配置账号权限：	[root@nagios etc]# egrep -v "^#\|^$" cgi.cfg main_config_file=/usr/local/nagios/etc/nagios.cfg physical_html_path=/usr/local/nagios/share url_html_path=/nagios show_context_help=0 use_pending_states=1 use_authentication=1 use_ssl_authentication=0 authorized_for_system_information=nagiosadmin,admin authorized_for_configuration_information=nagiosadmin,admin authorized_for_system_commands=nagiosadmin,admin authorized_for_all_services=nagiosadmin,admin authorized_for_all_hosts=nagiosadmin,admin authorized_for_all_service_commands=nagiosadmin,admin authorized_for_all_host_commands=nagiosadmin,admin authorized_for_read_only=xiaomin,chenkaixiong,chengcai #注：只给chengcai账号只读权限，如果想给该账号更多权限，可根据配置添加。 default_statusmap_layout=5 default_statuswrl_layout=4 ping_syntax=/bin/ping-n -U -c 5 $HOSTADDRESS$ refresh_rate=90 escape_html_tags=1 action_url_target=_blank notes_url_target=_blank lock_author_names=1
至此，服务端安装部分暂时告一段落，，，

客户端配置及安装

准备工作	同服务端=调整字符集+关闭防火+关闭selinux+时间同步
上传软件包	rz nagios.zip
创建用户	useradd -M nagios -s /sbin/nologin
安装perl	yum install -y perl-devel perl-CPAN openssl* yum install -y mysql-server # 这是为了解决报错
安装Nagios Plugins	tar xf nagios-plugins-1.4.16.tar.gz cd nagios-plugins-1.4.16 ./configure --with-nagios-user=nagios --with-nagios-group=nagios --enable-perl-modules make && make install cd .. ls /usr/local/nagios/libexec/\|wc -l
安装nrpe	tar xf nrpe-2.12.tar.gz cd nrpe-2.12 ./configure make all make install-plugin make install-daemon make install-daemon-config cd ..
安装iostat #for monitor iostat yum install sysstat -y #这个命令是安装系统性能分析工具，监控系统性能时程序或脚本会调用这些工具。检查成功与否 [root@RS01 nagios]# iostat 这条命令可以执行就可以了。执行后也会显示IO信息。	wget http://www.cpan.org/authors/id/T/TO/TONVOON/Nagios-Plugin-0.34.tar.gz wget http://www.cpan.org/authors/id/S/SF/SFINK/Math-Calc-Units-1.07.tar.gz wgethttp://www.cpan.org/authors/id/A/AB/ABIGAIL/Regexp-Common-2017060201.tar.gz wget http://search.cpan.org/CPAN/authors/id/K/KA/KASEI/Class-Accessor-0.31.tar.gz wget http://search.cpan.org/CPAN/authors/id/A/AD/ADAMK/Config-Tiny-2.12.tar.gz wget http://mirror.thekeelecentre.com/distfiles/Params-Validate-0.91.tar.gz tar xf Params-Validate-0.91.tar.gz cd Params-Validate-0.91 perl Makefile.PL make make install cd .. tar xf Class-Accessor-0.31.tar.gz cd Class-Accessor-0.31 perl Makefile.PL make && make install cd .. tar xf Config-Tiny-2.12.tar.gz cd Config-Tiny-2.12 perl Makefile.PL echo $? make && make install cd .. tar xf Math-Calc-Units-1.07.tar.gz cd Math-Calc-Units-1.07 perl Makefile.PL make && make install echo $? cd .. tar xf Regexp-Common-2017060201.tar.gz cd Regexp-Common-2017060201 perl Makefile.PL make && make install echo $? cd .. tar xf Nagios-Plugin-0.34.tar.gz cd Nagios-Plugin-0.34 perl Makefile.PL make make install echo $? cd .. yum install -y sysstat
配置开发的几个基础脚本 nagios自己的内存和IO监控性能不是很好，这里用自己做的插件	cp check_memory.pl /usr/local/nagios/libexec/ cp check_iostat /usr/local/nagios/libexec/ chmod 755 /usr/local/nagios/libexec/check_memory.pl chmod 755 /usr/local/nagios/libexec/check_iostat yum install -y dos2unix dos2unix /usr/local/nagios/libexec/check_iostat dos2unix /usr/local/nagios/libexec/check_memory.pl 1当前路径为软件包的路径 2把写好的脚本放到nagios脚本目录下 3授权使脚本可执行 3使用dos2unix使之成为Unix的脚本格式
配置nrpe	cd /usr/local/nagios/etc cp nrpe.cfg{,.bak} sed -ri 's@^allowed_hosts.*@&,10.0.0.1@g' nrpe.cfg sed -ri '199,203d' nrpe.cfg #也可用替代第三条： perl -pi -e 's/allowed_hosts=127.0.0.1/allowed_hosts=192.168.233.160/g' /usr/local/nagios/etc/nrpe.cfg #先备份 # 79行允许10.0.0.1监控 #注释或干脆干掉199-203行。 #如果机器大于500台做集群或分布式监控时，可以使用多个nagios server，ip要用逗号隔开。
配置nrpe	echo "command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,6 -c 30,25,20" >>nrpe.cfg echo "command[check_mem]=/usr/local/nagios/libexec/check_memory.pl -w 6% -c 3%" >>nrpe.cfg echo "command[check_disk]=/usr/local/nagios/libexec/check_disk -w 20% -c 8% -p /" >>nrpe.cfg echo "command[check_swap]=/usr/local/nagios/libexec/check_swap -w 20% -c 10%" >>nrpe.cfg echo "command[check_iostat]=/usr/local/nagios/libexec/check_iostat -w 6 -c 10" >>nrpe.cfg # -w警告； -c严重警告。上面依次对负载，内存，硬盘，虚拟内存，磁盘IO的监控，这些都是本地的服务（我们这里称之为被动监控），由nagios服务器端通过nrpe插件定时去client的nrpe服务定期获取信息。原理：
启动nagios client	/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d echo "# nagios nrpe process cmd" >>/etc/rc.local echo "/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d" >>/etc/rc.local tail -2 /etc/rc.local # -c：指定配置文件 -d：daemon #检查
检查	ps -ef\|grep nagios lsof -i tcp:5666 netstat -lnt
提示	如果客户端nrpe改了配置文件，这样重启： pkill nrpe && /usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d
	至此，客户端配置完毕

配置server端nagios监控的服务

Nagios安装生成的文件	[root@nagios nagios]# pwd /usr/local/nagios [root@nagios nagios]# tree -L 1 . \|-- bin \|-- etc \|-- libexec # nagios调用的插件库 \|-- sbin # CGI程序 \|-- share # Nagios界面展示的php程序等内容的目录，被Nagios在httpd配置文件目录生成的配置文件所调用 `-- var # 日志和数据 6 directories, 0 files
配置文件di目录	[root@nagios nagios]# tree etc/ etc/ \|-- cgi.cfg # 被主配置文件包含 \|-- nagios.cfg # 主配置文件 \|-- objects # 被主配置文件包含 \| \|-- commands.cfg # 存放Nagios命令相关配置(也可指定commands目录)，这里的命令不是系统命令 \| \|-- contacts.cfg \| \|-- localhost.cfg # 对本机的监控，我们不使用它进行监控，而是将本机当成客户端来监控 \| \|-- printer.cfg # 打印机 \| \|-- switch.cfg # 交换机 \| \|-- templates.cfg # 模板配置文件 \| \|-- timeperiods.cfg \| `-- windows.cfg # windows `-- resource.cfg # 被主配置文件包含，这里面是Nagios内置变量的定义，如$USER1$,$USER2$,$USER3$等
追加注释	services.cfg：存放具体被监控的服务相关的配置内容(对哪些服务进行监控)，上百台以上可指定services目录，默认不存在； hosts.cfg：存放具体被监控的主机相关配置，上百台以上可指定hosts目录，默认不存在； contacts.cfg：存放报警联系人相关配置的文件； timeperiods.cfg：存放报警周期时间等相关配置； template.cfg：模板配置文件，模板的存在是为了方便的配置服务器配置，类似shell里的函数功能

配置主配置文件nagios.cfg	添加： vi /usr/local/nagios/etc/nagios.cfg +34 #added by zhang at 2016 cfg_file=/usr/local/nagios/etc/objects/hosts.cfg cfg_file=/usr/local/nagios/etc/objects/services.cfg cfg_dir=/usr/local/nagios/etc/objects/services #cfg_file=/usr/local/nagios/etc/objects/localhost.cfg 或： [root@nagios etc]# sed -ri '33acfg_file=/usr/local/nagios/etc/objects/hosts.cfg' nagios.cfg sed -ri '33acfg_file=/usr/local/nagios/etc/objects/services.cfg' nagios.cfg sed -ri 's@#(cfg_dir=/usr/local/nagios/etc/servers)@1@g' nagios.cfg sed -ri 's@cfg_file=/usr/local/nagios/etc/objects/localhost.cfg@#&@g' nagios.cfg #cfg_dir作为备用增加一个service目录，在目录下的文件只要符合*.cfg就可以被nagios加载，使用脚本批量部署时非常方便的随机命名配置。注释掉，从而统一监控
配置主配置文件nagios.cfg	mkdir /usr/local/nagios/etc/objects/services chown -R nagios.nagios /usr/local/nagios/etc/objects/services cd objects/ head -51 localhost.cfg >hosts.cfg chown -R nagios.nagios hosts.cfg touch /usr/local/nagios/etc/objects/services.cfg # 暂时留空 chown -R nagios.nagios /usr/local/nagios/etc/objects/services.cfg #生成hosts.cfg 、services.cfg 文件，services 目录，并更改 #前51行有些主机模板

nagios被动模式实例配置细节

监控客户端服务器磁盘分区，load负载，men内存，swap、磁盘IO

配置hosts.cfg

#添加客户端主机和主机组

[root@nagios objects]# vim hosts.cfg

define host{

use linux-server

host_name 02-client1

alias 02-client1

address 192.168.233.158

}

define host{ use linux-server

host_name 01-nagios

alias 01-nagios

address 192.168.233.160 # 将本机也加入监控

}

define hostgroup{

hostgroup_name linux-servers

alias Linux Servers

members 02-client1,01-nagios # 再将两个客户端加入一个组

}

#一个host标签就是一个被监控的主机

use表示一个使用名为linux-server的模板，该模板就是和hosts.cfg在同一个目录下的timeperiods.cfg，在该文件中可以搜索到linux-server定义的属性。也可以将该模板中定义的属性写在define

#对于host{}标签，如果在该标签中定义了Linux-server的属性，那么就以该标签中的内容为准；如果没定义就会到模板配置文件中找。使用模板配置文件的好处就在于在现在这个标签内只需定义四行即可。

检查语法1

两种方式：

/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg

/etc/init.d/nagios checkconfig

[root@nagios objects]# /etc/init.d/nagios checkconfig

...

Error: There are no services defined! # 这就是错误，没有定义服务。

...

#下面就是统计的

Total Warnings: 2 # 警告无所谓

Total Errors: 1 # 但是错误一定要解决

#其实第二种就是调用第一种的命令，但是它将信息都定义到了/dev/null中了，根本看不出来什么地方出错了，因此我们可以修改启动脚本中的内容：

[root@nagios objects]# vim /etc/init.d/nagios +183

checkconfig)

printf "Running configuration check..."

$NagiosBin -v $NagiosCfgFile # 后面的重定向去掉

#既然语法检查出没有定义服务，那我们就定义一个服务，接下来添加一个监控的服务配置到services.cfg

添加监控的服务

[root@nagios objects]# vi services.cfg

define service {

use generic-service