zoukankan      html  css  js  c++  java
  • 关于Nagios通过NRPE监控客户端的安装与配置

    环境介绍>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
    服务端(监控端):192.168.100.2     --nagios服务+check_nrpe
    客户端(被监控端):192.168.100.3    --nrpe守护进程+检测插件

    Nagios通过NRPE来远端管理服务的过程
    1. Nagios服务端执行安装在它里面的check_nrpe插件,并告诉check_nrpe 去检测哪些服务。
    2. 通过SSL,check_nrpe连接远端机子上的NRPE daemon
    3. 被监控端的NRPE运行本地的各种插件去检测本地的服务和状态(check_disk,..etc)
    4. 最后,被监控端的的NRPE把检测的结果传给nagios服务端的check_nrpe,check_nrpe再把结果送到Nagios状态队列中。
    5. Nagios 依次读取队列中的信息,再把结果显示出来。 

    NRPE 工作原理如下图所示:

    NRPE 总共由两部分组成:
    1、check_nrpe 插件,位于监控主机上
    2、NRPE daemon,运行在远程的Linux主机上(通常就是被监控机)

    当Nagios 需要监控某个远程Linux 主机的服务或者资源情况时:
    Nagios 会运行check_nrpe 这个插件,告诉它要检查什么;
    check_nrpe 插件会连接到远程的NRPE daemon,所用的方式是SSL;
    NRPE daemon会运行相应的Nagios插件来执行检查;
    NRPE daemon将检查的结果返回给check_nrpe 插件,插件将其递交给nagios做处理。
    注意:NRPE daemon需要Nagios 插件安装在远程的Linux主机上,否则,daemon不能做任何的监控。

    服务端(监控端)安装过程 

    1、服务端需要先安装nagios服务,安装方法可点击笔者的另一篇文章,《linux系统下Nagios+rrdtool+Pnp4nagios监控环境的搭建》

    2、安装nrpe所需的依赖,使用yum命令安装即可。

    [root@nagios_server ~]# yum install gcc make -y
    [root@nagios_server ~]# yum install openssl-devel -y      //check_nrpd会通过ssl的方式,连接远端的NRPE Daemon

    3、解压nrpe-2.15.tar.gz,进入其目录,执行如下命令。

    [root@nagios_server nrpe-2.15]# ./configure --with-nrpe-user=nagios    //可以就以nagios用户运行nrpe,如没有此用户,须先创建
    [root@nagios_server nrpe-2.15]# make all                               //编译所有源码
    [root@nagios_server nrpe-2.15]# make install-plugin       //安装check_nrpe插件,默认为安装到/usr/local/nagios/libexec目录

    客户端(被监控端)的安装过程 

    1、安装nrpe所需的依赖,使用yum命令安装即可。

    [root@nagios_server ~]# yum install gcc make -y
    [root@nagios_server ~]# yum install openssl-devel -y                     //check_nrpd会通过ssl的方式,连接远端的NRPE Daemon

    2、解压nrpe-2.15.tar.gz,进入其目录,执行如下命令:

    [root@nagios_client ~]# useradd nagios                                   //创建nagios用户
    [root@nagios_server nrpe-2.15]# ./configure --with-nrpe-user=nagios      //可以就以nagios用户运行nrpe  
    [root@nagios_client nrpe-2.15]# make all                                 //编译所有源码
    [root@nagios_client nrpe-2.15]# make install-daemon                      //安装nrpe命令,默认安装到/usr/local/nagios/bin目录
    [root@nagios_client nrpe-2.15]# make install-daemon-config               //安装nrpe配置文件,默认安装到/usr/local/nagios/etc目录

    3、修改nrpe.cfg配置文件,允许监控端通过check_nrpe进行连接nrpe守护进程,默认只允许本机,加上监控端的IP即可。

    allowed_hosts=127.0.0.1,192.168.100.2

    4、启动nrpe守护进程,也可以将如下命令加入到开机启动脚本/etc/rc.local 

    [root@nagios_client nrpe-2.15]# /usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d    //启动nrpe,监听TCP 5666 端口

    5、验证是否安装及启动成功,可在服务端执行如下命令:

    [root@nagios_server libexec]# /usr/local/nagios/libexec/check_nrpe -H 192.168.100.3                 //显示被监控端nrpe的版本
    [root@nagios_server libexec]# /usr/local/nagios/libexec/check_nrpe -H 192.168.100.3 -c check_load   //通过nrpe执行远端的检测插件

    这里需要特别注意的有2点

    (1)被监控端必须得有有/usr/local/nagios/libexec/check_load 检测脚本文件

    (2)通过check_nrpe 命令后的-c参数所接的命令名是被定义在监控端的nrpe.cfg中,如下图所示:

    服务端(监控端)的配置 

    1、定义命令,在/usr/local/nagios/etc/objects/commands.cfg中增加对check_nrpe的定义,加入如下内容:

    define command{
            command_name    check_nrpe                                      //定义命令名称为check_nrpe,在services.cfg中要使用这个名称.
            command_line    $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$   //这是定义实际运行的插件程序
            }

    -c后的$ARG1$参数是传给nrpe daemon执行的检测命令,它必须是nrpe.cfg中所定义的那几条命令中的一条。在定义监控服务中使用check_nrpe的时候要用!带上这个参数

    2、在/usr/local/nagios/etc/nagios.cfg配置文件中加上如下内容:

    cfg_file=/etc/nagios/objects/linux.cfg                           //让nagios包含此配置文件

    3、定义主机与check_nrpe要检测的远端command名字。这里我们可以将主机与服务写在一个文件里,创建/usr/local/nagios/etc/objects/linux.cfg文件,写入如下内容:

    define host{
            use                     linux-server
            host_name               nagios_client                    //nagios网页上的主机名
            address                 192.168.100.3
            }
    define service{
            use                             local-service
            host_name                       nagios_client
            service_description             cpu_load                 //nagios网页上的服务名
            check_command                   check_nrpe!check_load
            normal_check_interval           1                        //检测的间隔
            }

    4、重启nagios服务。打开nagios监控网站,可见如下图所示,则表示被监控节点添加成功。

  • 相关阅读:
    Java Web开发——JSP基本语法杂记
    Java Web开发——HTML CSS JavaScript 杂记
    Leetcode#13 Roman to Integer
    Leetcode#20 Valid Parentheses
    Leetcode#88 Merge Sorted Array
    Leetcode#171 Excel Sheet Column Number
    Leetcode#168 Excel Sheet Column Title
    Leetcode#160 Intersection of Two Linked Lists
    Leetcode#6 ZigZag Conversion
    Leetcode#8 String to Integer (atoi)
  • 原文地址:https://www.cnblogs.com/5201351/p/4334089.html
Copyright © 2011-2022 走看看