zoukankan      html  css  js  c++  java
  • Nagios安装与部署

    Nagios概述:

    Nagios是一款开源免费(也有收费版的Nagios XI)的监控工具,可以用以监控Windows、Linux、Unix、Router、Switch,可以监控指定主机的物理基础资源或服务,当被监控对象健康状态“变好”或者“变坏”的时候,可以通过邮件、短信等方式通知到相关管理人员或运维人员。

    官方介绍:

    https://www.nagios.org/about/

    官方下载地址:

    https://www.nagios.org/downloads/nagios-core/thanks/?skip=1&product_download=nagioscore-source

    相关网址:

    https://www.nagios.org/downloads/nagios-core-frontends/                                     //如果嫌弃Nagios的web界面不够美观,可以去这里找些主题换上

    https://exchange.nagios.org/#_ga=2.236442180.491245866.1535507044-125128113.1535507044      //nagios的一些拓展插件,可以在这里下载

    https://exchange.nagios.org/directory/Addons                                                      //各类插件,包括一些监控脚本

    https://www.nagios.org/downloads/nagios-core-addons/                                     //nagios的一些项目

    Nagios的运行模式:

    Nagios服务以C/S模式收集数据,用户以B/S模式查看

    Nagios的运行原理:

    上图的过程可以概括为Nagios Server从客户端采集过来数据加以分析,然后以网页形式呈现给用户。

    附上另外两张网上找的Nagios的运行原理图帮助理解:

    部署Nagios所需的软件:

    LAP(Linux + Apache + PHP)

    nagios-3.5.1.tar                                  //Nagios的核心文件,Nagios服务文件,选择稳定版就好,最新版的很多插件用不了

    nagios-plugins-2.1.1.tar                    //Nagios插件,用于各种脚本和命令

    nrpe-2.15.tar                                    //代理服务,用户监控非Nagios服务器的服务器本地私有信息代理

    NSCP-0.4.3.143-x64                      //Nsclient++,用于监控Windows,分32位和64位

    pnp4nagios-0.6.25.tar                     //非必需,用于结合nagios出图

    vautour_style                                  //nagios主题

    开始部署

    首先解决依赖

    [root@xueji ~]# yum install -y gcc gcc-c++ glibc glibc-common php gd gd-devel libpng libmng libjpeg zlib
    这里注意:如果提示那个依赖库安装失败,建议配置下网络YUM源,USTC、Tsinghua或者ali的开源镜像站都可以;也可以直接去网上下载。

    采用YUM方式安装apache和php:

    [root@xueji ~]# yum install -y httpd php

    启动httpd服务并测试PHP是否可用

    [root@xueji ~]# service httpd start 
    [root@xueji ~]# elinks 192.168.159.130 --dump >> php_out.txt
    [root@xueji ~]# echo $?
    0
    [root@xueji ~]# less php_out.txt
       [1]PHP Logo
    
       PHP Version 5.3.3
    
       System             Linux xueji 2.6.32-431.el6.x86_64 #1 SMP Fri Nov 22
                          03:15:09 UTC 2013 x86_64
       Build Date         Mar 22 2017 12:27:34
                          './configure' '--build=x86_64-redhat-linux-gnu'......
    显示出PHP的相关信息,即说明PHP正常

    添加nagios运行用户并准备软件包

    [root@xueji ~]# groupadd nagcmd
    [root@xueji ~]# usermod -G nagcmd apache
    [root@xueji ~]# useradd nagios -G nagcmd
    [root@xueji ~]# mkdir Nagios
    [root@xueji Nagios]# ls
    nagios-3.5.1.tar.gz          pnp4nagios-0.6.25.tar.gz
    nagios-plugins-2.1.1.tar.gz  vautour_style.zip
    nrpe-2.15.tar.gz

    开始安装nagios

    [root@xueji Nagios]# tar -xf nagios-3.5.1.tar.gz 
    [root@xueji Nagios]# tar -xf nagios-plugins-2.1.1.tar.gz 
    [root@xueji Nagios]# tar -xf nrpe-2.15.tar.gz 
    [root@xueji Nagios]# tar -xf pnp4nagios-0.6.25.tar.gz 
    [root@xueji Nagios]# unzip vautour_style.zip 
    [root@xueji Nagios]# cd nagios
    [root@xueji nagios]# ./configure --with-command-group=nagcmd && echo $? && sleep 3 && make all && echo $? && sleep 3 && make install && make install-init && make install-commandmode && make install-config && make install-webconf
    //make install安装生成/usr/local/nagios/,其中/usr/local/nagios/share即nagiosWEB访问界面的站点目录
    //make install-init                安装生成/etc/rc.d/init.d/nagios  启动脚本                                
    //make install-config            安装生成/usr/local/nagios/etc下的nagios相关配置文件                    
    //make install-commandmode    设定相应nagios工作目录的权限
    //make install-webconf            安装Nagios的WEB配置文件到Apache的conf.d目录下
    到此时,安装过程就结束了

    Nagios安装完成后,相关文件目录说明

    [root@xueji nagios]# ls /usr/local/nagios/    
    bin  etc  libexec  sbin  share  var
    [root@xueji nagios]# ls /usr/local/nagios/share/   #执行过make install 后生成了/usr/local/nagios/share这个目录
    config.inc.php  includes   media             side.php
    contexthelp     index.php  robots.txt        ssi
    docs            js         rss-corefeed.php  stylesheets
    images          main.php   rss-newsfeed.php
    ##执行了make install-init 后,生成了/etc/init.d/nagios,即nagios的启动文件
    [root@xueji nagios]# ls /etc/init.d/nagios 
    /etc/init.d/nagios
    ##执行make install-config后,生成了nagios的配置文件
    [root@xueji nagios]# ls /usr/local/nagios/etc/
    cgi.cfg  nagios.cfg  objects  resource.cfg
    ##执行make install-webconf后,会在/etc/httpd/conf.d/下生成nagios的配置文件
    [root@xueji nagios]# ls /etc/httpd/conf.d/ | grep nagios
    nagios.conf

    Nagios安装完成后的主目录

    [root@xueji nagios]# ls /usr/local/nagios/
    bin       //nagios执行程序所在的目录
    etc       //nagios配置文件所在目录,初始安装完成后,只有几个.cfg文件,
    libexec  //监控所用命令,需要安装nagios-plugins插件才会有,检测命令,不装是空的
    sbin    //Nagios的cgi文件所在目录,外部命令所需的文件存放目录
    share  //nagiosde 前端页面
    var     //日志文件,pid(进程)文件等等。

    使用客户端访问测试nagios的前端

    此时还不能登录,需要建立登录用户

    [root@xueji ~]# htpasswd -c /usr/local/nagios/etc/htpasswd
    .users nagiosadmin
    New password: 
    Re-type new password: 
    Adding password for user nagiosadmin
    ##htpasswd.users这个文件是htpasswd 命令通过-c参数创建出来的,之后再添加nagios用户的话,就不需要-c参数了
    [root@xueji ~]# cat /usr/local/nagios/etc/htpasswd.users 
    nagiosadmin:6WusQf7QgCtw6
    [root@xueji ~]# service httpd restart  //重启httpd服务测试刚才创建的nagios用户是否可以登录。

    登录测试

    现在可以登录,但仅限于可以登录,因为没有做其他配置。

    开始安装nagios-plugins插件

    [root@xueji Nagios]# cd nagios-plugins-2.1.1
    [root@xueji nagios-plugins-2.1.1]# ./configure --with-nagios-user=nagios --with-nagios-group=nagcmd && echo $? &&sleep 3 && make && echo $? && sleep 3 && make install && echo $?

    安装完成后,生成的相关文件

    [root@xueji nagios-plugins-2.1.1]# cd /usr/local/nagios/
    [root@xueji nagios]# ls
    bin  etc  include  libexec  sbin  share  var
    [root@xueji nagios]# ls libexec/
    check_apt           check_ldap         check_procs
    check_breeze        check_ldaps        check_real
    check_by_ssh        check_load         check_rpc
    check_clamd         check_log          check_sensors
    check_cluster       check_mailq        check_simap
    check_dhcp          check_mrtg         check_smtp
    check_dig           check_mrtgtraf     check_spop
    check_disk          check_mysql        check_ssh
    check_disk_smb      check_mysql_query  check_ssmtp
    check_dns           check_nagios       check_swap
    check_dummy         check_nntp         check_tcp
    check_file_age      check_nntps        check_time
    check_flexlm        check_nt           check_udp
    check_ftp           check_ntp          check_ups
    check_http          check_ntp_peer     check_uptime
    check_icmp          check_ntp_time     check_users
    check_ide_smart     check_nwstat       check_wave
    check_ifoperstatus  check_oracle       negate
    check_ifstatus      check_overcr       urlize
    check_imap          check_pgsql        utils.pm
    check_ircd          check_ping         utils.sh
    check_jabber        check_pop

    启动nagios服务

    [root@xueji ~]# service httpd restart 
    Stopping httpd:                                          [  OK  ]
    Starting httpd:                                          [  OK  ]
    [root@xueji ~]# service nagios restart 
    Running configuration check...done.
    Stopping nagios: No lock file found in /usr/local/nagios/var/nagios.lock
    Starting nagios: done.

    再次登录测试

    现在就有机器信息了。

    配置监控之前,需要做一系列的准备工作(指定主配置文件需要加载的配置文件—定义主机—定义服务 –定义监控命令—检查配置文件—启动Nagios)

    [root@xueji ~]# vim /usr/local/nagios/etc/nagios.cfg
    log_file=/var/log/nagios/nagios.log                         #日志位置
    cfg_file=/etc/nagios/objects/commands.cfg                   #这个文件定义了很多命令
    cfg_file=/etc/nagios/objects/contacts.cfg                   #定义联系人,怎么联系
    cfg_file=/etc/nagios/objects/timeperiods.cfg                #定义了时间段
    cfg_file=/etc/nagios/objects/templates.cfg                  #模板(联系人,主机,时间)
    cfg_file=/etc/nagios/objects/localhost.cfg                  #监控本机相关配置文件
    #cfg_file=/etc/nagios/objects/windows.cfg                   #windows,默认不监控
    #cfg_file=/etc/nagios/objects/switch.cfg                    #交换机路由器监控,默认不监控
    #cfg_file=/etc/nagios/objects/printer.cfg                   #打印机监控,默认不监控
    
    #cfg_dir=/etc/nagios/servers                                #定义了服务合集(多个使用)
    #cfg_dir=/etc/nagios/printers                               #定义了打印机合集(多个使用)
    #cfg_dir=/etc/nagios/switches                               #定义了交换合集(多个使用)
    #cfg_dir=/etc/nagios/routers                                #定义了路由合集(多个使用)
    cfg_dir=/etc/nagios/conf.d                     #配置文件目录(下面的cfg文件一样有效)
    
    resource_file=/etc/nagios/private/resource.cfg 资源变量配置文件,包括$USER1$变量(一个路径)等
    status_update_interval=10                                   #状态更新时间,单位s
    log_rotation_method=d                                       #日志滚动,默认天
    service_check_timeout=60                                    #服务检查超时时间
    host_check_timeout=30                                        #主机检查超时时间
    event_handler_timeout=30                                
    notification_timeout=30
    ocsp_timeout=5
    perfdata_timeout=5
    [root@xueji ~]# vim /usr/local/nagios/etc/cgi.cfg  //比nagios.cfg文件的优先级高
    main_config_file=/etc/nagios/nagios.cfg             #主配置文件
    physical_html_path=/usr/share/nagios/html           #物理路径
    url_html_path=/nagios                               #在URL后面加上/nagios才能访问
    use_authentication=1                                #使用认证
    use_ssl_authentication=0                            #不使用ssl
    authorized_for_system_information=nagiosadmin       #认证用户

    配置nagios实现对本地NFS服务的监控

    [root@xueji ~]# cd /usr/local/nagios/etc/objects/
    [root@xueji objects]# ls
    commands.cfg   printer.cfg    timeperiods.cfg
    contacts.cfg   switch.cfg     windows.cfg
    localhost.cfg  templates.cfg
    [root@xueji objects]# cp localhost.cfg{,.bak}
    [root@xueji objects]# vim localhost.cfg
    define service{
            use                             local-service         ; Name of service template to use
            host_name                       localhost
            service_description             NFS        check_command                   check_tcp!2049
            }
    
    
    @                                                         
    /define service 
    ##创建一个共享
    [root@xueji objects]# vim /etc/exports
    /tmp *{rw}
    [root@xueji objects]# /etc/init.d/nfs start
    Starting NFS services:  exportfs: No options for /tmp *{rw}: suggest *{rw}(sync) to avoid warning
                                                             [  OK  ]
    Starting NFS quotas:                                     [  OK  ]
    Starting NFS mountd:                                     [  OK  ]
    Starting NFS daemon:                                     [  OK  ]
    Starting RPC idmapd:                                     [  OK  ]
    [root@xueji objects]# showmount -e 192.168.159.130
    Export list for 192.168.159.130:
    /tmp *{rw}
    检查localhost是否启用
    [root@xueji objects]# grep localhost /usr/local/nagios/etc/nagios.cfg 
    cfg_file=/usr/local/nagios/etc/objects/localhost.cfg  //默认已经启用
    检查配置文件是否有误
    [root@xueji objects]# /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg  | grep ^Total
    Total Warnings: 0
    Total Errors:   0
    都是0表明配置文件没有问题。
    [root@xueji objects]# /etc/init.d/nagios restart 
    Running configuration check...done.
    Stopping nagios: done.
    Starting nagios: done.

    再次登录nagios查看

    手动停掉NFS服务,强制刷新,再次查看,在上图界面,鼠标单击NFS会出现如下所示

    点击右侧Re-schedule the next check of this service,然后在弹出的窗口点击commit,一次不行,多试两次,然后就会看到如下所示

    nagios的告警颜色含义

  • 相关阅读:
    Girls and Boys
    妹子图.py
    requests的常用的方法和bs4的常用的方法:
    爬天极网线程池和进程池.py
    爬天极网多线程.py
    爬天极网多线程.py
    java实现遍历树形菜单方法——service层
    java实现遍历树形菜单方法——Dao层
    java实现遍历树形菜单方法——Dao层
    java实现遍历树形菜单方法——映射文件VoteTree.hbm.xml
  • 原文地址:https://www.cnblogs.com/zd520pyx1314/p/9500344.html
Copyright © 2011-2022 走看看