一.配置文件优化
server端配置文件添加如下
StartPollers=160 #zabbix_server的进程数 StartPollersUnreacheable=80 #默认情况下,ZABBIX会启用指定进程用于探测某些不可达主机的(含IPMI场景);若使用场景中含有代理端,建议保持默认;若直接agent较多,可视具体情况调整 StartTrappers=20 #Trappers初始子进程数 StartPingers=100 #用于设置启用icmp协议PING主机方式启动子进程数量,若单台代理所管理机器超过500台,建议加大此数值 StartDiscoverers=120 #用于设置自动发现主机的子进程数量,若单台代理所管理机器超过500台,可以考虑加大此数值(仅适用于直接AGENT场景) Cachesize=1024M #配置缓存的大小(以字节为单位)。用于存储主机,项目和触发器数据的共享内存大小。范围是128K-8G startDBSyncers=16 #DB同步进程数量 HistoryCacheSize=1024M #历史缓存的大小(以字节为单位)。用于存储历史数据的共享内存大小。范围是128K-2G TrendCacheSize=1024M #用于设置划分多少系统共享内存用于存储计算出来的趋势数据,此参数值从一定程度上可影响数据库读压力,范围是128K-2G
二、zabbix_server配置文件详解
############一般参数############ # ListenPort=10051 #trapper的监听端口,端口范围1024-32767,默认是10051 #SourceIP= #出站连接的源IP地址。默认为空 # LogType=file #指定日志消息写入的位置:system是写到syslog里面,file是写到本地指定的位置,console是标准输出到屏幕,这里默认是file LogFile=/var/zabbix/zabbix_server.log #这里一般要修改到我们指定位置的 # LogFileSize=1 #日志文件的最大大小(MB)就轮询日志。0 - 禁用自动日志旋转。范围是0-1024,默认是1M大小就轮询。 # DebugLevel=3 #日志调试级别,0-有关Zabbix进程启动和停止的基本信息,1-关键信息,2是错误信息,3是warnings级别,4是debug信息,5是扩展调试信息 # PidFile=/tmp/zabbix_server.pid #pid文件的保存位置,也可以写到指定目录下 # DBHost=localhost #连接数据库的主机地址,默认是localhost DBName=zabbix #连接数据库的库名称 # DBSchema= #模式名称。用于IBM DB2和PostgreSQL。 DBUser=zabbix #连接指定数据库的用户名 DBPassword=zabbix #连接指定数据库用户名的密码 # DBSocket=/tmp/mysql.sock #MySQL套接字的路径。 # DBPort=3306 #数据库的端口号 ############高级参数############ #StartPollers=5 #初始化时,启动子进程数量,数量越多,则服务端吞吐能力越强,对系统资源消耗越大。范围是0-1000如非特殊默认即可 # StartIPMIPollers=0 #主要用于IPMI技术用于获取硬件状态场景。若无相关监控项,建议设置为0 # StartPollersUnreachable=1 #默认情况下,ZABBIX会启用指定进程用于探测某些不可达主机的(含IPMI场景);若使用场景中含有代理端,建议保持默认;若直接agent较多,可视具体情况调整 # StartTrappers=5 #Trappers初始子进程数 # StartPingers=1 #用于设置启用icmp协议PING主机方式启动子进程数量,若单台代理所管理机器超过500台,建议加大此数值 StartDiscoverers=1 #用于设置自动发现主机的子进程数量,若单台代理所管理机器超过500台,可以考虑加大此数值(仅适用于直接AGENT场景) # StartHTTPPollers=1 #HTTP主动监测的进程数 # StartTimers=1 #计时器的预分支实例数。定时器处理基于时间的触发功能和维护期。 只有第一个定时器进程处理维护期。 # StartEscalators=1 #用于处理动作中的步骤的进程的数量 # JavaGateway= #Zabbix Java网关的IP地址(或主机名).仅在Java轮询器启动时才需要。 # JavaGatewayPort=10052 #Zabbix Java网关侦听的端口。 # StartJavaPollers=0 #Java轮询器的预分支实例数。 # StartVMwareCollectors=0 #用于设置监控VMWARE Esxi主机实例时使用,若为0则不启用,若要监控ESXI主机,此值最少为1 ;视监控ESXI数量设置对应数值 # VMwareFrequency=60 #Zabbix将连接到VMware服务以获取新数据的频率。默认是60秒 # VMwarePerfFrequency=60 #Zabbix将连接到VMware服务以获取性能数据的频率。默认是60秒 # VMwareCacheSize=8M #划出多少共享内存用于存储VMWARE数据,范围是256K-2G # VMwareTimeout=10 #指定vmware收集器等待VMware服务响应的秒数。 # SNMPTrapperFile=/tmp/zabbix_traps.tmp #指定SNMP TRAPPER时的临时文件,用于代理端启用SNMP TRAPPER功能时使用,必须与zabbix_trap_receiver.pl或SNMPTT配置文件中的相同。 # StartSNMPTrapper=0 #是否启用 snmptrapper功能 ,默认不启用=0,启用=1(配合参数SNMPTrapperFile使用) ListenIP=127.0.0.1 #监听地址,留空则会在所有的地址上监听,可以监听多个IP地址,ip之间使用逗号分隔,默认是0.0.0.0 # HousekeepingFrequency=1 #多少小时清理一次代理端数据库的 history, alert, and alarms,以保持代理端数据库轻便,范围是0-24 # MaxHousekeeperDelete=5000 #每次最多删除历史数据的行数,范围是0-1000000 # SenderFrequency=30 #多少秒后重试发送失败的报警信息,范围是5-3600 # CacheSize=8M #配置缓存的大小(以字节为单位)。用于存储主机,项目和触发器数据的共享内存大小。范围是128K-8G # CacheUpdateFrequency=60 #Zabbix更新缓存数据的频率,单位为秒,范围是1-3600 # StartDBSyncers=4 #DB同步进程数量 # HistoryCacheSize=16M #历史缓存的大小(以字节为单位)。用于存储历史数据的共享内存大小。范围是128K-2G # HistoryIndexCacheSize=4M #历史索引缓存的大小(以字节为单位)。用于索引历史缓存的共享内存大小。范围是128K-2G # TrendCacheSize=4M #用于设置划分多少系统共享内存用于存储计算出来的趋势数据,此参数值从一定程度上可影响数据库读压力,范围是128K-2G # ValueCacheSize=8M #历史值缓存的大小,以字节为单位。 用于缓存项历史数据请求的共享内存大小。 设置为0将禁用值缓存。范围是0,128K-64G Timeout=4 #指定等待代理,SNMP设备或外部检查的时间(以秒为单位)。 # TrapperTimeout=300 #Trapper处理新数据的最长时间,单位是秒,范围是1-300 # UnreachablePeriod=45 #当主机不可达多少秒后,设置为主机不可用,单位是秒,范围是1-3600 # UnavailableDelay=60 #当主机不可用了,多久检查一次该主机的可用性,单位为秒,范围是1-3600 # UnreachableDelay=15 #当主机不可到达了,多久检查一次该主机的可用性,单位为秒,范围是1-3600 # AlertScriptsPath=${datadir}/zabbix/alertscripts #监控报警脚本路径,取决于编译时候的datadir参数 # ExternalScripts=${datadir}/zabbix/externalscripts #自定义脚本存储路径 # FpingLocation=/usr/sbin/fping #fping的位置 确保fping二进制有root权限和SUID标志设置。 # Fping6Location=/usr/sbin/fping6 #fping6的位置 确保fping6二进制有root权限和SUID标志设置。 # SSHKeyLocation= #用于SSH检查和操作的公钥和私钥的位置。 LogSlowQueries=3000 #数据库查询在记录之前可能需要多长时间(以毫秒为单位)。仅当DebugLevel设置为3,4或5时才可用。0 - 不记录慢查询。范围是1-3600000 # TmpDir=/tmp #临时目录 # StartProxyPollers=1 #启用多少子进程与代理端通信,若代理端较多可考虑加大此数值,范围是0-250 # ProxyConfigFrequency=3600 #proxy被动模式下,server多少秒同步配置文件至proxy。该参数仅用于被动模式下的代理。范围是1-3600*24*7 # ProxyDataFrequency=1 #被动模式下,zabbix server间隔多少秒向proxy请求历史数据 # AllowRoot=0 #是否允许以root身份运行服务端,0是不允许如果禁用并且服务器由“root”启动,服务器将尝试切换到用户配置选项指定的用户。,1是允许。 # User=zabbix #运行使用的用户 # Include= #可以将单个文件或所有文件包含在配置文件中的目录中。安装Zabbix将在/usr/local/etc中创建include目录,除非在编译期间进行修改。 # SSLCertLocation=${datadir}/zabbix/ssl/certs #SSL客户端证书的位置。 此参数仅用于Web监控。 # SSLKeyLocation=${datadir}/zabbix/ssl/keys #SSL客户端证书的私钥位置。此参数仅用于Web监控。 # SSLCALocation= #SSL CA钥文件目录 # LoadModulePath=${libdir}/modules #服务器模块位置的完整路径。 默认值取决于编译选项。 # LoadModule= #<br><div id="inner-editor"></div>260/5000在服务器启动时加载模块。 模块用于扩展服务器的功能。 格式:LoadModule = <module.so>模块必须位于LoadModulePath指定的目录中。 允许包含多个LoadModule参数。 # TLSCAFile= #包含用于对等证书验证的顶级CA证书的文件的完整路径名。 # TLSCRLFile= #包含撤销证书的文件的完整路径名。 # TLSCertFile= #包含服务器证书或证书链的文件的完整路径名。 # TLSKeyFile= #包含服务器私钥的文件的完整路径名。
三、zabbix_agent配置文件详解
############一般参数############ # PidFile=/tmp/zabbix_agentd.pid #pid文件位置 LogFile=/tmp/zabbix_agentd.log #log文件的位置,如果不设置则使用syslog也就是写入/var/log/message # LogFileSize=1 #日志轮询大小默认是1MB # DebugLevel=3 #日志级别 # SourceIP= #出站连接的源IP地址,当系统有多个IP的时候需要制定哪个IP与代理或服务端通信 # EnableRemoteCommands=0 #是否允许来自Zabbix服务器的远程命令。0为不允许,1为允许。 # LogRemoteCommands=0 #是否开启日志记录shell命令作为警告,0表示不允许,1表示允许。 #####被动检查相关(被动模式:被动模式下,由代理或服务端主动请求AGENT,去获取所采集到的监控数据) Server=192.168.1.103 #在有代理情况下,此IP地址应该填写代理服务器的IP,反之,若无代理服务器,则此IP应设置为服务端,多IP用逗号隔开 # ListenPort=10050 #agent的监听服务端或者代理的连接端口,范围是1024-32767,默认是10050 # ListenIP=0.0.0.0 #监听IP # StartAgents=3 #在被动模式下,agent启动时启动的子进程数量,范围是0-100, 如果设置为0,则禁用被动检查,并且代理将不会在任何TCP端口上侦听。 #####主动检查相关(主动模式:在主动模式下,AGENT端(即采集客户端)将所采集的结果,主动提交给代理服务器或服务器,而此种情况下,代理服务器或服务器将被动接收采集信息) # ServerActive= #主动模式下,代理端口的IP,如果没有指定端口则默认为10051端口,若需要更改端口,则为IP:port的形式 # Hostname= #唯一,区分大小写的主机名。需要活动检查,并且必须与服务器上配置的主机名匹配。 如果未定义,则从HostnameItem获取值。手工自定义一个主机名,可以和系统的主机名一样,也可以不一样 # HostnameItem=system.hostname #这里的优先级低于上面的Hostname。system.hostname是ZABBIX内置的一个自动获取主机名的方法 # HostMetadata= #用于定义当前主机唯一标识符,范围是0-255,仅适用于自动发现情况下,默认不定义。如果未定义,则将从HostMetadataItem获取值。 # HostMetadataItem= #定义用于获取主机元数据的项目的可选参数。主机自动注册过程使用主要的元数据。 在自动注册请求期间,如果指定项目返回的值超过255个字符,代理将记录一条警告消息。 仅当未定义HostMetadata时才使用此选项。 # RefreshActiveChecks=120 #被监控的主机多久(秒)重新请求代理或服务端刷新一监控列表。范围为60-3600秒。ZABBIX运行原理为:,zabbix客户端启动后,在等待RefreshActiveChecks秒后, #开始从代理或服务端请求并下载监控项信息,保存在本地专门的buffersend中,再过RefreshActiveChecks秒后,重新获取监控项信息。这就是为什么当配置监控项,要过一会才能生效的原因。这个数值,就是等待时间。建议,不要将此数值设置过小,以免加大AGENT端和服务端及数据库的压力,建议为120秒。 # BufferSend=5 #多少秒后,将BUFFER中的数据提交到代理或服务端。范围(1-3600)此数值的大小决定了采集后,提交数据的及时性,数值越小,则提交得越频繁, #对服务器压力越大,同时对AGENT端系统资源消耗越大,则表现出来的现象是报警非常及时,建议根据实际情况自行考虑,也可保持默认,若发现ZABBIX消耗资源较多,建议加大此数值。 # BufferSize=100 #此参数作用设置保存采集数据在内存中的容量大小。若此agent端监控项较多,建议加大此数值。BufferSize与BufferSend之间有联系的。当达到bUFFERSEND或Buffersize已满时,都会触发数据提交动作。范围是2-65535 # MaxLinesPerSecond=100 #代理将每秒发送到Zabbix服务器或代理处理的最大新行数,范围是1-1000 ############高级参数############ # Default: #设置项目键的别名。 它可以用来代替较长和更简单的长而复杂的项目密钥。可能存在多个别名参数。 不允许具有相同别名键的多个参数。 不同的别名键可以引用相同的项目键。例如:Alias=zabbix.userid:vfs.file.regexp[/etc/passwd,^zabbix:.:([0-9]+),,,,1] # Timeout=3 #gant采集一个数据的超时时间,但是是秒,范围是1-30 # AllowRoot=0 #是否允许ROOT帐号运行此客户端。0:不允许,1:允许 # User=zabbix #运行agent的用户 # Include= #加载目录路径或扩展配置文件路径 #######用户定义的监控参数####### # UnsafeUserParameters=0 #是否启用用户自定义监控脚本,1启用,0不启用。由于ZABBIX实现监控方法的多样性,一般都采用脚本来实现监控数据的采集,所以,建议开启,否则功能将受限。 # UserParameter= #用户定义的参数进行监控。 可以有几个用户定义的参数。格式:UserParameter = <key>,<shell命令>请参见“zabbix_agentd”目录中的示例。 #######扩展模块####### # LoadModulePath=${libdir}/modules #扩展模块路径 # LoadModule= #扩展模块路径
StartAgents=0 #客户端agent模式,仅为主动模式,值为0的时候,被监控端的zabbix_agentd 不监听本地端口,所以无法在 netstat -tunpl 中查看到zabbix_agentd进程
四、zabbix_proxy.conf配置文件详解
# cat /etc/zabbix/zabbix_proxy.conf #这是zabbix代理的配置文件
############一般参数############ # ProxyMode=0 #代理操作模式。 0 - 代理在主动模式,1 - 代理在被动模式 # Server= #Zabbix服务器的IP地址(或主机名)。Active Proxy将从服务器获取配置数据。当 Proxy 处于被动模式时,该参数将被忽略。 # ServerPort=10051 #Zabbix Server 监听端口,同上只在 Proxy 为主动模式时生效 Hostname=Zabbix proxy #手工设置zabbix获取的主机名称 # HostnameItem=system.hostname #如果上面没设置就按这里通过zabbix的内置函数获取 # ListenPort=10051 #自己本地的监听端口 # SourceIP= #多IP下要设置 # LogType=file #日志的存储类型 LogFile=/tmp/zabbix_proxy.log #日志的存储位置 # LogFileSize=1 #日志轮询大小 # DebugLevel=3 #日志级别 # PidFile=/tmp/zabbix_proxy.pid #pid位置 # DBHost=localhost #连接哪个主机库 DBName=zabbix_proxy #数据库名称 # DBSchema= DBUser=zabbix #数据库用户名 # DBPassword= #数据库密码 # DBSocket=/tmp/mysql.sock #数据库sock位置 # DBPort=3306 #数据库端口 #########代理特定参数######### # ProxyLocalBuffer=0 #即使数据已经与服务器同步,代理将在本地保留数据N小时。如果本地数据将被第三方应用程序使用,则可以使用此参数。范围是0-720 # ProxyOfflineBuffer=1 #如果与Zabbix Server无连接,代理将保留数据N小时。 较旧的数据将丢失。范围是1-720 # HeartbeatFrequency=60 #心跳消息的频率(秒)用于监视服务器端的代理服务器的可用性。 0 - 心跳消息被禁用。 对于被动模式下的代理,该参数将被忽略。范围是0-3600 # ConfigFrequency=3600 #代理在几秒钟内从Zabbix Server检索配置数据的频率。 对于被动模式下的代理,该参数将被忽略。范围是1-3600*24*7 # DataSenderFrequency=1 #代理将每N秒将收集的数据发送到服务器。 对于被动模式下的代理,该参数将被忽略。范围是1-3600 #########高级参数############(这就跟zabbix_agentd.conf一样了,就不重复了)
五、命令
zabbix_get命令
# /usr/local/zabbix/bin/zabbix_get -h #这个主要是zabbix的server端或者是proxy端,来测试是否能从被监控的主机获取数据
用法:zabbix_get [-hV] -s <host name or IP> [-p <port>] [-I <IP address>] -k <key> 选项: -s --host <host name or IP> #指定主机的主机名或IP地址 -p --port <port number> #指定主机上运行的代理端口号。 默认值为10050 -I --source-address <IP address> #指定源IP地址 -k --key <key of metric> #指定要检索的值的项目的键
例子:
# /usr/local/zabbix/bin/zabbix_get -s 192.168.1.104 -p 10050 -I 192.168.1.103 -k “system.hostname” #向192.168.1.104发起get请求,-p 是10050端口,-I 来源IP是192.168.1.103,-k 想获取的key
# /usr/local/zabbix/bin/zabbix_get -s 192.168.1.105 -k “system.cpu.load[all,avg15]” #向192.168.1.105获取load每15分钟的负载值(这是一个比较简单的写法一般也这么写)