zoukankan      html  css  js  c++  java
  • 使用Zabbix监控Oracle数据库

     

    Orabbix介绍

    监控Oracle数据库我们需要安装第三方提供的Zabbix插件,我们先测试比较有名的Orabbix,http://www.smartmarmot.com/product/orabbix/

    clip_image001

    从部署架构图上可以看出,orabbix是通过JDBC去连接被监控数据库的,其实不是必须在数据库主机上安装Agent,而运行orabbix的主机,可以是Zabbix Server,也可以是数据库主机和zabbix server之外的任意一台主机,为了测试方便,我们将orabbix安装在Zabbix Server上。

    下载软件及安装服务

    Ø 下载 Orabbix ,上传到你的 Zabbix Server

    Ø unzip 软件到这个目录: /opt/orabbix

    Ø 安装服务:

    Ø 复制启动脚本

    #cp /opt/orabbix/init.d/orabbix /etc/init.d/orabbix

    Ø 运行权限:

    #chmod +x /etc/init.d/orabbix

    #chmod +x /opt/orabbix/run.sh

    Ø #chkconfig --add orabbix

    建立监控用户及授权

    CREATE USER ZABBIX

    IDENTIFIED BY welcome1

    DEFAULT TABLESPACE SYSTEM

    TEMPORARY TABLESPACE TEMP

    PROFILE DEFAULT

    ACCOUNT UNLOCK;

    REM 2 Roles for ZABBIX

    GRANT CONNECT TO ZABBIX;

    GRANT RESOURCE TO ZABBIX;

    ALTER USER ZABBIX DEFAULT ROLE ALL;

    REM 5 System Privileges for ZABBIX

    GRANT SELECT ANY TABLE TO ZABBIX;

    GRANT CREATE SESSION TO ZABBIX;

    GRANT SELECT ANY DICTIONARY TO ZABBIX;

    GRANT UNLIMITED TABLESPACE TO ZABBIX;

    GRANT SELECT ANY DICTIONARY TO ZABBIX;

    如果是11g数据库,执行下列语句:

    exec dbms_network_acl_admin.create_acl(acl => 'resolve.xml',description => 'resolve acl', principal =>'ZABBIX', is_grant => true, privilege => 'resolve');

    exec dbms_network_acl_admin.assign_acl(acl => 'resolve.xml', host =>'*');

    commit;

    修改orabbix配置文件

    #cd /opt/orabbix/conf

    #cp config.props.sample config.props

    根据实际的部署情况修改文件,比如:

    #comma separed list of Zabbix servers

    ZabbixServerList=ZabbixServer1

    ZabbixServer1.Address=192.168.0.41 ##Zabbix服务器地址

    ZabbixServer1.Port=10051 ##Zabbix服务器端口

    #pidFile

    OrabbixDaemon.PidFile=./logs/orabbix.pid

    #frequency of item's refresh

    OrabbixDaemon.Sleep=300

    #MaxThreadNumber should be >= than the number of your databases

    OrabbixDaemon.MaxThreadNumber=100

    #put here your databases in a comma separated list

    DatabaseList=DB1,DB2,DB3 ##数据库列表,名称随便起

    #Configuration of Connection pool

    #if not specified Orabbis is going to use default values (hardcoded)

    #Maximum number of active connection inside pool

    DatabaseList.MaxActive=10

    #The maximum number of milliseconds that the pool will wait

    #(when there are no available connections) for a connection to be returned

    #before throwing an exception, or <= 0 to wait indefinitely.

    DatabaseList.MaxWait=100

    DatabaseList.MaxIdle=1

    #define here your connection string for each database

    DB1.Url=jdbc:oracle:thin:@192.168.0.31:1521:test1 ##数据库连接串

    DB1.User=zabbix ##监控数据库用户名

    DB1.Password=welcome1 ##监控数据库口令

    保存配置文件,然后重启orabbix。

    导入模板

    在orabbix的软件包里面有4各模板文件,导入下面途中这个模板文件就可以了,包含了其他所有模板文件的内容。

    clip_image002

    适用Orabbix

    在zabbix界面上配置数据库监控时,要注意,orabbix是把每个数据库都配置成一个“主机”的,这块看着有点别扭,而且,注意在配置主机时,名称一定要和config.props文件中配置的数据库名称一样,比如我这里就是DB1:

    clip_image003

    前面说了,这个“主机”的地址可以随便写,因为被监控的主机端不需要一定有agent,但是为了方便管理,我觉得还是写上Oracle主机的地址比较好。

    定义了主机后,就可以适用模板中预定义的监控项、触发器和图表了。

    比如图表:

    clip_image004

    clip_image005

    比如最简单的检查数据库适用可用的触发器:

    clip_image006

    当然,对应触发器的动作还是需要自己配置。

    自定义SQL检查

    Orabbix提供了表空间的监控,监控项对应的SQL:

    tbl_space.Query=SELECT * FROM (

    select '- Tablespace ->',t.tablespace_name ktablespace,

    '- Type->',substr(t.contents, 1, 1) tipo,

    '- Used(MB)->',trunc((d.tbs_size-nvl(s.free_space, 0))/1024/1024) ktbs_em_uso,

    '- ActualSize(MB)->',trunc(d.tbs_size/1024/1024) ktbs_size,

    '- MaxSize(MB)->',trunc(d.tbs_maxsize/1024/1024) ktbs_maxsize,

    '- FreeSpace(MB)->',trunc(nvl(s.free_space, 0)/1024/1024) kfree_space,

    '- Space->',trunc((d.tbs_maxsize - d.tbs_size + nvl(s.free_space, 0))/1024/1024) kspace,

    '- Perc->',decode(d.tbs_maxsize, 0, 0, trunc((d.tbs_size-nvl(s.free_space, 0))*100/d.tbs_maxsize)) kperc

    from

    ( select SUM(bytes) tbs_size,

    SUM(decode(sign(maxbytes - bytes), -1, bytes, maxbytes)) tbs_maxsize, tablespace_name tablespace

    from ( select nvl(bytes, 0) bytes, nvl(maxbytes, 0) maxbytes, tablespace_name

    from dba_data_files

    union all

    select nvl(bytes, 0) bytes, nvl(maxbytes, 0) maxbytes, tablespace_name

    from dba_temp_files

    )

    group by tablespace_name

    ) d,

    ( select SUM(bytes) free_space,

    tablespace_name tablespace

    from dba_free_space

    group by tablespace_name

    ) s,

    dba_tablespaces t

    where t.tablespace_name = d.tablespace(+) and

    t.tablespace_name = s.tablespace(+)

    order by 8)

    where kperc > 93

    and tipo <>'T'

    and tipo <>'U'

    tbl_space.NoDataFound=none

    这个SQL会返回93%满的表空间信息,而对应这个监控项,orabbix也定义了触发器,因为监控项的返回值是文本,而没有满足条件的记录时返回字符串“none“,所以监控项对应的触发器会检查返回值开头是不是none,如果不是,就报警,这样,用户除了收到预警信息,还能从返回值的具体值中看到具体时哪个表空间快满了。

    当然,大部分时间监控项会返回none,所以我们无法画出正常未满的表空间的空间占用时间曲线。只有超过93%慢时,我们才知道具体的占用情况。

    如果想收集并保留更多信息,就需要使用自定义查询,方法就是在query.props文件中加入你想检查的SQL,比如我们想了解表空间信息,就加以下SQL:

    customtbl.Query=select 'TBL:'||a.tablespace_name||',' TBL,

    'Total Size:'||trunc(sum(a.tots) / 1024 / 1024, 2)||',' Tot_Size_mb,

    'Free MB:'||round(sum(a.sumb) / 1024 / 1024, 2)||',' Tot_Free_mb,

    'PCT Free:'||round(sum(a.sumb) * 100 / sum(a.tots), 2)||',' Pct_Free,

    'Max Free MB:'||round(sum(a.largest) / 1024 / 1024, 2)||',' Max_Free_mb,

    'Chunks Free:'||sum(a.chunks)||',' Chunks_Free

    from (select tablespace_name,

    0 tots,

    sum(bytes) sumb,

    max(bytes) largest,

    count(*) chunks

    from dba_free_space a

    group by tablespace_name

    union

    select tablespace_name, sum(bytes) tots, 0, 0, 0

    from dba_data_files

    group by tablespace_name) a

    group by a.tablespace_name

    customtbl.NoDataFound=none

    然后在orabbix对应的模板中添加这个监控项customtbl就可以了,下面时从最新数据菜单查看的SQL的返回结果:

    clip_image007

    当然,我们要做进一步的分析和展示,就需要使用别的工具或者开发工具来做了,这个就不是这篇文章讨论的范围了。

    Orabbix不足

    初步测试,感觉orabbix有2点明显缺陷:

    1. 被监控数据库信息要逐个写进配置文件,如果数据库个数比较多,管理会比较麻烦

    2. 被监控数据库的账号信息是写在配置文件中,而且口令是明文存储,有很大的安全隐患

    3. 对RAC的支持还是很初级

  • 相关阅读:
    1619: 【例 1】Prime Distance
    Apache的架构师们遵循的30条设计原则(转帖)
    DP秒思维
    dsu on tree入门
    莫队入门
    行列式与霍尔基夫矩阵
    高精度板子
    splay入门
    回文自动机入门
    AC自动机
  • 原文地址:https://www.cnblogs.com/raobing/p/6173529.html
Copyright © 2011-2022 走看看