zoukankan      html  css  js  c++  java
  • 转 MySQL数据库监控软件lepus使用问题以及解决办法

    ##感谢coe2coe

    MySQL数据库监控软件lepus使用问题以及解决办法

    在使用lepus3.7监控MySQL数据库的时候,碰到了以下几个问题,本博客给出了这些问题产生的原因,以及相应的解决办法。

    1. 问题1:php页面无法连接数据库

    直接使用php程序执行php文件,可以连接mysql,但是在httpd中同样的php页面无法连接mysql。

    lepus的web程序(PHP代码)无法连接数据库时,web界面上什么操作也无法继续。

    为此编写了最简单的PDO连接测试代码:

    php代码如下:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    [x@coe2coe lepus]$ cat mysql.php
    <?php
     try{
     #$dsn="mysql:host=127.0.0.1;dbname=lepus;";
     $dsn="mysql:host=11.1.1.11;dbname=lepus;";
     $user="coe2coe";
     $pwd="XXXXXXXXXX";
     $sql="select now() as a";
     $dbh=new PDO($dsn,$user,$pwd);
     $stmt=$dbh->prepare($sql);
     $stmt->execute();
     $row=$stmt->fetch(PDO::FETCH_ASSOC);
     echo "result:".$row['a'];
     }
     catch(PDOException $e) {
     echo "FAILED:".$e->getMessage();
     }
    ?>

    php程序直接执行php文件:

    1
    2
    [x@coe2coe lepus]$ php mysql.php
    result:2018-09-27 00:03:44

    通过浏览器访问这个页面:

    FAILED:SQLSTATE[HY000] [2003] Can't connect to MySQL server on '11.1.1.11' (13)

    lepus的web程序给出的错误提示信息更加模糊。

    原因:

    通过一番baidu之后,终于看到了一个比较靠谱的分析。

    Linux(CentOS7)的selinux安全机制禁止了httpd中的模块访问网络。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    [x@coe2coe lepus]$ sudo getsebool -a |grep httpd
    httpd_anon_write --> off
    httpd_builtin_scripting --> on
    httpd_can_check_spam --> off
    httpd_can_connect_ftp --> off
    httpd_can_connect_ldap --> off
    httpd_can_connect_mythtv --> off
    httpd_can_connect_zabbix --> off
    httpd_can_network_connect --> off
    httpd_can_network_connect_cobbler --> off
    httpd_can_network_connect_db --> off
    httpd_can_network_memcache --> off
    httpd_can_network_relay --> off
    httpd_can_sendmail --> off
    httpd_dbus_avahi --> off
    httpd_dbus_sssd --> off
    httpd_dontaudit_search_dirs --> off
    httpd_enable_cgi --> on
    httpd_enable_ftp_server --> off
    httpd_enable_homedirs --> off
    httpd_execmem --> off
    httpd_graceful_shutdown --> on
    httpd_manage_ipa --> off
    httpd_mod_auth_ntlm_winbind --> off
    httpd_mod_auth_pam --> off
    httpd_read_user_content --> off
    httpd_run_ipa --> off
    httpd_run_preupgrade --> off
    httpd_run_stickshift --> off
    httpd_serve_cobbler_files --> off
    httpd_setrlimit --> off
    httpd_ssi_exec --> off
    httpd_sys_script_anon_write --> off
    httpd_tmp_exec --> off
    httpd_tty_comm --> off
    httpd_unified --> off
    httpd_use_cifs --> off
    httpd_use_fusefs --> off
    httpd_use_gpg --> off
    httpd_use_nfs --> off
    httpd_use_openstack --> off
    httpd_use_sasl --> off
    httpd_verify_dns --> off

    解决办法:

    临时办法:临时禁用SELINUX。

    [x@coe2coe lepus]$ sudo setenforce 0

    永久办法:修改selinux配置文件,禁用SELINUX。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    [x@coe2coe lepus]$ cat /etc/selinux/config
    # This file controls the state of SELinux on the system.
    # SELINUX= can take one of these three values:
    #  enforcing - SELinux security policy is enforced.
    #  permissive - SELinux prints warnings instead of enforcing.
    #  disabled - No SELinux policy is loaded.
    #SELINUX=enforcing
    SELINUX=disabled
    # SELINUXTYPE= can take one of three two values:
    #  targeted - Targeted processes are protected,
    #  minimum - Modification of targeted policy. Only selected processes are protected.
    #  mls - Multi Level Security protection.
    SELINUXTYPE=targeted

    验证:

    再次在浏览器中访问这个php页面:

    result:2018-09-27 00:09:26

    2. 问题2:lepus日志中出现group by警告。

    2018-09-27 01:12:41 [WARNING] check mysql 11.1.1.11:3408 failure: 1055 Expression #2 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'information_schema.processlist.USER' which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_mode=only_full_group_by

    原因:

    这是lepus后端监控程序写的log。

    默认情况下sql_mode包含ONLY_FULL_GROUP_BY。

    1
    2
    3
    4
    5
    6
    7
    mysql> select @@sql_mode;
    +-------------------------------------------------------------------------------------------------------------------------------------------+
    | @@sql_mode                                |
    +-------------------------------------------------------------------------------------------------------------------------------------------+
    | ONLY_FULL_GROUP_BY,STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION |
    +-------------------------------------------------------------------------------------------------------------------------------------------+
    1 row in set (0.01 sec)

    解决办法:

    去掉ONLY_FULL_GROUP_BY。

    1
    sql_mode=STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION

    3. 问题3:复制监控查询不到数据。

    没有查询到数据.

    解决办法:

    show_compatibility_56=1

    4. 问题4:表空间分析没有数据。

    5. 问题5:慢查询没有数据。

    前提:

    MySQL的my.cnf配置文件中已经配置了慢查询日志。

    1
    2
    3
    4
    5
    6
    7
    slow_query_log=1
     
    long_query_time=10
     
    log_slow_admin_statements=1
     
    log_slow_slave_statements=1

    原因:

    1.lepus慢查询分析基于pecona-toolkit工具包中的pt-query-digest程序。需要先安装这个工具包。

    2. pt-query-digest程序与lepus3.7建的表有点冲突。

    Pipeline process 5 (iteration) caused an error: DBD::mysql::st execute failed: Data truncated for column 'checksum' at row 1 [for Statement "REPLACE INTO `lepus`.`mysql_slow_query_review_history`(`checksum`, `sample`, `serverid_max`, `db_max`, `user_max`, `ts_min`,
    .....
    Terminating pipeline because process 4 (iteration) caused too many errors.

    修改mysql_slow_query_review:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    mysql> alter table mysql_slow_query_review modify checksum varchar(100) not null ;
    Query OK, 0 rows affected (0.03 sec)
    Records: 0 Duplicates: 0 Warnings: 0
    修改mysql_slow_query_review_history:
    mysql> alter table mysql_slow_query_review_history modify checksum varchar(100) not null;
    Query OK, 0 rows affected (0.02 sec)
    Records: 0 Duplicates: 0 Warnings: 0
    mysql> alter table mysql_slow_query_review_history modify serverid_max smallint(4) null;
    Query OK, 0 rows affected (0.02 sec)
    Records: 0 Duplicates: 0 Warnings: 0

    修改脚本:

    原始的lepus_slowquery.sh文件存在一些问题。

    (1) 需要人工指定lepus_server_id。这个脚本需要在每个MySQL服务器上部署,因此如果要监控的MySQL很多,会比较容易出错。

    lepus_server_id这个参数很重要。下面的代码可以自动取得这个id。

    1
    id=$( $mysql_client -h$lepus_db_host -P$lepus_db_port -u$lepus_db_user -p$lepus_db_password -e "select id,host,port from $lepus_db_database.db_servers_mysql where host='$mysql_host' and port=$mysql_portG" 2>/dev/null |grep "id:" |awk -F": " '{print $2}')

    (2)同一台机器上如果部署有多个MySQL服务实例时,应该只需要一个定时任务即可,在另一脚本中同时对本机的多个MySQL服务实例进行检查。

    这个总的定时脚本如下,测试时开启了6个MySQL实例,端口依次为:3306 3307 3308 3406 3407 3408.其中3306和3406为MASTER,其它为SLAVE。在这个总的脚本中对每个实例调用lepus_slowquery.sh。

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    [x@coe2coe mysql]$ cat slowquery.sh
    ##################################################################
    # FileName :slowquery.sh
    # Author  : coe2coe@qq.com
    # Created  :2018-09-27
    #################################################################
    #!/bin/bash
    ports=(3306 3307 3308 3406 3407 3408)
    i=0
    while [ $i -lt ${#ports[*]} ]
    do
     port=${ports[$i]}
     echo -e "/lepus_slowquery.sh $port"
     ./lepus_slowquery.sh $port
     let i=i+1
    done

    (3)原始的lepus_slowquery.sh会去修改MySQL的全局配置参数,个人认为不需要修改,这两个配置还是应该按照MySQL服务器的my.cnf文件中配置的为准,不应该因为部署了一个lepus监控系统就随意的修改这个参数。因此直接注释掉了最后面的几行代码。

    1
    2
    long_query_time
    slow_query_log_file

    修改后的完整的lepus_slowquery.sh文件如下:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    [x@coe2coe mysql]$ cat lepus_slowquery.sh
    #!/bin/bash
    #****************************************************************#
    # ScriptName: /usr/local/sbin/lepus_slowquery.sh
    # Create Date: 2014-03-25 10:01
    # Modify Date: 2014-03-25 10:01
    #***************************************************************#
    port=$1
    id=$2
    if [ "$port" == "" ] || [ $port -lt 1 ]
    then
     echo -e "invalid argument port"
     exit 1
    fi
    echo -e "mysql port is :{$port} "
    #config lepus database server
    lepus_db_host="11.1.1.11"
    lepus_db_port=3306
    lepus_db_user="lepus_monitor"
    lepus_db_password="XXXXXXXXXX"
    lepus_db_database="lepus"
    #config mysql server
    mysql_client="/usr/bin/mysql"
    mysql_host="11.1.1.11"
    mysql_port=$port
    mysql_user="lepus_monitor"
    mysql_password="XXXXXXXXXX"
    id=$( $mysql_client -h$lepus_db_host -P$lepus_db_port -u$lepus_db_user -p$lepus_db_password -e "select id,host,port from $lepus_db_database.db_servers_mysql where host='$mysql_host' and port=$mysql_portG" 2>/dev/null |grep "id:" |awk -F": " '{print $2}')
    if [ "$id" == "" ] || [ $id -lt 1 ]
    then
     echo -e "invalid argument id"
     exit 2
    fi
    echo -e "mysql lepus id is :{$id}"
    #config slowqury
    slowquery_dir="/tmp/"
    slowquery_long_time=1
    slowquery_file=`$mysql_client -h$mysql_host -P$mysql_port -u$mysql_user -p$mysql_password -e "show variables like 'slow_query_log_file'" 2>/dev/null |grep log|awk '{print $2}'`
    pt_query_digest="/usr/bin/pt-query-digest"
    #config server_id
    lepus_server_id=$id
    #collect mysql slowquery log into lepus database
    $pt_query_digest --user=$lepus_db_user --password=$lepus_db_password --port=$lepus_db_port --review h=$lepus_db_host,D=$lepus_db_database,t=mysql_slow_query_review --history h=$lepus_db_host,D=$lepus_db_database,t=mysql_slow_query_review_history --no-report --limit=100% --filter=" $event->{add_column} = length($event->{arg}) and $event->{serverid}=$lepus_server_id " $slowquery_file > /tmp/lepus_slowquery.log
    ##### set a new slow query log ###########
    #tmp_log=`$mysql_client -h$mysql_host -P$mysql_port -u$mysql_user -p$mysql_password -e "select concat('$slowquery_dir','slowquery_', '$port','_', date_format(now(),'%Y%m%d%H'),'.log');" 2>/dev/null |grep log|sed -n -e '2p'`
    #config mysql slowquery
    #$mysql_client -h$mysql_host -P$mysql_port -u$mysql_user -p$mysql_password -e "set global slow_query_log=1;set global long_query_time=$slowquery_long_time;" 2>/dev/null
    #$mysql_client -h$mysql_host -P$mysql_port -u$mysql_user -p$mysql_password -e "set global slow_query_log_file = '$tmp_log'; "
    #delete log before 7 days
    #cd $slowquery_dir
    #/usr/bin/find ./ -name 'slowquery_*' -mtime +7|xargs rm -rf ;
    ####END####

    6. 问题6:web慢查询查询不到lepus中的数据

    在mysql_slow_query_review表中记录了慢查询,但是在lepus web界面上没有数据。

    执行:select sleep(14)有时候无法在web界面查询到。

    原因:有时候pt-query-digest产生的结果中db_max为NULL,导致查询不出来。

    这个字段安装的原始数据库是NOT NULL,但是在NOT NULL的情况下pt-query-digest有时会插入NULL数据,导致报错。所以修改为了NULL。

    修改为NULL后,web界面中查询时使用的PHP程序的SQL语句有问题,没有考虑NULL的情况,导致查询不出来这部分数据。

    解决办法:

    临时打开general_log这个全局参数,再做web查询慢日志,就可以很快找到这个SQL语句,再根据这个SQL语句就可以找到有问题的PHP代码。

    将 application/controllers/lp_mysql.php中的以下语句注释掉即可。

    修改前:

    1
    $this->db->where( "b.db_max !=", 'information_schema'");

    修改后:

    1
    //$this->db->where( "b.db_max !=", 'information_schema'");

    7. 问题7:主机监控中的三项都没有数据。

    原因:监控主机以及被监控主机上没有安装snmpd,snmptrapd。

    解决办法:

    在所有主机上安装snmpd和snmptrapd。

    软件包:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    x@coe2coe snmp]$ ls net-snmp*
     
    net-snmp-5.7.2-32.el7.x86_64.rpm
     
    net-snmp-agent-libs-5.7.2-32.el7.x86_64.rpm
     
    net-snmp-devel-5.7.2-32.el7.x86_64.rpm
     
    net-snmp-libs-5.7.2-32.el7.x86_64.rpm
     
    net-snmp-perl-5.7.2-32.el7.x86_64.rpm
     
    net-snmp-python-5.7.2-32.el7.x86_64.rpm
     
    net-snmp-sysvinit-5.7.2-32.el7.x86_64.rpm
     
    net-snmp-utils-5.7.2-32.el7.x86_64.rpm

    CentOS7-everything-xxx.iso上有这些软件包。

    安装完毕后启动snmpd和snmptrapd服务。

    总结

    以上所述是小编给大家介绍的MySQL数据库监控软件lepus使用问题以及解决办法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!

    您可能感兴趣的文章:

    ###sample 2 感谢GPF19950411


    参考解析命令
    请注意要加charset,要不然sql中中文会乱码


    pt-query-digest
    --user=user --password=password --port=port
    --review h=ip,D=dbname,t=t_slowq_review
    --history h=ip,D=dbname,t=t_slowq_details
    --no-report --limit=100% --charset=utf8

    --charset=utf8
    ————————————————
    版权声明:本文为CSDN博主「GPF19950411」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
    原文链接:https://blog.csdn.net/GPF19950411/java/article/details/99676516

    ###感谢@Mount565Mount565

    This is caused by incorrect character encoding. In my case , it is because perl is trying to insert utf8mb4 character into table with utf8mb3 encoding. I changed table character encoding to utf8mb4 , the error vanished

  • 相关阅读:
    CentOS6.4安装OpenSSL
    Linux下设置Tomcat开机启动
    Linux下Tomcat8.0.44配置使用Apr
    CentOS6.4将MySQL5.1升级至5.5.36
    Linux下实现MySQL数据库自动备份
    Linux将MySQL数据库目录挂载至新数据盘
    MySQL创建数据库与创建用户以及授权
    Node.js Mongoose数据库连接失败 提示:Authentication failed
    JBoss7.1.1远程无法访问
    mongodb3.4 远程连接认证失败
  • 原文地址:https://www.cnblogs.com/feiyun8616/p/12736678.html
Copyright © 2011-2022 走看看