zoukankan      html  css  js  c++  java
  • 我家很管事的猫——mycat初步部署实践与问题排查

    mycat,阿里出品的mysql中间件,提供读写分离和分库分表方案。项目中主要使用的是其读写分离功能。

    【如何部署?】

    本文只采用并测试了双主从模式,配置看这一篇足矣:

    https://www.cnblogs.com/biglittleant/p/7059569.html

    需要注意在配置并启动mycat之前一定要完成mysql物理节点之间主从复制配置,并保证每个节点show slave statusG中

    SLAVE_SQL_RUNNING、SLAVE_IO_RUNNING都为YES。

    然后启动mycat,一般不会发生问题。

    对dataHost的三个参数进行解读:

    <dataHost name="mysqlms" maxCon="2000" minCon="20" balance="1"
    writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">

    其中,balance指的负载均衡类型。

    1. balance="0", 不开启读写分离机制,所有读操作都发送到当前可用的writeHost上。

    2. balance="1",全部的readHost与stand by writeHost参与select语句的负载均衡,简单的说,当双主双从模式(M1->S1,M2->S2,并且M1与 M2互为主备),正常情况下,M2,S1,S2都参与select语句的负载均衡。

    3. balance="2",所有读操作都随机的在writeHost、readhost上分发。

    4. balance="3",所有读请求随机的分发到wiriterHost对应的readhost执行,writerHost不负担读压力

    writeType指写操作模式。

    1. writeType=“0”, 所有写操作都发送到可用的writeHost上。
    2. writeType=“1”,所有写操作都随机的发送到readHost。
    3. writeType=“2”,所有写操作都随机的在writeHost、readhost分上发。

    switchType指的是切换的模式。

    1. switchType='-1' 表示不自动切换

    2. switchType='1' 默认值,表示自动切换

    3. switchType='2' 基于MySQL主从同步的状态决定是否切换,心跳语句为 show slave status

    4. switchType='3'基于MySQL galary cluster的切换机制(适合集群),心跳语句为 show status like 'wsrep%'。

    目前还没有尝试过双主节点同时挂掉的情况,switchType暂且使用了默认值。这里有待后续测试。

    【日志级别】
    /.../mycat/conf/log4j2.xml
    <asyncRoot level="debug"

    此时能够看到mycat负载路径,很实用。

    另外附上mysql在配置文件my.cnf中打开bin日志和普通日志的方式,尤其是普通日志,配合mycat日志可以更好地理解读写分离实现过程。

    普通
    general_log=1

    general_log_file=/usr/local/log/query.log

    SHOW GLOBAL VARIABLES LIKE 'general%';(查看开启状态,如未成功查看mysql日志mysqld.log)

    二进制
    log_bin=mysql-bin

    SHOW GLOBAL VARIABLES LIKE '%log%';(查看开启状态,如未成功查看mysql日志mysqld.log)

    【监控】

    这里我试用了mycat-eye,个人感觉并不是很好用,很多项是空白也不清楚怎么开启,但至少可以很方便的获得物理节点的心跳状态。

    【节点down掉】

    写节点down掉之后其读节点也会失效,一般情况下重连之后此主从仍会作为mycat集群中承担读任务的节点。
    mysql的主从同步线程重启时间较长,估算约30秒,估计还会受期间发生的事务数量影响。
    好处是节点down掉之后重连会自动同步(只要双主从初始配置正常),不用手动修改mysql主从复制配置。

    【写主节点down掉】
    mycat在检测到写主节点会尝试将主节点分配给写从节点。并在dnindex.properties记录,dataHost name=? 为0时表示M1,为1时表示M2。

    注意:在down掉的写主节点重新连接或将mycat重启后此值依然不变。指定写主节点需要手动修改并重启mycat。

    【偶发bug】
    1、【数据不一致】mycat对于即时性高的事务支持是比较稳定的,测试中与代码执行逻辑相违背的数据不一致情况极偶发,其中**在写主节点down掉重新启动之后必发**。
    未及时情况原因:在mycat中,部分写sql发生在读sql之后。

    2、down掉重启之后可能不会再将读请求分配给写从节点及其读从节点,这里可能涉及负载均衡策略,还需进一步测试。

    【其他问题排查,mysql本身问题居多】

    1、【navicat前端不能直接操作mycat?数据会不一致?】

    这个问题比较具有迷惑性,经测试,navicat操作mycat节点时,sql与jdbc连接mycat执行的sql无异,都是先发送至mycat由其进行负载分配(可查看日志mycat.log验证),update语句在writeType=“0”的情况下一定由写主节点完成。

    如果不经由mycat而直接在写节点或读节点操作,mycat不会形成日志。

    后来查清当时之所形成这样的认知,是因为其中一个读节点,由于服务器上其他应用的日志文件迅速占满了空间而导致mysql主从同步的线程阻塞,而mycat并未发现异常,继续为此节点分配读任务,导致数据不一致。

    解决方法腾出空间即可,无需对该节点mysql进行额外操作。

    实际上,当其中一个节点出现磁盘空间已满这种问题时,在navicat连接mycat打开一个表,反复刷新就会发现数据不一致情况。

    mycat能否发现出问题的读节点并将其排除,有待进一步研究。

    2、【SLAVE_SQL_RUNNING、SLAVE_IO_RUNNING为NO】

    (1)SLAVE_SQL_RUNNING为NO可单独尝试reset master;看能否生效。

    (2)SLAVE_IO_RUNNING为NO

    到主库上show master status查一下主库当前的gtid(Executed_Gtid_Set),
    然后到从库执行下面命令:
    reset master;
    stop slave;
    set global gtid_purged = 'xxxx'; -- 这里xxxx是主库的Executed_Gtid_Set,可以为空噢
    start slave;

    意思是从库同步时,丢弃现有主库执行过的gtid。

    (3)以上若不能解决,看日志/var/log/mysqld.log对症下药。

    对于网上的一些change master解决方式,在GTID模式开启的情况下,

    gtid-mode=on
    enforce-gtid-consistency

    不用重新指定change master to master_log_file='mysql-bin.xxxxxx',master_log_pos=xxx;

     3、【我用navicat打开某个schema之后刷新,看到的“行”、“自动递增值”、“修改日期”不一样?】

    首先,这里的统计数据是由SHOW TABLE STATUS得到的。每个表内的记录实际上是完全一致的。

    (1)“行”:这里引用CSDN论坛小小小小周的回答:

    “部分存储引擎,如MyISAM,存储精确的数目。
    对于其它存储引擎,比如InnoDB,本值是一个大约的数,与实际值相差可达40到50%。在这些情况下,使用SELECT COUNT(*)来获得准确的数目。
    对于在INFORMATION_SCHEMA数据库中的表,Rows值为NULL”

    (2)“自动递增值”:在,除了主写节点以外,其他承担读任务的节点increment应该都一致并比主写节点少1。

    (increment可以通过 SELECT auto_increment FROM information_schema.tables where table_schema="dbName" and table_name="tableName";单独查看,值和SHOW TABLE STATUS得到的相同。)

    查看my.cnf中的配置,两个写节点(或称M节点)的offset一个为1另一个为2。

    auto-increment-offset=x
    auto-increment-increment=2

    为了实现双主从模式的事务控制和切换,increment设置为2。由此导致主写节点比当前存在的最大一个id多2,其他节点(同步自己的主节点)比当前存在的最大一个id多1,注意这里设置了increment为2的另一写节点同样比当前存在的最大一个id多1。

    另猜测,**在写主节点down掉重新启动之后必发**的数据不一致bug可能与此有关,有待进一步测试。

    (3)“修改日期”:这个值应该只有微小不一致,因为各节点主从同步时间有微小差别。当然,这里的信息都不完全准确。

    不当之处恳请各位指教,下篇jenkins。

    【190103补充】

    经测试,update等DML操作可以正常加行锁,而select...for update被mycat视作普通select,也就是说不会把select...for update分配到主写节点。

    但是,在使用mybatis+spring的情况下,在select方法上加@Transaction注解(如果写在更外层则不会影响select方法)可以由主写节点处理查询,这时select...for update即可正常加锁了。

  • 相关阅读:
    Java反射(2)访问字段(Field)
    《编程珠玑》中“位图排序”引发的一系列实验
    Java : 传值or传引用?
    const 指针
    三种数据库访问——Spring3.2 + Hibernate4.2
    三种数据库访问——Spring JDBC
    数据库连接池:Druid
    三种数据库访问——原生JDBC
    介绍4款json的java类库 及 其性能测试
    云存储(Swift+Keystone)部署策略
  • 原文地址:https://www.cnblogs.com/feixuefubing/p/10191237.html
Copyright © 2011-2022 走看看