zoukankan      html  css  js  c++  java
  • MySql--MVCC

    一、MVCC是什么?

    Multi-Vesrion Concurrency Control多版本并发控制,MVCC是一种并发控制的方法,一般在数据库管理系统中,实现对数据库的并发访问。

    你可以把MVCC看作一种行级别锁的妥协,在很多情况下避免了锁的使用,同时可以提供更小的开销。根据不同的实现,可以允许非阻塞式读,在写操作时只锁定必要的记录

     MVCC只在REPEATABLE READREAD COMMITTED两个隔离级别下工作。其他两个隔离级别都和MVCC不兼容,因为READ UNCOMMITTED总是读取最新的数据行,而不是符合当前事务版本的数据行,而SERIALIZABLE会对所有读取到的行都加锁。

    MVCC只解决了部分幻读(当前读时还是会读到已提交的数据)

    优势:

    使用MVCC多版本并发控制比锁定模型的主要优点是在MVCC里,对检索(读)数据的锁要求与写数据的锁要求不冲突,所以读不会阻塞写写也不会阻塞读

    恰当的使用MVCC会提供比锁更好的性能。

    二、MVCC的底层原理

    InnDB内部结构

     为了实现MVCC机制,InnDB内部为每一行添加了两个隐藏列:DB_TRX_IDDB_ROLL_PTR(MySQL另外还有一个隐藏DB_ROW_ID,这是在InnoDB表没有主键的时候会用来作为主键)。

     DB_TRX_ID:长度为6字节,存储了插入或更新语句的最后一个事务的事务ID。

     DB_ROLL_PTR:长度为7字节,称之为:回滚指针。回滚指针指向写入回滚段的undo log记录,读取记录的时候会根据指针去读取undo log中的记录。(正因为MySQL中undo log中会维护一个历史数据记录,所以我们应该养成定期提交事务的习惯,否则回滚段会越来越   大,甚至占满了表空间。)

     read-view: 当执行查询sql时会生成一致性试图read-view,它由执行查询时所有未提交事务id数组([DB_TRX_ID,DB_TRX_ID]已创建的最大事务id组成(数组里最小id:min_id,最大id:max_id),查询的数据结果需要跟read-view做比对从而得到快照结果。

    快照读

     快照读是针对上下文的当前读而言,指的是在RR隔离级别下,在不加锁的情况下MySql会根据回滚指针选择从undo log记录中获取快照数据,而不总是获取新的数据,这也就是为什么另一个事务提交了数据,在当前事务中看到的依然是另一个事务提交之前的数据。

    版本链比较规则(重点):

    1.如果落在绿色部分(trx_id<min_id),表示这个版本是已提交的事务生成的,这个数据是可见的。

    2.如果落在红色部分(trx_id>max_id),表示这个版本是由将来启动的事务生成的,是肯定不可见的。

    3.如果落在黄色部分(min_id<=trx_id<=max_id),那就包括两种情况

       a.若row在trx_id在数组中,表示这个版本是由还没提交的事务生成的,不可见,当前自己的事务是可见的

       b.若row的trx_id不在数组中,表示这个版本是已经提交的事务生成的,可见。

    下面逐步分析一下(RR隔离级别下

    第一步:

    有表:table1、table2。table2表中有字段:id、name、db_trx_id、db_roll_ptr(重点看table2)

    事务100对table1进行了update(未提交)、事务200对table1进行了update(未提交)、事务300对table2进行了update操作(已提交)

    update前:版本链中有一条id=1、name=UZI、db_trx_id=60的数据

    update中:先将版本链上最新的数据复制一份,然后将trx_id修改成update的trx_id,将db_roll_ptr指向原始数据。

    update后:版本链中有两条数据,新数据用指针指向旧数据

     注意:这时readview为[100,200],300,因为事务100未提交、事务200未提交,当前最大db_trx_id=300。

     当在select1中进行select时,trx_id在readview([100,200],300)的黄色区域,且不再数组中,所以name的结果为JackLove。(符合比较规则)

    第二步:

     事务100又对table2先后进行了两次update操作,在commit前,select1进行了一次select。

     这时版本链内的数据如下:

     注意:这时readview也是[100,200],300,因为在一个事务中readview是不可变的,从第一次执行sql开始。

     当在select1中进行select时(trx_id=100),先判断第一条数据,发现在黄色区域且在数组内,则不符合。

     向下找第二条数据,发现也在黄色区域且在数组内,则不符合。

      向下找第三条数据,发现也在黄色区域且不在数组内,符合,所以还是返回name="JackLove"。

    第三步:

     事务200分别进行了两次update,在commit前,select1和select2分别进行了一次select;

     这时版本链中的数据如下:

     

     这时select1(readview:[100,200],300)查询结果是:name="JackLove",

     select2进行select时,事务200未提交,最大max_id=300,所以readview=[200],300,trx_id=200,

     进行逐次比较,结果name="Rookie"

    对于删除操作:

     对于删除的情况可以认为是update的特殊情况,会将版本链上最新的数据复制一份,然后将trx_id修改成删除操作的trx_id,同时在该条记录的头信息(record header)里的(deleted flag)标记未写上true,来表示当前记录已经被删除,在查询时按照上面的规则查到对应的   记录,如果delete_flag标记为true,意味着记录已被删除,则不返回数据。

    总结:

    MVCC解决了什么问题?

      就是解决了Repeatable Read和Read Committed两个隔离级别下读同一行和写同一行的两个事务的并发。

    RC和RR两个不同的事务的隔离级别下,快照读有什么不同呢?

      RC下,快照读总是能读到最新的行数据快照,当然,必须是已提交事务写入的

      RR下,某个事务首次read记录的时间为T,未来不会读取到T时间之后已提交事务写入的记录,以保证连续相同的read读到相同的结果集。也就是readview不会改变。

    快照读和当前读?

    select * from table where id=1 是快照读

    select * from table where id=1 for update、select * from table where id=1 lock in share mode、update、 insert、delete都是当前读

    当前读时,会从别的事务中拿到已提交的数据,不走快照,即使是在RR的事务隔离级别下。

  • 相关阅读:
    Zookeeper白话解析
    WireMock简单使用
    mysql通用包安装
    修改mysql密码
    jmeter for循环嵌套if学习2
    jmeter for循环嵌套if学习1
    jmeter Transaction Controller学习
    jmeter ForEach Controller学习
    loadrunner随笔1
    shell中创建mysql库和执行sql脚本
  • 原文地址:https://www.cnblogs.com/BounceGuo/p/13441073.html
Copyright © 2011-2022 走看看