MySQL的四种事务隔离级别SQL标准定义了4类隔离级别,包括了一些具体规则,用来限定事务内外的哪些改变是可见的,哪些是可见的。低级别的隔离级一般支持更高的并发处理,并拥有更低的系统开销。
一、事务的基本要素(ACID)
1、原子性(Atomicity):事务开始后所有操作,要么全部做完,要么全部不做,不可能停滞在中间环节。事务执行过程中出错,会回滚到事务开始前的状态,所有的操作就像没有发生一样,也就是说事务是一个不可分割的整体。
2、一致性(Consistency):事务开始前和结束后,数据库的完整性约束没有被破坏 。比如A向B转账,不可能A扣了钱,B却没收到。
3、隔离性(Isolation):同一时间,只允许一个事务请求同一数据,不同的事务之间彼此没有任何干扰。比如A正在从一张银行卡中取钱,在A取钱的过程结束前,B不能向这张卡转账。
4、持久性(Durability):事务完成后,事务对数据库的所有更新将被保存到数据库,不能回滚。
小结:原子性是事务隔离的基础,隔离性和持久性是手段,最终目的是为了保持数据的一致性。
二、事务的并发问题
1、脏读:事务A读取了事务B更新的数据,然后B回滚操作,那么A读取到的数据是脏数据(某个事务已更新一份数据,另一个事务在此时读取了同一份数据,由于某些原因,前一个RollBack了操作,则后一个事务所读取的数据就会是不正确的)
2、不可重复读:事务 A 多次读取同一数据,事务 B 在事务A多次读取的过程中,对数据作了更新并提交,导致事务A多次读取同一数据时,结果 不一致(在一个事务的两次查询之中数据不一致,这可能是两次查询过程中间插入了一个事务更新的原有的数据)。
3、幻读:系统管理员A将数据库中所有学生的成绩从具体分数改为ABCDE等级,但是系统管理员B就在这个时候插入了一条具体分数的记录,当系统管理员A改结束后发现还有一条记录没有改过来,就好像发生了幻觉一样,这就叫幻读(在一个事务的两次查询中数据笔数不一致,例如有一个事务查询了几列(Row)数据,而另一个事务却在此时插入了新的几列数据,先前的事务在接下来的查询中,就会发现有几列数据是它先前所没有的)。
小结:不可重复读的和幻读很容易混淆,不可重复读侧重于修改,幻读侧重于新增或删除。解决不可重复读的问题只需锁住满足条件的行,解决幻读需要锁表
简而言之:
- 脏读:指一个线程中的事务读取到了另外一个线程中未提交的数据。
- 不可重复读(虚读):指一个线程中的事务读取到了另外一个线程中提交的update的数据。
- 幻读:指一个线程中的事务读取到了另外一个线程中提交的insert的数据。
三、四种隔离级别介绍
四、操作演示
查看一下Mysql版本
查看InnoDB存储引擎 系统级的隔离级别 和 会话级的隔离级别,默认为repeatable-read
select @@global.tx_isolation,@@tx_isolation;
1、读未提交:
(1)打开一个客户端A,并设置当前事务模式为read uncommitted(未提交读),查询表user的初始值:
(2)在客户端A的事务提交之前,打开另一个客户端B,更新表user:
(3)这时,虽然客户端B的事务还没提交,但是客户端A就可以查询到B已经更新的数据:
(4)一旦客户端B的事务因为某种原因回滚,所有的操作都将会被撤销,那客户端A查询到的数据其实就是脏数据:
要想解决这个问题可以采用读已提交的隔离级别
2、读已提交
(1)打开一个客户端A,并设置当前事务模式为read committed(未提交读),查询表user的初始值:
(2)在客户端A的事务提交之前,打开另一个客户端B,更新表user:
(3)这时,客户端B的事务还没提交,客户端A不能查询到B已经更新的数据,解决了脏读问题
(4)客户端B的事务用COMMIT命令提交之后,再查看一下客户端A的数据
(5)客户端A执行与上一步相同的查询,结果 与上一步不一致,即产生了不可重复读的问题,在应用程序中,假设我们处于客户端A的会话,查询到id为1的amount为5000,但是其他事务将id为1的amount值改为4900,我们并不知道,如果用4900这个值去做其他操作,是有问题的,不过这个概率真的很小,要想避免这个问题,可以采用可重复读的隔离级别。
3、可重复读
(1)打开一个客户端A,并设置当前事务模式为repeatable read,查询表user的初始值:
(2)在客户端A的事务提交之前,打开另一个客户端B,更新表user并提交,客户端B的事务居然可以修改客户端A事务查询到的行,也就是mysql的可重复读不会锁住事务查询到的行,sql标准中事务隔离级别为可重复读时,读写操作要锁行的,mysql居然没有锁,。在应用程序中要注意给行加锁,不然你会以步骤(1)中id为1的amount为5000作为中间值去做其他操作。
(3)在客户端A执行步骤(1)的查询:
(4)执行步骤(1),id为1的amount仍然是50000与步骤(1)查询结果一致,没有出现不可重复读的 问题;接着执行update user set amount = amount -100 where id = 1,amount没有变成5000-100 = 4900,id为1的amount值用的是步骤(2)中的4900来算的,所以是数据为4800,数据的一致性倒是没有被破坏!
(5) 在客户端A开启事务,查询表user的初始值
(6)在客户端B开启事务,新增一条数据,其中amount字段值为8000,并提交
(7) 在客户端A计算amount之和,值为4800+3500+6700=15000,没有把客户端B的值算进去,客户端A提交后再计算amount之和,居然变成了23000,这是因为把客户端B的8000算进去了,站在客户的角度,客户是看不到客户端B的,它会觉得是天下掉馅饼了,多了8000块,这就是幻读,站在开发者的角度,数据的 一致性并没有破坏。但是在应用程序中,我们得代码可能会把15000提交给用户,如果你一定要避免这情况小概率状况的发生,那么就要采取下面要介绍的事务隔离级别“串行化”
4、串行化
(1)打开一个客户端A,并设置当前事务模式为serializable,查询表user的初始值:
(2)打开一个客户端B,并设置当前事务模式为serializable,插入一条记录报错,表被锁了插入失败,mysql中事务隔离级别为serializable时会锁表,因此不会出现幻读的情况,这种隔离级别并发性极低,往往一个事务霸占了一张表,其他成千上万个事务只有干瞪眼,得等他用完提交才可以使用,开发中很少会用到。
补充:
1、mysql中默认事务隔离级别是可重复读时并不会锁住读取到的行
2、事务隔离级别为串行化时,读取数据会锁住整张表
3、阅读此文时,如果站在开发者的角度,也许会觉得不可重复读和幻读,在逻辑上并没有什么问题,最终数据仍然是一致的,但是站在用户的角度,他们通常只能看到一个事务(只能看到客户端A,不知道客户端B这个卧底的存在),而不会考虑事务并发执行的现象,一旦出现同一数据多次读取结果不同,或者凭空出现新记录,他们可能会产生疑虑,这是用户体验的问题。
4.事务在mysql中执行时,最终的结果不会出现数据的一致性的问题,因为在一个事务中,mysql执行某个操作未必会使用前一个操作的中间结果,它会根据其他并发事务的实际情况采来处理,看起来不合逻辑,但是保证了数据的一致性 ;但是事务在应用程序中执行时,一个操作的结果会被下一个操作用到,并进行其他的计算。这是我们得小心,可重复读的时候应该锁行,串行化时 要锁表,不然会破坏数据的一致性。
5、事务在mysql中执行时,mysql会根据各个事务的实际情况综合处理,导致数据的一致性没有被破坏,但是应用程序时按照逻辑套路来出牌,并没有mysql聪明,难免会出现数据的一致性问题。
6、隔离级别越高,越能保证数据的完整性和一致性,但是对并发性能的影响也越大,鱼和熊掌不可兼得啊。对于多数应用程序,可以优先考虑把数据库系统的隔离级别设为Read Committed,它能够避免脏读取,而且具有较好的并发性能。尽管它会导致不可重复读、幻读这些并发问题,在可能出现这类问题的个别场合,可以由应用程序采用悲观锁或乐观锁来控制。