比如现在我们有这样一段代码:线程等待另一个线程将数据装载完就输出success,可是最后程序一直卡在while循环里没有往下执行。
public class VolatileDemo { private static boolean flag = false; //private static volatile boolean flag = false; public static void main(String[] args) throws Exception{ new Thread(()->{ System.out.println("等待装载数据。。。。"); while(!flag){ } System.out.println("====== SUCCESS ====="); }).start(); Thread.sleep(2000); new Thread(()->{ System.out.println("开始装载"); flag = true; System.out.println("装载完毕"); }).start(); } } /* 控制台输出 等待装载数据。。。。 开始装载 装载完毕 */
造成这个问题出现的原因是jmm原子操作造成的。jmm内存模型就是java内存模型、准确的说是java线程内存模型。它和cpu缓存模型类似、是基于cpu缓存模型来建立的。
jmm一共有8种原子操作:
read(读取):从主存读取数据
load(载入):将内存数据读到工作内存
use (使用):取出工作内存中的数据来计算
assign(赋值):将计算好的值重新赋予到工作内存中
store(存储):将工作内存数据写入主存
write(写入):将store过去的变量值赋值给主内存中的变量
lock(锁定):将主内存变量加锁,标识为线程独占状态
unlock(解锁):将主存变量解锁,解锁后其他线程可以锁定该变量
工作原理
可以看到线程1已经把变量副本加载到工作内存了,而线程2将计算后的值存到主存之后,却没有办法告诉线程1,所以就出现了线程安全问题。其实cpu与主存交互会经过"总线"这么一个概念,cpu为了解决这种数据不一致问题有两种方案:
总线加锁(性能太低)
早期cpu是对总线加锁,lock住这个数据,这样其它线程就没法对它读或写,直到这个线程用完这个数据 unlock之后才能被其他线程操作。也就是说从read开始后直到write结束才释放锁。
MESI缓存一致性协议
多个线程将同一个数据读取到各自的缓存区后,某个cpu修改了缓存的数据之后,会立马同步给主存,这都是汇编语言实现的。其他cpu通过总线嗅探机制(可以理解为监听)可以感知到数据的变化从而将自己缓存里的数据失效,从而去读取主存的值。所以mesi协议是从store开始加锁,锁的粒度更小,时间更短。实际上volatile就是这么实现可见性的。同时由于这中间过程中有store和write几步操作、还要让其他cpu缓存的数据置空都是要耗时的,可能这个过程中数据被别人改了,所以它是非原子操作的。
指令重排
我们写好的代码,只是我们理解的执行顺序。但是在编译时实际是:1. javac(静态编译器)把代码编译为 .class字节码。2. jit(动态编译器)将 .class字节码 编译成 jvm 所在操作系统支持的机器码。但是在编译的过程中,为了提高代码的执行顺序,jit就会进行指令重排。在CPU在执行JVM字节码的时候,对现有的指令顺序进行排序优化,但不会对有依赖关系的做重排序。比如:
int a = 1;
int b = 2;
int c = a*c;
a 和 b 没有任何关系,所以它们的顺序无所谓,但是 c 依赖于a、b。只能存在于a、b后面,不然就乱套了。在一个变量被volatile修饰后会被禁止指令重排,JVM会为我们做两件事:
1.在每个volatile写操作前插入StoreStore屏障,在写操作后插入StoreLoad屏障。
2.在每个volatile读操作前插入LoadLoad屏障,在读操作后插入LoadStore屏障。
* 比如我们通过 双层检查+锁的形式创建某个类的单例时,我们会对这个类加上volatile,就是因为指令重排的原因可能类实例初始化好了,但是里面的成员变量还是空,这样就会出现异常。
volatile保证原子性?
在java中,long和double都8个字节共64位(一个字节=8bit),JVM 规范出来的较早,那时候处理器还不能处理 64 位字长,所以 JVM 规范里定义的是 32 位字长的读写是原子的,而 64 位字长需要分成两次来操作。像long 和 double 都是 8 字节长度的类型,也就是有 64 位。需要分两步执行,每次读取32位,这样就对double和long变量的赋值就会出现问题。而通过volatile修饰之后,对这种类型数据赋值就是原子的了,因为它只是一步操作;而对于i++这种操作是无法保证原子性的,因为它实际是三步操作。现在都是64位的服务器系统了,那么对64位的long和double的读写都是原子操作的。即可以以一次性读写long或double的整个64bit。 (小知识点:防止工作中遇到杠精。)
。