在java程序中,有时候可能需要推迟一些高开销的对象初始化操作,并且只有在使用这些对象时才进行初始化。此时程序员可能会采用延迟初始化。但要正确实现线程安全的延迟初始化需要一些技巧,否则很容易出现问题。比如,下面是非线程安全的延迟初始化对象的示例代码:
1 public class UnsafeLazyInitialization { 2 3 private static UnsafeLazyInitialization instance; 4 5 public static UnsafeLazyInitialization getInstance() { 6 if(instance == null) //1:A线程执行 7 instance = new UnsafeLazyInitialization(); //2:B线程执行 8 return instance; 9 } 10 11 12 }
在UnsafeLazyInitialization中,假设A线程执行代码1的同时,B线程执行代码2。此时,线程A可能会看到instance引用的对象还没有完成初始化(出现这种情况的原因见后文的“问题的根源”)。
对于UnsafeLazyInitialization,我们可以对getInstance()做同步处理来实现线程安全的延迟初始化。示例代码如下:
1 public class UnsafeLazyInitialization { 2 3 private static UnsafeLazyInitialization instance; 4 5 public static synchronized UnsafeLazyInitialization getInstance() { 6 if(instance == null) //1:A线程执行 7 instance = new UnsafeLazyInitialization(); //2:B线程执行 8 return instance; 9 } 10 11 }
由于对getInstance()做了同步处理,synchronized将导致性能开销。如果getInstance()被多个线程频繁的调用,将会导致程序执行性能的下降。反之,如果getInstance()不会被多个线程频繁的调用,那么这个延迟初始化方案将能提供令人满意的性能。
在早期的JVM中,synchronized(甚至是无竞争的synchronized)存在这巨大的性能开销。因此,人们想出了一个“聪明”的技巧:双重检查锁定(double-checked locking)。人们想通过双重检查锁定来降低同步的开销。下面是使用双重检查锁定来实现延迟初始化的示例代码:
1 public class UnsafeLazyInitialization { 2 3 private static UnsafeLazyInitialization instance; 4 5 public static synchronized UnsafeLazyInitialization getInstance() { 6 if(instance == null) // 4:第一次检查 7 synchronized (UnsafeLazyInitialization.class){ //5:加锁 8 if(instance == null ){ // 6:第二次检查 9 instance = new UnsafeLazyInitialization(); //7:问题的根源出在这里 10 } 11 } 12 return instance; 13 } 14 15 }
如上面代码所示,如果第一次检查instance不为null,那么就不需要执行下面的加锁和初始化操作。因此可以大幅降低synchronized带来的性能开销。上面代码表面上看起来,似乎两全其美:
在多个线程试图在同一时间创建对象时,会通过加锁来保证只有一个线程能创建对象。
在对象创建好之后,执行getInstance()将不需要获取锁,直接返回已创建好的对象。
双重检查锁定看起来似乎很完美,但这是一个错误的优化!在线程执行到第4行代码读取到instance不为null时,instance引用的对象有可能还没有完成初始化。
问题的根源(new一个对象不是原子性的)
前面的双重检查锁定示例代码的第7行(instance = new Singleton();)创建一个对象。这一行代码可以分解为如下的三行伪代码:
memory = allocate(); //1:分配对象的内存空间
ctorInstance(memory); //2:初始化对象
instance = memory; //3:设置instance指向刚分配的内存地址
上面三行伪代码中的2和3之间,可能会被重排序(在一些JIT编译器上,这种重排序是真实发生的,详情见参考文献1的“Out-of-order writes”部分)。2和3之间重排序之后的执行时序如下:
memory = allocate(); //1:分配对象的内存空间
instance = memory; //3:设置instance指向刚分配的内存地址 注意,此时对象还没有被初始化!
ctorInstance(memory); //2:初始化对象
根据《The Java Language Specification, Java SE 7 Edition》(后文简称为java语言规范),所有线程在执行java程序时必须要遵守intra-thread semantics。intra-thread semantics保证重排序不会改变单线程内的程序执行结果。换句话来说,intra-thread semantics允许那些在单线程内,不会改变单线程程序执行结果的重排序。上面三行伪代码的2和3之间虽然被重排序了,但这个重排序并不会违反intra-thread semantics。这个重排序在没有改变单线程程序的执行结果的前提下,可以提高程序的执行性能。
为了更好的理解intra-thread semantics,请看下面的示意图(假设一个线程A在构造对象后,立即访问这个对象):
时间 |
线程A |
线程B |
t1 |
A1:分配对象的内存空间 |
|
t2 |
A3:设置instance指向内存空间 |
|
t3 |
B1:判断instance是否为空 |
|
t4 |
B2:由于instance不为null,线程B将访问instance引用的对象 |
|
t5 |
A2:初始化对象 |
|
t6 |
A4:访问instance引用的对象 |
这里A2和A3虽然重排序了,但java内存模型的intra-thread semantics将确保A2一定会排在A4前面执行。因此线程A的intra-thread semantics没有改变。但A2和A3的重排序,将导致线程B在B1处判断出instance不为空,线程B接下来将访问instance引用的对象。此时,线程B将会访问到一个还未初始化的对象。
在知晓了问题发生的根源之后,我们可以想出两个办法来实现线程安全的延迟初始化:
①:不允许2和3重排序;
②:允许2和3重排序,但不允许其他线程“看到”这个重排序。
后文介绍的两个解决方案,分别对应于上面这两点。
基于volatile的双重检查锁定的解决方案
对于前面的基于双重检查锁定来实现延迟初始化的方案(指DoubleCheckedLocking示例代码),我们只需要做一点小的修改(把instance声明为volatile型),就可以实现线程安全的延迟初始化。请看下面的示例代码:
1 public class UnsafeLazyInitialization { 2 3 private static volatile UnsafeLazyInitialization instance; 4 5 public static synchronized UnsafeLazyInitialization getInstance() { 6 if(instance == null) // 4:第一次检查 7 synchronized (UnsafeLazyInitialization.class){ //5:加锁 8 if(instance == null ){ // 6:第二次检查 9 instance = new UnsafeLazyInitialization(); //7:问题的根源出在这里 10 } 11 } 12 return instance; 13 } 14 15 }
注意,这个解决方案需要JDK5或更高版本(因为从JDK5开始使用新的JSR-133内存模型规范,这个规范增强了volatile的语义)。
当声明对象的引用为volatile后,“问题的根源”的三行伪代码中的2和3之间的重排序,在多线程环境中将会被禁止。上面示例代码将按如下的时序执行:
这个方案本质上是通过禁止上图中的2和3之间的重排序,来保证线程安全的延迟初始化。
总结
延迟初始化降低了初始化类或创建实例的开销,但增加了访问被延迟初始化的字段的开销。在大多数时候,正常的初始化要优于延迟初始化。如果确实需要对实例字段使用线程安全的延迟初始化,请使用上面介绍的基于volatile的延迟初始化的方案;如果确实需要对静态字段使用线程安全的延迟初始化,请使用上面介绍的基于类初始化的方案。