zoukankan      html  css  js  c++  java
  • 第2章 Java并发机制的底层实现原理

      Java代码在编译后会变成Java字节码,字节码被类加载器加载到JVM里,JVM执行字节码,最终需要转化为汇编指令在CPU上执行,Java中所使用的并发机制依赖于JVM的实现和CPU的指令

       2.1 volatile 的应用

        在多线程并发编程中synchronized和volatile都扮演着重要的角色volatile是轻量级的synchronized,它在多处理器开发中保证了共享变量的“可见性”可见性的意思是当一个线程修改了一个共享变量时,另外一个线程能够读到这个修改的值如果volatile变量修饰符使用恰当的话,它比synchronized的使用和执行成本更低,因为他不会引起线程上下文的切换和调度。本章将会在硬件方面分析Intel处理器是如何实现volatile的,帮助我们正确的使用volatile变量。

      1.volatile的定义与原理

      Java语言规范第3版中对volatile的定义如下:Java编程语言允许线程访问共享变量,为了确保共享变量能被准确和一致的更新,线程应该确保通过排他锁单独获得这个变量。如果一个字段被声明成volatile,Java线程内存模型确保所有线程看到的这个变量的值时一致的。

      在了解volatile实现原理之前,我们先来看一下其实现原理相关的CPU术语与说明。

      表2-1 CPU术语的定义

        

       查看Java生成的汇编指令来查看volatile进行写操作时,CPU会做什么事情。我们可以发现有volatile变量修饰的共享变量在进行写操作的时候会多出第二行汇编代码 lock ...,通过查询手册可知,Lock前缀的指令在多核处理器下会引发了两件事情

      1)将当前处理器缓存行的数据写回到系统内存

      2)这个写回内存的操作会使在其他CPU里缓存了该内存地址的数据无效

      为了提高处理速度,处理器不直接和内存进行通信而是先将系统内存的数据读到内存缓存(L1,L2和其它)后进行操作,但操作完不知道何时会写到内存如果对声明了volatile的变量进行写操作JVM就会向内存处理器发送一条Lock前缀的指令将这个变量所在缓存行的数据写回系统内存。但是就算写回内存,如果其它处理器缓存的值还是就是,再执行计算操作就会有问题。所以,在多处理器下,为了保证各个处理器的缓存时一致的就会实现缓存一致性协议,每个处理器通过嗅探在总线上传播的数据来检查自己缓存的值是否过期,若是就会将当前处理器的缓存行设置成无效状态,当处理器对这个数据进行修改操作的时候,就会重新从内存系统中把数据读取到处理器缓存。

      2.2 synchronized的实现原理与应用

        之前synchronized被称为重量级锁,但是,随着Java SE 1.6对synchronized进行了各种优化之后,有些情况下,他就不那么重了。本文想写介绍了Java SE1.6中为了减少获得锁和释放锁带来的性能消耗引入的偏向锁和轻量级锁以及锁的存储结构和升级过程

      先来看下利用synchronized实现同步的基础:Java中的每一个对象都可以做为锁。具体表现为一下3种形式

        对于普通同步方法,锁是当前实例对象

        对于静态同步方法,锁是当前类的Class对象

        对于同步方法块,锁是Synchronized括号里面配置的对象

      当一个线程试图访问同步代码块时,它首先必须获得锁,退出或抛出异常时必须释放锁。那么锁到底存在哪里呢锁里面会存储什么信息呢

      从JVM规范中可以看到Synchronized在JVM里的实现原理,JVM基于进入和退出Monitor对象来实现方法同步和代码块同步,但两者的实现方式不同。代码块同步时使用monitorenter和monitorexit指令来实现的,而方法同步时通过另一种方式来实现的。

      monitorenter指令是在编译后插入到同步代码块的开始位置,而monitorexit是插入到方法结束和异常处,JVM要保证每个monitorenter必须有对应的monitorexi与之匹配任何对象都有一个monitor与之关联当且一个monitor被持有后,它将处于锁定状态线程执行到monitorenter指令时,将会尝试获取对象所对应的monitor的所有权,即尝试获得对象的锁。 

        2.2.1Java对象头

          synchronized用的锁是存在Java对象头里的如果对象是数组类型,则虚拟机用3个字宽(Word)存储的对象头,如果对象是非数组类型的,则用两个字宽存储对象头在32位虚拟机中,1字宽等于4字节,即32bit,如表2-2所示。

      

      Java对象头里biao的Mark Word里默认存储对象的HashCode、分代年龄和锁标记位。32位JVM的Mark Word 的默认存储结构如表2-3所示。  

      

       在运行期间,Mark Word里存储的数据会随着锁标志位的变化而变化。Mark Word 可能变化存储以下4种数据如图2-4所示。

      

       2.2.2锁的升级与对比

        在jdk1.6中,锁一共有4种状态,级别从低到高依次是:无锁状态、偏向锁状态、轻量级锁状态、重量级锁状态。这几个状态会随着竞争情况逐渐升级。锁可以升级的那hi是不能降级,意味着偏向锁升级成轻量级锁后不能降级成为偏向锁。这主要是为了提高获得锁和释放锁的效率。

      1.偏向锁

      在大多数情况下,锁不仅不存在多线程竞争,而且总是由同一线程多次获得,为了让线程获得锁的代价更低而引入了偏向锁当一个线程访问同步代码块并获得锁时,会在对象头和栈帧中的锁记录里存储偏向锁的线程ID,以后该线程在进入和退出同步块时不需要进行CAS操作来加锁和解锁,只需要简单的测试以下对象头的Mark Word里是否存储着指向当前线程的偏向锁如果测试成功,表示线程已经获得锁如果测试失败,则需要先再测试一下 Mark Word中偏向锁的标识是否设置为1(表示当前是偏向锁):如果没有,则使用CAS竞争锁,如果有,则尝试使用CAS将对象头的偏向锁指向当前线程。  

      (1)偏向锁的撤销

      偏向锁使用了一种等到竞争出现才释放锁的机制,所以当其它线程尝试竞争偏向锁时,持有偏向锁的线程才会释放锁。偏向锁的撤销,需要等待全局安全点(在这个时间点上没有正在执行的字节码)。他会首先暂停拥有偏向锁的线程,然后检查持有偏向锁的线程是否活着,如果线程不处于活动状态,则将对象头设置为无锁状态;若线程依然活着,拥有偏向锁的栈会被执行,遍历偏向对象的所记录,栈中的所记录和对象头的Mark Word要么重新偏向于其它线程,要么恢复到无锁或者标记对象不适合作为偏向锁,最后唤醒暂停的线程。图2-1中的线程1演示了偏向锁初始化流程,线程2演示了偏向锁撤销的流程。

                  

      (2)关闭偏向锁

        偏向锁在1.6和1.7中默认启用,通常在程序启动几秒钟之后才激活,如果有必要可以使用JVM参数来关闭延迟,如果你确定程序大部分情况下处于竞争状态,可以通过JVM参数关闭偏向锁。

      2.轻量级锁

      (1)加锁

        线程在执行同步块之前,JVM会在当前线程中的栈帧中创建一个存储所记录的空间,并将对象头中的Mark Word复制到锁记录中,然后县城尝试使用CAS对象将对象头中的Mark Word替换为指向锁记录的指针。如果成功,当前线程获取锁,如果失败,表示其它线程竞争所,当前线程编程时使用自旋来获取锁。

      (2)解锁

        轻量级解锁时,会使用原子的 CAS操作将栈帧中的Mark word 替换回对象头,如果成功,则表示没有竞争发生。如果失败,表示当前锁存在竞争,锁就会膨胀成重量级锁。图2-2是两个线程同时竞争锁,导致锁膨胀的流程图。

              

      3.锁的优缺点对比

            

       2.3 原子操作的实现原理

        1. 术语定义

          在了解原子操作之前,先要了解一下相关的术语,如表2-7所示

            

      处理器提供总线锁定和缓存锁定两个机制来保证复杂内存操作的原子性

       2.Java中如何实现原子操作

      (1)使用循环CAS来实现原子操作

        以下代码实现了一个基于CAS线程安全的计数器方法safeCount和一个非线程安全的计数器count.

        

    package com.example.demo.test;
    
    import java.util.ArrayList;
    import java.util.List;
    import java.util.concurrent.atomic.AtomicInteger;
    
    public class Counter {
        
        private int i=0;
        private AtomicInteger atomicI = new AtomicInteger(0);
        
        private void safeCount() {
            for(;;) {
                int i = atomicI.get();
                boolean suc = atomicI.compareAndSet(i, ++i);
                if(suc) {
                    break;
                }
            }
        }
        
        private void count() {
            i++;
        }
        
        
        
        public static void main(String[] args) {
            final Counter cas = new Counter();
            
            List<Thread> list = new ArrayList<Thread>(600);
            for(int j=0;j<100;j++) {
                Thread thread = new Thread(new Runnable() {
                    
                    @Override
                    public void run() {
                        for(int i=0;i<10000;i++) {
                            cas.count();
                            cas.safeCount();
                        }
                    }
                });
                list.add(thread);
            }
            for(Thread thread:list) {
                thread.start();
            }
            
            for(Thread thread:list) {
                try {
                    thread.join();
                } catch (InterruptedException e) {
                    // TODO Auto-generated catch block
                    e.printStackTrace();
                }
            }
            System.out.println(cas.i);
            System.out.println(cas.atomicI);
            
        }
    }

      从jdk1.5开始,并发包里提供了一些类来支持原子操作,如AtomicBoolean(用原子方式更新的boolean值)、AtomicInteger、AtomicLong,这些原子包装类提供了有用的工具方法,比如以原子的方式将当前值自增1和自减1.

      (2)CAS实现原子操作的三大问题

          1)ABA问题:因为CAS需要在操作之的时候,检查值有没有发生变化,如果没有发生变化则更新,但是如果一个值原来是A,变成了B,又变成了A,那么使用CAS进行检查的时候会发现他的值没有发生变化,但是实际上却变化了。ABA问题的解决思路是使用版本号,从1.5开始,JDK的Atomic包里提供了一个AtomicStammpedReference来解决ABA问题,这个类的compareAndSet方法的作用是首先检查当前引用是否等于预期引用,并且检查当前标志是否等于于其标志,如果全部相等,则以原子方式将该引用和该标志位设置为给定的更新值。

          2)循环时间长开销大:自旋CAS如果长时间不成功,会给CPU带来非常大的执行开销。如果JVM能够支持处理器的pause指令,那么效率会有一定的提升。

          3)只能保证一个共享变量的原子操作

              当然这里有一个取巧的操作方法,如下:

              比如有两个共享变量 i=2,j=a,合并一下ij=2a,然后用CAS操作来操作ij.从1.5开始,JDK提供了AtomicReference类来保证引用对象之间的原子性,就可以多个变量房子一个对象来进行CAS操作了。

     

      

      

  • 相关阅读:
    痞子衡嵌入式:单片机AI的春天已来,ARM Cortex-M55发布了
    《痞子衡嵌入式半月刊》 第 1 期
    痞子衡嵌入式:ARM Cortex-M内核那些事(6)- 系统堆栈机制
    痞子衡嵌入式:嵌入式里堆栈原理及其纯C实现
    将博客搬至CSDN
    痞子衡嵌入式:知名半导体MCU大厂软件开发C代码规范
    痞子衡嵌入式:语音处理工具pzh-speech诞生记(4)- 音频录播实现(PyAudio)
    痞子衡嵌入式:语音处理工具pzh-speech诞生记(2)- 界面构建(wxFormBuilder3.8.0)
    痞子衡嵌入式:ARM Cortex-M内核那些事(3.2)- 为Security而生(M23/33/35P)
    痞子衡嵌入式:恩智浦i.MX RT1xxx系列MCU外设那些事(2)- 百变星君FlexRAM
  • 原文地址:https://www.cnblogs.com/helloworldmybokeyuan/p/11721330.html
Copyright © 2011-2022 走看看