zoukankan      html  css  js  c++  java
  • 【漫画】CAS原理分析!无锁原子类也能解决并发问题!

    本文来源于微信公众号【胖滚猪学编程】、转载请注明出处

    在漫画并发编程系统博文中,我们讲了N篇关于锁的知识,确实,锁是解决并发问题的万能钥匙,可是并发问题只有锁能解决吗?今天要出场一个大BOSS:CAS无锁算法,可谓是并发编程核心中的核心!

    _1

    温故

    首先我们再回顾一下原子性问题的原因,参考【漫画】JAVA并发编程 如何解决原子性问题
    image.png

    两个线程同时把count=0加载到自己的工作内存,线程B先执行count++操作,此时主内存已经变化成了1,但是线程A依旧以为count=0,这是导致问题的根源

    所以解决方案就是:不能让线程A以为count=0,而是要和主内存进行一次compare(比较),如果内存中的值是0,说明没有其他线程更新过count值,那么就swap(交换),把新值写回主内存。如果内存中的值不是0,比如本案例中,内存中count就已经被线程B更新成了1,比较0!=1,因此compare失败,不把新值写回主内存。

    _2

    本文来源于微信公众号【胖滚猪学编程】。一个集颜值与才华于一身的女程序媛、以漫画形式让编程so easy and interesting!转载请注明出处

    CAS概念

    CAS (compareAndSwap),中文叫比较交换,一种无锁原子算法

    CAS算法包含 3 个参数 CAS(V,E,N),V表示要更新变量在内存中的值,E表示旧的预期值,N表示新值。
    仅当 V值等于E值时,才会将V的值设为N
    如果V值和E值不同,则说明已经有其他线程做两个更新,那么当前线程不做更新,而是自旋。

    _3

    模拟CAS实现

    既然我们了解了CAS的思想,那可以手写一个简单的CAS模型:

        // count必须用volatile修饰 保证不同线程之间的可见性
        private volatile static int count;
        
        public void addOne() {
            int newValue;
            do {
                newValue = count++;
            } while (!compareAndSwapInt(expectCount, newValue)); //自旋 循环
        }
    
        public final boolean compareAndSwapInt(int expectCount, int newValue) {
            // 读目前 count 的值
            int curValue = count;
            // 比较目前 count 值是否 == 期望值
            if (curValue == expectCount) {
                // 如果是,则更新 count 的值
                count = newValue;
                return true;
    
            }
            //否则返回false 然后循环
            return false;
        }
    

    这个简单的模拟代码,其实基本上把CAS的思想体现出来了,但实际上CAS原理可要复杂很多哦,我们还是看看JAVA是怎么实现CAS的吧!

    原子类

    要了解JAVA中CAS的实现,那不得不提到大名鼎鼎的原子类,原子类的使用非常简单,而其中深奥的原理就是CAS无锁算法。

    Java 并发包里提供的原子类内容很丰富,我们可以将它们分为五个类别:原子化的基本数据类型、原子化的对象引用类型、原子化数组、原子化对象属性更新器和原子化的累加器。

    image.png

    原子类的使用可谓非常简单,相信只要看一下api就知道如何使用,因此不过多解释,如有需要可以参考本人github代码。
    此处只以AtomicInteger为例子,测试一下原子类是否名副其实可以保证原子性:

        private static AtomicInteger count = new AtomicInteger(0);
        private static int count1 = 0;
        //省略代码 同时启动10个线程 分别测试AtomicInteger和普通int的输出结果
        private static void add10K() {
            int idx = 0;
            while (idx++ < 10000) {
                //使用incrementAndGet实现i++功能
                count.incrementAndGet();
            }
            countDownLatch.countDown();
        }
        private static void add10K1() {
            int idx = 0;
            while (idx++ < 10000) {
                count1++;
            }
            countDownLatch.countDown();
        }
    

    通过测试可以发现,使用AtomicInteger可以保证输出结果为100000,而普通int则不能保证。

    本文来源于微信公众号【胖滚猪学编程】。一个集颜值与才华于一身的女程序媛、以漫画形式让编程so easy and interesting!转载请注明出处

    CAS源码分析

    据此,我们又可以回归正题,JAVA是怎么实现CAS的呢?跟踪一下AtomicInteger中的incrementAndGet()方法,相信就会有答案了。
    首先关注一下AtomicInteger.java中这么几个东西:

        private static final Unsafe unsafe = Unsafe.getUnsafe();
        private static final long valueOffset;//数据在内存中的地址偏移量,通过偏移地址可以获取数据原值
    
        static {
            try {
                //计算变量 value 在类对象中的偏移量
                valueOffset = unsafe.objectFieldOffset
                    (AtomicInteger.class.getDeclaredField("value"));
            } catch (Exception ex) { throw new Error(ex); }
        }
    
        private volatile int value;//要修改的值 volatile保证可见性
    
        public final int incrementAndGet() {
            return unsafe.getAndAddInt(this, valueOffset, 1) + 1;
        }
    

    Unsafe,是CAS的核心类,由于Java方法无法直接访问底层系统,需要通过本地(native)方法来访问,Unsafe相当于一个后门,基于该类可以直接操作特定内存的数据。
    变量valueOffset,表示该变量值在内存中的偏移地址,因为Unsafe就是根据内存偏移地址获取数据的。
    变量value必须用volatile修饰,保证了多线程之间的内存可见性。

    当然具体实现我们还是得瞧瞧getAndAddInt方法:

        //内部使用自旋的方式进行CAS更新(while循环进行CAS更新,如果更新失败,则循环再次重试)
        public final int getAndAddInt(Object var1, long var2, int var4) {
             //var1为当前这个对象,如count.getAndIncrement(),则var1为count这个对象
            //第二个参数为AtomicInteger对象value成员变量在内存中的偏移量
            //第三个参数为要增加的值
            int var5;
            do {
                //var5 获取对象内存地址偏移量上的数值v 即预期旧值
                var5 = this.getIntVolatile(var1, var2);
            } while(!this.compareAndSwapInt(var1, var2, var5, var5 + var4));//循环判断内存位置的值与预期原值是否相匹配
    
            return var5;
        }
    

    此时我们还想继续了解compareAndSwapInt的实现,点进去看,首先映入眼帘的是四个参数:1、当前的实例 2、实例变量的内存地址偏移量 3、预期的旧值 4、要更新的值

        public final native boolean compareAndSwapInt(Object var1, long var2, int var4, int var5);
    

    还想继续刨根问底,会发现点不动了。因为用native修饰的方法代表是底层方法,当然如果你非得一探究竟你也可以找找对应的unsafe.cpp 文件进行深度解析C代码:

    image.png
    image.png

    个人认为没必要深究,毕竟术业有专攻,你只需要知道其实核心代码就是一条 cmpxchg 指令
    cmpxchg: 即“比较并交换”指令。与我们上面说的思想是一样的:将 eax 寄存器中的值(compare_value)与 [edx] 双字内存单元中的值进行对比,如果相同,则将 ecx 寄存器中的值(exchange_value)存入 [edx] 内存单元中。

    总之:你只需要记住:CAS是靠硬件实现的,从而在硬件层面提升效率。实现方式是基于硬件平台的汇编指令,在intel的CPU中,使用的是cmpxchg指令。 核心思想就是:比较要更新变量的值V和预期值E(compare),相等才会将V的值设为新值N(swap)。

    CAS真有这么好吗?

    CAS和锁都解决了原子性问题,和锁相比,由于其非阻塞的,它对死锁问题天生免疫,并且,线程间的相互影响也非常小。更为重要的是,使用无锁的方式完全没有锁竞争带来的系统开销,也没有线程间频繁调度带来的开销,因此,他要比基于锁的方式拥有更优越的性能

    但是,CAS真的有那么好吗?又到挑刺时间了!

    要让我们失望了,CAS并没有那么好,主要表现在三个方面:

    • 1、循环时间太长
    • 2、只能保证一个共享变量原子操作
    • 3、ABA问题。

    循环时间太长
    如果CAS长时间地不成功,我们知道会持续循环、自旋。必然会给CPU带来非常大的开销。在JUC中有些地方就限制了CAS自旋的次数,例如BlockingQueue的SynchronousQueue。

    只能保证一个共享变量原子操作
    看了CAS的实现就知道这只能针对一个共享变量,如果是多个共享变量就只能使用锁了,当然如果你有办法把多个变量整成一个变量,利用CAS也不错。例如读写锁中state的高低位。

    ABA问题
    这可是个面试重点问题哦!认真听好!

    CAS需要检查操作值有没有发生改变,如果没有发生改变则更新。但是存在这样一种情况:如果一个值原来是A,变成了B,然后又变成了A,那么在CAS检查的时候会发现没有改变,但是实质上它已经发生了改变,这就是所谓的ABA问题。
    某些情况我们并不关心 ABA 问题,例如数值的原子递增,但也不能所有情况下都不关心,例如原子化的更新对象很可能就需要关心 ABA 问题,因为两个 A 虽然相等,但是第二个 A 的属性可能已经发生变化了。

    对于ABA问题其解决方案是加上版本号,即在每个变量都加上一个版本号,每次改变时加1,即A —> B —> A,变成1A —> 2B —> 3A。

    原子类之AtomicStampedReference可以解决ABA问题,它内部不仅维护了对象值,还维护了一个Stamp(可把它理解为版本号,它使用整数来表示状态值)。当AtomicStampedReference对应的数值被修改时,除了更新数据本身外,还必须要更新版本号。当AtomicStampedReference设置对象值时,对象值以及版本号都必须满足期望值,写入才会成功。因此,即使对象值被反复读写,写回原值,只要版本号发生变化,就能防止不恰当的写入。

        // 参数依次为:期望值 写入新值 期望版本号 新版本号
        public boolean compareAndSet(V expectedReference, V
                newReference, int expectedStamp, int newStamp);
    
        //获得当前对象引用
        public V getReference();
    
        //获得当前版本号
        public int getStamp();
    
        //设置当前对象引用和版本号
        public void set(V newReference, int newStamp);
    

    说理论太多也没用,还是亲自实验它是否能解决ABA问题吧:

        private static AtomicStampedReference<Integer> count = new AtomicStampedReference<>(10, 0);
    
        public static void main(String[] args) {
            Thread main = new Thread(() -> {
                int stamp = count.getStamp(); //获取当前版本
    
                log.info("线程{} 当前版本{}",Thread.currentThread(),stamp);
                try {
                    Thread.sleep(1000); //等待1秒 ,以便让干扰线程执行
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
                boolean isCASSuccess = count.compareAndSet(10, 12, stamp, stamp + 1);  //此时expectedReference未发生改变,但是stamp已经被修改了,所以CAS失败
                log.info("CAS是否成功={}",isCASSuccess);
            }, "主操作线程");
    
            Thread other = new Thread(() -> {
                int stamp = count.getStamp(); //获取当前版本
                log.info("线程{} 当前版本{}",Thread.currentThread(),stamp);
                count.compareAndSet(10, 12, stamp, stamp + 1);
                log.info("线程{} 增加后版本{}",Thread.currentThread(),count.getStamp());
    
                // 模拟ABA问题 先更新成12 又更新回10
                int stamp1 = count.getStamp(); //获取当前版本
                count.compareAndSet(12, 10, stamp1, stamp1 + 1);
                log.info("线程{} 减少后版本{}",Thread.currentThread(),count.getStamp());
            }, "干扰线程");
    
            main.start();
            other.start();
        }
    

    输出结果如下:

    线程Thread[主操作线程,5,main] 当前版本0
    [干扰线程] INFO - 线程Thread[干扰线程,5,main] 当前版本0
    [干扰线程] INFO  - 线程Thread[干扰线程,5,main] 增加后版本1
    [干扰线程] INFO - 线程Thread[干扰线程,5,main] 减少后版本2
    [主操作线程] INFO  - CAS是否成功=false
    

    总结

    JAVA博大精深,解决并发问题可不仅仅是锁才能担此大任。CAS无锁算法对于解决原子性问题同样是势在必得。而原子类,则是无锁工具类的典范,原子类包括五大类型(原子化的基本数据类型、原子化的对象引用类型、原子化数组、原子化对象属性更新器和原子化的累加器)。

    CAS 是一种乐观锁,乐观锁会以一种更加乐观的态度对待事情,认为自己可以操作成功。而悲观锁会让线程一直阻塞。因此CAS具有很多优势,比如性能佳、可以避免死锁。但是它没有那么好,你应该考虑到ABA问题、循环时间长的问题。因此需要综合选择,适合自己的才是最好的。

    附录:并发编程全系列代码github

    本文来源于微信公众号【胖滚猪学编程】。一个集颜值与才华于一身的女程序媛、以漫画形式让编程so easy and interesting!欢迎关注与我一起交流!

    本文转载自公众号【胖滚猪学编程】 用漫画让编程so easy and interesting!欢迎关注!形象来源于微信表情包【胖滚家族】喜欢可以下载哦~

  • 相关阅读:
    Java中文语言处理HanLP
    python的jieba分词词性标注(转载)
    solr 自聚类实现
    IntelliJ IDEA 创建 java Maven项目
    javat Itext实践 pdf
    java 中PriorityQueue优先级队列使用方法
    java实现 tf-idf
    Solr6.6 IK 中文分词的配置和使用
    yaha分词
    实现自动文本摘要(python,java)
  • 原文地址:https://www.cnblogs.com/liuyanling/p/12913356.html
Copyright © 2011-2022 走看看