zoukankan      html  css  js  c++  java
  • Java并发之Semaphore源码解析(二)

    在上一章,我们学习了信号量(Semaphore)是如何请求许可证的,下面我们来看看要如何归还许可证。

    可以看到当我们要归还许可证时,不论是调用release()或是release(int permits),都会调用AQS实现的releaseShared(int arg)方法。在releaseShared(int arg)方法中会先调用子类实现的tryReleaseShared(int arg)方法,这个方法会向信号量归还许可证,在归还完毕后,会调用doReleaseShared()方法尝试唤醒信号量等待队列中需要许可证的线程,这也印证了笔者之前所说的线程在归还信号量后,会尝试唤醒等待队列中等待许可证的线程。

    那我们来看看信号量(Semaphore)静态内部类Sync实现的tryReleaseShared(int releases)是怎么完成归还许可证,首先会调用getState()获取信号量当前剩余的许可证,加上外部线程归还的许可证数量算出总许可证数量:current + releases,如果能用CAS的方式修改成功,则退出方法,否则一直轮询直到归还成功,这里CAS失败的原因有可能是外部也在请求和归还许可证,可能在执行完代码<1>处后和执行代码<2>处之前,信号量内部的许可证数量已经变了,所以CAS失败。归还信号量成功后就会调用doReleaseShared(),这个方法前面已经讲解过了,这里就不再赘述了。

    public class Semaphore implements java.io.Serializable {
    	//...
    	abstract static class Sync extends AbstractQueuedSynchronizer {
    		//...
            protected final boolean tryReleaseShared(int releases) {
                for (;;) {
                    int current = getState();//<1>
                    int next = current + releases;
                    if (next < current) // overflow
                        throw new Error("Maximum permit count exceeded");
                    if (compareAndSetState(current, next))//<2>
                        return true;
                }
            }
    		//...
    	}
    	//...
        public void release() {
            sync.releaseShared(1);
        }
    	//...
        public void release(int permits) {
            if (permits < 0) throw new IllegalArgumentException();
            sync.releaseShared(permits);
        }
    	//...
    }
    
    public abstract class AbstractQueuedSynchronizer
        extends AbstractOwnableSynchronizer
        implements java.io.Serializable {
    	//...
        public final boolean releaseShared(int arg) {
            if (tryReleaseShared(arg)) {
                doReleaseShared();
                return true;
            }
            return false;
        }
    	//...
    	protected boolean tryReleaseShared(int arg) {
            throw new UnsupportedOperationException();
        }
    	//...
    }
    

      

    下面我们再来看看tryAcquire(long timeout, TimeUnit unit)和tryAcquire(int permits, long timeout, TimeUnit unit)的实现,这两个方法会在给定的时间范围内尝试获取许可证,如果获取成功则返回true,获取失败则返回false。

    这两个方法都会调用AQS实现的tryAcquireSharedNanos(int arg, long nanosTimeout),这个方法其实和先前讲得doAcquireShared(int arg)十分相似,只是多了一个超时返回的功能。

    这里笔者简单过一下这个方法的实现:先在代码<1>处算出超时时间,然后封装线程对应的节点Node并将其入队,如果判断节点的前驱节点是头节点,且申请许可证成功,这里会调用setHeadAndPropagate(node, r)将头节点指向当前节点,并尝试唤醒下一个节点对应的线程。如果申请许可证失败,会在<2>处算出还剩多少的阻塞时间nanosTimeout,如果剩余阻塞时间小于等于0,代表线程获取许可证失败,这里会调用<3>处的cancelAcquire(node) 将节点从等待队列中移除,具体的移除逻辑可以看笔者写的ReentrantLock源码解析第二章。如果剩余阻塞时间大于0,则会执行shouldParkAfterFailedAcquire(p, node)将前驱节点的等待状态改为SIGNAL,在第二次循环时,如果前驱节点的状态为SIGNAL,且剩余阻塞时间大于SPIN_FOR_TIMEOUT_THRESHOLD(1000ns),则陷入阻塞,直到被中断抛出异常,或者被唤醒,检查是否能获取许可证,如果不能获取许可证且超时,则会返回false表示在超时时间内没有获取到许可证。

    public class Semaphore implements java.io.Serializable {
    	//...
        public boolean tryAcquire(int permits, long timeout, TimeUnit unit)
            throws InterruptedException {
            if (permits < 0) throw new IllegalArgumentException();
            return sync.tryAcquireSharedNanos(permits, unit.toNanos(timeout));
        }
    	//...
        public boolean tryAcquire(long timeout, TimeUnit unit)
            throws InterruptedException {
            return sync.tryAcquireSharedNanos(1, unit.toNanos(timeout));
        }
    	//...
    }
    
    public abstract class AbstractQueuedSynchronizer
        extends AbstractOwnableSynchronizer
        implements java.io.Serializable {
    	//...
        public final boolean tryAcquireSharedNanos(int arg, long nanosTimeout)
                throws InterruptedException {
            if (Thread.interrupted())
                throw new InterruptedException();
            return tryAcquireShared(arg) >= 0 ||
                doAcquireSharedNanos(arg, nanosTimeout);
        }
    	//...
        private boolean doAcquireSharedNanos(int arg, long nanosTimeout)
                throws InterruptedException {
            if (nanosTimeout <= 0L)
                return false;
            final long deadline = System.nanoTime() + nanosTimeout;//<1>
            final Node node = addWaiter(Node.SHARED);
            try {
                for (;;) {
                    final Node p = node.predecessor();
                    if (p == head) {
                        int r = tryAcquireShared(arg);
                        if (r >= 0) {
                            setHeadAndPropagate(node, r);
                            p.next = null; // help GC
                            return true;
                        }
                    }
                    nanosTimeout = deadline - System.nanoTime();//<2>
                    if (nanosTimeout <= 0L) {
                        cancelAcquire(node);//<3>
                        return false;
                    }
                    if (shouldParkAfterFailedAcquire(p, node) &&
                        nanosTimeout > SPIN_FOR_TIMEOUT_THRESHOLD)
                        LockSupport.parkNanos(this, nanosTimeout);
                    if (Thread.interrupted())
                        throw new InterruptedException();
                }
            } catch (Throwable t) {
                cancelAcquire(node);
                throw t;
            }
        }
    	//...
    }
    

     

    下面我们对照一下FairSync和NonfairSync,其实NonfairSync基本没有什么实现,都是调用其父类Sync的方法,以非公平的方式竞争许可证也是调用其父类nonfairTryAcquireShared(acquires)方法。而FairSync自身是有实现以公平的方式获取许可证,实现逻辑也非常简单。先判断信号量的等待队列是否有节点,有的话则返回获取失败,如果没有再获取当前的可用许可证数量available,扣去申请的许可证数量available - acquires,用CAS的方式把扣减完的值remaining存放进state,由于扣减的时候可能存在其他线程也在申请/归还许可证,所以available的值并非一直有效,如果在获取available后有其他线程也申请和归还许可证,那么这里的CAS很可能会失败,判断CAS失败后,又会开始新的一轮尝试获取许可证逻辑。

    static final class FairSync extends Sync {
    	private static final long serialVersionUID = 2014338818796000944L;
    
    	FairSync(int permits) {
    		super(permits);
    	}
    
    	protected int tryAcquireShared(int acquires) {
    		for (;;) {
    			if (hasQueuedPredecessors())
    				return -1;
    			int available = getState();
    			int remaining = available - acquires;
    			if (remaining < 0 ||
    				compareAndSetState(available, remaining))
    				return remaining;
    		}
    	}
    }
    
    static final class NonfairSync extends Sync {
    	private static final long serialVersionUID = -2694183684443567898L;
    
    	NonfairSync(int permits) {
    		super(permits);
    	}
    
    	protected int tryAcquireShared(int acquires) {
    		return nonfairTryAcquireShared(acquires);
    	}
    }
    

        

    对照完公平FairSync和非公平NonfairSync的差别后,我们来看看Sync类实现的方法,Sync类的实现其实也不算复杂,主要就下面4个方法,其中:nonfairTryAcquireShared(int acquires)和tryReleaseShared(int releases)先前已经将结果了,下面我们专注:reducePermits(int reductions)和drainPermits()。

    abstract static class Sync extends AbstractQueuedSynchronizer {
    	final int nonfairTryAcquireShared(int acquires) {
    		//...
    	}
    	protected final boolean tryReleaseShared(int releases) {
    		//...
    	}
    	final void reducePermits(int reductions) {
    		//...
    	}
    	final int drainPermits() {
    		//...
    	}
    }
    

      

    Sync类实现的的reducePermits(int reductions)的作用是降低许可证数量,比如当双11来临时,淘宝京东可以对一些服务进行扩容和配置升级,使得原本可以承受10W并发量的服务提高到可以承受50W,这里可以在不调用acquire()的前提下,调用release()方法增加信号量的许可证,当双11的压力过去后,需要对服务进行缩容,由50W的并发量回到10W,这里可以用reducePermits(int reductions)降低许可证数量。在这个方法中会先获取当前许可证数量,减去我们要扣除的许可证数量current - reductions,并判断其结果是否溢出,如果溢出则抛出异常,没有溢出用CAS的方式设置最新的许可证数量。

    public class Semaphore implements java.io.Serializable {
    	//...
        abstract static class Sync extends AbstractQueuedSynchronizer {
    		//...
            final void reducePermits(int reductions) {
                for (;;) {
                    int current = getState();
                    int next = current - reductions;
                    if (next > current) // underflow
                        throw new Error("Permit count underflow");
                    if (compareAndSetState(current, next))
                        return;
                }
            }
    		//...
    	}
    	//...
    	protected void reducePermits(int reduction) {
            if (reduction < 0) throw new IllegalArgumentException();
            sync.reducePermits(reduction);
        }
    	//...
    }
    

      

    需要注意两点:

    1. 这个方法的访问权限是protected,如果要使用此方法需要用一个类去继承,并修改此方法的访问权限。
    2. 这个方法可能导致信号量的剩余许可证数量为负,比如一个信号量原先的许可证数量为10,且被借走了9个许可证,当前许可证数量为1。这时想把许可证数量从原先的10扣降到3,向reducePermits(int reduction)传入7,此时current-reductions=1-7=-6,如果CAS成功,那么信号量目前的许可证数量为-6,不过没关系,如果前面借走的9个许可证最终会归还,信号量的许可证数量最终会回到3。
    class MySemaphore extends Semaphore {
    	public MySemaphore(int permits) {
    		super(permits);
    	}
    
    	@Override
    	public void reducePermits(int reduction) {
    		super.reducePermits(reduction);
    	}
    }
    
    public static void main(String[] args) {
    	MySemaphore semaphore = new MySemaphore(8);
    	System.out.println("初始信号量的许可证数量:" + semaphore.availablePermits());
    	//初始化完信号量后,增加信号量的许可证数量
    	int add = 2;
    	semaphore.release(add);
    	System.out.printf("增加%d个许可证后,许可证数量:%d
    ", add, semaphore.availablePermits());
    	//申请9个许可证
    	int permits = 9;
    	try {
    		semaphore.acquire(permits);
    		System.out.printf("申请%d个许可证后剩余许可证数量:%d
    ", permits, semaphore.availablePermits());
    	} catch (InterruptedException e) {
    		e.printStackTrace();
    	}
    	//这里要将原先10个许可证扣除到只剩3个,所以传入7,扣除7个许可证
    	semaphore.reducePermits(7);
    	System.out.println("扣除7个许可证数量后,剩余许可证数量:" + semaphore.availablePermits());
    	//归还原先出借的9个许可证
    	semaphore.release(permits);
    	System.out.printf("归还原先出借的%d信号量后,剩余信号量:%d
    ", permits, semaphore.availablePermits());
    }
    

        

    执行结果:

    初始信号量的许可证数量:8
    增加2个许可证后,许可证数量:10
    申请9个许可证后剩余许可证数量:1
    扣除7个许可证数量后,剩余许可证数量:-6
    归还原先出借的9信号量后,剩余信号量:3
    

      

    Sync类实现的drainPermits()可以一次性扣除信号量目前所有的许可证数量并返回,通过这个API,我们可以得知资源目前最大的访问限度。还是拿上一章远程服务为例,判定服务能承受的并发是5000,用于限流的semaphore信号量的最大许可证数量也是5000。假设目前信号量剩余的许可证数量为2000,即有3000个线程正在并发访问远程服务,我们可以通过drainPermits()方法获取剩余的允许访问数量2000,然后创建2000个线程访问远程服务,这个API一般用于计算量大且计算内容比较独立的场景。

    public class Semaphore implements java.io.Serializable {
    	//...
        abstract static class Sync extends AbstractQueuedSynchronizer {
    		//...
            final int drainPermits() {
                for (;;) {
                    int current = getState();
                    if (current == 0 || compareAndSetState(current, 0))
                        return current;
                }
            }
    		//...
    	}
    	//...
        public int drainPermits() {
            return sync.drainPermits();
        }
    	//...
    }
    

    最后,笔者介绍一个Semaphore在JDK1.6.0_17时期的BUG,便结束对Semaphore的源码解析。

    当时AQS的setHeadAndPropagate(Node node, int propagate)和releaseShared(int arg) 两个方法的实现是下面这样的,这个代码可能导致队列被阻塞。

    private void setHeadAndPropagate(Node node, int propagate) {
    	setHead(node);
    	if (propagate > 0 && node.waitStatus != 0) {
    		Node s = node.next;
    		if (s == null || s.isShared())
    			unparkSuccessor(node);
    	}
    }
    
    public final boolean releaseShared(int arg) {
    	if (tryReleaseShared(arg)) {
    		Node h = head;
    		if (h != null && h.waitStatus != 0)
    			unparkSuccessor(h);
    		return true;
    	}
    	return false;
    }
    

      

    按照上面代码的实现,会让下面的代码出现队列被阻塞的情况。t1和t2线程用于请求许可证,t3和t4线程用于归还许可证,循环10000000次只是为了增加出现阻塞的概率,现在说说什么样的场景下会出现队列被阻塞的情况。

    程序开始时,信号量的许可证数量为0,所以t1和t2只能进入队列等待,t1和t2在队列中的节点对应N1和N2,节点的排序为:head->N1->N2(tail)。t3归还许可证时发现头节点不为null且头节点的等待状态为SIGNAL,于是会调用unparkSuccessor(h)方法唤醒头节点的后继节点N1对应的线程t1,在执行unparkSuccessor(h)的时候会把head的等待状态改为0。

    t1被唤醒后获取到许可证,返回剩余许可证数量为0,即之后调用setHeadAndPropagate(Node node, int propagate)方法传入的propagate为0,但尚未调用。此时t4也归还了许可证,但发现head节点的等待状态为0,就不会调用unparkSuccessor(h)。

    t1执行setHeadAndPropagate(Node node, int propagate),将头节点指向自身线程对应的节点N1,虽然此时信号量里有剩余的许可证,但t1原先拿到的propagate为0,所以不会执行unparkSuccessor(node)唤醒t4。

    那么新版本的setHeadAndPropagate(Node node, int propagate)和releaseShared(int arg)又是如何保证有许可证被归还时唤醒队列中被阻塞的线程呢?这里其实和PROPAGATE有关,让我们按照新版的setHeadAndPropagate和releaseShared走一遍上面的流程。

    t1和t2进入队列中等待,t3归还许可证发现头节点不为null,且头节点等待状态为SIGNAL,于是调用unparkSuccessor(h)方法唤醒头节点的后继节点N1对应的线程t1,在执行unparkSuccessor(h)的时候会把head的等待状态改为0。

    t1被唤醒后获取到许可证,返回剩余许可证数量为0,在调用setHeadAndPropagate(Node node, int propagate)之前,t4归还了许可证,发现头节点的等待状态为0,将其改为PROPAGATE。

    t1执行setHeadAndPropagate(Node node, int propagate),获取原先头节点h,并将头节点指向N1,此时虽然propagate为0,但原先头节点h的等待状态<0,可以执行doReleaseShared()唤醒后继节点N2对应的线程t2。

    import java.util.concurrent.Semaphore;
    
    public class TestSemaphore {
    
        private static Semaphore sem = new Semaphore(0);
    
        private static class Thread1 extends Thread {
            @Override
            public void run() {
                sem.acquireUninterruptibly();
            }
        }
    
        private static class Thread2 extends Thread {
            @Override
            public void run() {
                sem.release();
            }
        }
    
        public static void main(String[] args) throws InterruptedException {
            for (int i = 0; i < 10000000; i++) {
                Thread t1 = new Thread1();
                Thread t2 = new Thread1();
                Thread t3 = new Thread2();
                Thread t4 = new Thread2();
                t1.start();
                t2.start();
                t3.start();
                t4.start();
                t1.join();
                t2.join();
                t3.join();
                t4.join();
                System.out.println(i);
            }
        }
    }
    

       

    至此,Semaphore的源码解析就到此结束了。笔者在这里并没有全部介绍完所有Semaphore的API,例如:acquireUninterruptibly()和acquireUninterruptibly(int permits),因为这两个方法实在与之前介绍的acquire(),如果大家能理解清楚前面讲解的内容,这两个API相信对大家不在话下。

    本章我们也初次见到AQS内部类Node的不同状态和使用方式,即节点除了独占(Node.EXCLUSIVE),还会有共享的状态(Node.SHARED),这里我们也首次见到等待状态为PROPAGATE的节点,代表传播的意思,通过这个状态,不但可以提升信号量整体的吞吐量,还可以避免高并发场景下节点没有被唤醒的情况。

  • 相关阅读:
    Mysql-存储过程-批量增加数据
    VIM
    查看Chrome浏览器同步数据状态工具
    Tomcat运行配置
    mysql的engine不同,导致事物回滚失败的问题
    git在MAC,Linux的terminator(命令行)下自动显示当前分支
    SED单行脚本快速参考(Unix 流编辑器)
    awk中使用shell的环境变量
    Grep Sed Awk
    shred_linux_unix
  • 原文地址:https://www.cnblogs.com/beiluowuzheng/p/14968428.html
Copyright © 2011-2022 走看看