zoukankan      html  css  js  c++  java
  • AbstractQueuedSynchronizer源码解读--续篇之Condition

    1. 背景

    在之前的AbstractQueuedSynchronizer源码解读中,介绍了AQS的基本概念、互斥锁、共享锁、AQS对同步队列状态流转管理、线程阻塞与唤醒等内容。其中并不涉及Condition相关的内容。本文主要介绍AQS中Condition的实现即ConditionObject类的源码。
    Condition在JUC中使用很多,最常见的就是各种BlockingQueue了。

    2. Condition是什么

    java.util.concurrent.locks.Condition是JUC提供的与Java的Object中wait/notify/notifyAll类似功能的一个接口,通过此接口,线程可以在某个特定的条件下等待/唤醒。
    与wait/notify/notifyAll操作需要获得对象监视器类似,一个Condition实例与某个互斥锁绑定,在此Condition实例进行等待/唤醒操作的调用也需要获得互斥锁,线程被唤醒后需要再次获取到锁,否则将继续等待。
    而与原生的wait/notify/notifyAll等API不同的地方在于,JUC提供的Condition具有更丰富的功能,例如等待可以响应/不响应中断,可以设定超时时间或是等待到某个具体时间点。
    此外一把互斥锁可以绑定多个Condition,这意味着在同一把互斥锁上竞争的线程可以在不同的条件下等待,唤醒时可以根据条件来唤醒线程,这是Object中的wait/notify/notifyAll不具备的机制

    3. 代码解读

    3.1 套路

    JUC中Condition接口的主要实现类是AQS的内部类ConditionObject,它内部维护了一个队列,我们可以称之为条件队列,在某个Condition上等待的线程被signal/signalAll后,ConditionObject会将对应的节点转移到外部类AQS的等待队列中,线程需要获取到AQS等待队列的锁,才可以继续恢复执行后续的用户代码。

    这里给出一个流程:

    await流程:
    1. 创建节点加入到条件队列
    2. 释放互斥锁
    3. 只要没有转移到同步队列就阻塞(等待其他线程调用signal/signalAll或是被中断)
    4. 重新获取互斥锁
    
    signal流程:
    1. 将队列中第一个节点转移到同步队列
    2. 根据情况决定是否要唤醒对应线程
    


    这里以我之前在[AbstractQueuedSynchronizer源码解读]画的AQS状态流转图来说明下:
    如果一个节点通过ConditionObject#await等方法调用初始化后,在被唤醒之后,会将状态切换至0,也即无状态,随后进入AQS的同步队列,此后就与一般的争锁无异了。

    3.2 await方法

    public final void await() throws InterruptedException {
        // 对中断敏感。
        if (Thread.interrupted())
            throw new InterruptedException();
        // 加到条件队列中。
        Node node = addConditionWaiter();
        // 完全释放互斥锁(无论锁是否可以重入),如果没有持锁,会抛出异常。
        int savedState = fullyRelease(node);
        int interruptMode = 0;
        /*
         * 只要仍未转移到同步队列就阻塞。
         * 转移的情况如下:
         * 1. 其它线程调用signal将当前线程节点转移到同步队列并唤醒当前线程。
         * 2. 其它线程调用signalAll。
         * 3. 其它线程中断了当前线程,当前线程会自行尝试进入同步队列。
         */
        while (!isOnSyncQueue(node)) {
            LockSupport.park(this);
            /*
             * 获取中断模式。
             * 在线程从park中被唤醒的时候,需要判断是否此时被中断,若中断则尝试转移到同步队列。
             * 1. 中断且自行进入同步队列,返回THROW_IE(值-1),后续需要抛出InterruptedException。
             * 2. 中断且未能自行进入同步队列,则说明有线程调用signal/signalAll唤醒线程并尝试转移到同步队列,
             *     返回REINTERRUPT,后续重新中断线程。
             * 3. 线程未被中断,返回0,此时需要重试循环判断是否上了同步队列。
             */
            if ((interruptMode = checkInterruptWhileWaiting(node)) != 0)
                break;
        }
        // 重新获取互斥锁过程中如果中断并且interruptMode不为"抛出异常",设置为REINTERRUPT。
        if (acquireQueued(node, savedState) && interruptMode != THROW_IE)
            interruptMode = REINTERRUPT;
        if (node.nextWaiter != null) // clean up if cancelled
            unlinkCancelledWaiters();
        // 如果线程发生过中断则根据THROW_IE或是REINTERRUPT分别抛出异常或者重新中断。
        if (interruptMode != 0)
            reportInterruptAfterWait(interruptMode);
    }
    
    private Node addConditionWaiter() {
        Node t = lastWaiter;
        /*
         * 如果条件队列中最后一个waiter节点状态为取消,
         * 则调用unlinkCancelledWaiters清理队列。
         */
        if (t != null && t.waitStatus != Node.CONDITION) {
            unlinkCancelledWaiters();
            // 重读lastWaiter。
            t = lastWaiter;
        }
        Node node = new Node(Thread.currentThread(), Node.CONDITION);
        // t如果为null, 初始化firstWaiter为当前节点。
        if (t == null)
            firstWaiter = node;
        else
            // 将队尾的next连接到node。
            t.nextWaiter = node;
        lastWaiter = node;
        return node;
    }
    
    /**
     * 移除队列中所有取消节点。
     */
    private void unlinkCancelledWaiters() {
        Node t = firstWaiter;
        // 记录上一个非取消节点。
        Node trail = null;
        while (t != null) {
            Node next = t.nextWaiter;
            if (t.waitStatus != Node.CONDITION) {
                // 断开
                t.nextWaiter = null;
                if (trail == null)
                    // 如果trail为null,取当前节点的后继作为头节点的值(next可以为null)。
                    firstWaiter = next;
                else
                    // 否则把trail连接到当前节点的后继。
                    trail.nextWaiter = next;
                // 如果当前节点没有后继了, 更新lastWaiter为trail, 即上一个非取消节点。
                if (next == null)
                    lastWaiter = trail;
            }
            else
                trail = t;
            t = next;
        }
    }
    
    final boolean isOnSyncQueue(Node node) {
        /*
         * 节点状态为CONDITION一定是在条件队列,
         * 或者如果prev为null也一定是在条件队列。
         *
         * 同步队列里的节点prev为null只可能是获取到锁后调用setHead清为null,
         * 新入队的节点prev值是不会为null的。
         * 另外,条件队列里节点是用nextWaiter来维护的,不用next和prev。
         */
        if (node.waitStatus == Node.CONDITION || node.prev == null)
            return false;
        /*
         * 如果next不为null,一定是在同步队列的。
         * 这里值得一提的是在AQS的cancelAcquire方法中,
         * 一个节点将自己移除出队列的时候会把自己的next域指向自己。
         * 即node.next = node;     
         *
         * 从GC效果上来看node.next = node和node.next = null无异,
         * 但是这对此处next不为null一定在同步队列上来说,
         * 这样可以将节点在同步队列上被取消的情况与普通情况归一化判断。
         */
        if (node.next != null)
            return true;
        /*
         * 有可能node.prev的值不为null,但还没在队列中,因为入队时CAS队列的tail可能失败。
         * 这是从tail向前遍历一次,确定是否已经在同步队列上。
         */
        return findNodeFromTail(node);
    }
    
    /**
     * 从队列尾部向前遍历判断节点是否在队列中。
     */
    private boolean findNodeFromTail(Node node) {
        Node t = tail;
        for (;;) {
            if (t == node)
                return true;
            if (t == null)
                return false;
            t = t.prev;
        }
    }
    
    private int checkInterruptWhileWaiting(Node node) {
        /*
         * 1. 线程未中断返回0
         * 2. 线程中断且入同步队列成功,返回THROW_IE表示后续要抛出InterruptedException。
         * 3. 线程中断且未能入同步队列(由于被signal方法唤醒),则返回REINTERRUPT表示后续重新中断。
         */
        return Thread.interrupted() ?
            (transferAfterCancelledWait(node) ? THROW_IE : REINTERRUPT) :
            0;
    }
    
    final boolean transferAfterCancelledWait(Node node) {
        if (compareAndSetWaitStatus(node, Node.CONDITION, 0)) {
            enq(node);
            return true;
        }
        /*
         * 上面CAS失败的原因是signal()方法被调用,状态已经被抢先更新了。
         * 这时需要自旋等待节点成功进入同步队列,否则会影响后续的重新获取锁acquireQueued()方法。
         * 因为acquireQueued必须在节点成功入队后才可以调用。
         */
        while (!isOnSyncQueue(node))
            Thread.yield();
        return false;
    }
    
    /**
     * THROW_IE则抛出InterruptedException,
     * REINTERRUPT则重新中断当前线程。
     */
    private void reportInterruptAfterWait(int interruptMode)
            throws InterruptedException {
            if (interruptMode == THROW_IE)
                throw new InterruptedException();
            else if (interruptMode == REINTERRUPT)
                selfInterrupt();
    }
    
    static void selfInterrupt() {
        Thread.currentThread().interrupt();
    }
    

    3.3 signal/signalAll方法

    public final void signal() {
        // 检查互斥锁持有情况。
        if (!isHeldExclusively())
            throw new IllegalMonitorStateException();
        Node first = firstWaiter;
        if (first != null)
            doSignal(first);
    }
    
    private void doSignal(Node first) {
        do {
            // 将firstWaiter设置为后继节点,如果为null,则置lastWaiter为null。
            if ( (firstWaiter = first.nextWaiter) == null)
                lastWaiter = null;
            // 断开连接。
            first.nextWaiter = null;
            /*
             * 如果转移失败并且下一个节点不为null,则重试。
             * 在这里转移失败只可能因为节点被取消。
             */
        } while (!transferForSignal(first) &&
                (first = firstWaiter) != null);
    }
    
    public final void signalAll() {
        // 检查互斥锁持有情况。
        if (!isHeldExclusively())
            throw new IllegalMonitorStateException();
        Node first = firstWaiter;
        if (first != null)
            doSignalAll(first);
    }
    
    private void doSignalAll(Node first) {
        // 将firstWaiter和lastWaiter先清为null。
        lastWaiter = firstWaiter = null;
        // 从first开始一直遍历到第一个null节点。
        do {
            Node next = first.nextWaiter;
            first.nextWaiter = null;
            transferForSignal(first);
            first = next;
        } while (first != null);
    }
    
    final boolean transferForSignal(Node node) {
        // 必须将状态从CONDITION流转到0,如果失败则说明节点被取消,因为这里不会存在signal的竞争。
        if (!compareAndSetWaitStatus(node, Node.CONDITION, 0))
            return false;
    
        // 插入同步队列。
        Node p = enq(node);
        int ws = p.waitStatus;
        /*
         * 如果前驱节点状态为取消或者无法将状态CAS到SIGNAL(比如可能前驱在此期间被取消了),
         * 则需要唤醒参数node节点对应的线程,使其能开始尝试争锁。
         *
         * 如果将前驱状态切到SIGNAL了,则由相应线程在释放锁之后唤醒node节点对应线程。
         */
        if (ws > 0 || !compareAndSetWaitStatus(p, ws, Node.SIGNAL))
            LockSupport.unpark(node.thread);
        return true;
    }
    

    4. 思考与总结

    至此,已经对ConditionObject的await/signal/signalAll方法源码进行了分析。对于中断不敏感的awaitUninterruptibly, 带有时限的awaitNanos由于大致套路与await无异,不作冗述。
    ConditionObject的firstWaiter/lastWaiter以及AQS.Node的nextWaiter都是没有volatile修饰的。这是因为ConditionObject假设在await/signal/signalAll等方法的调用是已经持有互斥锁的。

    个人认为ConditionObject这样的设计是有个问题的。即按照Condition接口的定义,在不持锁情况下调用await由子类决定如何处理,通常是抛出InterruptedException。但如果同时有持锁和不持锁的线程调用await方法,可能会对ConditionObject的内部队列造成破坏,后果就是有些成功调用await方法的线程可能永远没有办法被唤醒,因为无法通过队列追溯到它们。也就是非法调用会抛出异常,但仍然会对内部数据结构造成破坏,这其实是有一些不合理的,至少是可以改进的地方。
    最简单的处理方式是,对于不持锁的请求抛出异常,不应该依靠await -> fullyRelease这一步来抛出异常,此时按照流程已经调用过addConditionWaiter了。可以在await这类方法前面与signal/signalAll一样预检查一次持锁情况:

    if (!isHeldExclusively())
        throw new IllegalMonitorStateException();
    

    整体而言,ConditionObject中代码对GC友好,逻辑缜密,读过之后受益匪浅。

  • 相关阅读:
    使用IDEA 创建Mevan项目后,项目中没有Java源文件夹的解决方案
    Head FIRST HTML & CSS 16/3/15
    Head FIRST HTML & CSS 16/3/11
    hdu 5375 dp
    Thinking in java 16/3/8plus
    Thinking in java 16/3/8
    Beauty of mathematics
    Thinking in java 16/3/6
    Thinking in java 16/3/5
    SQL SERVER迁移--更换磁盘文件夹
  • 原文地址:https://www.cnblogs.com/micrari/p/7219751.html
Copyright © 2011-2022 走看看