zoukankan      html  css  js  c++  java
  • 【JDK】JDK源码分析-AbstractQueuedSynchronizer(2)

    概述

    前文「JDK源码分析-AbstractQueuedSynchronizer(1)」初步分析了 AQS,其中提到了 Node 节点的「独占模式」和「共享模式」,其实 AQS 也主要是围绕对这两种模式的操作进行的。

    Node 节点是对线程 Thread 类的封装,因此两种模式可以理解如下:

    独占模式(exclusive):线程对资源的访问是排他的,即某个时间只能一个线程单独访问资源;

    共享模式(shared):与独占模式不同,多个线程可以同时访问资源。

    本文先分析独占模式下的各种操作,后面再分析共享模式。

    独占模式

    方法概述

    独占模式下的操作主要有以下几个方法(可与前面分析的 Lock 接口的方法类比):

    1. acquire(int arg)

    以独占模式获取资源,忽略中断;可以类比 Lock 接口的 lock 方法;

    2. acquireInterruptibly(int arg)

    以独占模式获取资源,响应中断;可以类比 Lock 接口的 lockInterruptibly 方法;

    3. tryAcquireNanos(int arg, long nanosTimeout)

    以独占模式获取资源,响应中断,且有超时等待;可以类比 Lock 接口的 tryLock(long, TimeUnit) 方法;

    4. release(int arg)

    释放资源,可以类比 Lock 接口的 unlock 方法。

    方法分析

    1. 独占模式获取资源(忽略中断)

    这几种获取资源的方法很多地方是类似的。我们先从 acquire 方法开始分析,如下:

    public final void acquire(int arg) {
        if (!tryAcquire(arg) &&
            acquireQueued(addWaiter(Node.EXCLUSIVE), arg))
            selfInterrupt();
    }

    该方法看似很短,其实是内部做了封装。这几行代码包含了如下四个操作步骤:

    1. tryAcquire

    2. addWaiter(Node.EXECUSIVE)

    3. acquireQueued(final Node node, arg))

    4. selfInterrupt

    上面的四个步骤不一定全部执行,下面依次进行分析。

    step 1: tryAcquire

    protected boolean tryAcquire(int arg) {
        throw new UnsupportedOperationException();
    }

    该方法的作用是尝试以独占模式获取资源,若成功则返回 true。

    可以看到该方法是一个 protected 方法,而且 AQS 中该方法直接抛出了异常,其实是它把实现委托给了子类。这也是 ReentrantLock、CountdownLatch 等类(严格来说是其内部类 Sync)的实现功能不同的地方,这些类正是通过对该方法的不同实现来制定了自己的“游戏规则”。

    若 step 1 中的 tryAcquire 方法返回 true,则表示当前线程获取资源成功,方法直接返回,该线程接下来就可以“为所欲为”了;否则表示获取失败,接下来会依次执行 step 2 和 step 3。

    step 2: addWaiter(Node.EXECUSIVE)

    private Node addWaiter(Node mode) {
        // 将当前线程封装为一个 Node 节点,指定 mode
        // PS: 独占模式 Node.EXECUSIVE, 共享模式 Node.SHARED
        Node node = new Node(Thread.currentThread(), mode);
        // Try the fast path of enq; backup to full enq on failure
        Node pred = tail;
        if (pred != null) {
            node.prev = pred;
            // 通过 CAS 操作设置主队列的尾节点
            if (compareAndSetTail(pred, node)) {
                pred.next = node;
                return node;
            }
        }
        // 尾节点 tail 为 null,表示主队列未初始化
        enq(node);
        return node;
    }

    enq 方法:

    private Node enq(final Node node) {
        for (;;) {
            Node t = tail;
            // 尾节点为空,表明当前队列未初始化
            if (t == null) { // Must initialize
                // 将队列的头尾节点都设置为一个新的节点
                if (compareAndSetHead(new Node()))
                    tail = head;
            } else {
                // 将 node 节点插入主队列末尾
                node.prev = t;
                if (compareAndSetTail(t, node)) {
                    t.next = node;
                    return t;
                }
            }
        }
    }

    可以看到 addWaiter(Node.EXECUSIVE) 方法的作用是:把当前线程封装成一个独占模式的 Node 节点,并插入到主队列末尾(若主队列未初始化,则将其初始化后再插入)。

    step 3: acquireQueued(final Node node, arg))

    final boolean acquireQueued(final Node node, int arg) {
        boolean failed = true;
        try {
            // 中断标志位
            boolean interrupted = false;
            for (;;) {
                // 获取该节点的前驱节点
                final Node p = node.predecessor();
                // 若前驱节点为头节点,则尝试获取资源
                if (p == head && tryAcquire(arg)) {
                    // 若获取成功,则将该节点设置为头节点并返回
                    setHead(node);
                    p.next = null; // help GC
                    failed = false;
                    return interrupted;
                }
                // 若上面条件不满足,即前驱节点不是头节点,或尝试获取失败
                // 判断当前线程是否可以休眠
                if (shouldParkAfterFailedAcquire(p, node) &&
                    parkAndCheckInterrupt())
                    interrupted = true;
            }
        } finally {
            if (failed)
                cancelAcquire(node);
        }
    }

    若当前节点的前驱节点为头节点,则会再次尝试获取资源(tryAcuqire),若获取成功,则将当前节点设置为头节点并返回;否则,若前驱节点不是头节点,或者获取资源失败,则执行如下两个方法:

    private static boolean shouldParkAfterFailedAcquire(Node pred, Node node) {
        // 前驱节点的等待状态
        int ws = pred.waitStatus;
        // 若前驱节点的等待状态为 SIGNAL,返回 true,表示当前线程可以休眠
        if (ws == Node.SIGNAL)
            /*
             * This node has already set status asking a release
             * to signal it, so it can safely park.
             */
            return true;
        // 若前驱节点的状态大于 0,表示前驱节点处于取消(CANCELLED)状态
        // 则将前驱节点跳过(相当于踢出队列)
        if (ws > 0) {
            /*
             * Predecessor was cancelled. Skip over predecessors and
             * indicate retry.
             */
            do {
                node.prev = pred = pred.prev;
            } while (pred.waitStatus > 0);
            pred.next = node;
        } else {
            /*
             * waitStatus must be 0 or PROPAGATE.  Indicate that we
             * need a signal, but don't park yet.  Caller will need to
             * retry to make sure it cannot acquire before parking.
             */
             // 此时 waitStatus 只能为 0 或 PROPAGATE 状态,将前驱节点的等着状态设置为 SIGNAL
            compareAndSetWaitStatus(pred, ws, Node.SIGNAL);
        }
        return false;
    }

    该方法的流程:

    1. 若前驱节点的等待状态为 SIGNAL,返回 true,表示当前线程可以休眠(park);

    2. 若前驱节点是取消状态 (ws > 0),则将其清理出队列,以此类推;

    3. 若前驱节点为 0 或 PROPAGATE,则将其设置为 SIGNAL 状态。

    正如其名,该方法(shouldParkAfterFailedAcquire)的作用就是判断当前线程在获取资源失败后,是否可以休眠(park)。

    parkAndCheckInterrupt:

    private final boolean parkAndCheckInterrupt() {
        // 将当前线程休眠
        LockSupport.park(this);
        return Thread.interrupted();
    }

    该方法的作用:

    1. 使当前线程休眠(park);

    2. 返回该线程是否被中断(其他线程对其发过中断信号)。

    上面就是 acquireQueued(final Node node, arg)) 方法的执行过程,为了便于理解,可参考下面的流程图:

     

    若此期间被其他线程中断过,则此时再去执行 selfInterrupt 方法去响应中断请求:

    static void selfInterrupt() {
        Thread.currentThread().interrupt();
    }

    以上就是 acquire 方法执行的整体流程。

    2. 以独占模式获取资源(响应中断)

    该操作其实与前面的过程类似,因此分析相对简单些,代码如下:

    public final void acquireInterruptibly(int arg)
            throws InterruptedException 
        // 若线程被中断过,则抛出异常
        if (Thread.interrupted())
            throw new InterruptedException();
        // 尝试获取资源
        if (!tryAcquire(arg))
            // 尝试获取资源失败
            doAcquireInterruptibly(arg);
    }

    tryAcquire 与前面的操作一样,若尝试获取资源成功则直接返回;否则,执行 doAcquireInterruptibly:

    private void doAcquireInterruptibly(int arg)
        throws InterruptedException 
        // 将当前线程封装成 Node 节点插入主队列末尾
        final Node node = addWaiter(Node.EXCLUSIVE);
        boolean failed = true;
        try {
            for (;;) {
                final Node p = node.predecessor();
                if (p == head && tryAcquire(arg)) {
                    setHead(node);
                    p.next = null; // help GC
                    failed = false;
                    return;
                }
                if (shouldParkAfterFailedAcquire(p, node) &&
                    parkAndCheckInterrupt())
                    // 抛出中断异常
                    throw new InterruptedException();
            }
        } finally {
            if (failed)
                cancelAcquire(node);
        }
    }

    通过与前面的 acquire 方法对比可以发现,二者代码几乎一样,区别在于 acquire 方法检测到中断(parkAndCheckInterrupt)时只是记录了标志位,并未响应;而此处直接抛出了异常。这也是二者仅有的区别,此处不再详细分析。

    3. 以独占模式获取资源(响应中断,且有超时)

    该操作与前者也是类似的,代码如下:

    public final boolean tryAcquireNanos(int arg, long nanosTimeout)
            throws InterruptedException 
        // 若被中断,则响应
        if (Thread.interrupted())
            throw new InterruptedException();
        return tryAcquire(arg) ||
            doAcquireNanos(arg, nanosTimeout);
    }

    doAcquireNanos: 

    static final long spinForTimeoutThreshold = 1000L;
    
    private boolean doAcquireNanos(int arg, long nanosTimeout)
            throws InterruptedException {
        // 若超时时间小于等于 0,直接获取失败
        if (nanosTimeout <= 0L)
            return false;
        // 计算截止时间
        final long deadline = System.nanoTime() + nanosTimeout;
        final Node node = addWaiter(Node.EXCLUSIVE);
        boolean failed = true;
        try {
            for (;;) {
                final Node p = node.predecessor();
                if (p == head && tryAcquire(arg)) {
                    setHead(node);
                    p.next = null; // help GC
                    failed = false;
                    return true;
                }
                nanosTimeout = deadline - System.nanoTime();
                // 已经超时了,获取失败
                if (nanosTimeout <= 0L)
                    return false;
                // 若大于自旋时间,则线程休眠;否则自旋
                if (shouldParkAfterFailedAcquire(p, node) &&
                    nanosTimeout > spinForTimeoutThreshold)
                    LockSupport.parkNanos(this, nanosTimeout);
                // 若被中断,则响应
                if (Thread.interrupted())
                    throw new InterruptedException();
            }
        } finally {
            if (failed)
                cancelAcquire(node);
        }
    }

    这里有个变量 spinForTimeoutThreshold,表示自旋时间,若大于该值则将线程休眠,否则继续自旋。个人理解这里增加该时间是为了提高效率,即,只有在等待时间较长的时候才让线程休眠。

    该方法与 acquireInterruptibly 也是类似的,在前者的基础上增加了 timeout,不再详细分析。

    4. 释放资源

    前面分析了三种获取资源的方式,自然也有释放资源。下面分析释放资源的 release 操作:

    public final boolean release(int arg) {
        // 尝试释放资源,若成功则返回 true
        if (tryRelease(arg)) {
            Node h = head;
            // 若头节点不为空,且等待状态不为 0(此时为 SIGNAL)
            // 则唤醒其后继节点
            if (h != null && h.waitStatus != 0)
                unparkSuccessor(h);
            return true;
        }
        return false;
    }

    与 tryAcquire 方法类似,tryRelease 方法在 AQS 中也是抛出异常,同样交由子类实现:

    protected boolean tryRelease(int arg) {
        throw new UnsupportedOperationException();
    }

    unparkSuccessor 的主要作用是唤醒 node 的后继节点,代码如下:

    private void unparkSuccessor(Node node) {
        /*
         * If status is negative (i.e., possibly needing signal) try
         * to clear in anticipation of signalling.  It is OK if this
         * fails or if status is changed by waiting thread.
         */
        int ws = node.waitStatus;
        if (ws < 0)
            compareAndSetWaitStatus(node, ws, 0);
    
        /*
         * Thread to unpark is held in successor, which is normally
         * just the next node.  But if cancelled or apparently null,
         * traverse backwards from tail to find the actual
         * non-cancelled successor.
         */
        // 后继节点
        Node s = node.next;
        if (s == null || s.waitStatus > 0) {
            // 若后继节点是取消状态,则从尾节点向前遍历,找到 node 节点后面一个未取消状态的节点
            s = null;
            for (Node t = tail; t != null && t != node; t = t.prev)
                if (t.waitStatus <= 0)
                    s = t;
        }
        // 唤醒node节点的后继节点
        if (s != null)
            LockSupport.unpark(s.thread);
    }

    若 node 节点的后继节点是取消状态(ws > 0),则从主队列中取其后面一个非取消状态的线程唤醒。

    前面三个获取资源的方法中,finally 代码块中都用到了 cancelAcquire 方法,都是获取失败时的操作,这里也分析一下:

    private void cancelAcquire(Node node) {
        // Ignore if node doesn't exist
        if (node == null)
            return;
            
        node.thread = null;
        
        // Skip cancelled predecessors
        // 跳过取消状态的前驱节点
        Node pred = node.prev;
        while (pred.waitStatus > 0)
            node.prev = pred = pred.prev;
            
        // predNext is the apparent node to unsplice. CASes below will
        // fail if not, in which case, we lost race vs another cancel
        // or signal, so no further action is necessary.
        // 前驱节点的后继节点引用
        Node predNext = pred.next;
        
        // Can use unconditional write instead of CAS here.
        // After this atomic step, other Nodes can skip past us.
        // Before, we are free of interference from other threads.
        // 将当前节点设置为取消状态
        node.waitStatus = Node.CANCELLED;
        
        // If we are the tail, remove ourselves.
        // 若该节点为尾节点(后面没其他节点了),将 predNext 指向 null
        if (node == tail && compareAndSetTail(node, pred)) {
            compareAndSetNext(pred, predNext, null);
        } else {
            // If successor needs signal, try to set pred's next-link
            // so it will get one. Otherwise wake it up to propagate.
            int ws;
            if (pred != head &&
                ((ws = pred.waitStatus) == Node.SIGNAL ||
                 (ws <= 0 && compareAndSetWaitStatus(pred, ws, Node.SIGNAL))) &&
                pred.thread != null) {
                Node next = node.next;
                if (next != null && next.waitStatus <= 0)
                    compareAndSetNext(pred, predNext, next);
            } else {
                // 前驱节点为头节点,表明当前节点为第一个,取消时唤醒它的下一个节点
                unparkSuccessor(node);
            }
            
            node.next = node; // help GC
        }
    }

    该方法的主要操作:

    1. 将 node 节点设置为取消(CANCELLED)状态;

    2. 找到它在队列中非取消状态的前驱节点 pred:

        2.1 若 node 节点是尾节点,则前驱节点的后继设为空,

        2.2 若 pred 不是头节点,且状态为 SIGNAL,则后继节点设为 node 的后继节点;

        2.3 若 pred 是头节点,则唤醒 node 的后继节点。

    PS: 该过程可以跟双链表删除一个节点的过程进行对比分析。

    小结

    本文分析了以独占模式获取资源的三种方式,以及释放资源的操作。分别为:

    1. acquire: 独占模式获取资源,忽略中断;

    2. acquireInterruptibly: 独占模式获取资源,响应中断;

    tryAcquireNanos: 独占模式获取资源,响应中断,有超时;

    4. release: 释放资源,唤醒主队列中的下一个线程。

    这几个方法都可以类比 Lock 接口的相关方法定义。

    相关阅读:

    JDK源码分析-AbstractQueuedSynchronizer(1)

    JDK源码分析-Lock&Condition

    Stay hungry, stay foolish.

    PS: 本文首发于微信公众号【WriteOnRead】。

  • 相关阅读:
    RSA加密及加签
    间隔Ns请求某函数并且有timeout
    关于Erlang中的behaviour
    Erlang&RabbitMQ服务安装配置
    java IO流详解
    Uncaught TypeError: Cannot read property 'options' of undefined
    sql server 数据修改不了的设计
    Android多点触控详解
    java实现图的遍历(深度优先遍历和广度优先遍历)
    判断输入的8个数字不是符合8X8皇后棋盘
  • 原文地址:https://www.cnblogs.com/jaxer/p/11300190.html
Copyright © 2011-2022 走看看