zoukankan      html  css  js  c++  java
  • 34-多线程(下)

    文章摘自公众号:低并发编程

    1. 线程状态的实质

    首先你得明白,当我们说一个线程的状态时,说的是什么?没错,就是一个变量的值而已。哪个变量?Thread 类中的一个变量,叫:

    private volatile int threadStatus = 0;
    

    这个值是个整数,不方便理解,可以通过映射关系(VM.toThreadState),转换成一个枚举类。

    public enum State {
    
        NEW,
    
        RUNNABLE,
    
        BLOCKED,
    
        WAITING,
    
        TIMED_WAITING,
    
        TERMINATED;
    
    }
    

    所以,我们就盯着 threadStatus 这个值的变化就好了。就是这么简单 ~

    2. NEW

    现在我们还没有任何 Thread 类的对象呢,也就不存在线程状态一说。一切的起点,要从把一个 Thread 类的对象创建出来,开始说起。

    Thread t = new Thread();
    

    当然,你后面可以接很多参数。

    Thread t = new Thread(r, "name1");
    

    你也可以 new 一个继承了 Thread 类的子类。

    Thread t = new MyThread();
    

    你说线程池怎么不 new 就可以有线程了呢?人家内部也是 new 出来的。

    public class Executors {
      static class DefaultThreadFactory implements ThreadFactory {
          public Thread newThread(Runnable r) {
              Thread t = new Thread(...);
              ...
              return t;
          }
      }
    }
    

    总是,一切的开始,都要调用 Thread 类的构造方法。而这个构造方法,最终都会调用 Thread 类的 init() 方法。

    private void init(
            ThreadGroup g,
            Runnable target,
            String name,
            long stackSize,
            AccessControlContext acc,
            boolean inheritThreadLocals) {
    
        ...
        this.grout = g;
        this.name = name;
        ...
        tid = nextThreadID();
    
    }
    

    这个 init() 方法,仅仅是给该 Thread 类的对象中的属性,附上值,除此之外啥也没干。

    它没有给 theadStatus 再次赋值,所以它的值仍然是其默认值。

    而这个值对应的状态,就是 STATE.NEW,非要翻译成中文,就叫初始态吧。

    因此说了这么多,其实就分析出了,新建一个 Thread 类的对象,就是创建了一个新的线程,此时这个线程的状态,是 NEW(初始态)。

    之后的分析,将弱化 threadStatus 这个整数值了,就直接说改变了其线程状态,大家知道其实就只是改变了 threadStatus 的值而已。

    3. RUNNABLE

    3.1 状态解释

    你说,刚刚处于 NEW 状态的线程,对应操作系统里的什么状态呢?

    一看你就没仔细看我上面的分析。

    Thread t = new Thread();
    

    只是做了些表面功夫,在 Java 语言层面将自己的一个对象中的属性附上值罢了,根本没碰到操作系统级别的东西呢。

    所以这个 NEW 状态,不论往深了说还是往浅了说,还真就只是个无聊的枚举值而已。

    下面,精彩的故事才刚刚开始。

    躺在堆内存中无所事事的 Thread 对象,在调用了 start() 方法后,才显现生机。

    t.start();
    

    这个方法一调用,那可不得了,最终会调用到一个讨厌的 native 方法里。

    private native void start0();
    

    看来改变状态就并不是一句 threadStatus = xxx; 这么简单了,而是有本地方法对其进行了修改。

    九曲十八弯跟进 jvm 源码之后,调用到了这个方法。

    hotspot/src/os/linux/vm/os_linux.cpp
    pthread_create(...);
    

    大名鼎鼎的 unix 创建线程的方法:pthread_create

    此时,在操作系统内核中,才有了一个真正的线程,被创建出来。

    而 Linux 操作系统,是没有所谓的刚创建但没启动的线程这种说法的,创建即刻开始运行。

    虽然无法从源码发现线程状态的变化,但通过 debug 的方式,我们看到调用了 Thread.start() 方法后,线程的状态变成了 RUNNABLE(运行态),于是我们的状态图又丰富了起来。

    通过这部分,我们知道如下几点:

    1. 在 Java 调用 start() 后,操作系统中才真正出现了一个线程,并且立刻运行;
    2. Java 中的线程,和操作系统内核中的线程,是一对一的关系;
    3. 调用 start() 后,线程状态变为 RUNNABLE,这是由 native 方法里的某部分代码造成的。

    3.2 RUNNING 和 READY

    CPU 一个核心,同一时刻,只能运行一个线程。

    具体执行哪个线程,要看操作系统 的调度机制。

    所以,上面的 RUNNABLE 状态,准确说是,得到了可以随时准备运行的机会的状态。

    而处于这个状态中的线程,也分为了:〈正在 CPU 中运行的线程〉和〈一堆处于就绪中等待 CPU 分配时间片来运行的线程〉

    处于就绪中的线程,会存储在一个就绪队列中,等待着被操作系统的调度机制选到,进入 CPU 中运行。

    当然,要注意,这里的 RUNNING 和 READY 状态,是我们自己为了方便描述而造出来的。

    无论是 Java 语言,还是操作系统,都不区分这两种状态,在 Java 中统统叫 RUNNABLE。

    4. TERMINATED

    当一个线程执行完毕(或者调用已经不建议的 stop() 方法),线程的状态就变为 TERMINATED。

    此时这个线程已经无法死灰复燃了,如果你此时再强行执行 start 方法,将会报出错误:java.lang.IllegalThreadStateException

    很简单,因为 start() 方法的第一行就是这么直戳了当地写的。

    public synchronized void start() {
        if (threadStatus != 0)
            throw new IllegalThreadStateException();
        ...
    }
    

    诶,那如果此时强行把 threadStatus 改成 0,会怎么样呢?你可以试试哟。

    5. BLOCKED

    上面把最常见,最简单的线程生命周期讲完了。

    初始 --> 运行 --> 终止
    

    没有发生任何的障碍。

    接下来,就稍稍复杂一点了,我们让线程碰到些障碍。

    首先创建一个对象 lock。

    public static final Object lock = new Object();
    

    一个线程,执行一个 sychronized 块,锁对象是 lock,且一直持有这把锁不放。

    new Thread(() -> {
        synchronized (lock) {
            while (true) {}
        }
    }).start();
    

    另一个线程,也同样执行一个锁对象为 lock 的 sychronized 块。

    new Thread(() -> {
        synchronized (lock) {
           ...
        }
    }).start();
    

    那么,在进入 synchronized 块时,因为无法拿到锁,会使线程状态变为 BLOCKED。

    同样,对于 synchronized 方法,也是如此。

    当该线程获取到了锁后,便可以进入 synchronized 块,此时线程状态变为 RUNNABLE。

    因此我们得出如下转换关系。

    当然,这只是线程状态的改变,线程还发生了一些实质性的变化。

    我们不考虑虚拟机对 synchronized 的极致优化。

    当进入 synchronized 块或方法,获取不到锁时,线程会进入一个〈该锁对象的同步队列〉。

    当持有锁的这个线程,释放了锁之后,会唤醒该锁对象同步队列中的所有线程,这些线程会继续尝试抢锁。如此往复。

    比如,有一个锁对象 A,线程 1 此时持有这把锁。线程 2、3、4 分别尝试抢这把锁失败。

    线程 1 释放锁,线程 2、3、4 重新变为 RUNNABLE,继续抢锁,假如此时线程 3 抢到了锁。

    如此往复。

    6. WAITING

    这部分是最复杂的,同时也是面试中考点最多的,将分成 3 部分讲解。听我说完后你会发现,这 3 部分有很多相同但地方,不再是孤立的知识点。

    6.1 wait/notify

    我们在刚刚的 synchronized 块中加点东西。

    new Thread(() -> {
        synchronized (lock) {
           ...
           lock.wait();
           ...
        }
    }).start();
    

    当这个 lock.wait() 方法一调用,会发生 3 件事。

    1. 释放锁对象 lock(隐含着必须先获取到这个锁才行);
    2. 线程状态变成 WAITING;
    3. 线程进入 lock 对象的等待队列。

    什么时候这个线程被唤醒,从等待队列中移出,并从 WAITING 状态返回 RUNNABLE 状态呢?

    必须由另一个线程,调用同一个对象的 notify/notifyAll() 方法。

    new Thread(() -> {
        synchronized (lock) {
           ...
           lock.notify();
           ...
        }
    }).start();
    

    只不过 notify() 是只唤醒一个线程,而 notifyAll() 是唤醒所有等待队列中的线程。

    但需要注意,被唤醒后的线程,从等待队列移出,状态变为 RUNNABLE,但仍然需要抢锁,抢锁成功了,才可以从 wait() 方法返回,继续执行。

    如果失败了,就和上一部分的 BLOCKED 流程一样了。

    所以我们的整个流程图,现在变成了这个样子。

    6.2 join

    主线程这样写。

    public static void main(String[] args) {
      thread t = new Thread(...);
      t.start();
      t.join();
      ...
    }
    

    当执行到 t.join() 的时候,主线程会变成 WAITING 状态,直到线程 t 执行完毕,主线程才会变回 RUNNABLE 状态,继续往下执行。

    看起来,就像是主线程执行过程中,另一个线程插队加入(join),而且要等到其结束后主线程才继续。

    因此我们的状态图,又多了 2 项。

    那 join 又是怎么神奇地实现这一切呢?也是像 wait() 一样放到等待队列么?

    打开 Thread.join() 的源码,你会发现它非常简单。

    // Thread.java
    // 无参的 join 有用的信息就这些,省略了额外分支 ...
    public synchronized void join() {
      while (isAlive()) {
          wait();
      }
    }
    

    也就是说,他的本质仍然是执行了 wait() 方法,而锁对象就是 Thread t 对象本身。

    那从 RUNNABLE 到 WAITING,就和执行了 wait() 方法完全一样了。

    那从 WAITING 回到 RUNNABLE 是怎么实现的呢?

    主线程调用了 wait(),需要另一个线程 notify() 才行,难道需要这个子线程 t 在结束之前,调用一下 t.notifyAll() 么?

    答案是否定的,那就只有一种可能,线程 t 结束后,由 jvm 自动调用 t.notifyAll(),不用我们程序显示写出。

    没错,就是这样。

    怎么证明这一点呢?道听途说可不行,老子今天非要扒开 jvm 的外套。

    果然,找到了如下代码。

    // hotspot/src/share/vm/runtime/thread.cpp
    
    void JavaThread::exit(...) {
      ...
      ensure_join(this);
      ...
    }
    static void ensure_join(JavaThread* thread) {
      ...
      lock.notify_all(thread);
      ...
    }
    

    我们看到,虚拟机在一个线程的方法执行完毕后,执行了个 ensure_join 方法,看名字就知道是专门为 join() 而设计的。

    而继续跟进会发现一段关键代码:lock.notify_all,这便是一个线程结束后,会自动调用自己的 notifyAll() 方法的证明。

    所以,其实 join() 就是 wait(),线程结束就是 notifyAll()。现在,是不是更清晰了。

    6.3 park/unpark

    有了上面 wait 和 notify 的机制,下面就好理解了。

    • 一个线程调用方法:LockSupport.park();,该线程状态会从 RUNNABLE 变成 WAITING;
    • 另一个线程调用:LockSupport.unpark(Thread 刚刚的线程),刚刚的线程会从 WAITING 回到 RUNNABLE。

    但从线程状态流转来看,与 wait 和 notify 相同。从实现机制上看,他们甚至更为简单。

    1. park 和 unpark 无需事先获取锁,或者说跟锁压根无关;
    2. 没有什么等待队列一说,unpark 会精准唤醒某一个确定的线程;
    3. park 和 unpark 没有顺序要求,可以先调用 unpark。

    关于第 3 点,就涉及到 park 的原理了,这里我只简单说明。

    线程有一个计数器,初始值为 0。

    • 调用 park 就是:如果这个值为 0,就将线程挂起,状态改为 WAITING。如果这个值为 1,则将这个值改为 0,其余的什么都不做;
    • 调用 unpark 就是:将这个值改为 1。

    然后我用三个例子,你就基本明白了。

    // 例子1
    LockSupport.unpark(Thread.currentThread()); // 1
    LockSupport.park(); // 0
    System.out.println("可以运行到这");
    
    // 例子2
    LockSupport.unpark(Thread.currentThread()); // 1
    LockSupport.unpark(Thread.currentThread()); // 1
    LockSupport.park(); // 0
    System.out.println("可以运行到这");
    
    // 例子3
    LockSupport.unpark(Thread.currentThread()); // 1
    LockSupport.unpark(Thread.currentThread()); // 1
    LockSupport.park(); // 0
    LockSupport.park(); // WAITING
    System.out.println("不可以运行到这");
    

    park 的使用非常简单,同时也是 JDK 中锁实现的底层。它的 JVM 及操作系统层面的原理很复杂,改天可以专门找一节来讲解。

    现在我们的状态图,又可以更新了。

    7. TIMED_WAITING

    这部分就再简单不过了,将上面导致线程变成 WAITING 状态的那些方法,都增加一个超时参数,就变成了将线程变成 TIMED_WAITING 状态的方法了,我们直接更新流程图。

    这些方法的唯一区别就是,从 TIMED_WAITING 返回 RUNNABLE,不但可以通过之前的方式,还可以通过到了超时时间,返回 RUNNABLE 状态。

    就这样。

    还有,大家看。

    • wait 需要先获取锁,再释放锁,然后等待被 notify;
    • join 就是 wait 的封装;
    • park 需要等待 unpark 来唤醒,或者提前被 unpark 发放了唤醒许可。

    那有没有一个方法,仅仅让线程挂起,只能通过等待超时时间到了再被唤醒呢。这个方法就是:

    Thread.sleep(long);
    

    我们把它补充在图里,这一部分就全了。

    再把它加到全局图中。

    8. 小结

    Java 线程的状态,有 6 种:NEW、RUNNABLE、BLOCKED、WAITING、TIMED_WAITING、TERMINATED。

    经典的线程五态模型,有 5 种状态:创建、就绪、执行、阻塞、终止。

    不同实现者,可能有合并和拆分。

    比如 Java 将五态模型中的就绪和执行,都统一成 RUNNABLE,将阻塞(即不可能得到 CPU 运行机会的状态)细分为了 BLOCKED、WAITING、TIMED_WAITING,这里我们不去评价好坏。

    也就是说,BLOCKED、WAITING、TIMED_WAITING 这几个状态,线程都不可能得到 CPU 的运行权,你叫它挂起、阻塞、睡眠、等待,都可以,很多文章,你也会看到这几个词没那么较真地来回用。

    再说两个你可能困惑的问题。

    Q1:调用 jdk 的 Lock 接口中的 lock,如果获取不到锁,线程将挂起,此时线程的状态是什么呢?

    有多少同学觉得应该和 synchronized 获取不到锁的效果一样,是变成 BLOCKED 状态?

    不过如果你仔细看我上面的文章,有一句话提到了,jdk 中锁的实现,是基于 AQS 的,而 AQS 的底层,是用 park 和 unpark 来挂起和唤醒线程,所以应该是变为 WAITING 或 TIMED_WAITING 状态。

    Q2:调用阻塞 IO 方法,线程变成什么状态?换句话说,就如 socket 编程时,若调用 accept()/read() 这种阻塞方法时,线程处于什么状态呢?

    答案是处于 RUNNABLE 状态,但实际上这个线程是得不到运行权的,因为在操作系统层面处于阻塞态,需要等到 IO 就绪,才能变为就绪态。
    但是在 Java 层面,JVM 认为等待 IO 与等待 CPU 执行权,都是一样的,人家就是这么认为的,这里我仍然不讨论其好坏,你觉得这么认为不爽,可以自己设计一门语言,那你想怎么认为,别人也拿你没办法。

    比如要我设计语言,我就认为可被 CPU 调度执行的线程,处于死亡态。这样我的这门语言一定会有个经典面试题,为什么闪客把可运行的线程定义为死亡态呢?

  • 相关阅读:
    PAT 1018. 锤子剪刀布
    PAT 1017. A除以B
    PAT 1016. 部分A+B
    PAT 1015. 德才论
    PAT 1014. 福尔摩斯的约会
    PAT 1013. 数素数
    PAT 1012. 数字分类
    PAT 1011. A+B和C
    292. Nim Game
    412. Fizz Buzz
  • 原文地址:https://www.cnblogs.com/liujiaqi1101/p/14855332.html
Copyright © 2011-2022 走看看