前言
(1)降低创建线程和销毁线程的开销。
(2)可以提高响应速度,当有新任务进来的时候不需要重新等待创建线程。
(3)合理设置线程池的大小可以避免因为线程数超过硬件资源瓶颈带来的问题。
常用API
public ThreadPoolExecutor(int corePoolSize,//核心线程数 int maximumPoolSize,//最大线程数 long keepAliveTime,//超时时间,超过核心线程数量以为的线程 多长时间进行空闲线程回收 TimeUnit unit,//存活时间单位 BlockingQueue<Runnable> workQueue,//保存执行任务的队列 ThreadFactory threadFactory, //创建新线程使用的工厂 RejectedExecutionHandler handler) { //当任务无法执行的时候的处理方式 ... }
public static ExecutorService newFixedThreadPool(int nThreads) { return new ThreadPoolExecutor(nThreads, nThreads, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>()); }
public static ExecutorService newSingleThreadExecutor() { return new FinalizableDelegatedExecutorService (new ThreadPoolExecutor(1, 1, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>())); }
//可以看出来核心线程数为0 public static ExecutorService newCachedThreadPool() { return new ThreadPoolExecutor(0, Integer.MAX_VALUE, 60L, TimeUnit.SECONDS, new SynchronousQueue<Runnable>()); }
super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS, new DelayedWorkQueue(), threadFactory);
线程池原理分析
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0)); private static final int COUNT_BITS = Integer.SIZE - 3; private static final int CAPACITY = (1 << COUNT_BITS) - 1; //接收新任务,并执行队列中的任务,初始化的时候处于这个状态 private static final int RUNNING = -1 << COUNT_BITS; //不接收新任务,但是执行队列中的任务,调用shutdown()时 private static final int SHUTDOWN = 0 << COUNT_BITS; //不接收新任务,不执行队列中的任务,但是中断正在执行的任务,调用shutdownNow()时 private static final int STOP = 1 << COUNT_BITS; //所有的任务都已结束,线程数量为 0,处于该状态的线程池即将调用 terminated()方法向terminated状态转变 private static final int TIDYING = 2 << COUNT_BITS; //terminated()方法,执行完成 private static final int TERMINATED = 3 << COUNT_BITS;
public void execute(Runnable command) { if (command == null) throw new NullPointerException(); int c = ctl.get();//读取ctl变量 if (workerCountOf(c) < corePoolSize) {//当前线程数和corePoolSize比较,当小于时: if (addWorker(command, true))//addWorker一个new thread来处理该任务(true的情况),直接返回;如果addWork返回false(线程池被shutdown or shutdownNow;或者同时又别的客户端提交任务,并且此时线程数大于corePoolSize);继续往下执行 return; c = ctl.get(); } if (isRunning(c) && workQueue.offer(command)) {//对addWorker返回false的情况进行判断,当线程池还运行着,说明是因为thread number 大于corePoolSize的情况,则&&操作第二个表达式把任务添加到workQueue队列中. int recheck = ctl.get();//再次读取ctl,防止并发哦 if (! isRunning(recheck) && remove(command))//把任务加入队列的同时,pool被shutdown, 则从队列中删除task,并且调用rejectHandler的方法 reject(command);//如果线程池处于非运行状态,并且把当前的任务从任务队列中移除成功,则拒绝该任务 else if (workerCountOf(recheck) == 0)//如果此时线程数为0(即设置了allowCorePoolSizeTimeOut为true的情况),则追加一个new thread(初始任务为null) addWorker(null, false); } else if (!addWorker(command, false))//对于其他addWorker()为false的情况,即!isRunning和workQueue.offer()失败的情况,再次尝试addWorker()添加new thread,如果为false,说明pool被关闭或者达到pool饱和,直接reject。 reject(command); }
private boolean addWorker(Runnable firstTask, boolean core) { retry: //goto语句 for (;;) { int c = ctl.get();//添加new thread前,还是先读取pool ctl变量,判断一个pool state int rs = runStateOf(c); //如果线程处于非运行状态,并且 (rs 不等于 SHUTDOWN 或者 firstTask 不等于空 或者 workQueue 为空),直接返回 false(表示不可添加 work 状态)。 //1,线程池已经 shutdown 后,还要添加新的任务,拒绝 //2,(第二个判断)SHUTDOWN 状态不接受新任务,但仍然会执行已经加入任务队列的任务,所以当进入 SHUTDOWN 状态,而传进来的任务为空,并且任务队列不为空的时候,是允许添加新线程的,如果把这个条件取反,就表示不允许添加 worker if (rs >= SHUTDOWN && ! (rs == SHUTDOWN && firstTask == null && ! workQueue.isEmpty())) return false; for (;;) { //自旋 int wc = workerCountOf(c);//获得 Worker 工作线程数 if (wc >= CAPACITY || wc >= (core ? corePoolSize : maximumPoolSize)) return false; if (compareAndIncrementWorkerCount(c))//通过 cas 来增加工作线程数,如果 cas 失败,则直接重试 break retry; c = ctl.get(); //再次获取 ctl 的值 if (runStateOf(c) != rs) //这里如果不相等,说明线程的状态发生了变化,继续重试 continue retry; } } //上面这段代码主要是对 worker 数量做原子+1 操作,下面的逻辑才是正式构建一个 worker boolean workerStarted = false;//工作线程是否启动的标识 boolean workerAdded = false;//工作线程是否已经添加成功的标识 Worker w = null; try { w = new Worker(firstTask);//构建一个 Worker,这个 worker 是什么呢?我们可以看到构造方法里面传入了一个 Runnable 对象 final Thread t = w.thread;//从 worker 对象中取出线程 if (t != null) { final ReentrantLock mainLock = this.mainLock; mainLock.lock(); try { int rs = runStateOf(ctl.get()); //只有当前线程池是正在运行状态,[或是 SHUTDOWN 且 firstTask 为空],才能添加到 workers 集合中 if (rs < SHUTDOWN || (rs == SHUTDOWN && firstTask == null)) { if (t.isAlive()) //任务刚封装到 work 里面,还没 start,你封装的线程就是 alive,几个意思?肯定是要抛异常出去的 throw new IllegalThreadStateException(); workers.add(w);//将新创建的 Worker 添加到 workers 集合中 int s = workers.size(); //如果集合中的工作线程数大于最大线程数,这个最大线程数表示线程池曾经出现过的最大线程数 if (s > largestPoolSize) largestPoolSize = s;//更新线程池出现过的最大线程数 workerAdded = true;//表示工作线程创建成功了 } } finally { mainLock.unlock(); } if (workerAdded) {//如果 worker 添加成功 t.start();//启动线程 workerStarted = true; } } } finally { if (! workerStarted) addWorkerFailed(w);//如果添加失败,就需要做一件事,就是递减实际工作线程数(还记得我们最开始的时候增加了工作线程数吗) } return workerStarted;//返回结果 }
Worker(Runnable firstTask) { setState(-1); //初始状态 -1,防止在调用 runWorker(),也就是真正执行task前中断thread this.firstTask = firstTask; this.thread = getThreadFactory().newThread(this); //因为Worker本身实现了Runnable,所以它本身就是一个Runnable也就是一个线程,所以可以使用this,所以一个线程启动的时候会调用它的run()方法 } public void run() { runWorker(this); }
private void addWorkerFailed(Worker w) { final ReentrantLock mainLock = this.mainLock; mainLock.lock(); try { if (w != null) workers.remove(w); decrementWorkerCount(); tryTerminate(); } finally { mainLock.unlock(); } }
final void runWorker(Worker w) { Thread wt = Thread.currentThread(); Runnable task = w.firstTask; w.firstTask = null; w.unlock();//unlock,表示当前 worker 线程允许中断,因为 new Worker 默认的 state=-1,此处是调用Worker 类的 tryRelease()方法,将 state 置为 0,而 interruptIfStarted()中只有 state>=0 才允许调用中断 boolean completedAbruptly = true; try { while (task != null || (task = getTask()) != null) {////注意这个 while 循环,在这里实现了 [线程复用] // 如果 task 为空,则通过getTask 来获取任务 w.lock(); //1,上锁,不是为了防止并发执行任务,为了在 shutdown()时不终止正在运行的 worker。2,线程池为 stop 状态时不接受新任务,不执行已经加入任务队列的任务,还要中断正在执行的任务。所以对于 stop 状态以上是要中断线程的,(Thread.interrupted() && runStateAtLeast(ctl.get(), STOP)确保线程中断标志位为 true 且是 stop 状态以上,接着清除了中断标志,!wt.isInterrupted()则再一次检查保证线程需要设置中断标志位 if ((runStateAtLeast(ctl.get(), STOP) || (Thread.interrupted() && runStateAtLeast(ctl.get(), STOP))) && !wt.isInterrupted()) wt.interrupt(); try { beforeExecute(wt, task);//这里默认是没有实现的,在一些特定的场景中我们可以自己继承 ThreadpoolExecutor 自己重写 Throwable thrown = null; try { task.run();//执行任务中的 run 方法 } catch (RuntimeException x) { thrown = x; throw x; } catch (Error x) { thrown = x; throw x; } catch (Throwable x) { thrown = x; throw new Error(x); } finally { afterExecute(task, thrown);//这里默认也是没有实现 } } finally { //置空任务(这样下次循环开始时,task 依然为 null,需要再通过 getTask()取) + 记录该 Worker 完成任务数量 + 解锁 task = null; w.completedTasks++; w.unlock(); } } completedAbruptly = false; } finally { //1.将入参 worker 从数组 workers 里删除掉; //2.根据布尔值 allowCoreThreadTimeOut 来决定是否补充新的 Worker 进数组workers processWorkerExit(w, completedAbruptly); } }
private Runnable getTask() { boolean timedOut = false; // Did the last poll() time out? for (;;) { int c = ctl.get(); int rs = runStateOf(c); //对线程池状态的判断,两种情况会 workerCount-1,并且返回 null。 1,线程池状态为 shutdown,且 workQueue 为空(反映了 shutdown 状态的线程池还是要执行 workQueue 中剩余的任务的)2,线程池状态为 stop(shutdownNow()会导致变成 STOP)(此时不用考虑 workQueue的情况) if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) { decrementWorkerCount(); return null;//返回 null,则当前 worker 线程会退出 } int wc = workerCountOf(c); // timed 变量用于判断是否需要进行超时控制。 //allowCoreThreadTimeOut 默认是 false,也就是核心线程不允许进行超时; // wc > corePoolSize,表示当前线程池中的线程数量大于核心线程数量;对于超过核心线程数量的这些线程,需要进行超时控制 boolean timed = allowCoreThreadTimeOut || wc > corePoolSize; //1,线程数量超过 maximumPoolSize 可能是线程池在运行时被调用了 setMaximumPoolSize()被改变了大小,否则已经 addWorker()成功不会超过 maximumPoolSize。2, timed && timedOut 如果为 true,表示当前操作需要进行超时控制,并且上次从阻塞队列中获取任务发生了超时.其实就是体现了空闲线程的存活时间。 if ((wc > maximumPoolSize || (timed && timedOut)) && (wc > 1 || workQueue.isEmpty())) { if (compareAndDecrementWorkerCount(c)) return null; continue; } try { //根据 timed 来判断,如果为 true,则通过阻塞队列 poll 方法进行超时控制,如果在keepaliveTime 时间内没有获取到任务,则返回 null. Runnable r = timed ? workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) : workQueue.take(); if (r != null) return r; timedOut = true;//如果 r==null,说明已经超时了,设置 timedOut=true,在下次自旋的时候进行回收 } catch (InterruptedException retry) { timedOut = false;// 如果获取任务时当前线程发生了中断,则设置 timedOut 为false 并返回循环重试 } } }
AbortPolicy:直接抛出异常,默认策略;
CallerRunsPolicy:用调用者所在的线程来执行任务;
DiscardOldestPolicy:丢弃阻塞队列中靠最前的任务,并执行当前任务;
DiscardPolicy:直接丢弃任务;
当然也可以根据应用场景实现 RejectedExecutionHandler 接口,自定义饱和策略,如记录日志或持久化存储不能处理的任务。
线程池的注意事项
1,阿里开发手册不建议使用线程池:使用Executors来创建线程池使得用户不需要关心创建线程池的参数配置,这会导致我们可能因为不了解不同的线程池里面的参数配置而导致一些问题,例如newFixdThreadPool 或者singleThreadPool允许的队列长度为Integer.MAX_VALUE,如果使用不当可能会造成线程堆积引发OOM。
2,合理配置线程池的大小:
CPU密集型,执行计算任务,响应时间很快,cpu一直在运行,配置过多的线程反而导致cpu频繁切换上下文。所以建议线程数配置为 cpu核心数+1。
IO密集型,主要是执行IO操作,一般cpu处于空闲状态,导致cup利用不高。所以建议线程数配置为cpu核心数的2倍,公式:线程池设定最佳线程数目 = ((线程池设定的线程等待时间+线程 CPU 时间)/线程 CPU 时间 )* CPU 数目
3,线程池中线程的初始化:创建线程池之后,默认是没有线程的,需要提交任务才有线程,如果想创建成功立即创建线程可以调用prestartCoreThread()或者prestartAllCoreThreads()
4,线程池的关闭:shutdown(),不接收新任务,但执行完缓存队列中的任务。shutdownNow(),不接收新任务,立即终止线程池,尝试打断正在执行的任务,并且清空缓存队列。
5,缓存池容量调整:setCorePoolSize() 和 setMaximumPoolSize()
6,线程池的监控:重写线程池的 beforeExecute、afterExecute 和 shutdown 等方式对线程池监控
Callable/Future使用及原理分析
private volatile int state; private static final int NEW = 0;//NEW 新建状态,表示这个 FutureTask还没有开始运行 private static final int COMPLETING = 1;// COMPLETING 完成状态, 表示 FutureTask 任务已经计算完毕了, 但是还有一些后续操作,例如唤醒等待线程操作,还没有完成。 private static final int NORMAL = 2;// FutureTask 任务完结,正常完成,没有发生异常 private static final int EXCEPTIONAL = 3;// FutureTask 任务完结,因为发生异常。 private static final int CANCELLED = 4;// FutureTask 任务完结,因为取消任务 private static final int INTERRUPTING = 5;// FutureTask 任务完结,也是取消任务,不过发起了中断运行任务线程的中断请求 private static final int INTERRUPTED = 6;// FutureTask 任务完结,也是取消任务,已经完成了中断运行任务线程的中断请求
//运行call方法,拿到返回值根据有没有异常设置setException(ex)和set(result) public void run() { if (state != NEW || !UNSAFE.compareAndSwapObject(this, runnerOffset, null, Thread.currentThread())) return; try { Callable<V> c = callable; if (c != null && state == NEW) { V result; boolean ran; try { result = c.call(); ran = true; } catch (Throwable ex) { result = null; ran = false; setException(ex); } if (ran) set(result); } } finally { // runner must be non-null until state is settled to // prevent concurrent calls to run() runner = null; // state must be re-read after nulling runner to prevent // leaked interrupts int s = state; if (s >= INTERRUPTING) handlePossibleCancellationInterrupt(s); } }
//1,判断当前线程状态,如果小于COMPLETING,说明还有任务还没有执行完全,调用awaitDown让当前线程等待 //2,返回执行结果或者抛出异常 public V get() throws InterruptedException, ExecutionException { int s = state; if (s <= COMPLETING) s = awaitDone(false, 0L); return report(s); }
//如果当前线程没有执行完,则把当前线程加入等待队列 private int awaitDone(boolean timed, long nanos) throws InterruptedException { final long deadline = timed ? System.nanoTime() + nanos : 0L; WaitNode q = null; boolean queued = false; //节点是否已经添加 for (;;) { if (Thread.interrupted()) { removeWaiter(q); //如果中断标志位是true,移出当前线程抛出异常 throw new InterruptedException(); } int s = state; if (s > COMPLETING) {//大于COMPLETING,证明已经结束 if (q != null) q.thread = null; return s; } else if (s == COMPLETING) //等于COMPLETING,说明还有后续的一些线程执行,让出cpu执行权 Thread.yield(); else if (q == null) //到这状态肯定是new了,那么就需要将当年线程阻塞等待 q = new WaitNode();//等待节点为空 新建一个 else if (!queued) //通过cas将新节点加入到列表中 queued = UNSAFE.compareAndSwapObject(this, waitersOffset, q.next = waiters, q); else if (timed) {// timed 为 true 表示需要设置超时 nanos = deadline - System.nanoTime(); if (nanos <= 0L) { removeWaiter(q); return state; } LockSupport.parkNanos(this, nanos); } else LockSupport.park(this); } }
private V report(int s) throws ExecutionException {
Object x = outcome;//表示 call 的返回值
if (s == NORMAL)// 表示正常完结状态,所以返回结果值
return (V)x;
if (s >= CANCELLED)
throw new CancellationException();
throw new ExecutionException((Throwable)x);
}
在线程池中的运行
public <T> Future<T> submit(Callable<T> task) { if (task == null) throw new NullPointerException(); RunnableFuture<T> ftask = newTaskFor(task); execute(ftask); return ftask; }