zoukankan      html  css  js  c++  java
  • 线程池

    1.线程池

      1.1 什么是线程池

        java中的线程池是运用场景最多的并发框架,几乎所以需要异步或并发执行任务的程序都可以使用线程池。在开发过程中,合理地使用线程池能够带来三个好处:

          第一:降低资源消耗:通过复利用已创建的线程降低线程创建和销毁造成的消耗;

          第二:提高相应程序:当任务达到时,任务可以不需要等到线程创建就能立即执行;

          第三:提高线程的可管理性:线程是稀缺资源,如果无限制地创建,不仅会消耗系统资源,还会降低系统的稳定性,使用线程池可以进行统一分配,调优和监控,但是,要做到合理利用线程池,必须对其实现原理了如指掌;

      1.2 线程池作用

        线程池是为突然大量爆发的线程设计的,通过有限的几个固定线程为大量的操作服务,减少了创建和销毁线程所需的时间,从而提高效率;

        如果一个线程的时间非常长,就没必要用线程池了(不是不能作长时间操作,而是不宜),况且我们还不能控制线程池中线程的开始,挂起,和中止;

      1.3线程池的分类

        ThreadPoolExecutor

          java是天生就支持并发语言的,支持并发意味着多线程,线程的频繁创建在高并发及大数据量是非常消耗资源的,因为java提供了线程池。在jdk1.5以前的版本,线程池的使用时机器简陋的,但是jdk1.5后,有了很大的改善。jdk1.5之后加入了java.util.concurrent包,java.util.concurrent包的加入给予开发人员并发程序以及解决并发问题很大的帮助。

          Executor框架的最顶层实现时ThreadPoolExecutor类,Executor工厂类中提供的newScheduledThreadPool、newFixedThreadPool、newCachedThreadPool方法其实也只是ThreadPoolExecutor的构造函数参数不同而已。通过传入不同的参数,就可以构造出适用于不同应用场景下的线程池,那么它的底层原理是怎样实现的呢,这篇就来介绍下ThreadPoolExecutor线程池的运行过程。

          CorePoolSize:核心池的大小。当任务来之后,就会创建一个线程去执行任务,当线程池中的线程数目达到corePoolSize后,就会把到达的任务放到缓存队列当中; 

          maximunPoolSize:线程池最大线程数,它表示在线程池中最多能创建多少个线程;

          keepAliveTime:表示线程没有任务执行时最多保持多久时间会终止;

          unit:参数keepAliveTime的时间单位,有七种取值,在TimeUnit类中有七种静态属性;   

    2.常见的四种线程池

      2.1 newCachedThreadPool

        newCachedThreadPool:可缓存线程池,先查看池中有没有以前建立的线程,如果有,就直接使用;如果没有,就创建一个新的线程加入池中,缓存型池通常用于执行一些生存期很短的异步型任务;

    package com.wn.threadpool;
    
    import java.util.concurrent.ExecutorService;
    import java.util.concurrent.Executors;
    
    public class NewCachedThreadPoolTest {
        //无限大侠线程池,JVM自动回收
        public static void main( String[] args ){
            ExecutorService newCachedThreadPool = Executors.newCachedThreadPool();
            for (int i=1;i<=10;i++){
                newCachedThreadPool.execute(new Runnable() {
                    @Override
                    public void run() {
                        System.out.println(Thread.currentThread().getName());
                    }
                });
            }
        }
    
    }

        

        线程池为无限大,当执行第二个任务已经完成,会复用执行第一个任务的线程,而不用每次新建线程

      2.2 newFixedThreadPool

        newFixedThreadPool:创建一个可重用固定个数的线程池,以共享的无界队列方式来运行这些线程;

    package com.wn.threadpool;
    
    import java.util.concurrent.ExecutorService;
    import java.util.concurrent.Executors;
    
    public class NewFixedThreadPoolTest {
        public static void main( String[] args ){
            ExecutorService newFixedThreadPool = Executors.newFixedThreadPool(3);
            for (int i=0;i<10;i++){
                newFixedThreadPool.execute(new Runnable() {
                    @Override
                    public void run() {
                        System.out.println(Thread.currentThread().getName());
                    }
                });
            }
        }
    }

        

        因为线程池大小为3,每个任务输出index后sleep 2秒,所以每两秒打印3个结果;

        定长线程池的大小最好根据系统资源进行设置;

      2.3 newScheduledThreadPool

        newScheduledThreadPool:创建一个定长线程池,支持定时及周期性任务执行

    package com.wn.threadpool;
    
    import java.util.concurrent.Executors;
    import java.util.concurrent.ScheduledExecutorService;
    import java.util.concurrent.TimeUnit;
    
    public class NewScheduledThreadPoolTest {
        public static void main( String[] args ) {
            ScheduledExecutorService newScheduledThreadPool = Executors.newScheduledThreadPool(3);
            for (int i=0;i<10;i++){
                newScheduledThreadPool.schedule(new Runnable() {
                    @Override
                    public void run() {
                        System.out.println(Thread.currentThread().getName());
                    }
                },3, TimeUnit.SECONDS);
            }
        }
    }

        

        输出结果时,有延迟时间;

      2.4 newSingleThreadExecutor

        newSingleThreadExecutor:创建一个单线程化的线程池,它只会用唯一的工作线程来执行任务,保证所有任务按照指定顺序执行;

    package com.wn.threadpool;
    
    import java.util.concurrent.ExecutorService;
    import java.util.concurrent.Executors;
    
    public class NewSingleThreadExecutorTest {
        public static void main( String[] args ){
            ExecutorService newSingleThreadExecutor = Executors.newSingleThreadExecutor();
            for (int i=0;i<10;i++){
                final int index=i;
                newSingleThreadExecutor.execute(new Runnable() {
                    @Override
                    public void run() {
                        System.out.println(Thread.currentThread().getName()+"正在被执行,index:"+index);
                        try {
                            Thread.sleep(200);
                        } catch (InterruptedException e) {
                            e.printStackTrace();
                        }
                    }
                });
            }
        }
    }

        

    3.线程池原理剖析

      提交一个任务到线程池中,线程池的处理流程如下:

        1.判断线程池里的核心线程是否都在执行任务,如果不是(核心线程空闲或者还有核心线程没有被创建)则创建一个新的工作线程来执行任务,如果核心线程都在执行任务,则进入下一个阶段;

        2.线程池判断工作队列是否已满,如果工作队列没有满,则将新提交的任务存储在这个工作队列中,如果工作队列满了,则进入下一个阶段;

        3判断线程池里的线程是否都处于工作状态,如果没有,则创建一个新的工作线程来执行任务,如果已经满了,则交给饱和策略来处理这个任务;

    4.合理配置线程池

      要想合理的配置线程池,就必须首先分析任务特性,可以从以下几个角度来进行分析:

        任务的性质:CPU密集型任务,IO密集型任务和混合型任务;

        任务的优先级:高,中,低;

        任务的执行时间:长,中,短;

        任务的依赖性:是否依赖其他系统资源,如数据库连接;

        任务性质不同的任务可以用不同规模的线程池分开处理;CPU密集型任务配置尽可能少的线程数量,如配置Ncpu+1和线程的线程池;IO密集型任务则由于需要等待IO操作,线程并不是一直在执行任务,则配置尽可能多的线程,如2*Ncpu;混合型的任务,如果可以拆分,则将其拆分成一个CPU密集型任务和一个IO密集型任务,只要有两个任务执行的时间相差不是太大,那么分解后执行的吞吐率要高于串行执行的吞吐率,如果这两个任务执行时间相差太大,则没有必要进行分解;我们可以通过Runtime.getRuntime().availableProcessors()方法获得当前设备的CPU个数。

        优先级不同的任务可以使用优先级队列PriorityBlockingQueue来处理。它可以让优先级高的任务先得到执行,需要注意的是如果一直有优先级高的任务提交到队列里,那么优先级低的任务可能永远不能执行。

        执行时间不同的任务可以交给不同规模的线程池来处理,或者也可以使用优先级队列,让执行时间短的任务先执行。

        依赖数据库连接池的任务,因为线程提交SQL后需要等待数据库返回结果,如果等待的时间越长CPU空闲时间就越长,那么线程数应该设置越大,这样才能更好的利用CPU。

        总结:CPU密集型时,任务可以少配置线程数,大概和机器的cpu核数相当,这样可以使得每个线程都在执行任务

            IO密集型时,大部分线程都阻塞,故需要多配置线程数,2*cpu核数

            操作系统之名称解释:

              某些进程花费了绝大多数时间在计算上,而其他则在等待I/O上花费了大多是时间,

              前者称为计算密集型(CPU密集型)computer-bound,后者称为I/O密集型,I/O-bound。

     

  • 相关阅读:
    Apache Spark 2.2.0 中文文档
    Apache Spark 2.2.0 中文文档
    Apache Spark 2.2.0 中文文档
    Apache Spark 2.2.0 中文文档
    Apache Spark 2.2.0 中文文档
    Apache Spark RDD(Resilient Distributed Datasets)论文
    Apache Spark 2.2.0 中文文档
    Apache Spark 2.2.0 中文文档
    【机器学习实战】第10章 K-Means(K-均值)聚类算法
    [译]flexbox全揭秘
  • 原文地址:https://www.cnblogs.com/wnwn/p/12523804.html
Copyright © 2011-2022 走看看