多线程中两个必要的开销:线程的创建、上下文切换
创建线程:
创建线程使用是直接向系统申请资源的,对操作系统来说,创建一个线程的代价是十分昂贵的, 需要给它分配内存、列入调度,同时在线程切换的时候还要执行内存换页,CPU 的缓存被 清空,切换回来的时候还要重新从内存中读取信息,破坏了数据的局部性。
关于资源:Java线程的线程栈所占用的内存是在Java堆外的,所以是不受java程序控制的,只受系统资源限制,默认一个线程的线程栈大小是1M(当然这个可以通过设置-Xss
属性设置,但是要注意栈溢出问题),但是,如果每个用户请求都新建线程的话,1024个用户光线程就占用了1个G的内存,如果系统比较大的话,一下子系统资源就不够用了,最后程序就崩溃了。
同样的道理在java程序中也不要随意开启新的线程,特别是高频业务尽量使用线程池,不然很容易导致内存不足,程序崩溃的问题。
上下文切换:
概念:
当前任务执行一个时间片后会切换到下一个任务。在切换之前,上一个任务的状态会被保存下来,下次切换回这个任务时,可以再加载这个任务的状态,任务从保存到再加载的过程就是一次上下文切换。
说明:
1)时间片是CPU分配给各个线程的时间,时间片一般是几十毫秒。
2)CPU通过给每个线程分配CPU时间片,并且不停地切换线程来实现多线程。因为时间片非常短,所以感觉多个线程是在同时执行。
减少上下文切换的方法:
1)无锁并发编程:
多线程竞争锁时,会引起上下文切换,所以在使用多线程处理数据时,可以采用一些策略来避免使用锁。
常见的策略:将数据按照id的哈希值进行切分,不同的线程处理不同段的数据。
2)锁分离技术:
举例:ConcurrentHashMap
3)CAS算法
java的Atomic包使用CAS算法来更新数据,而不需要加锁。
4)使用最少的线程
避免创建不需要的线程,比如任务很少,但是创建了很多线程来处理,这样会造成大量线程都处于等待状态。
举例:
通过减少大量WAITING的线程,来减少上下文切换次数
# 转储堆栈信息
jstack PID > dumpfile
# 统计所有线程的状态
grep java.lang.Thread.State dumpfile | awk '{print $2" "$3" "$4" "$5}' | sort | uniq -c
如果存在大量waiting的线程,则查看dumpfile文件进行分析:
1)如果是服务器的工作线程大量等待,则修改服务器配置文件中线程池的配置信息,然后重启查看效果。