概述
说起垃圾收集(Garbage Collection,GC),大部分人都把这项技术当做Java语言的伴生产物。事实上,GC的历史远远比Java久远,1960年诞生于MIT的Lisp是第一门真正使用内存动态分配和垃圾收集技术的语言。当Lisp还在胚胎时期时,人们就在思考:
GC需要完成的三件事情:
哪些内存需要回收?
什么时候回收?
如何回收?
经过半个世纪的发展,内存的动态分配与内存回收技术已经相当成熟,一切看起来都进入了“自动化”时代,那为什么我们还要去了解GC和内存分配呢?答案很简单:当需要排查各种内存溢出、内存泄漏问题时,当垃圾收集成为系统达到更高并发量的瓶颈时,我们就需要对这些“自动化”的技术实施必要的监控和调节。
把时间从半个世纪以前拨回到现在,回到我们熟悉的Java语言。第2章介绍了Java内存运行时区域的各个部分,其中程序计数器、虚拟机栈、本地方法栈三个区域随线程而生,随线程而灭;栈中的栈帧随着方法的进入和退出而有条不紊地执行着出栈和入栈操作。每一个栈帧中分配多少内存基本上是在类结构确定下来时就已知的(尽管在运行期会由JIT编译器进行一些优化,但在本章基于概念模型的讨论中,大体上可以认为是编译期可知的),因此这几个区域的内存分配和回收都具备确定性,在这几个区域内不需要过多考虑回收的问题,因为方法结束或线程结束时,内存自然就跟随着回收了。而Java堆和方法区则不一样,一个接口中的多个实现类需要的内存可能不一样,一个方法中的多个分支需要的内存也可能不一样,我们只有在程序处于运行期间时才能知道会创建哪些对象,这部分内存的分配和回收都是动态的,垃圾收集器所关注的是这部分内存,本书后续讨论中的“内存”分配与回收也仅指这一部分内存。
串行垃圾收集器
只有一个线程在进行垃圾回收,其他线程都要停止(STW),不适合用在交互性较高的应用当中
通过设置VM Options参数制定我们采用串行垃圾收集器,并且打印垃圾收集信息
设置垃圾回收为串行收集器
-XX:+UseSerialGC -XX:+PrintGCDetails -Xms16m -Xmx16m
并行垃圾收集器
多个线程进行垃圾回收,导致STW,缩短垃圾清理时间
1.ParNew垃圾收集器
工作在年轻代,通过-XX:UseParNewGC
2.ParallelGC垃圾收集器
与ParNew垃圾收集器机制相同,都是通过多个线程同时进行垃圾收集,同样会导致应用程序STW,可以通过参数设置提高程序吞吐量
设置程序VM Options参数制定年轻代和年老代都是用ParallelGC,并且设置垃圾收集停顿时间最大为100ms(年轻代和年老代默认使用该GC)
-XX:+UseParallelGC
选择垃圾收集器为并行收集器。此配置仅对年轻代有效。可以同时并行多个垃圾收集线程,但此时用户线程必须停止。
-XX:+UseParallelOldGC
年轻代使用ParallelGC垃圾回收期,老年代使用ParallelOldGC垃圾回收器;
-XX:+PrintGCDetails
设置最大的垃圾收集时的停顿时间,单位为毫秒;需要注意的是,ParallelGC为了达到设置的停顿时间,可能会调整堆大小或其他的参数,如果堆的大小设置的较小,就会导致GC工作变得很频繁,反而可能会影响性能;带参数使用需谨慎;
CMS垃圾收集器
串行和并行在进行垃圾收集时都会导致应用线程的停止,CMS可以同应用程序同步执行,该收集器是针对老年代,使用标记清除法进行垃圾回收
只有标记阶段会导致应用程序停止,然后其他阶段都是与应用程序并行
G1垃圾收集器
将原有的内存模型划分成了每一个区域,包含Eden区,还包含S区,还包含O区,以及H区,
其中H区存放短暂的占用空间50%以上的大对象
YoungGC回收:
1.专门回收Eden区的数据,当Eden区内存满了的情况下,会进行垃圾回收,Eden区的数据存活的对象会转移到Survivor区域,如果Survivor区域内存太小,那么Eden区就会将这个数据提升到Old区当中
2.当suvivor区域满了会将数据转移到Old区
3.Rset:记录引用地址,方便于快速定位,节省资源
在垃圾回收的时候,我们需要定位到根对象,找根对象的引用关系,之前没有G1时,我们进行内存对象的全部扫描,G1提供一个Rset
Rset专门存储引用的对象的位置,在哪一个区域,在哪一个Card当中
G1垃圾收集器会将每一块Region分为若干个Card,每一个Card默认大小为512KB
MixedGC:
当越来越多的数据晋升到Old区域当中的情况下, 为了避免内存不足的情况,JVM虚拟机会启用MiexdGC,进行混合数据的回收,包含YongGC以及部分OldGC
当老年代数据占用堆内存整体45%的时候会触发,可以通过 -XX:InitiatingHeapOccupancyPercent=n进行设置
MixedGC回收的两个部分:
1.全局标记
初始化标记
根节点扫描
全局标记
重新标记
清除垃圾:并不是真正清除,而是恢复状态
2.对象拷贝阶段
将要回收的区域的存活对象复制到另外一个Region当中,然后进行垃圾清理
G1参数:设置启用G1 设置暂停时间 设置堆内存大小
-XX:+UseG1GC -XX:MaxGCPauseMillis=100 -XX:+PrintGCDetails -Xmx32m
优化建议:
1.不要设置年轻代内存大小
2.暂停时间不要太苛刻