1. 如何判断对象已“死”
Java堆中存放着几乎所有的对象实例,垃圾回收器在堆进行垃圾回收前,首先要判断这些对象哪些还存活,哪些已经“死去”。判断对象是否已“死”有如下几种算法
1.1 引用计数法
引用计数法描述的算法为:给对象增加一个引用计数器,每当有一个地方引用它时,计数器就+1,每引用失效时,计数器就-1,任何时刻计数器为0的对象就是不能再被使用的,即对象已“死”。
引用计数法实现简单,判定效率也比较高,在大部分情况下都是一个比较好的算法。比如Python语言就是采用的引用计数法来进行内存管理的。但是,在主流的JVM中没有选用引用计数法来管理内存,最主要的原因是引用计数法无法解决对象的循环引用问题。
范例:循环引用问题
public class Test{ public static void main(String[] args){ testGC(); } public static void testGC(){ Test test1 = new Test(); Test test2 = new Test(); test1.instance = test2; test2.instance = test1; // 建议JVM进行垃圾回收 System.gc(); } }
1.2 可达性分析算法(JVM所使用的算法)
在上面讲了,Java并不采用引用计数法来判断对象是否已“死”,而采用可达性分析"来判断对象是否存活(同样采用此法的还有C#、Lisp-最早的一门采用动态内存分配的语言)。
此算法的核心思想:通过一系列称为“GC Roots’的对象作为起始点,从这些节点开始向下搜索,搜索走过的路径称为“引用链”,当一个对象到GC Roots没有任何的引用链相连时(从GC Roots到这个对象不可达)时,证明此对象不可用。以下图为例:
对象Object5——Object7之间虽然彼此还有联系,但是它们到GC Roots 是不可达的,因此它们会被判定为可回收对象。
在Java语言中,可作为GC Roots的对象包含以下几种:
- 虚拟机栈(栈帧中的本地变量表)中引用的对象。
- 方法区中静态属性引用的对象。
- 方法区中常量引用的对象。
- 本地方法栈中(Native方法)引用的对象。
2. 垃圾回收算法
2.1 标记清除算法
“标记-清除”算法是最基础的收集算法。算法分为标记和清除两个阶段:首先标记出所有需要回收的对象,在标记完成后统-回收所有被标记的对象(标记过程参见1.2可达性分析)。后续的收集算法都是基于这种思路并对其不足加以改进而已。
“标记-清除"算法的不足主要有两个:
效率问题:标记和清除这两个过程的效率都不高。
空间问题:标记清除后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行中需要分配较大对象时,无法找到足够连续内存
而不得不提前触发另-次垃圾收集。
2.2 复制算法(新生代回收算法)
“复制”算法是为了解决“标记-清除的效率问题。它将可用内存按容量划分为大小相等的两块,每次只使用其中-块。当这块内存需要进行垃圾回收时,会将此区域还存活着的对象复制到另-块上面,然后再把已经使用过的内存区域-次清理掉。这样做的好处是每次都是对整个半区进行内存回收,内存分配时也就不需要考虑内存碎片等的复杂情况,只需要移动堆顶指针,按顺序分配即可。此算法实现简单,运行高效。算法的执行
流程如下图:
2.3 新生代复制算法
2.4 标记整理算法(老年代回收算法)
复制收集算法在对象存活率较高时会进行比较多的复制操作,效率会变低。因此在老年代一般不能使用复制算法。
针对老年代的特点,提出了一种称之为“标记-整理算法"。标记过程仍与“标记-清除"过程一致, 但后续步骤不是直接对可回收对象进行清理,而是让所有存活对象向一端移动,然后直接清理掉端边界以外的内存。
流程图如下:
2.5 分代收集算法(GC回收算法)
2.6 回收方法区
当方法区内存不足以存放新数据时会回收方法区,回收方法区时会伴随着Full GC 也会导致JVM停止运行,Full GC也会发生一至多个Young GC。