Java虚拟机-------垃圾回收机机制

zoukankan html css js c++ java

Java虚拟机-------垃圾回收机机制

概述

jvm中的堆图

在了解垃圾回收器之前，首先得了解一下垃圾回收器的几个名词。

1. 吞吐量
CPU 用于运行用户代码的时间与 CPU 总消耗时间的比值。比如说虚拟机总运行了 100 分钟，用户代码时间 99 分钟，垃圾回收时间 1 分钟，那么吞吐量就是 99%。

吞吐量 = 运行用户代码时间/（运行用户代码时间 + 垃圾回收时间）

2. 停顿时间
停顿时间指垃圾回收器正在运行时，应用程序的暂停时间。对于独占回收器而言，停顿时间可能会比较长。使用并发回收器时，由于垃圾回收器和应用程序交替运行，程序的停顿时间会变短，但是，由于其效率很可能不如独占垃圾回收器，故系统的吞吐量可能会较低。

3. GC的名词
3.1. 新生代GC（Minor GC）
指发生在新生代的垃圾回收动作，因为 Java 对象大多都具备朝生夕死的特性，所以 Minor GC 通常非常频繁，一般回收速度也比较快。

3.2. 老年代GC（Major GC）
指发生在老年代的垃圾回收动作，出现了 Major GC，经常会伴随至少一次的 Minor GC（发生这种情况，那么整个堆都 GC 一遍，通常称为 Full GC）。Major GC 的速度一般会比 Minor GC 慢 10 倍以上。

4. 并发与并行
4.1. 串行（Serial）
单线程进行垃圾回收工作，但此时用户线程仍然处于等待状态。

4.2. 并发（Concurrent）
这里的并发指用户线程与垃圾回收线程交替执行。

4.3. 并行（Parallel）
这里的并行指用户线程和多条垃圾回收线程分别在不同 CPU 上同时工作。

垃圾回收算法

1. 根搜索算法
根搜索算法是从离散数学中的图论引入的，程序把所有引用关系看作一张图，从一个节点 GC ROOT 开始，寻找对应的引用节点，找到这个节点后，继续寻找这个节点的引用节点。当所有的引用节点寻找完毕后，剩余的节点则被认为是没有被引用到的节点，即无用的节点。

目前 Java 中可以作为 GC ROOT 的对象有：

虚拟机栈中引用的对象（本地变量表）；

方法区中静态变量引用的对象；

方法区中常量引用的对象；

本地方法栈中引用的对象（Native 对象）。

基本所有 GC 算法都引用根搜索算法这种概念。

2. 标记 - 清除算法
标记-清除算法从根集合进行扫描，对存活的对象进行标记。标记完毕后，再扫描整个空间中未被标记的对象进行直接回收。

标记-清除算法不需要进行对象的移动，并且仅对不存活的对象进行处理，在存活的对象比较多的情况下极为高效。但由于标记-清除算法直接回收不存活的对象，并没有对还存活的对象进行整理，因此会导致内存碎片，影响内存的使用。

3. 复制算法
复制算法将内存划分为两个区间，使用此算法时，所有动态分配的对象都只能分配在其中一个区间（活动区间），而另外一个区间（空间区间）则是空闲的。

复制算法同样从根集合扫描，将存活的对象复制到空闲区间。当扫描完毕活动区间后，会的将活动区间一次性全部回收。此时原本的空闲区间变成了活动区间。下次 GC 时候又会重复刚才的操作，以此循环。

复制算法在存活对象比较少的时候，极为高效，但是带来的成本是牺牲一半的内存空间用于进行对象的移动。所以复制算法的使用场景，必须是对象的存活率非常低才行。最重要的是，我们需要克服 50% 的内存浪费。

4. 标记 - 整理算法
标记-整理算法采用标记-清除算法一样的方式进行对象的标记，但在回收不存活的对象占用的空间后，会将所有存活的对象往左端空闲空间移动，并更新对应的指针。

标记-整理是在标记-清除之上，又进行了对象的移动排序整理，因此成本更高，但却解决了内存碎片的问题。

JVM 为了优化内存的回收，使用了分代回收的方式。

对于新生代内存的回收（Minor GC）主要采用复制算法。

而对于老年代内存的回收（Major GC），大多采用标记-整理算法。

垃圾回收器

1. 七种垃圾回收器概述

在 JVM 中，具体实现有 Serial、ParNew、Parallel Scavenge、CMS、Serial Old（MSC）、Parallel Old、G1 等。在下图中，你可以看到不同垃圾回收器适合于不同的内存区域，如果两个垃圾回收器之间存在连线，那么表示两者可以配合使用。

如果当垃圾回收器进行垃圾清理时，必须暂停其他所有的工作线程，直到它完全收集结束。我们称这种需要暂停工作线程才能进行清理的策略为 Stop-the-World。以上回收器中， Serial、ParNew、Parallel Scavenge、Serial Old、Parallel Old 均采用的是 Stop-the-World 的策略。

图中有 7 种不同的垃圾回收器，它们分别用于不同分代的垃圾回收。

新生代回收器：Serial、ParNew、Parallel Scavenge

老年代回收器：Serial Old、Parallel Old、CMS

整堆回收器：G1

两个垃圾回收器之间有连线表示它们可以搭配使用，可选的搭配方案如下：

新生代老年代
Serial Serial Old
Serial CMS
ParNew Serial Old
ParNew CMS
Parallel Scavenge Serial Old
Parallel Scavenge Parallel Old
G1 G1

2. 单线程垃圾回收器

2.1. Serial（-XX:+UseSerialGC）
Serial 回收器是最基本的新生代垃圾回收器，是单线程的垃圾回收器。由于垃圾清理时，Serial 回收器不存在线程间的切换，因此，特别是在单 CPU 的环境下，它的垃圾清除效率比较高。对于 Client 运行模式的程序，选择 Serial 回收器是一个不错的选择。

Serial 新生代回收器采用的是复制算法。

2.2. Serial Old（-XX:+UseSerialGC）
Serial Old 回收器是 Serial 回收器的老生代版本，属于单线程回收器，它使用标记-整理算法。对于 Server 模式下的虚拟机，在 JDK1.5 及其以前，它常与 Parallel Scavenge 回收器配合使用，达到较好的吞吐量，另外它也是 CMS 回收器在 Concurrent Mode Failure 时的后备方案。

Serial Old 老年代回收器采用的是标记 - 整理算法。

3. 多线程垃圾回收器（吞吐量优先）

3.1. ParNew（-XX:+UseParNewGC）

ParNew 回收器是在 Serial 回收器的基础上演化而来的，属于 Serial 回收器的多线程版本，同样运行在新生代区域。在实现上，两者共用很多代码。在不同运行环境下，根据 CPU 核数，开启不同的线程数，从而达到最优的垃圾回收效果。对于那些 Server 模式的应用程序，如果考虑采用 CMS 作为老生代回收器时，ParNew 回收器是一个不错的选择。

ParNew 新生代回收器采用的是复制算法。

3.2. Parallel Scavenge（-XX:+UseParallelGC）

和 ParNew 回收一样，Parallel Scavenge 回收器也是运行在新生代区域，属于多线程的回收器。但不同的是，ParNew 回收器是通过控制垃圾回收的线程数来进行参数调整，而 Parallel Scavenge 回收器更关心的是程序运行的吞吐量。即一段时间内，用户代码运行时间占总运行时间的百分比。

Parallel Scavenge 新生代回收器采用的是复制算法。

3.3. Parallel Old（-XX:+UseParallelOldGC）

Parallel Old 回收器是 Parallel Scavenge 回收器的老生代版本，属于多线程回收器，采用标记-整理算法。Parallel Old 回收器和 Parallel Scavenge 回收器同样考虑了吞吐量优先这一指标，非常适合那些注重吞吐量和 CPU 资源敏感的场合。

Parallel Old 老年代回收器采用的是标记 - 整理算法。

4. 其他的回收器（停顿时间优先）

4.1. CMS（-XX:+UseConcMarkSweepGC）
CMS（Concurrent Mark Sweep）回收器是在最短回收停顿时间为前提的回收器，属于多线程回收器，采用标记-清除算法。

相比之前的回收器，CMS 回收器的运作过程比较复杂，分为四步：

初始标记（CMS initial mark）
初始标记仅仅是标记 GC Roots 内直接关联的对象。这个阶段速度很快，需要 Stop the World。

并发标记（CMS concurrent mark）
并发标记进行的是 GC Tracing，从 GC Roots 开始对堆进行可达性分析，找出存活对象。

重新标记（CMS remark）
重新标记阶段为了修正并发期间由于用户进行运作导致的标记变动的那一部分对象的标记记录。这个阶段的停顿时间一般会比初始标记阶段稍长一些，但远比并发标记的时间短，也需要 Stop The World。

并发清除（CMS concurrent sweep）
并发清除阶段会清除垃圾对象。

初始标记（CMS initial mark）和重新标记（CMS remark）会导致用户线程卡顿，Stop the World 现象发生。

在整个过程中，CMS 回收器的内存回收基本上和用户线程并发执行。

由于 CMS 回收器并发收集、停顿低，因此有些地方成为并发低停顿回收器（Concurrent Low Pause Sweep Collector）。

CMS 回收器的缺点：

CMS回收器对CPU资源非常依赖
CMS 回收器过分依赖于多线程环境，默认情况下，开启的线程数为（CPU 的数量 + 3）/ 4，当 CPU 数量少于 4 个时，CMS 对用户查询的影响将会很大，因为他们要分出一半的运算能力去执行回收器线程；

CMS回收器无法清除浮动垃圾
由于 CMS 回收器清除已标记的垃圾（处于最后一个阶段）时，用户线程还在运行，因此会有新的垃圾产生。但是这部分垃圾未被标记，在下一次 GC 才能清除，因此被成为浮动垃圾。

由于内存回收和用户线程是同时进行的，内存在被回收的同时，也在被分配。当老生代中的内存使用超过一定的比例时，系统将会进行垃圾回收；当剩余内存不能满足程序运行要求时，系统将会出现 Concurrent Mode Failure，临时采用 Serial Old 算法进行清除，此时的性能将会降低。

垃圾收集结束后残余大量空间碎片
CMS 回收器采用的标记清除算法，本身存在垃圾收集结束后残余大量空间碎片的缺点。CMS 配合适当的内存整理策略，在一定程度上可以解决这个问题。

4.2. G1回收器（垃圾区域Region优先）

G1 是 JDK 1.7 中正式投入使用的用于取代 CMS 的压缩回收器。它虽然没有在物理上隔断新生代与老生代，但是仍然属于分代垃圾回收器。G1 仍然会区分年轻代与老年代，年轻代依然分有 Eden 区与 Survivor 区。

G1 首先将堆分为大小相等的 Region，避免全区域的垃圾回收。然后追踪每个 Region 垃圾堆积的价值大小，在后台维护一个优先列表，根据允许的回收时间优先回收价值最大的 Region。同时 G1采用 Remembered Set 来存放 Region 之间的对象引用，其他回收器中的新生代与老年代之间的对象引用，从而避免全堆扫描。G1 的分区示例如下图所示：

这种使用 Region 划分内存空间以及有优先级的区域回收方式，保证 G1 回收器在有限的时间内可以获得尽可能高的回收效率。

G1 和 CMS 运作过程有很多相似之处，整个过程也分为 4 个步骤：

初始标记（CMS initial mark）
初始标记仅仅是标记 GC Roots 内直接关联的对象。这个阶段速度很快，需要 Stop the World。

并发标记（CMS concurrent mark）
并发标记进行的是 GC Tracing，从 GC Roots 开始对堆进行可达性分析，找出存活对象。

重新标记（CMS remark）
重新标记阶段为了修正并发期间由于用户进行运作导致的标记变动的那一部分对象的标记记录。这个阶段的停顿时间一般会比初始标记阶段稍长一些，但远比并发标记的时间短，也需要 Stop The World。

筛选回收
首先对各个 Region 的回收价值和成本进行排序，根据用户所期望的 GC 停顿时间来制定回收计划。这个阶段可以与用户程序一起并发执行，但是因为只回收一部分 Region，时间是用户可控制的，而且停顿用户线程将大幅提高回收效率。

与其它 GC 回收相比，G1 具备如下 4 个特点：

并行与并发
使用多个 CPU 来缩短 Stop-the-World 的停顿时间，部分其他回收器需要停顿 Java 线程执行的 GC 动作，G1 回收器仍然可以通过并发的方式让 Java 程序继续执行。

分代回收
与其他回收器一样，分代概念在 G1 中依然得以保留。虽然 G1 可以不需要其他回收器配合就能独立管理整个GC堆，但它能够采用不同的策略去处理新创建的对象和已经存活一段时间、熬过多次 GC 的旧对象，以获取更好的回收效果。新生代和老年代不再是物理隔离，是多个大小相等的独立 Region。

空间整合
与 CMS 的标记—清理算法不同，G1 从整体来看是基于标记—整理算法实现的回收器。从局部（两个 Region 之间）上来看是基于复制算法实现的。

但无论如何，这两种算法都意味着 G1 运作期间不会产生内存空间碎片，回收后能提供规整的可用内存。这种特性有利于程序长时间运行，分配大对象时不会因为无法找到连续内存空间而提前触发下一次 GC。

可预测的停顿
这是 G1 相对于 CMS 的另一大优势，降低停顿时间是 G1 和 CMS 共同的关注点。G1 除了追求低停顿外，还能建立可预测的停顿时间模型，能让使用者明确指定在一个长度为 M 毫秒的时间片段内，消耗在垃圾回收上的时间不得超过 N 毫秒。（后台维护的优先列表，优先回收价值大的 Region）。

----------------------------------------------------------------------------------------------------------

参考
周志明，深入理解Java虚拟机：JVM高级特性与最佳实践，机械工业出版社

查看全文

相关阅读:
互评Beta版本——可以低头，但没必要——取件帮
 作业要求 20181127-5 Beta发布用户使用报告
 从程序员到CTO的Java技术路线图
 feodora git command autocomplete
java case
哑铃图解
 links
编辑被标记为“只读”的Word文档
 css装饰文本框input
css中background-image背景图片路径设置

原文地址：https://www.cnblogs.com/insist-bin/p/11147239.html