zoukankan      html  css  js  c++  java
  • Java垃圾回收与算法

    我们知道Java在运行时内存分为了五个部分:程序计数器、虚拟机栈、本地方法栈、堆、方法区。其中程序计数器、虚拟机栈、本地方法栈所占用的内存是不需要垃圾收集的,这三个区域的内存随着线程生,随着线程死,我们需要关注的其实只有堆和方法区这两块内存的垃圾收集。

    下面从这几点说一下JVM GC

    1. GC要做什么

    2. 如何判断对象已经死亡

    3. 垃圾回收算法有哪些

    4. 垃圾收集器

    GC具体做了什么

    哪些内存需要回收

    什么时候回收

    怎么回收

    如何判断对象已经死亡:

    1.引用计数法:

    在Java中,引用和对象是关联的,如果要操作对象,则必须用引用进行,因此,可以通过引用计数来判断对象是否可以回收。如果该对象被引用,计数器加1,不引用减1,如果计数器等于0,我们就认为没有引用指向该对象,可以将该对象回收,

    它的不足之处就是不能解决循环引用,如下面的例子,实际上这两个对象已经不可能再被访问,但是它们因为互相引用着对方,导致它们的引用计数都不为0,于是引用计数算法无法通知GC收集器回收它们。

    public class TestCycleReference {
    
        private Object obj = null;
        private static final int _size = 1024 * 1024;
    
        public static void main(String[] args) {
            TestCycleReference t1 = new TestCycleReference();
            TestCycleReference t2 = new TestCycleReference();
            t1.obj = t2;
            t2.obj = t1;
            t1 = null;
            t2 = null;
            System.gc();
        }
    }

    2.可达性分析

    通过一系列GC Roots对象作为起始点搜索,如果在GC Roots和一个对象之间没有可达路径,则认为该对象不在存活

    那么什么可以GC Roots呢?

    • 静态变量的引用的对象

    • 类中常量引用的对象

    • 虚拟机栈临时变量引用的对象

    • 本地方法栈JNI引用的对象

    既然找到了哪些对象是不存活的,那么GC就应该采取一些策略,将不存活的对象kill掉,提供了四种算法来kill掉这些不存活的对象

    垃圾回收算法:

    1.标记-清除算法:

    最基础的垃圾回收算法,分为两个阶段,标记和清楚,标记阶段记出所有需要回收的对象,清除阶段回收被标记的对象所占用的空,如图:

    从图中可以看出,该算法最大的问题是内存碎片太严重,后序可能无法对一个大的对象找到可利用的空间

    2.复制算法:

    将新生代内存分为一块较大的Eden(伊甸园)与两块大小相等的Survivor(幸存者),默认比例8:1:1

    ,每次使用Eden与其中一块Survivor区域(一个叫From区,另一个叫To区)

     复制算法的核心流程:

    step1.对象默认都在Eden区产生,当Eden空间即将满时,触发第一次Minor GC(新生代GC),

    Eden区所有存活对象复制到From区,然后一次性清理掉Eden区的所有空间。

    step2.当Eden区再次即将满的时,触发MinorGC,此时需要将Eden与From区的所有存活对象复制到To区,然后一次清理掉Eden与From的所有空间。之后的新生代GC,重复阶段2(只是From与To

    来回作为备用区域).

    备注:某些对象来回在From与To区交换若干次(默认15次)以上,将其置入老年代空间

     这种算法虽然实现简单,内存效率高,不易产生碎片,但是最大的问题是可用内存被压缩到了原本的一半。且存活对象增多的话,Copying算法的效率会大大降低

    3.标记整理算法(老年代的垃圾回收算法)

    核心思想相较于标记清除-整理阶段先让存活对象向一端移动,而后清理掉存活对象边界之外的所有空间。

    4.分代收集算法

    一般情况下,我们将堆区划分为新生代和老年代,老年代特点是每次垃圾回收时只有少量对象需要被回收,所以老年代采用标记整理算法;新生代特点是每次垃圾回收都有大量的对象被回收,所以新生代采用复制算法。

    注意:当对象在Survivor区躲过一次GC后,其年龄就会+1默认情况下年龄到达15的对象会被移到老生代中。

    GC垃圾收集器

    Java堆内存被划分为新生代和年老代两部分,新生代主要使用复制和标记-清除垃圾回收

    年老代主要使用标记-整理垃圾回收算法,因此java虚拟中针对新生代和年老代分别提供了多种不
    同的垃圾收集器,JDK1.6SunHotSpot虚拟机的垃圾收集器如下:
     
    1. Serial垃圾收集器(单线程、复制算法):Serial是一个单线程的收集器。它不但只会使用一个CPU或一条线程去完成垃圾收集工作,并且在进行垃圾收集的同时,必须暂停其他的工作线程,但是它简单高效,对于限定单个CPU环境来说,没有线程交互开销,可以获得最高的单线程垃圾收集效率,因此Serial垃圾收集器依然是Java虚拟机运行在Client模式下默认的新生代垃圾收集器

    2. ParNew垃圾收集器(Serial+多线程):其实是Serial收集器的多线程版本,也使用复制算法,除了使用多线程外其余特性和Serial收集器一样,ParNew收集器默认开启和CPU数目相同的线程数,ParNew虽然是除了多线程外和Serial收集器几乎完全一样,但是ParNew垃圾收集器是很多Java虚拟机运行在Server模式下新生代的默认垃圾收集器

    3. Parallel Scavenge收集器(多线程复制算法、高效):ParallelScavenge收集器也是一个新生代垃圾收集器,同样使用复制算法,也是一个多线程的垃圾收集器,它重点关注的是程序达到一个可控制的吞吐量ThoughputCPU用于运行用户代码的时间/CPU总消耗时间,即吞吐量=运行用户代码时间/(运行用户代码时+垃圾收集时间)),高吞吐量可以最高效率地利用CPU时间,尽快地完成程序的运算任务,主要适用于在后台运算而不需要太多交互的任务。自适应调节策略也是ParallelScavenge收集器与ParNew收集器的一个重要区别。

    4. Serial Old收集器(单线程标记整理算法)

    5. Parallel Old收集器(多线程标记整理算法)

    6. CMS收集器(多线程标记清楚算法):Concurrentmarksweep(CMS)收集器是一种年老代垃圾收集器,其最主要目标是获取最短垃圾回收停顿时间,和其他年老代使用标记-整理算法不同,它使用多线程的标记-清除算法CMS工作机制相比其他的垃圾收集器来说更复杂,整个过程分为以下4个阶段:初始标记:只是标记一下GCRoots能直接关联的对象,速度很快,仍然需要暂停所有的工作线程。
      并发标记:进行GCRoots跟踪的过程,和用户线程一起工作,不需要暂停工作线程。
      重新标记:为了修正在并发标记期间,因用户程序继续运行而导致标记产生变动的那一部分对象的标记录,仍然需要暂停所有的工作线程。
      并发清除:清除GCRoots不可达对象,和用户线程一起工作,不需要暂停工作线程。由于耗时最长的并发标记和并发清除过程中,垃圾收集线程可以和用户现在一起并发工作,所以总体上来看CMS收集器的内存回收和用户线程是一起并发地执行。

    7. G1收集器:G1收集器避免全区域垃圾收集,它把堆内存划分为大小固定的几个独立区域,并且跟踪这些区域的垃圾收集进度,同时在后台维护一个优先级列表,每次根据所允许的收集时间,优先回收垃圾最多的区域。区域划分和优先级区域回收机制,确保G1收集器可以在有限时间获得最高的垃圾收集效率。

    CMS和G1区别:

    区别一: 使用范围不一样
        CMS收集器是老年代的收集器,可以配合新生代的Serial和ParNew收集器一起使用

          由于G1收集器对堆区进行划分,所以G1收集器收集范围是老年代和新生代。不需要结合其他收集器使用

    区别二: STW的时间
      CMS收集器以最小的停顿时间为目标的收集器。

      G1收集器可预测垃圾回收的停顿时间(建立可预测的停顿时间模型)

    区别三: 垃圾碎片
      CMS收集器是使用“标记-清除”算法进行的垃圾回收,容易产生内存碎片

      G1收集器使用的是“标记-整理”算法,进行了空间整合,降低了内存空间碎片。

    区别四: 垃圾回收的过程不一样
      CMS收集器    :初始标记、并发标记、重新标记、并发清除

      G1收集器:初始标记、并发标记、最终标记、筛选回收                 

  • 相关阅读:
    建模时选择SVM还是LR?
    decision_function详解
    HIVE SQL与SQL的区别
    数据不平衡如何处理
    Spring Boot 两步集成 日志收集ELK与分布式系统监控CAT
    Web Application Integrate with Box
    字符编解码的故事(ASCII,ANSI,Unicode,Utf-8区别)
    SharePoint Client Api Search user 几种方法
    C#,反射和直接调用的效率差别
    System.Data.SqlClient.SqlConnectionStringBuilder 链接字符串的问题
  • 原文地址:https://www.cnblogs.com/du001011/p/11380785.html
Copyright © 2011-2022 走看看