zoukankan      html  css  js  c++  java
  • JVM(四) 垃圾回收

    1. 堆内存结构

     

    Java堆从GC的角度可以细分为:新生代(Eden区、From Survivor区和To Survivor区)和老年代。

    1.1 新生代

    新生代是用来存放新生的对象。一般占据堆的1/3空间。由于频繁创建对象,所以新生代会频繁触发MinorGC进行垃圾回收。新生代又分为Eden区、ServivorFrom、ServivorTo三个区。
      1.1.1.Eden区Java新对象的出生地(如果新创建的对象占用内存很大,则直接分配到老年代)。当Eden区内存不够的时候就会触发MinorGC,对新生代区进行一次垃圾回收。
      1.1.2.ServivorFrom上一次GC的幸存者,作为这一次GC的被扫描者。
      1.1.3.ServivorTo保留了一次MinorGC过程中的幸存者。
      1.1.4.MinorGC的过程(复制->清空->互换)MinorGC采用复制算法。
        1:eden、servicorFrom 复制到ServicorTo,年龄+1首先,把Eden和ServivorFrom区域中存活的对象复制到ServicorTo区域(如果有对象的年龄以及达到了老年的标准,则赋值到老年代区),
        同时把这些对象的年龄+1(如果ServicorTo不够位置了就放到老年区);
        2:清空eden、servicorFrom然后,清空Eden和ServicorFrom中的对象;
        3:ServicorTo和ServicorFrom互换最后,ServicorTo和ServicorFrom互换,原ServicorTo成为下一次GC时的ServicorFrom区。

    1.2 老年代

    老年代主要存放应用程序中生命周期长的内存对象。老年代的对象比较稳定,所以MajorGC不会频繁执行。在进行MajorGC前一般都先进行了一次MinorGC,使得有新生代的对象晋身入老年代,
    导致空间不够用时才触发。当无法找到足够大的连续空间分配给新创建的较大对象时也会提前触发一次MajorGC进行垃圾回收腾出空间。MajorGC采用标记清除算法:首先扫描一次所有老年代,标记出存活的对象,
    然后回收没有标记的对象。MajorGC的耗时比较长,因为要扫描再回收。MajorGC会产生内存碎片,为了减少内存损耗,我们一般需要进行合并或者标记出来方便下次直接分配。当老年代也满了装不下的时候,
    就会抛出OOM(Out of Memory)异常。

    2.垃圾回收机制算法

    2.1 垃圾回收机制

    不定时去堆内存中清理不可达对象。不可达的对象并不会马上就会直接回收, 垃圾收集器在一个Java程序中的执行是自动的,不能强制执行,即使程序员能明确地判断出有一块内存已经无用了,是应该回收的,
    程序员也不能强制垃圾收集器回收该内存块。程序员唯一能做的就是通过调用System.gc 方法来"建议"执行垃圾收集器,但其是否可以执行,什么时候执行却都是不可知的。
    这也是垃圾收集器的最主要的缺点。当然相对于它给程序员带来的巨大方便性而言,这个缺点是瑕不掩瑜的。

     2.2 对象回收判断

    2.2.1 引用计数算法

    引用计数法就是如果一个对象没有被任何引用指向,则可视之为垃圾。这种方法的缺点就是不能检测到环的存在。 首先需要声明,至少主流的Java虚拟机里面都没有选用引用计数算法来管理内存。 什么是引用计数算法:给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值加1;当引用失效时,计数器值减1.任何时刻计数器值为0的对象就是不可能再被使用的。
    那为什么主流的Java虚拟机里面都没有选用这种算法呢?其中最主要的原因是它很难解决对象之间相互循环引用的问题。

    2.2.2  根搜索算法(可达性算法)

    根搜索算法的基本思路就是通过一系列名为”GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时,
    则证明此对象是不可用的。 这个算法的基本思想是通过一系列称为“GC Roots”的对象作为起始点,从这些节点向下搜索,搜索所走过的路径称为引用链,当一个对象到GC Roots没有任何引用链(即GC Roots到对象不可达)时,
    则证明此对象是不可用的。 那么问题又来了,如何选取GCRoots对象呢?在Java语言中,可以作为GCRoots的对象包括下面几种: (
    1). 虚拟机栈(栈帧中的局部变量区,也叫做局部变量表)中引用的对象。 (2). 方法区中的类静态属性引用的对象。 (3). 方法区中常量引用的对象。 (4). 本地方法栈中JNI(Native方法)引用的对象。

     

     2.3 垃圾回收算法

    2.3.1  标记清楚算法(Mark -Swep)

    最基础的垃圾回收算法,分为两个阶段,标注和清除。

    标记阶段标记出所有需要回收的对象,清除阶段回收被标记的对象所占用的空间。该算法最大的问题是内存碎片化严重,后续可能发生大对象不能找到可利用空间的问题。

    标记清除算法的优点和缺点
    
    1. 优点
    
    - 是可以解决循环引用的问题
    
    - 必要时才回收(内存不足时)
    
    2. 缺点:
    
    - 回收时,应用需要挂起,也就是stop the world。
    
    - 标记和清除的效率不高,尤其是要扫描的对象比较多的时候
    
    - 会造成内存碎片(会导致明明有内存空间,但是由于不连续,申请稍微大一些的对象无法做到)

    2.3.2  复制算法(copying)

    为了解决Mark-Sweep算法内存碎片化的缺陷而被提出的算法。

    概念
    如果jvm使用了coping算法,一开始就会将可用内存分为两块,from域和to域, 每次只是使用from域,to域则空闲着。当from域内存不够了,开始执行GC操作,这个时候,会把from域存活的对象拷贝到to域,
    然后直接把from域进行内存清理。 应用场景 coping算法一般是使用在新生代中,因为新生代中的对象一般都是朝生夕死的,存活对象的数量并不多,这样使用coping算法进行拷贝时效率比较高。jvm将Heap 内存划分为新生代与老年代,
    又将新生代划分为Eden(伊甸园) 与2块Survivor Space(幸存者区) ,然后在Eden –
    >Survivor Space 以及From Survivor Space 与To Survivor Space 之间实行Copying 算法。
    不过jvm在应用coping算法时,并不是把内存按照1:1来划分的,这样太浪费内存空间了。一般的jvm都是8:1。也即是说,Eden区:From区:To区域的比例是始终有90%的空间是可以用来创建对象的,
    而剩下的10%用来存放回收后存活的对象。 1、当Eden区满的时候,会触发第一次young gc,把还活着的对象拷贝到Survivor From区;当Eden区再次触发young gc的时候,会扫描Eden区和From区域,对两个区域进行垃圾回收,经过这次回收后还存活的对象,
    则直接复制到To区域,并将Eden和From区域清空。
    2、当后续Eden又发生young gc的时候,会对Eden和To区域进行垃圾回收,存活的对象复制到From区域,并将Eden和To区域清空。 3、可见部分对象会在From和To区域中复制来复制去,如此交换15次(由JVM参数MaxTenuringThreshold决定,这个参数默认是15),最终如果还是存活,就存入到老年代 注意: 万一存活对象数量比较多,那么To域的内存可能不够存放,这个时候会借助老年代的空间。
    优缺点 优点:在存活对象不多的情况下,性能高,能解决内存碎片和java垃圾回收算法之
    -标记清除 中导致的引用更新问题。 缺点: 会造成一部分的内存浪费。不过可以根据实际情况,将内存块大小比例适当调整;如果存活对象的数量比较大,coping的性能会变得很差。

    2.3.3  标记整理算法(Mark-Sweep) 也叫标记压缩算法

     标记清除算法和标记压缩算法非常相同,但是标记压缩算法在标记清除算法之上解决内存碎片化问题

    压缩算法简单介绍
    任意顺序 : 即不考虑原先对象的排列顺序,也不考虑对象之间的引用关系,随意移动对象;
    线性顺序 : 考虑对象的引用关系,例如a对象引用了b对象,则尽可能将a和b移动到一块;
    滑动顺序 : 按照对象原来在堆中的顺序滑动到堆的一端。
    
    优缺点
    优点:解决内存碎片问题,缺点压缩阶段,由于移动了可用对象,需要去更新引用。

     2.3.4 分代算法

    这种算法,根据对象的存活周期的不同将内存划分成几块,新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。可以用抓重点的思路来理解这个算法。

    新生代对象朝生夕死,对象数量多,只要重点扫描这个区域,那么就可以大大提高垃圾收集的效率。另外老年代对象存储久,无需经常扫描老年代,避免扫描导致的开销。

    新生代
    在新生代,每次垃圾收集器都发现有大批对象死去,只有少量存活,采用复制算法,只需要付出少量存活对象的复制成本就可以完成收集;
    
    老年代
    而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须“标记-清除-压缩”算法进行回收。新创建的对象被分配在新生代,如果对象经过几次回收后仍然存活,那么就把这个对象划分到老年代。
    老年代区存放Young区Survivor满后触发minor GC后仍然存活的对象,当Eden区满后会将存活的对象放入Survivor区域,如果Survivor区存不下这些对象,GC收集器就会将这些对象直接存放到Old区中,
    如果Survivor区中的对象足够老,也直接存放到Old区中。如果Old区满了,将会触发Full GC回收整个堆内存。

    3.垃圾收集器

    Java堆内存被划分为新生代和年老代两部分,新生代主要使用复制和标记-清除垃圾回收算法;年老代主要使用标记-整理垃圾回收算法,因此java虚拟中针对新生代和年老代分别提供了多种不同的垃圾收集器。

     

     3.1 Serial收集器(单线程+复制算法)

    Serial收集器是发展最悠久的垃圾收集器。在jdk1.3的时候只能用我们serial垃圾回收器。他是一个单线程的垃圾回收器。用在我们的新生代复制算法在桌面应用比较多(单线程服务器上,堆内存比较小的应用使用效率比较高).当我们gc执行时候会暂停我们的所有的线程这个步骤简称STW (Stop The World)

     

     3.2  ParNew收集器(Serial+多线程)

     ParNew垃圾收集器其实是Serial收集器的多线程版本,也使用复制算法,除了使用多线程进行垃圾收集之外,其余的行为和Serial收集器完全一样,ParNew垃圾收集器在垃圾收集过程中同样也要暂停所有其他的工作线程。

     3.3 Parallel Scavenge收集器 (简称PS收集器,线程程复制算法,高效)

    Parallel  Scavenge收集器也是一个新生代垃圾收集器,同样使用复制算法,也是一个多线程的垃圾收集器,它重点关注的是程序达到一个可控制的吞吐量(Thoughput,CPU用于运行用户代码的时间/CPU总消耗时间,即吞吐量=运行用户代码时间/(运行用户代码时间+垃圾收集时间)),高吞吐量可以最高效率地利用CPU时间,尽快地完成程序的运算任务,主要适用于在后台运算而不需要太多交互的任务。自适应调节策略也是ParallelScavenge收集器与ParNew收集器的一个重要区别

    -XX:MaxGCPauseMillis 垃圾回收器最大停顿时间

    -XX:GCTimeRatio 吞吐量大小  (0,100) 默认最大99

    3.4 Serial Old收集器(单线程标记整理算法)

     Serial Old是Serial垃圾收集器年老代版本,它同样是个单线程的收集器,使用标记-整理算法,这个收集器也主要是运行在Client默认的java虚拟机默认的年老代垃圾收集器。

    3.5.Parallel Old收集器(多线程标记整理算法)

    Parallel Old收集器是Parallel Scavenge的年老代版本,使用多线程的标记-整理算法,在JDK1.6才开始提供。在JDK1.6之前,新生代使用ParallelScavenge收集器只能搭配年老代的Serial Old收集器,只能保证新生代的吞吐量优先,无法保证整体的吞吐量,Parallel Old正是为了在年老代同样提供吞吐量优先的垃圾收集器,如果系统对吞吐量要求比较高,可以优先考虑新生代Parallel Scavenge和年老代Parallel Old收集器的搭配策略。

    3.6 CMS收集器(多线程标记清楚算法)

    Concurrent  mark  sweep(CMS)收集器是一种年老代垃圾收集器,其最主要目标是获取最短垃圾回收停顿时间,和其他年老代使用标记-整理算法不同,它使用多线程的标记-清除算法。

    最短的垃圾收集停顿时间可以为交互比较高的程序提高用户体验。CMS工作机制相比其他的垃圾收集器来说更复杂,整个过程分为以下4个阶段:

    1.初始标记只是标记一下GC Roots能直接关联的对象,速度很快,仍然需要暂停所有的工作线程。
    2.并发标记进行GC Roots跟踪的过程,和用户线程一起工作,不需要暂停工作线程。
    3.重新标记为了修正在并发标记期间,因用户程序继续运行而导致标记产生变动的那一部分对象的标记记录,仍然需要暂停所有的工作线程。
    4.并发清除清除GC Roots不可达对象,和用户线程一起工作,不需要暂停工作线程。由于耗时最长的并发标记和并发清除过程中,垃圾收集线程可以和用户现在一起并发工作,
    所以总体上来看CMS收集器的内存回收和用户线程是一起并发地执行。

    优点:并发收集,低停顿

    缺点:占用大量的cpu资源,无法处理浮动垃圾,会产生碎片化

    3.7 G1收集器

     Garbage  first垃圾收集器是目前垃圾收集器理论发展的最前沿成果,相比与CMS收集器,G1收集器两个最突出的改进是:

    1.基于标记-整理算法,不产生内存碎片。

    2.可以非常精确控制停顿时间,在不牺牲吞吐量前提下,实现低停顿垃圾回收。

    G1收集器避免全区域垃圾收集,它把堆内存划分为大小固定的几个独立区域,并且跟踪这些区域的垃圾收集进度,同时在后台维护一个优先级列表,每次根据所允许的收集时间,优先回收垃圾最多的区域。区域划分和优先级区域回收机制,确保G1收集器可以在有限时间获得最高的垃圾收集效率。

    4.内存分配策略

    4.1创建的对象会优先分配到eden区域

    4.2大对象直接分配到老年代

    有对应的参数分配多大的对象会直接进入我们的老年代 使用 要指定的收集器才有效

    -XX:PretenureSizeThreshold

    4.3 长期存活的的对象分配到老年代

    4.4 空间分配担保

    当对象生成在EDEN区失败时,出发一次YGC,先扫描EDEN区中的存活对象,进入S0区,S0放不下的进入OLD区,再扫描S1区,若存活次数超过阀值则进入OLD区,其它进入S0区,然后S0和S1交换一次。

    那么当发生YGC时,JVM会首先检查老年代最大的可用连续空间是否大于新生代所有对象的总和,如果大于,那么这次YGC是安全的,如果不大于的话,JVM就需要判断HandlePromotionFailure是否允许空间分配担保。

    允许分配担保:

    JVM继续检查老年代最大的可用连续空间是否大于历次晋升到老年代的对象的平均大小,如果大于,则正常进行一次YGC,尽管有风险(因为判断的是平均大小,有可能这次的晋升对象比平均值大很多);

    如果小于,或者HandlePromotionFailure设置不允许空间分配担保,这时要进行一次FGC。

    新生代采用的是复制收集算法,S0和S1始终只是用其中一块内存区,当出现YGC后大部分对象仍然存活的话,就需要老年代进行分配担保,把survior区无法容纳的对象直接晋升到老年代。

    那么这种空间分配担保的前提是老年代还有容纳的空间,一共有多少对象会活下来,在实际完成内存回收之前是无法明确知道的,所以只好取之前每次回收晋升到老年代对象容量的平均值大小作为经验值,与老年代的剩余空间比较,决定是否进行FGC来让老年代腾出更多空间。

    4.5 动态对象年龄判断

    当 Survivor 空间中相同年龄所有对象的大小总和大于 Survivor 空间的一半,年龄大于或等于该年龄的对象就可以直接进入老年代,而不需要达到默认的分代年龄

  • 相关阅读:
    【数据结构】线段树(Segment Tree)
    c++基础--数字读入及优化
    转:async异步、thread多线程
    走进 Akka.NET
    基于 Docker 的 DevOps 搭建
    (翻译)与.NET容器映像保持同步
    (翻译)使用 AppCenter 持续输出导出到 Application Insights
    (翻译)Xamarin.Essentials 最新预览版的更多跨平台 API
    (翻译)在 Xamarin 应用中使用 MongoDB
    (翻译)一起使用 .NET 和 Docker——DockerCon 2018 更新
  • 原文地址:https://www.cnblogs.com/hlkawa/p/11951871.html
Copyright © 2011-2022 走看看