zoukankan      html  css  js  c++  java
  • JVM内存回收机制

    复制于   http://www.cnblogs.com/fefjay/p/6297340.html

    当JVM创建对象遇到内存不足的时候,JVM会自动触发垃圾回收garbage collecting(简称GC)操作,将不再使用但仍存在JVM内存中的对象当做垃圾一样直接清理掉,释放被占用的内存空间,供新创建的对象使用。
    那么问题来了,要让系统能够自动实现不被引用对象的回收,有几个问题需要解决:

    • Who:哪些是不再使用要被当做“垃圾”回收处理的对象?也就是要确定垃圾对象。
    • Where:在哪里执行垃圾回收?明确要清理的内存区域。
    • When:什么时候执行GC操作?即JVM触发GC的时机。
    • How:怎么样进行垃圾对象处理?即GC的实现算法。

    关于第二点,对于oracle Hotspot VM的 GC操作主要回收的内存区域是JVM中的堆(分为年轻代和年老代,年轻代又分Eden和两个survivor区域),JVM内存结构不是本文的重点,我们在看本文前要对JVM内存结构有一定的了解,这里不作详细分析。


    1.判断对象是否可以被回收(判别算法或搜索算法)

    下面的算法回答了who的问题。

    1.1 引用计数法

    每个对象创建的时候,会分配一个引用计数器,当这个对象被引用的时候计数器就加1,当不被引用或者引用失效的时候计数器就会减1。任何时候,对象的引用计数器值为0就说明这个对象不被使用了,就认为是“垃圾”,可以被GC处理掉。

    评价

    • 【优点】算法实现简单。
    • 【缺点】不能解决对象之间循环引用的问题。有垃圾对象不能被正确识别,这对垃圾回收来说是很致命的,所以GC并没有使用这种搜索算法。

    1.2 根搜索算法

    以一些特定的对象作为基础原始对象,或者称作“根”,不断往下搜索,到达某一个对象的路径称为引用链。
    如果一个对象和根对象之间有引用链,即根对象到这个对象是可到达的,则这个对象是活着的,不是垃圾,还不能回收。例如,假设有根对象O,O引用了A对象,同时A对象引用了B对象,B对象又引用了C对象,那么对象C和根对象O之间的路径的可达的,C对象就不能当做垃圾对象。引用链为O->A->B->C。
    反之,如果一个对象和根对象之间没有引用链,根对象到这个对象的路径是不可达的,那么这个对象就是可回收的垃圾对象。

    评价

    • 【优点】可找到所以得垃圾对象,并且完美解决对象之间循环引用的问题。
    • 【缺点】不可避免地要遍历全局所有对象,导致搜索效率不高。

    根搜索算法是现在GC使用的搜索算法。

    可以当做GC roots的对象有以下几种:

    • 虚拟机栈中的引用的对象。(java栈的栈帧本地变量表)
    • 方法区中的类静态属性引用的对象。
    • 方法区中的常量引用的对象。(声明为final的常量对象)
    • 本地方法栈中JNI的引用的对象。(本地方法栈的栈帧本地变量表)

      下面是从网上找来的图,将就看看:GC ROOTS就是跟对象节点,蓝色的是可达的引用链,引用链上的对象是活着的,不能被当做垃圾对象回收。相反暗灰色的路径表示不可达的路径,这些对象将会被回收。每个圈圈里面的数字,表示其被引用的次数,没错,就是上面说到的引用计数法的计数值。跟搜索算法示例图


    2.GC算法

    这里讨论的是oracle的Hotspot VM常见的垃圾回收算法。使用的搜索算法都是基于根搜索算法实现的。

    2.1 标记-清除算法(Mark-Sweep)

    该算法分两步执行:

    1) 标记Mark:从GC ROOTS开始,遍历堆内存区域的所有根对象,对在引用链上的对象都进行标记。这样下来,如果是存活的对象就会被做了标记,反之如果是垃圾对象,则没做有标记。GC很容易根据有没有被做标记就完成了垃圾对象回收。

    2) 清除Sweep:遍历堆中的所有的对象(标记阶段遍历的是所有根节点),找到未被标记的对象,直接回收所占的内存,释放空间。

    评价

    • 【优点】没有产生额外的内存空间消耗,内存利用率高。
    • 【缺点】效率低,清除阶段要遍历所有的对象;回收的垃圾对象是在各个角落的,直接回收垃圾对象,导致存在不连续的内存空间,产生内存碎片。

    标记-清除算法操作的对象是【垃圾对象】,对于活着的对象(被标记的对象),它则直接不理睬。

    2.2 复制算法(Copying)

    复制算法把内存区间一分为二,有对象存在的一半区间称为“活动区间”,没有对象存在处于空闲状态的空间则为“空闲区间”。
    当内存空间不足时触发GC,先采用根搜索算法标记对象,然后把活着的对象全部复制到另一半空闲区间上,复制算法的“复制”就来自这一操作。复制到另一半区间的时候,严格按照内存地址依次排列要存放的对象,然后一次性回收垃圾对象。
    这样原来的空闲区间在GC后就变成活动区间,而且内存顺序齐整美观。原来的活动区间在GC后就变成了完全空的空闲区间,等待下一次GC把活的对象被copy进来。

    评价

    • 【优点】GC后的内存齐整,不产生内存碎片。
    • 【缺点】GC要使用两倍的内存,或者说导致堆只能使用被分配到的内存的一半,这个算法对空间要求太高!如果存活的对象较多,则意味着要复制很多对象并且要维护大量对象的内存地址,所以存活的对象数量不能太多,否则效率也会很低。

    复制算法复制移动的对象是【活着的对象】,对于垃圾对象(不被标记的对象)则直接回收。

    2.3 标记-整理算法(Mark-Compact)

    这个算法则是对上面两个算法的综合结果。也分为两个阶段:

    1)标记:这个阶段和标记-清除Mark-Sweep算法一样,遍历GC ROOTS并标记存活的对象。

    2)整理:移动所有活着的对象到内存区域的一侧(具体在哪一侧则由GC实现),严格按照内存地址次序依次排列活着的对象,然后将最后一个活着的对象地址以后的空间全部回收。

    评价

    • 【优点】内存空间利用率高,消除了复制算法内存减半的情况;GC后不会产生内存碎片。

    • 【缺点】需要遍历标记活着的对象,效率较低;复制移动对象后,还要维护这些活着对象的引用地址列表。

    2.4 分代回收算法(Generational Collecting)

    分代回收算法就是现在JVM使用的GC回收算法。

    2.4.1简要说明

    1)先来看看简单化后的堆的内存结构:

    Java堆 = 年老代 + 年轻代
    (空间大小比例一般是3:1)
    
    年轻代 = Eden区 + From Space区 + To Space区
    (空间大小比例一般是8:1:1)

    2)按照对象存活时间长短,我们可以把对象简单分为三类:

    • 短命对象:存活时间较短的对象,如中间变量对象、临时对象、循环体创建的对象等。这也是产生最多数量的对象,GC回收的关注重点。

    • 长命对象:存活时间较长的对象,如单例模式产生的单例对象、数据库连接对象、缓存对象等。

    • 长生对象:一旦创建则一直存活,几乎不死的对象。

    3)对象分配区域
    短命对象存在于年轻代,长命对象存在于年老代,而长生对象则存在于方法区中。
    由于GC的主要内存区域是堆,所以GC的对象主要就是短命对象和长命对象这类寿命“有限”的对象。

    2.4.2 分代回收的GC类型

    针对HotSpot VM的的GC其实准确分类只有两大种:

    1)Partial GC:部分回收模式

    • Young GC:只收集young gen的GC。和Minor GC一样。
    • Old GC:只收集old gen的GC。只有CMS的concurrent - collection是这个模式
    • Mixed GC:收集整个young gen以及部分old gen的GC。只有G1有这个模式

    2)Full GC:收集整个堆,包括young gen、old gen,还有永久代perm gen(如果存在的话)等所有部分的模式。同Major GC。

    3)触发时机
    HotSpot VM的串行GC的触发条件是:
    young GC:当young gen中的eden区分配满的时候触发。

    full GC:当准备要触发一次young GC时,如果发现统计数据说之前young GC的平均晋升大小比目前old gen剩余的空间大,则不会触发young GC而是转为触发full GC;或者,如果有perm gen的话,要在perm gen分配空间但已经没有足够空间时,也要触发一次full GC;或者System.gc()、heap dump带GC,默认也是触发full GC。

    并发GC的触发条件就不太一样。以CMS GC为例,它主要是定时去检查old gen的使用量,当使用量超过了触发比例就会启动一次CMS GC,对old gen做并发收集。

    2.4.3 年轻代GC过程

    当需要在堆中创建一个新的对象,而年轻代内存不足时触发一次GC,在年轻代触发的GC称为普通GC,Minor GC。注意到年轻代中的对象都是存活时间较短的对象,所以适合使用复制算法。这里肯定不会使用两倍的内存来实现复制算法了,牛人们是这样解决的,把年轻代内存组成是80%的Eden、10%的From Space和10%的To Space,然后在这些内存区域直接进行复制。

    刚开始创建的对象是在Eden中,此时Eden中有对象,而两个survivor区没有对象,都是空闲区间。第一次Minor GC后,存活的对象被放到其中一个survivor,Eden中的内存空间直接被回收。在下一次GC到来时,Eden和一个survivor中又创建满了对象,这个时候GC清除的就是Eden和这个放满对象的survivor组成的大区域(占90%),Minor GC使用复制算法把活的对象复制到另一个空闲的survivor区间,然后直接回收之前90%的内存。周而复始。始终会有一个10%空闲的survivor区间,作为下一次Minor GC存放对象的准备空间。

    要完成上面的算法,每次Minor GC过程都要满足:
    存活的对象大小都不能超过survivor那10%的内存空间,不然就没有空间复制剩下的对象了。但是,万一超过了呢?前面我们提到过年老代,对,就是把这些大对象放到年老代。

    2.4.4 年老代GC

    什么样的对象可以进入年老代呢?如下:

    • 在年轻代中,如果一个对象的年龄(GC一次后还存活的对象年岁加1)达到一个阈值(可以配置),就会被移动到年老代。
    • Survivor中相同年龄的对象大小总和超过survivor空间的一半,则不小于这个年龄的对象都会直接进入年老代。
    • 创建的对象的大小超过设定阈值,这个对象会被直接存进年老代。
    • 年轻代中大于survivor空间的对象,Minor GC时会被移进年老代。

    年老代中的对象特点就是存活时间较长,而且没有备用的空闲空间,所以显然不适合使用复制算法了,这个时候使用标记-清除算法或者标记-整理算法来实现GC。负责年老代中GC操作的是全局GC,Major GC,Full GC。

    什么时候触发Major GC呢?
    在Minor GC时,先检测JVM的统计数据,查看历史上进入老年代的对象平均大小是否大于目前年老代中的剩余空间,如果大于则触发Full GC。


    3.GC执行机制

    3.1串行GC

    在搜索扫描和复制过程都是采用单线程实现,适用于单CPU、新生代空间较小或者要求GC暂停时间要求不高的地方。是client级别的默认方式。

    3.2并行GC

    在搜索扫描和复制过程都是采用多线程实现,适用于多CPU、或者要求GC暂停时间要求高的地方。是server级别的默认方式。

    3.3同步GC

    同时允许多个GC任务,减少GC暂停时间。主要应用在实时性要求重于总体吞吐量要求的中大型应用,即使如此,降低中断时间的技术还是会导致应用程序性能的降低。


    4.内存调优

    JVM内存调优,主要是减少GC的频率和减少Full GC的次数,Full GC的时候会极大地影响系统的性能。所以在此基础上,更加要关注会导致Full GC的情况。

    4.1 容易导致Full GC的情况

    • 年老代空间不足
      1)分配足够大空间给old gen。
      2)避免直接创建过大对象或者数组,否则会绕过年轻代直接进入年老代。
      3)应该使对象尽量在年轻代就被回收,或待得时间尽量久,避免过早的把对象移进年老代。

    • 方法区的永久代空间不足
      1)分配足够大空间给。
      2)避免创建过多的静态对象。

    • 被显示调用System.gc()
      通常情况下不要显示地触发GC,让JVM根据自己的机制实现。

    4.2 JVM堆内存分配问题讨论

    4.2.1 年轻代过小(年老代过大)

    • 导致频繁发生GC,增大系统消耗
    • 容易让普通大文件直接进入年老代,从而更容易诱发Full GC。

    4.2.2 年轻代过大(年老大过小)

    • 导致年老代过小,从而更容易诱发Full GC。
    • GC耗时增加,降低GC的效率。

    4.2.3 Eden过大(survivor过小)

    Minor GC时容易让普通大文件直接绕过survivor进入年老代,从而更容易诱发Full GC。

    4.2.4Eden过小(survivor过大)

    导致GC频率升高,影响系统性能。

    4.3 调优策略

    • 保证系统吞吐量优先
    • 减少GC暂停时间优先

    5 JVM常见配置选项

    总结一下常见配置。

    堆设置
    
    -Xms:初始堆大小
    
    -Xmx:最大堆大小
    
    -XX:NewSize=n:设置年轻代大小
    
    -XX:NewRatio=n:设置年轻代和年老代的比值。如:为3,表示年轻代与年老代比值为1:3,年轻代占整个年轻代年老代和的1/4
    
    -XX:SurvivorRatio=n:年轻代中Eden区与两个Survivor区的比值。注意Survivor区有两个。如:3,表示Eden:Survivor=3:2,一个Survivor区占整个年轻代的1/5
    
    -XX:MaxPermSize=n:设置持久代大小
    
    收集器设置
    
    -XX:+UseSerialGC:设置串行收集器
    
    -XX:+UseParallelGC:设置并行收集器
    
    -XX:+UseParalledlOldGC:设置并行年老代收集器
    
    -XX:+UseConcMarkSweepGC:设置并发收集器
    
    垃圾回收统计信息
    
    -XX:+PrintGC
    
    -XX:+PrintGCDetails
    
    -XX:+PrintGCTimeStamps
    
    -Xloggc:filename
    
    并行收集器设置
    
    -XX:ParallelGCThreads=n:设置并行收集器收集时使用的CPU数。并行收集线程数。
    
    -XX:MaxGCPauseMillis=n:设置并行收集最大暂停时间
    
    -XX:GCTimeRatio=n:设置垃圾回收时间占程序运行时间的百分比。公式为1/(1+n)
    
    并发收集器设置
    
    -XX:+CMSIncrementalMode:设置为增量模式。适用于单CPU情况。
    
    -XX:ParallelGCThreads=n:设置并发收集器年轻代收集方式为并行收集时,使用的CPU数。并行收集线程数。
  • 相关阅读:
    损失函数 代价函数 评分函数 目标函数
    python目录索引
    机器学习/深度学习资料合集
    Git笔记
    目标检测中的正负样本分配
    map计算
    nms
    08shell脚本
    07makefile文件
    05-STL
  • 原文地址:https://www.cnblogs.com/gaoBlog/p/10843846.html
Copyright © 2011-2022 走看看