zoukankan      html  css  js  c++  java
  • java垃圾回收机制

    深入理解Java垃圾回收机制

    垃圾回收机制的意义

    java语言中一个显著的特点就是引入了java回收机制,是C++程序员最头疼的内存管理问题迎刃而解,它使得java程序员在编写程序的时候不在考虑内存管理。由于有个垃圾回收机制,java中的额外对象不在有"作用域"的概念,只有对象的引用才有"作用域"。垃圾回收可以有效的防止内存泄露,有效的使用空闲的内存。

    内存泄露:指该内存空间使用完毕后未回收,在不涉及复杂数据结构的一般情况下,java的内存泄露表现为一个内存对象的生命周期超出了程序需要它的时间长度,我们有时也将其称为"对象游离";

    垃圾回收机制中的算法

    Java语言规范没有明确说明JVM使用哪种垃圾回收算法,但是任何一种垃圾回收算法一般要做2件基本的事情:(1)发现无用信息对象;(2)回收被无用对象占用的内存空间,使该空间可被程序在此使用。

    1. 引用计数法(Reference Counting Collector)

    引用计数是垃圾收集器中的早期策略。在这种方法中,堆中每个对象实例都有一个引用计数。当一个对象呗创建时,且将该对象实例分配给一个变量,该变量计数设置为1。当任何其他变量被复制为这个对象的引用时,计数加1(a=b,则b引用的对象实例的计数器+1),但当一个对象实例的某个引用超过了生命周期或者被设置为一个新值时,对象实例的引用计数器减1。任何引用计数器为0的对象实例可以被当作垃圾收集。当一个对象实例被垃圾收集时,它引用的任何对象实例的应用器减1。

    优点:引用计数收集器可以很快地执行,交织在程序运行中。对程序需要不被长时间打断的实时环境比较有利。

    缺点:无法检测循环引用。如父对象有一个对子对象的引用,子对象反过来引用父对象。这样,他们的引用计数永远不可能为0。

    1. tracing算法(Tracing Collector)或标记-清除算法(mark and sweep)

    根搜索算法

    根搜索算法是从离散数学中的图论引入的,程序把所有的引用关系看作一张图,从一个节点GC ROOT开始,寻找对应的引用节点,找到这个节点后,继续寻找这个的节点的引用节点,当所有的引用节点寻找完毕后,剩余的节点则 被认为是没有引用到的节点,即无用节点。

    • java中可作为GC Root的对象有
    • 虚拟机栈中引用的对象(本地变两个表)
    • 方法区中静态属性引用的对象
    • 方法区中常量引用的对象
    • 本地方法栈中引用的对象(Native对象)

    tracing算法示意图

    标记-清除算法分析

    标记-清除算法采用从根集合进行扫描,对存活的对象标记,标记完毕后,再扫描整个空间中未标记的对象,进行回收,如上图所示。标记-清除算法不需要进行对象移动,并且仅不存活的对象进行处理,在存活对象比较多的情况下极为高效,但由于标记-清除算法直接回收不存活的对象,因此会造成内存碎片。

    1. compacting算法或标记-整理算法

    标记-整理算法采用标记-清除算法一样的方式进行对象的标记,但在清除时不同,在回收不存活的对象占用的空间后,会将所有的存活对象往左端空间空间移动,并更新对应的指针。标记-整理算法是在标记-清理算法的基础上,又进行了对象的移动,因此成本更高,但是却解决了内存碎片的问题。在基于Compacting算法的收集器的实现中,一般增加句柄和句柄表。

    1. copying算法(Compacting Collector)

    该算法的提出是为了克服句柄的开销和解决堆碎片的垃圾回收。它开始时把对堆分成一个对象面和多个空闲面,程序从对象面为对象分配空间,当对象满了,基于copying算法的垃圾收集就从根集中扫描活动对象,并将每个活动对象复制到空闲面(使得活动对象所占的内存之间没有空闲洞),这样空闲面变成了对象面,原来的对象面变成了空闲面,程序会在新的对象面中分配内存。一种典型的基于coping算法的垃圾回收是stop-and-copy算法,它将堆分成对象面和空闲区域面,在对象面与空闲区域面的切换过程中,程序暂停执行。

    1. generation算法(Generational Collector)

    分代的垃圾回收机制,是基于这样一个事实:不同的对象生命周期是不一样的。因此,不同生命周期的对象可以采用不同的回收算法,以便提高回收效率。

    年轻态(Young Generation)

    所有新生成的对象首先都是放在年轻代的。年轻代的目标就是尽可能快速的收集掉那些生命周期短的对象。

    新生代内存按照8:1:1的比例分成一个eden区和两个survior(survior0,survior1)区。一个Eden区,两个Survior区(一般而言)。大部分对象在Eden区中生成。回收时先将eden区存活对象复制到一个survivor0区,然后清空eden区,当这个survivor区也存满了时,则将eden区和survior0区存活对象复制到另一个survivor1区,然后清空eden和这个survivor0区,此时survivor0区是空的,然后将survivor0区和survivor1区交换,即保持survivor1区为空,如此往复。

    当survivor1区不足以存放eden和survivor0的存活对象是,就将存活对象直接放到老年代。若是老年代也满了就会触发一次Full GC,也就是新生代,老年代都进行回收。

    新生待发生的GC也叫做Minor GC,Minor GC发生频率比较高(不一定等Eden区满了才触发)

    老年代(Old Generation)

    在年轻代中经历了N次垃圾回收后仍然存活的对象,就会被放到老年代中。因此,可以认为老年代中存放都是一些生命周期较长的对象。

    内存比新生代也大很多(大概比例是1:2),当老年代内存满时触发Major GC即Full GC发生频率比较低,老年代存活时间比较长,存活率标记高。

    持久代(Permanent Generation)

    用于存放静态文件,如java类,方法等。持久代对来及回收没有显著影响,但是有些应用可能动态或者调用一些class,例如Hibernate等,在这种时候需要设置一个比较大的持久代空间来存放这些运行过程中新增的类。

    新生代收集器使用的收集器:Serial、PraNew、Parallel Scavenge

    老年代收集器使用的收集器:Serial Old、Parallel Old、CMS

    Serial收集器(复制算法)

    新生代单线程收集器,标记和清理都是单线程,优点是简单高效。

    Serial Old收集器(标记-整理算法)

    老年代单线程收集器,Serial收集器的老年代版本。

    ParNew收集器(停止-复制算法)

    新生代收集器,可以认为是Serial收集器的多线程版本,在多核CPU环境下有着比Serial更好的表现。

    Parallel Scavenge收集器(停止-复制算法)

    并行收集器,追求高吞吐量,高效利用CPU。吞吐量一般为99%,吞吐量=用户线程时间/(用户线程时间+GC线程时间)。适合后台应用等待对交互相应要求不高的场景。

    Parallel Old收集器(停止-复制算法)

    Parallel Scavenge收集器的老年代版本,并行收集器,吞吐量优先

    CMS(Concurrent Mark Sweep)收集器(标记-清理算法)

    高并发、底停顿,最求最短GC回收停顿时间,CPU占用比较高,响应时间快,停顿时间短,多核CPU最求高响应时间的选择。

    由于对象进行了分代处理,因此垃圾回收区域、时间也不一样。GC有两种类型:Scavenge GC和Full GC。

    Scavenge GC

    一般情况下,当新对象生成,并且在Eden申请空间失败时,就会触发Scavenge GC,对Eden区域进行GC,清除非存活对象,并且把尚且存活的对象移动到Survivor区。然后整理Survivor两个区。这种方式的GC是对年轻态的Eden区进行,不会影响到年老代。因为大部分对象都是从Eden区开始的,同时Eden区不会分配的很大,所以Eden区的GC会频繁进行。因而,一般在这里需要使用速度快,效率高的算法,使Eden能尽快空闲出来。

    Full GC

    对整个堆进行整理,包括Young、Tenured和Perm。Full GC因为需要对整个堆进行回收,所以比Scavenge GC要慢,因此应该尽可能减少Full GC的次数。在对JVM调优的过程中,很大一部分工作就是对于FullGC的调节。有如下原因可能导致Full GC:

    年老代(Tenured)被写满时

    持久带(Perm)被写满时

    System.gc()被显示的调用

    Java有了GC同样会出现内存泄露问题

    1.静态集合类像HashMap、Vector等的使用最容易出现内存泄露,这些静态变量的生命周期和应用程序一致,所有的对象Object也不能被释放,因为他们也将一直被Vector等应用着。

    在这个例子中,代码栈中存在Vector 对象的引用 v 和 Object 对象的引用 o 。在 For 循环中,我们不断的生成新的对象,然后将其添加到 Vector 对象中,之后将 o 引用置空。问题是当 o 引用被置空后,如果发生 GC,我们创建的 Object 对象是否能够被 GC 回收呢?答案是否定的。因为, GC 在跟踪代码栈中的引用时,会发现 v 引用,而继续往下跟踪,就会发现 v 引用指向的内存空间中又存在指向 Object 对象的引用。也就是说尽管o 引用已经被置空,但是 Object 对象仍然存在其他的引用,是可以被访问到的,所以 GC 无法将其释放掉。如果在此循环之后, Object 对象对程序已经没有任何作用,那么我们就认为此 Java 程序发生了内存泄漏。

    2.各种连接,数据库连接,网络连接,IO连接等没有显示调用close关闭,不被GC回收导致内存泄露。

    3.监听器的使用,在释放对象的同时没有相应删除监听器的时候也可能导致内存泄露。

  • 相关阅读:
    模拟赛总结
    2018.04.06学习总结
    2018.04.06学习总结
    Java实现 LeetCode 672 灯泡开关 Ⅱ(数学思路问题)
    Java实现 LeetCode 671 二叉树中第二小的节点(遍历树)
    Java实现 LeetCode 671 二叉树中第二小的节点(遍历树)
    Java实现 LeetCode 671 二叉树中第二小的节点(遍历树)
    Java实现 LeetCode 670 最大交换(暴力)
    Java实现 LeetCode 670 最大交换(暴力)
    Java实现 LeetCode 670 最大交换(暴力)
  • 原文地址:https://www.cnblogs.com/kexinxin/p/10147207.html
Copyright © 2011-2022 走看看