6. GC 调优(工具篇)

zoukankan html css js c++ java

6. GC 调优(工具篇)
进行GC性能调优时, 须要明白了解, 当前的GC行为对系统和用户有多大的影响。有多种监控GC的工具和方法, 本章将逐一介绍经常使用的工具。

您应该已经阅读了前面的章节:

垃圾收集简单介绍 - GC參考手冊

Java中的垃圾收集 - GC參考手冊

GC 算法(基础篇) - GC參考手冊

GC 算法(实现篇) - GC參考手冊

GC 调优(基础篇) - GC參考手冊

JVM 在程序执行的过程中, 提供了GC行为的原生数据。那么, 我们就能够利用这些原生数据来生成各种报告。
原生数据(raw data) 包含:

各个内存池的当前使用情况,

各个内存池的总容量,

每次GC暂停的持续时间,

GC暂停在各个阶段的持续时间。

能够通过这些数据算出各种指标, 比如: 程序的内存分配率, 提升率等等。本章主要介绍怎样获取原生数据。兴许的章节将对重要的派生指标(derived metrics)展开讨论, 并引入GC性能相关的话题。

JMX API

从 JVM 执行时获取GC行为数据, 最简单的办法是使用标准 JMX API 接口. JMX是获取 JVM内部执行时状态信息的标准API. 能够编敲代码代码, 通过 JMX API 来訪问本程序所在的JVM。也能够通过JMXclient执行(远程)訪问。

最常见的 JMXclient是 JConsole 和 JVisualVM (能够安装各种插件,十分强大)。两个工具都是标准JDK的一部分, 并且非常easy使用. 假设使用的是 JDK 7u40 及更高版本号, 还能够使用还有一个工具: Java Mission Control( 大致翻译为 Java控制中心, jmc.exe)。

JVisualVM安装MBeans插件的步骤: 通过工具(T) – 插件(G) – 可用插件 – 勾选VisualVM-MBeans – 安装 – 下一步 – 等待安装完毕…… 其它插件的安装过程基本一致。

全部 JMXclient都是独立的程序,能够连接到目标JVM上。目标JVM能够在本机, 也可能是远端JVM. 假设要连接远端JVM, 则目标JVM启动时必须指定特定的环境变量,以开启远程JMX连接/以及端口号。
示比例如以下:

java -Dcom.sun.management.jmxremote.port=5432 com.yourcompany.YourApp

在此处, JVM 打开端口5432以支持JMX连接。

通过 JVisualVM 连接到某个JVM以后, 切换到 MBeans 标签, 展开 “java.lang/GarbageCollector” . 就能够看到GC行为信息, 下图是 JVisualVM 中的截图:

下图是Java Mission Control 中的截图:

从以上截图中能够看到两款垃圾收集器。
当中一款负责清理年轻代(PS Scavenge)，还有一款负责清理老年代(PS MarkSweep); 列表中显示的就是垃圾收集器的名称。能够看到 , jmc 的功能和展示数据的方式更强大。

对全部的垃圾收集器, 通过 JMX API 获取的信息包含:

CollectionCount : 垃圾收集器执行的GC总次数,

CollectionTime: 收集器执行时间的累计。这个值等于全部GC事件持续时间的总和,

LastGcInfo: 近期一次GC事件的具体信息。
包含 GC事件的持续时间(duration), 開始时间(startTime) 和结束时间(endTime), 以及各个内存池在近期一次GC之前和之后的使用情况,

MemoryPoolNames: 各个内存池的名称,

Name: 垃圾收集器的名称

ObjectName: 由JMX规范定义的 MBean的名字,,

Valid: 此收集器是否有效。
本人仅仅见过 “true“的情况 (^_^)

依据经验, 这些信息对GC的性能来说,不能得出什么结论. 仅仅有编敲代码, 获取GC相关的 JMX 信息来进行统计和分析。在下文能够看到, 一般也不怎么关注 MBean , 但 MBean 对于理解GC的原理倒是挺实用的。

JVisualVM

JVisualVM 工具的 “VisualGC” 插件提供了主要的 JMXclient功能, 还实时显示出 GC事件以及各个内存空间的使用情况。

Visual GC 插件经常使用来监控本机执行的Java程序, 比方开发人员和性能调优专家经常会使用此插件, 以高速获取程序执行时的GC信息。

左側的图表展示了各个内存池的使用情况: Metaspace/永久代, 老年代, Eden区以及两个存活区。

在右边, 顶部的两个图表与 GC无关, 显示的是 JIT编译时间和类载入时间。
以下的6个图显示的是内存池的历史记录, 每一个内存池的GC次数,GC总时间, 以及最大值，峰值, 当前使用情况。

再以下是 HistoGram, 显示了年轻代对象的年龄分布。至于对象的年龄监控(objects tenuring monitoring), 本章不进行解说。

与纯粹的JMX工具相比, VisualGC 插件提供了更友好的界面, 假设没有其它趁手的工具, 请选择VisualGC. 本章接下来会介绍其它工具, 这些工具能够提供很多其它的信息, 以及更好的视角. 当然, 在“Profilers(分析器)”一节中。也会介绍 JVisualVM 的适用场景 —— 如: 分配分析(allocation profiling), 所以我们绝不会贬低哪一款工具, 关键还得看实际情况。

jstat

jstat 也是标准JDK提供的一款监控工具(Java Virtual Machine statistics monitoring tool),能够统计各种指标。既能够连接到本地JVM,也能够连到远程JVM. 查看支持的指标和相应选项能够执行 “jstat -options” 。
比如:

+-----------------+---------------------------------------------------------------+ | Option | Displays... | +-----------------+---------------------------------------------------------------+ |class | Statistics on the behavior of the class loader | |compiler | Statistics on the behavior of the HotSpot Just-In-Time com- | | | piler | |gc | Statistics on the behavior of the garbage collected heap | |gccapacity | Statistics of the capacities of the generations and their | | | corresponding spaces. | |gccause | Summary of garbage collection statistics (same as -gcutil), | | | with the cause of the last and current (if applicable) | | | garbage collection events. | |gcnew | Statistics of the behavior of the new generation. | |gcnewcapacity | Statistics of the sizes of the new generations and its corre- | | | sponding spaces. | |gcold | Statistics of the behavior of the old and permanent genera- | | | tions. | |gcoldcapacity | Statistics of the sizes of the old generation. | |gcpermcapacity | Statistics of the sizes of the permanent generation. | |gcutil | Summary of garbage collection statistics. | |printcompilation | Summary of garbage collection statistics. | +-----------------+---------------------------------------------------------------+

jstat 对于高速确定GC行为是否健康非常实用。启动方式为: “jstat -gc -t PID 1s” , 当中,PID 就是要监视的Java进程ID。能够通过 jps 命令查看正在执行的Java进程列表。

jps jstat -gc -t 2428 1s

以上命令的结果, 是 jstat 每秒向标准输出输出一行新内容, 比方:

Timestamp S0C S1C S0U S1U EC EU OC OU MC MU CCSC CCSU YGC YGCT FGC FGCT GCT 200.0 8448.0 8448.0 8448.0 0.0 67712.0 67712.0 169344.0 169344.0 21248.0 20534.3 3072.0 2807.7 34 0.720 658 133.684 134.404 201.0 8448.0 8448.0 8448.0 0.0 67712.0 67712.0 169344.0 169343.2 21248.0 20534.3 3072.0 2807.7 34 0.720 662 134.712 135.432 202.0 8448.0 8448.0 8102.5 0.0 67712.0 67598.5 169344.0 169343.6 21248.0 20534.3 3072.0 2807.7 34 0.720 667 135.840 136.559 203.0 8448.0 8448.0 8126.3 0.0 67712.0 67702.2 169344.0 169343.6 21248.0 20547.2 3072.0 2807.7 34 0.720 669 136.178 136.898 204.0 8448.0 8448.0 8126.3 0.0 67712.0 67702.2 169344.0 169343.6 21248.0 20547.2 3072.0 2807.7 34 0.720 669 136.178 136.898 205.0 8448.0 8448.0 8134.6 0.0 67712.0 67712.0 169344.0 169343.5 21248.0 20547.2 3072.0 2807.7 34 0.720 671 136.234 136.954 206.0 8448.0 8448.0 8134.6 0.0 67712.0 67712.0 169344.0 169343.5 21248.0 20547.2 3072.0 2807.7 34 0.720 671 136.234 136.954 207.0 8448.0 8448.0 8154.8 0.0 67712.0 67712.0 169344.0 169343.5 21248.0 20547.2 3072.0 2807.7 34 0.720 673 136.289 137.009 208.0 8448.0 8448.0 8154.8 0.0 67712.0 67712.0 169344.0 169343.5 21248.0 20547.2 3072.0 2807.7 34 0.720 673 136.289 137.009

略微解释一下上面的内容。參考 jstat manpage , 我们能够知道:

jstat 连接到 JVM 的时间, 是JVM启动后的 200秒。此信息从第一行的 “Timestamp” 列得知。继续看下一行, jstat 每秒钟从JVM 接收一次信息, 也就是命令行參数中 “1s” 的含义。

从第一行的 “YGC” 列得知年轻代共执行了34次GC, 由 “FGC” 列得知整个堆内存已经执行了 658次 full GC。

年轻代的GC耗时总共为 0.720 秒, 显示在“YGCT” 这一列。

Full GC 的总计耗时为 133.684 秒, 由“FGCT”列得知。这立刻就吸引了我们的目光, 总的JVM 执行时间仅仅有 200 秒, 但当中有 66% 的部分被 Full GC 消耗了。

再看下一行, 问题就更明显了。

在接下来的一秒内共执行了 4 次 Full GC。
參见 “FGC” 列.

这4次 Full GC 暂停占用了差点儿相同 1秒的时间(依据 FGCT列的差得知)。与第一行相比, Full GC 耗费了928 毫秒, 即 92.8% 的时间。

依据 “OC 和 “OU” 列得知, 整个老年代的空间为 169,344.0 KB (“OC“), 在 4 次 Full GC 后依旧占用了 169,344.2 KB (“OU“)。用了 928ms 的时间却仅仅释放了 800 字节的内存, 怎么看都觉得非常不正常。

仅仅看这两行的内容, 就知道程序出了非常严重的问题。继续分析下一行, 能够确定问题依旧存在,并且变得更糟。

JVM差点儿全然卡住了(stalled), 由于GC占用了90%以上的计算资源。
GC之后, 全部的老代空间仍然还在占用。
其实, 程序在一分钟以后就挂了, 抛出了 “java.lang.OutOfMemoryError: GC overhead limit exceeded” 错误。

能够看到, 通过 jstat 能非常快发现对JVM健康极为不利的GC行为。一般来说, 仅仅看 jstat 的输出就能高速发现以下问题:

最后一列 “GCT”, 与JVM的总执行时间 “Timestamp” 的比值, 就是GC 的开销。假设每一秒内, “GCT” 的值都会明显增大, 与总执行时间相比, 就暴露出GC开销过大的问题. 不同系统对GC开销有不同的容忍度, 由性能需求决定, 一般来讲, 超过 10% 的GC开销都是有问题的。

“YGC” 和 “FGC” 列的高速变化往往也是有问题的征兆。频繁的GC暂停会累积,并导致很多其它的线程停顿(stop-the-world pauses), 进而影响吞吐量。

假设看到 “OU” 列中,老年代的使用量约等于老年代的最大容量(OC), 并且不降低的话, 就表示尽管执行了老年代GC, 但基本上属于无效GC。

GC日志(GC logs)

通过日志内容也能够得到GC相关的信息。
由于GC日志模块内置于JVM中, 所以日志中包含了对GC活动最全面的描写叙述。
这就是其实的标准, 可作为GC性能评估和优化的最真实数据来源。

GC日志一般输出到文件之中, 是纯 text 格式的, 当然也能够打印到控制台。有多个能够控制GC日志的JVM參数。
比如,能够打印每次GC的持续时间, 以及程序暂停时间(-XX:+PrintGCApplicationStoppedTime), 还有GC清理了多少引用类型(-XX:+PrintReferenceGC)。

要打印GC日志, 须要在启动脚本中指定以下參数:

-XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -XX:+PrintGCDetails -Xloggc:<filename>

以上參数指示JVM: 将全部GC事件打印到日志文件里, 输出每次GC的日期和时间戳。不同GC算法输出的内容略有不同. ParallelGC 输出的日志相似这样:

199.879: [Full GC (Ergonomics) [PSYoungGen: 64000K->63998K(74240K)] [ParOldGen: 169318K->169318K(169472K)] 233318K->233317K(243712K), [Metaspace: 20427K->20427K(1067008K)], 0.1473386 secs] [Times: user=0.43 sys=0.01, real=0.15 secs] 200.027: [Full GC (Ergonomics) [PSYoungGen: 64000K->63998K(74240K)] [ParOldGen: 169318K->169318K(169472K)] 233318K->233317K(243712K), [Metaspace: 20427K->20427K(1067008K)], 0.1567794 secs] [Times: user=0.41 sys=0.00, real=0.16 secs] 200.184: [Full GC (Ergonomics) [PSYoungGen: 64000K->63998K(74240K)] [ParOldGen: 169318K->169318K(169472K)] 233318K->233317K(243712K), [Metaspace: 20427K->20427K(1067008K)], 0.1621946 secs] [Times: user=0.43 sys=0.00, real=0.16 secs] 200.346: [Full GC (Ergonomics) [PSYoungGen: 64000K->63998K(74240K)] [ParOldGen: 169318K->169318K(169472K)] 233318K->233317K(243712K), [Metaspace: 20427K->20427K(1067008K)], 0.1547695 secs] [Times: user=0.41 sys=0.00, real=0.15 secs] 200.502: [Full GC (Ergonomics) [PSYoungGen: 64000K->63999K(74240K)] [ParOldGen: 169318K->169318K(169472K)] 233318K->233317K(243712K), [Metaspace: 20427K->20427K(1067008K)], 0.1563071 secs] [Times: user=0.42 sys=0.01, real=0.16 secs] 200.659: [Full GC (Ergonomics) [PSYoungGen: 64000K->63999K(74240K)] [ParOldGen: 169318K->169318K(169472K)] 233318K->233317K(243712K), [Metaspace: 20427K->20427K(1067008K)], 0.1538778 secs] [Times: user=0.42 sys=0.00, real=0.16 secs]

在 “04. GC算法:实现篇” 中具体介绍了这些格式, 假设对此不了解, 能够先阅读该章节。

分析以上日志内容, 能够得知:

这部分日志截取自JVM启动后200秒左右。

日志片段中显示, 在780毫秒以内, 由于垃圾回收导致了5次 Full GC 暂停(去掉第六次暂停,这样更精确一些)。

这些暂停事件的总持续时间是 777毫秒, 占总执行时间的 99.6%。

在GC完毕之后, 差点儿全部的老年代空间(169,472 KB)依旧被占用(169,318 KB)。

通过日志信息能够确定, 该应用的GC情况非常糟糕。JVM差点儿全然停滞, 由于GC占用了超过99%的CPU时间。而GC的结果是, 老年代空间仍然被占满, 这进一步肯定了我们的结论。
演示样例程序和jstat 小节中的是同一个, 几分钟之后系统就挂了, 抛出 “java.lang.OutOfMemoryError: GC overhead limit exceeded” 错误, 不用说, 问题是非常严重的.

从此演示样例能够看出, GC日志对监控GC行为和JVM是否处于健康状态非常实用。
普通情况下, 查看 GC 日志就能够高速确定以下症状:

GC开销太大。
假设GC暂停的总时间非常长, 就会损害系统的吞吐量。不同的系统同意不同比例的GC开销, 但一般觉得, 正常范围在 10% 以内。

极个别的GC事件暂停时间过长。
当某次GC暂停时间太长, 就会影响系统的延迟指标. 假设延迟指标规定交易必须在 1,000 ms内完毕, 那就不能容忍不论什么超过 1000毫秒的GC暂停。

老年代的使用量超过限制。假设老年代空间在 Full GC 之后仍然接近全满, 那么GC就成为了性能瓶颈, 可能是内存太小, 也可能是存在内存泄漏。这种症状会让GC的开销暴增。

能够看到,GC日志中的信息非常具体。但除了这些简单的小程序, 生产系统一般都会生成大量的GC日志, 纯靠人工是非常难阅读和进行解析的。

GCViewer

我们能够自己编写解析器, 来将庞大的GC日志解析为直观易读的图形信息。
但非常多时候自己敲代码也不是个好办法, 由于各种GC算法的复杂性, 导致日志信息格式互相之间不太兼容。那么神器来了: GCViewer。

GCViewer 是一款开源的GC日志分析工具。项目的 GitHub 主页对各项指标进行了完整的描写叙述. 以下我们介绍最经常使用的一些指标。

第一步是获取GC日志文件。这些日志文件要能够反映系统在性能调优时的具体场景. 假若运营部门(operational department)反馈: 每周五下午,系统就执行缓慢, 无论GC是不是主要原因, 分析周一早晨的日志是没有多少意义的。

获取到日志文件之后, 就能够用 GCViewer 进行分析, 大致会看到相似以下的图形界面:

使用的命令行大致例如以下:

java -jar gcviewer_1.3.4.jar gc.log

当然, 假设不想打开程序界面,也能够在后面加上其它參数,直接将分析结果输出到文件。

命令大致例如以下:

java -jar gcviewer_1.3.4.jar gc.log summary.csv chart.png

以上命令将信息汇总到当前文件夹下的 Excel 文件 summary.csv 之中, 将图形信息保存为 chart.png 文件。

点击下载: gcviewer的jar包及使用演示样例。

上图中, Chart 区域是对GC事件的图形化展示。
包含各个内存池的大小和GC事件。
上图中, 仅仅有两个可视化指标: 蓝色线条表示堆内存的使用情况, 黑色的Bar则表示每次GC暂停时间的长短。

从图中能够看到, 内存使用量增长非常快。
一分钟左右就达到了堆内存的最大值. 堆内存差点儿全部被消耗, 不能顺利分配新对象, 并引发频繁的 Full GC 事件. 这说明程序可能存在内存泄露, 或者启动时指定的内存空间不足。

从图中还能够看到 GC暂停的频率和持续时间。
30秒之后, GC差点儿不间断地执行,最长的暂停时间超过1.4秒。

在右边有三个选项卡。“Summary(摘要)” 中比較实用的是 “Throughput”(吞吐量百分比) 和 “Number of GC pauses”(GC暂停的次数), 以及“Number of full GC pauses”(Full GC 暂停的次数). 吞吐量显示了有效工作的时间比例, 剩下的部分就是GC的消耗。

以上演示样例中的吞吐量为 6.28%。这意味着有 93.72% 的CPU时间用在了GC上面. 非常明显系统所面临的情况非常糟糕 —— 宝贵的CPU时间没实用于执行实际工作, 而是在试图清理垃圾。

下一个有意思的地方是“Pause”(暂停)选项卡:

“Pause” 展示了GC暂停的总时间,平均值,最小值和最大值, 并且将 total 与minor/major 暂停分开统计。假设要优化程序的延迟指标, 这些统计能够非常快推断出暂停时间是否过长。另外, 我们能够得出明白的信息: 累计暂停时间为 634.59 秒, GC暂停的总次数为 3,938 次, 这在11分钟/660秒的总执行时间里那不是一般的高。

更具体的GC暂停汇总信息, 请查看主界面中的 “Event details” 标签:

从“Event details” 标签中, 能够看到日志中全部重要的GC事件汇总: 普通GC停顿 和 Full GC 停顿次数, 以及并发执行数, 非 stop-the-world 事件等。此演示样例中, 能够看到一个明显的地方, Full GC 暂停严重影响了吞吐量和延迟, 依据是: 3,928 次 Full GC, 暂停了634秒。

能够看到, GCViewer 能用图形界面高速展现异常的GC行为。
一般来说, 图像化信息能迅速揭示以下症状:

低吞吐量。
当应用的吞吐量下降到不能容忍的地步时, 实用工作的总时间就大量降低. 具体有多大的 “容忍度”(tolerable) 取决于具体场景。依照经验, 低于 90% 的有效时间就值得警惕了, 可能须要好好优化下GC。

单次GC的暂停时间过长。
仅仅要有一次GC停顿时间过长,就会影响程序的延迟指标. 比如, 延迟需求规定必须在 1000 ms以内完毕交易, 那就不能容忍不论什么一次GC暂停超过1000毫秒。

堆内存使用率过高。假设老年代空间在 Full GC 之后仍然接近全满, 程序性能就会大幅降低, 可能是资源不足或者内存泄漏。
这种症状会对吞吐量产生严重影响。

业界良心 —— 图形化展示的GC日志信息绝对是我们重磅推荐的。不用去阅读冗长而又复杂的GC日志,通过easy理解的图形, 也能够得到相同的信息。

分析器(Profilers)

以下介绍分析器(profilers, Oracle官方翻译是:抽样器)。相对于前面的工具, 分析器仅仅关心GC中的一部分领域. 本节我们也仅仅关注分析器相关的GC功能。

首先警告 —— 不要觉得分析器适用于全部的场景。
分析器有时确实作用非常大, 比方检測代码中的CPU热点时。但某些情况使用分析器不一定是个好方案。

对GC调优来说也是一样的。
要检測是否由于GC而引起延迟或吞吐量问题时, 不须要使用分析器. 前面提到的工具( jstat 或原生/可视化GC日志)就能更好更快地检測出是否存在GC问题. 特别是从生产环境中收集性能数据时, 最好不要使用分析器, 由于性能开销非常大。

假设确实须要对GC进行优化, 那么分析器就能够派上用场了, 能够对 Object 的创建信息一目了然. 换个角度看, 假设GC暂停的原因不在某个内存池中, 那就仅仅会是由于创建对象太多了。全部分析器都能够跟踪对象分配(via allocation profiling), 依据内存分配的轨迹, 让你知道 实际驻留在内存中的是哪些对象。

分配分析能定位到在哪个地方创建了大量的对象. 使用分析器辅助进行GC调优的优点是, 能确定哪种类型的对象最占用内存, 以及哪些线程创建了最多的对象。

以下我们通过实例介绍3种分配分析器: hprof, JVisualVM 和 AProf。
实际上还有非常多分析器可供选择, 有商业产品,也有免费工具, 但其功能和应用基本上都是相似的。

hprof

hprof 分析器内置于JDK之中。在各种环境下都能够使用, 一般优先使用这款工具。

要让 hprof 和程序一起执行, 须要改动启动脚本, 相似这样:

java -agentlib:hprof=heap=sites com.yourcompany.YourApplication

在程序退出时,会将分配信息dump(转储)到工作文件夹下的 java.hprof.txt 文件里。
使用文本编辑器打开, 并搜索 “SITES BEGIN” keyword, 能够看到:

SITES BEGIN (ordered by live bytes) Tue Dec 8 11:16:15 2015 percent live alloc'ed stack class rank self accum bytes objs bytes objs trace name 1 64.43% 4.43% 8370336 20121 27513408 66138 302116 int[] 2 3.26% 88.49% 482976 20124 1587696 66154 302104 java.util.ArrayList 3 1.76% 88.74% 241704 20121 1587312 66138 302115 eu.plumbr.demo.largeheap.ClonableClass0006 ... 部分省略 ... SITES END

从以上片段能够看到, allocations 是依据每次创建的对象数量来排序的。第一行显示全部对象中有 64.43% 的对象是整型数组(int[]), 在标识为 302116 的位置创建。搜索 “TRACE 302116” 能够看到:

TRACE 302116: eu.plumbr.demo.largeheap.ClonableClass0006.<init>(GeneratorClass.java:11) sun.reflect.GeneratedConstructorAccessor7.newInstance(<Unknown Source>:Unknown line) sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45) java.lang.reflect.Constructor.newInstance(Constructor.java:422)

如今, 知道有 64.43% 的对象是整数数组, 在 ClonableClass0006 类的构造函数中, 第11行的位置, 接下来就能够优化代码, 以降低GC的压力。

Java VisualVM

本章前面的第一部分, 在监控 JVM 的GC行为工具时介绍了 JVisualVM , 本节介绍其在分配分析上的应用。

JVisualVM 通过GUI的方式连接到正在执行的JVM。连接上目标JVM之后 :

打开 “工具” –> “选项” 菜单, 点击 性能分析(Profiler) 标签, 新增配置, 选择 Profiler 内存, 确保勾选了 “Record allocations stack traces”(记录分配栈跟踪)。

勾选 “Settings”(设置) 复选框, 在内存设置标签下,改动预设配置。

点击 “Memory”(内存) button開始进行内存分析。

让程序执行一段时间,以收集关于对象分配的足够信息。

单击下方的 “Snapshot”(快照) button。
能够获取收集到的快照信息。

完毕上面的步骤后, 能够得到相似这种信息:

上图依照每一个类被创建的对象数量多少来排序。看第一行能够知道, 创建的最多的对象是 int[] 数组. 鼠标右键单击这行, 就能够看到这些对象都在哪些地方创建的:

与 hprof 相比, JVisualVM 更加easy使用 —— 比方上面的截图中, 在一个地方就能够看到全部int[] 的分配信息, 所以多次在同一处代码进行分配的情况就非常easy发现。

AProf

最重要的一款分析器,是由 Devexperts 开发的 AProf。
内存分配分析器 AProf 也被打包为 Java agent 的形式。

用 AProf 分析应用程序, 须要改动 JVM 启动脚本,相似这样:

java -javaagent:/path-to/aprof.jar com.yourcompany.YourApplication

重新启动应用之后, 工作文件夹下会生成一个 aprof.txt 文件。此文件每分钟更新一次, 包含这种信息:

======================================================================================================================== TOTAL allocation dump for 91,289 ms (0h01m31s) Allocated 1,769,670,584 bytes in 24,868,088 objects of 425 classes in 2,127 locations ======================================================================================================================== Top allocation-inducing locations with the data types allocated from them ------------------------------------------------------------------------------------------------------------------------ eu.plumbr.demo.largeheap.ManyTargetsGarbageProducer.newRandomClassObject: 1,423,675,776 (80.44%) bytes in 17,113,721 (68.81%) objects (avg size 83 bytes) int[]: 711,322,976 (40.19%) bytes in 1,709,911 (6.87%) objects (avg size 416 bytes) char[]: 369,550,816 (20.88%) bytes in 5,132,759 (20.63%) objects (avg size 72 bytes) java.lang.reflect.Constructor: 136,800,000 (7.73%) bytes in 1,710,000 (6.87%) objects (avg size 80 bytes) java.lang.Object[]: 41,079,872 (2.32%) bytes in 1,710,712 (6.87%) objects (avg size 24 bytes) java.lang.String: 41,063,496 (2.32%) bytes in 1,710,979 (6.88%) objects (avg size 24 bytes) java.util.ArrayList: 41,050,680 (2.31%) bytes in 1,710,445 (6.87%) objects (avg size 24 bytes) ... cut for brevity ...

上面的输出是依照 size 进行排序的。能够看出, 80.44% 的 bytes 和 68.81% 的 objects 是在 ManyTargetsGarbageProducer.newRandomClassObject() 方法中分配的。
当中, int[] 数组占用了 40.19% 的内存, 是最大的一个。

继续往下看, 会发现 allocation traces(分配痕迹)相关的内容, 也是以 allocation size 排序的:

Top allocated data types with reverse location traces ------------------------------------------------------------------------------------------------------------------------ int[]: 725,306,304 (40.98%) bytes in 1,954,234 (7.85%) objects (avg size 371 bytes) eu.plumbr.demo.largeheap.ClonableClass0006.: 38,357,696 (2.16%) bytes in 92,206 (0.37%) objects (avg size 416 bytes) java.lang.reflect.Constructor.newInstance: 38,357,696 (2.16%) bytes in 92,206 (0.37%) objects (avg size 416 bytes) eu.plumbr.demo.largeheap.ManyTargetsGarbageProducer.newRandomClassObject: 38,357,280 (2.16%) bytes in 92,205 (0.37%) objects (avg size 416 bytes) java.lang.reflect.Constructor.newInstance: 416 (0.00%) bytes in 1 (0.00%) objects (avg size 416 bytes) ... cut for brevity ...

能够看到, int[] 数组的分配, 在 ClonableClass0006 构造函数中继续增大。

和其它工具一样, AProf 揭露了分配的大小以及位置信息(allocation size and locations), 从而能够高速找到最耗内存的部分。在我们看来, AProf 是最实用的分配分析器, 由于它仅仅专注于内存分配, 所以做得最好。当然, 这款工具是开源免费的, 资源开销也最小。

请继续阅读下一章: 7. GC 调优(实战篇) - GC參考手冊

原文链接: GC Tuning: Tooling

翻译人员: 铁锚 http://blog.csdn.net/renfufei

翻译时间: 2016年02月06日
查看全文

相关阅读:
【容斥】Four-tuples @山东省第九届省赛 F
【树形dp入门】没有上司的舞会 @洛谷P1352
【贪心】LIS @The 15th Zhejiang Provincial Collegiate Programming Contest E
【map离散&容斥】Ghosts @Codeforces Round #478 (Div. 2) D
PCA & whitening
Autoencoders and Sparsity（二）
Autoencoders and Sparsity（一）
Regularized logistic regression
Regularization —— linear regression
Logistic Regression and Newton's Method

原文地址：https://www.cnblogs.com/yjbjingcha/p/7344133.html

6. GC 调优(工具篇)

JMX API

JVisualVM

jstat

GC日志(GC logs)

GCViewer

分析器(Profilers)

hprof

Java VisualVM

AProf