JDK本身提供了很多方便的JVM性能调优监控工具,除了集成式的VisualVM和jConsole外,但是在生产环境出现问题的时候,一方面工具的使用会有所限制,所有的工具几乎都是依赖于jdk的接口和底层的这些命令,研究这些命令的使用也让我们更能了解jvm构成和特性。
jps(JVM Process Status Tool,显示指定系统内所有的HotSpot虚拟机进程。)
语法:
jps [ options ] [ hostid ]
options | 说明 |
-q | 只输出进程ID |
-m | 输出JVM启动时传递给main()的参数 |
-l | 输出主类全名或jar路径 |
-v | 输出JVM启动时显示指定的JVM参数 |
参数详解:
-l、-m选项
1 [root@node1 ~]# jps -l
2 1640 org.apache.hadoop.hdfs.server.namenode.NameNode
3 2752 sun.tools.jps.Jps
4 1738 org.apache.hadoop.hdfs.server.datanode.DataNode
5 1894 org.apache.hadoop.hdfs.qjournal.server.JournalNode
6
7 [root@node1 ~]# jps -lm
8 1640 org.apache.hadoop.hdfs.server.namenode.NameNode
9 1738 org.apache.hadoop.hdfs.server.datanode.DataNode
10 1894 org.apache.hadoop.hdfs.qjournal.server.JournalNode
11 2840 sun.tools.jps.Jps -lm
jstat (JVM statistics Monitoring,虚拟机统计信息,以显示出虚拟机进程中的类装载、内存、垃圾收集、JIT编译等运行数据。)
语法:
jstat [ generalOption | outputOptions vmid [interval[s|ms] [count]] ]
其中:vmid 则是虚拟机的进程ID、interval 和 count 表示输出间隔以及输出次数。
options | 说明 |
-class | 监视类装载、卸载数量、总空间以及类装载所耗费的时间 |
-gc | 监视Java堆状况,包括Eden区、两个Survivor区、老年代、永久代等的容量、已用空间、GC时间合计等信息 |
-gccapacity | 监视内容与-gc基本相同,但输出主要关注Java堆各个区域使用到的最大、最小空间 |
-gcutil | 监视内容与-gc基本相同,但输出主要关注已使用空间占总空间的百分比 |
-gccause | 与-gcutil功能一样,但是会额外输出导致上一次GC产生的原因 |
-gcnew | 监视新生代GC状况 |
-gcnewcapacity | 监视内容与-gcnew基本相同,输出主要关注使用到的最大、最小空间 |
-gcold | 监视老年代GC状况 |
-gcoldcapacity | 监视内容与-gcold基本相同,输出主要关注使用到的最大、最小空间 |
-gcpermcapacity | 输出永久代使用到的最大、最小空间 |
-compiler | 输出JIT编译器编译过的方法、耗时信息 |
-printcompilation | 输出已经被JIT(just-in-time)编译的方法 |
option 参数详解
-class 监视类装载、卸载数量、总空间以及类装载所耗费的时间
$ jstat -class 3139 Loaded Bytes Unloaded Bytes Time 7197 14779.4 0 0.0 101.46 Loaded : 加载class的数量 Bytes : class字节大小 Unloaded : 未加载class的数量 Bytes : 未加载class的字节大小 Time : 加载时间
-compiler 输出JIT编译过的方法数量耗时等
$ jstat -compiler 4156 Compiled Failed Invalid Time FailedType FailedMethod 3892 0 0 50.32 0 Compiled :该进程的编译数量 Failed :编译失败的数量 Invalid :无效的数量 Time :编译耗时 FailedType :失败类型 FailedMethod :编译失败的方法的完全限定名
-gc 垃圾回收堆的行为统计,常用命令
[root@node1 ~]# jstat -gc 3388 S0C S1C S0U S1U EC EU OC OU MC MU CCSC CCSU YGC YGCT FGC FGCT GCT 17024.0 17024.0 9785.1 0.0 136320.0 135795.6 878208.0 22770.7 41504.0 40773.0 4912.0 4780.8 4 1.967 4 0.301 2.268 S0C : survivor0区的总容量(kB) S1C : survivor1区的总容量(kB) S0U : survivor0区已使用的容量(kB) S1U : survivor1区已使用的容量(kB) EC : Eden区的总容量(kB) EU : Eden区已使用的容量(kB) OC : Old区的总容量(kB) OU : Old区已使用的容量(kB) MC:(Klass Metaspace以及NoKlass Metaspace)metaspace总共committed的内存大小,单位KB MU:Klass Metaspace以及NoKlass Metaspace两者已经使用了的内存大小(kB) CCSC:Klass Metaspace的已经被commit的内存大小,单位也是KB CCSU: Klass Metaspace的已经被使用的内存大小(kB) YGC : 新生代垃圾回收次数 YGCT : 新生代垃圾回收时间 FGC : 老年代垃圾回收次数 FGCT : 老年代垃圾回收时间 GCT : 垃圾回收总消耗时间 [root@node1 ~]# jstat -gc 1075 2000 3 每隔2000ms检查一次,共输出3次 S0C S1C S0U S1U EC EU OC OU MC MU CCSC CCSU YGC YGCT FGC FGCT GCT 17024.0 17024.0 0.0 1255.5 136320.0 38105.2 1035800.0 654520.4 147396.0 139128.4 19736.0 18572.2 2815 56.979 24 3.324 60.303 17024.0 17024.0 0.0 1255.5 136320.0 38132.0 1035800.0 654520.4 147396.0 139128.4 19736.0 18572.2 2815 56.979 24 3.324 60.303 17024.0 17024.0 0.0 1255.5 136320.0 43593.5 1035800.0 654520.4 147396.0 139128.4 19736.0 18572.2 2815 56.979 24 3.324 60.303
-gccapacity :会输出Java堆各区域使用到的最大、最小空间
[root@node1 ~]# jstat -gccapacity 1075 NGCMN NGCMX NGC S0C S1C EC OGCMN OGCMX OGC OC MCMN MCMX MC CCSMN CCSMX CCSC YGC FGC 41600.0 170368.0 170368.0 17024.0 17024.0 136320.0 83328.0 4023936.0 1035800.0 1035800.0 0.0 1177600.0 147396.0 0.0 1048576.0 19736.0 2817 24 NGCMN : 新生代占用的最小空间 NGCMX : 新生代占用的最大空间 OGCMN : 老年代占用的最小空间 OGCMX : 老年代占用的最大空间 OGC:当前年老代的容量 (KB) OC:当前年老代的空间 (KB) PGCMN : perm占用的最小空间 PGCMX : perm占用的最大空间
-gcutil :输出的是已使用空间占总空间的百分比
[root@node1 ~]# jstat -gcutil 1075 S0 S1 E O M CCS YGC YGCT FGC FGCT GCT 0.00 10.71 17.84 63.34 94.42 94.11 2851 57.579 24 3.324 60.904
-gccause:垃圾收集统计概述,附加最近两次垃圾回收事件的原因
[root@node1 ~]# jstat -gccause 1075 S0 S1 E O M CCS YGC YGCT FGC FGCT GCT LGCC GCC 0.00 13.52 68.13 63.39 94.44 94.11 2853 57.612 24 3.324 60.937 Allocation Failure No GC LGCC:最近垃圾回收的原因 GCC:当前垃圾回收的原因
-gcnew: 统计新生代的行为
[root@node1 ~]# jstat -gcnew 1075 S0C S1C S0U S1U TT MTT DSS EC EU YGC YGCT 17024.0 17024.0 0.0 2282.2 6 6 8512.0 136320.0 46848.3 2855 57.650 TT:Tenuring threshold(提升阈值) MTT:最大的tenuring threshold DSS:survivor区域大小 (KB)
-gcnewcapacity:新生代与其相应的内存空间的统计
[root@node1 ~]# jstat -gcnewcapacity 1075 NGCMN NGCMX NGC S0CMX S0C S1CMX S1C ECMX EC YGC FGC 41600.0 170368.0 170368.0 17024.0 17024.0 17024.0 17024.0 136320.0 136320.0 2857 24 NGC:当前年轻代的容量 (KB) S0CMX:最大的S0空间 (KB) S0C:当前S0空间 (KB) ECMX:最大eden空间 (KB) EC:当前eden空间 (KB)
-gcold :统计老年代的行为
[root@node1 ~]# jstat -gcold 1075 MC MU CCSC CCSU OC OU YGC FGC FGCT GCT 147396.0 139195.6 19736.0 18572.7 1035800.0 657569.2 2864 24 3.324 61.137 [root@node1 ~]# jstat -gcold 1075 MC MU CCSC CCSU OC OU YGC FGC FGCT GCT 147396.0 139195.6 19736.0 18572.7 1035800.0 657569.2 2864 24 3.324 61.137
-gcmetacapacity:统计元数据容量
[root@node1 ~]# jstat -gcmetacapacity 1075 MCMN MCMX MC CCSMN CCSMX CCSC YGC FGC FGCT GCT 0.0 1177600.0 147396.0 0.0 1048576.0 19736.0 2868 24 3.324 61.208
-printcompilation :hotspot编译方法统计
[root@node1 ~]# jstat -printcompilation 1075 Compiled Size Type Method 29220 419 1 java/math/BigDecimal setScale Compiled:被执行的编译任务的数量 Size:方法字节码的字节数 Type:编译类型 Method:编译方法的类名和方法名。类名使用”/” 代替 “.” 作为空间分隔符. 方法名是给出类的方法名. 格式是一致于HotSpot - XX:+PrintComplation 选项
jmap命令
jmap - Prints shared object memory maps or heap memory details for a process, core file, or remote
debug server.
jmap不仅能生成dump文件,还阔以查询finalize执行队列、Java堆和永久代的详细信息,如当前使用率、当前使用的是哪种收集器等
语法:
jmap [ options ] pid
jmap [ options ] executable core
jmap [ options ] [ pid ] server-id@ ] remote-hostname-or-IP
常用选项
-dump:[live,] format=b, file=filename
dump堆使用信息到文件,format指定格式,live指存活的对象,file为文件名
[root@node1 ~]# jmap -dump:live,format=b,file=hprof.dump 2712 2712: Unable to open socket file: target process not responding or HotSpot VM not loaded The -F option can be used when the target process is not responding 报错原因: jvm运行时会生成一个目录hsperfdata_$USER($USER是启动java进程的用户),在linux中默认是/tmp。目录下会有些pid文件,存放jvm进程信息。
jvm相关命令会从这个路径/tmp/hsperfdata_$USER去获取pid的连接信息,我是root用户执行的命令,所以没有pid文件,而对应应用程序里面有
例如:
jmap报错原因:
可能是由于tmpwatch机制,防止/tmp目录里文件过多,系统每天基于此机制删除超过240小时未访问的文件和目录。 jmap和jstack不能正常运行的原因: 因为对应目录里没有pid文件 查看关键配置/etc/cron.daily/tmpwatch: flags=-umc /usr/sbin/tmpwatch "$flags" -x /tmp/.X11-unix -x /tmp/.XIM-unix -x /tmp/.font-unix -x /tmp/.ICE-unix -x /tmp/.Test-unix 240 /tmp /usr/sbin/tmpwatch "$flags" 720 /var/tmp for d in /var/{cache/man,catman}/{cat?,X11R6/cat?,local/cat?}; do if [ -d "$d" ]; then /usr/sbin/tmpwatch "$flags" -f 720 "$d" fi done
解决办法:
1、修改对应应用的Djava.io.tmpdir参数,统一使用/tmp目录。重启应用 2、修改/etc/cron.daily/tmpwatch /usr/sbin/tmpwatch "$flags" -x /tmp/hsperfdata_* -x /tmp/.X11-unix -x /tmp/.XIM-unix -x /tmp/.font-unix -x /tmp/.ICE-unix -x /tmp/.Test-unix 240 /tmp [root@node1 ~]# jmap -F -dump:live,format=b,file=hprof.dump 2712 Attaching to process ID 2712, please wait... Debugger attached successfully. Server compiler detected. JVM version is 25.201-b09 Dumping heap to hprof.dump ... Heap dump file created dump.hprof这个后缀是为了后续可以直接用MAT(Memory Anlysis Tool)打开。
-finalizerinfo :打印等待回收对象的信息
[root@node1 ~]# jmap -finalizerinfo 2712 Attaching to process ID 2712, please wait... Debugger attached successfully. Server compiler detected. JVM version is 25.201-b09 Number of objects pending for finalization: 0 可以看到当前F-QUEUE队列中并没有等待Finalizer线程执行finalizer方法的对象。
-heap :打印heap的概要信息,GC使用的算法,heap的配置及wise heap的使用情况,可以用此来判断内存目前的使用情况以及垃圾回收情况
[root@node1 ~]# jmap -heap 2712 Attaching to process ID 2712, please wait... Debugger attached successfully. Server compiler detected. JVM version is 25.201-b09 using thread-local object allocation. Parallel GC with 2 thread(s) # GC方式 Heap Configuration: // 堆内存初始化配置 MinHeapFreeRatio = 0 // 对应jvm启动参数-XX:MinHeapFreeRatio设置JVM堆最小空闲比率(default 40) MaxHeapFreeRatio = 100 // 对应jvm启动参数 -XX:MaxHeapFreeRatio设置JVM堆最大空闲比率(default 70) MaxHeapSize = 52428800 (50.0MB) // 对应jvm启动参数-XX:MaxHeapSize=设置JVM堆的最大大小 NewSize = 17301504 (16.5MB) // 对应jvm启动参数-XX:NewSize=设置JVM堆的‘新生代’的默认大小 MaxNewSize = 17301504 (16.5MB) // 对应jvm启动参数-XX:MaxNewSize=设置JVM堆的‘新生代’的最大大小 OldSize = 35127296 (33.5MB) // 对应jvm启动参数-XX:OldSize=<value>:设置JVM堆的‘老生代’的大小 NewRatio = 2 // 对应jvm启动参数-XX:NewRatio=:‘新生代’和‘老生代’的大小比率 SurvivorRatio = 8 // 对应jvm启动参数-XX:SurvivorRatio=设置年轻代中Eden区与Survivor区的大小比值 MetaspaceSize = 21807104 (20.796875MB) // 对应jvm启动参数-XX:PermSize=<value>:设置JVM堆的‘永生代’的初始大小 CompressedClassSpaceSize = 1073741824 (1024.0MB) // 对应jvm启动参数-XX:MaxPermSize=<value>:设置JVM堆的‘永生代’的最大大小 MaxMetaspaceSize = 17592186044415 MB G1HeapRegionSize = 0 (0.0MB) Heap Usage: // 堆内存使用情况 PS Young Generation Eden Space: // Eden区内存分布 capacity = 9961472 (9.5MB) // Eden区总容量 used = 3917840 (3.7363433837890625MB) // Eden区已使用 free = 6043632 (5.7636566162109375MB) // Eden区剩余容量 39.32993035567434% used // Eden区使用比率 From Space: // 其中一个Survivor区的内存分布 capacity = 3670016 (3.5MB) used = 1028528 (0.9808807373046875MB) free = 2641488 (2.5191192626953125MB) 28.025163922991073% used To Space: // 另一个Survivor区的内存分布 capacity = 3145728 (3.0MB) used = 0 (0.0MB) free = 3145728 (3.0MB) 0.0% used PS Old Generation // 当前的Old区内存分布 capacity = 35127296 (33.5MB) used = 27684384 (26.401885986328125MB) free = 7442912 (7.098114013671875MB) 78.81159995918843% used 20704 interned Strings occupying 2153624 bytes.
-histo :打印堆的对象统计,包括对象数、内存大小等等 (因为在dump:live前会进行full gc,如果带上live则只统计活对象,因此不加live的堆大小要大于加live堆的大小 )
[root@node1 ~]# jmap -F -histo 2656 num #instances #bytes Class description -------------------------------------------------------------------------- 1: 526458 45456832 char[] 2: 275076 6601824 java.lang.String 3: 44613 5271264 byte[] 4: 215455 5170920 java.util.concurrent.ConcurrentSkipListMap$Node 5: 62357 4515576 int[] 6: 109775 2634600 java.lang.Double 7: 74848 2395136 java.util.HashMap$Node 8: 18442 1880400 java.util.HashMap$Node[] 9: 53471 1820904 java.lang.Object[] .... 仅仅打印了前10行 xml class name是对象类型,说明如下: B byte C char D double F float I int J long Z boolean [ 数组,如[I表示int[] [L+类名 其他对象
-F :强制模式。如果指定的pid没有响应,请使用jmap -dump或jmap -histo选项。此模式下,不支持live子选项
jstack
jstack用于生成java虚拟机当前时刻的线程快照。线程快照是当前java虚拟机内每一条线程正在执行的方法堆栈的集合,生成线程快照的主要目的是定位线程出现长时间停顿的原因,如线程间死锁、死循环、请求外部资源导致的长时间等待等。 线程出现停顿的时候通过jstack来查看各个线程的调用堆栈,就可以知道没有响应的线程到底在后台做什么事情,或者等待什么资源。 如果java程序崩溃生成core文件,jstack工具可以用来获得core文件的java stack和native stack的信息,从而可以轻松地知道java程序是如何崩溃和在程序何处发生问题。另外,jstack工具还可以附属到正在运行的java程序中,看到当时运行的java程序的java stack和native stack的信息, 如果现在运行的java程序呈现hung的状态,jstack是非常有用的。
语法
jstack [ options ] pid
jstack [ options ] executable core
jstack [ options ] [ server-id@ ] remote-hostname-or-IP
选项
- -F : 当正常输出请求不被响应时,强制输出线程堆栈
- -l : 除堆栈外,显示关于锁的附加信息
- -m : 如果调用到本地方法的话,可以显示C/C++的堆栈
[root@node1 ~]# jstack -F -l 2656 Attaching to process ID 2656, please wait... Debugger attached successfully. Server compiler detected. JVM version is 25.201-b09 Deadlock Detection: No deadlocks found. Thread 6760: (state = BLOCKED) - sun.misc.Unsafe.park(boolean, long) @bci=0 (Compiled frame; information may be imprecise) - java.util.concurrent.locks.LockSupport.parkNanos(java.lang.Object, long) @bci=20, line=215 (Compiled frame) - java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject.awaitNanos(long) @bci=78, line=2078 (Compiled frame) - org.eclipse.jetty.util.BlockingArrayQueue.poll(long, java.util.concurrent.TimeUnit) @bci=53, line=337 (Compiled frame) - org.eclipse.jetty.util.thread.QueuedThreadPool.idleJobPoll() @bci=12, line=517 (Compiled frame) - org.eclipse.jetty.util.thread.QueuedThreadPool.access$600(org.eclipse.jetty.util.thread.QueuedThreadPool) @bci=1, line=39 (Compiled frame) - org.eclipse.jetty.util.thread.QueuedThreadPool$3.run() @bci=275, line=563 (Compiled frame) - java.lang.Thread.run() @bci=11, line=748 (Interpreted frame) Locked ownable synchronizers:
jinfo
jinfo(JVM Configuration info)这个命令作用是实时查看和调整虚拟机运行参数。 之前的jps -v口令只能查看到显示指定的参数,如果想要查看未被显示指定的参数的值就要使用jinfo口令
语法
jinfo [ option ] pid
jinfo [ option ] executable core
jinfo [ option ] [ servier-id ] remote-hostname-or-IP
选项
- -flag : 输出指定args参数的值
- -flags : 不需要args参数,输出所有JVM参数的值
- -sysprops : 输出系统属性,等同于System.getProperties()
[root@node1 ~]# jinfo -flags 2656 Attaching to process ID 2656, please wait... Debugger attached successfully. Server compiler detected. JVM version is 25.201-b09 Non-default VM flags: -XX:CICompilerCount=2 -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=null -XX:InitialHeapSize=268435456 -XX:MaxHeapSize=268435456 -XX:MaxNewSize=89128960 -XX:MinHeapDeltaBytes=524288 -XX:NewSize=89128960 -XX:OldSize=179306496 -XX:OnOutOfMemoryError=null -XX:+UseCompressedClassPointers -XX:+UseCompressedOops -XX:+UseFastUnorderedTimeStamps -XX:+UseParallelGC Command line: -Xmx1000m -Dhadoop.log.dir=/opt/cloudera/parcels/CDH-5.15.1-1.cdh5.15.1.p0.4/lib/hadoop/logs -Dhadoop.log.file=hadoop.log -Dhadoop.home.dir=/opt/cloudera/parcels/CDH-5.15.1-1.cdh5.15.1.p0.4/lib/hadoop -Dhadoop.id.str= -Dhadoop.root.logger=INFO,console -Djava.library.path=/opt/cloudera/parcels/CDH-5.15.1-1.cdh5.15.1.p0.4/lib/hadoop/lib/native -Dhadoop.policy.file=hadoop-policy.xml -Djava.net.preferIPv4Stack=true -Djava.net.preferIPv4Stack=true -Xms268435456 -Xmx268435456 -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/tmp/sentry_sentry-SENTRY_SERVER-1041b0846850e06963272caabb1fd69f_pid2656.hprof -XX:OnOutOfMemoryError=/usr/lib64/cmf/service/common/killparent.sh -Dhadoop.security.logger=INFO,NullAppender
jhat
jhat(JVM Heap Analysis Tool)命令是与jmap搭配使用,用来分析jmap生成的dump,jhat内置了一个微型的HTTP/HTML服务器,生成dump的分析结果后,可以在浏览器中查看。在此要注意,一般不会直接在服务器上进行分析,因为jhat是一个耗时并且耗费硬件资源的过程,一般把服务器生成的dump文件复制到本地或其他机器上进行分析
语法:
jhat [ options ] heap-dump-file
选项
- -stack false|true 关闭对象分配调用栈跟踪(tracking object allocation call stack)。 如果分配位置信息在堆转储中不可用. 则必须将此标志设置为 false. 默认值为 true.>
- -refs false|true 关闭对象引用跟踪(tracking of references to objects)。 默认值为 true. 默认情况下, 返回的指针是指向其他特定对象的对象,如反向链接或输入引用(referrers or incoming references), 会统计/计算堆中的所有对象。>
- -port port-number 设置 jhat HTTP server 的端口号. 默认值 7000.>
- -exclude exclude-file 指定对象查询时需要排除的数据成员列表文件(a file that lists data members that should be excluded from the reachable objects query)。 例如, 如果文件列列出了 java.lang.String.value , 那么当从某个特定对象 Object o 计算可达的对象列表时, 引用路径涉及 java.lang.String.value 的都会被排除。>
- -baseline exclude-file 指定一个基准堆转储(baseline heap dump)。 在两个 heap dumps 中有相同 object ID 的对象会被标记为不是新的(marked as not being new). 其他对象被标记为新的(new). 在比较两个不同的堆转储时很有用.>
- -debug int 设置 debug 级别. 0 表示不输出调试信息。 值越大则表示输出更详细的 debug 信息.>
- -version 启动后只显示版本信息就退出>
- -J< flag > 因为 jhat 命令实际上会启动一个JVM来执行, 通过 -J 可以在启动JVM时传入一些启动参数. 例如, -J-Xmx512m 则指定运行 jhat 的Java虚拟机使用的最大堆内存为 512 MB. 如果需要使用多个JVM启动参数,则传入多个 -Jxxxxxx
[root@node1 ~]# jhat -J-Xmx512m hprof.dump Reading from hprof.dump... Dump file created Wed Feb 12 16:39:57 CST 2020 Snapshot read, resolving... Resolving 1024621 objects... WARNING: Class fda37e78 not found, adding fake class! WARNING: Class fd2d08d0 not found, adding fake class! WARNING: Class fcf1a358 not found, adding fake class! Chasing references, expect 204 dots............................................................................................................................................................................................................ Eliminating duplicate references............................................................................................................................................................................................................ Snapshot resolved. Started HTTP server on port 7000 Server is ready. 中间的-J-Xmx512m是在dump快照很大的情况下分配512M内存去启动HTTP服务器,运行完之后就可在浏览器打开Http://localhost:7000进行快照分析 堆快照分析主要在最后面的Heap Histogram里,里面根据class列出了dump的时候所有存活对象。 分析同样一个dump快照,MAT需要的额外内存比jhat要小的多的多,所以建议使用MAT来进行分析,当然也看个人偏好。
浏览器页面最下面有相关功能,一般查看堆异常情况主要看这个两个部分: Show instance counts for all classes (excluding platform),平台外的所有对象信息。如下图: