1 官网
1.1 寻找JDK文档过程
www.oracle.com -> 右下角Product Documentation -> 往下拉选择Java -> Java SE documentation
-> Previous releases -> JDK 8 -> 此时定位到:https://docs.oracle.com/javas...
1.2 The relation of JDK/JRE/JVM
Reference -> Developer Guides -> 定位到:https://docs.oracle.com/javas...
Oracle has two products that implement Java Platform Standard Edition (Java SE) 8: Java SE
Development Kit (JDK) 8 and Java SE Runtime Environment (JRE) 8.
JDK 8 is a superset of JRE 8, and contains everything that is in JRE 8, plus tools such as the
compilers and debuggers necessary for developing applets and applications. JRE 8 provides the
libraries, the Java Virtual Machine (JVM), and other components to run applets and applications
written in the Java programming language. Note that the JRE includes components not required by
the Java SE specification, including both standard and non-standard Java components.
2 源码到类文件
2.1 源码
1 java 2 class Person{ 3 private String name; 4 private int age; 5 private static String address; 6 private final static String hobby="Programming"; 7 public void say(){ 8 System.out.println("person say..."); 9 } 10 public int calc(int op1,int op2){ 11 return op1+op2; 12 } 13 }
编译: javac Person.java ---> Person.class
2.2 编译过程
Person.java -> 词法分析器 -> tokens流 -> 语法分析器 -> 语法树/抽象语法树 -> 语义分析器-> 注解抽象语法树 -> 字节码生成器 -> Person.class文件
2.3 类文件(Class文件)
官网TheclassFileFormat:
https://docs.oracle.com/javas...
cafe babe 0000 0034 0027 0a00 0600 1809 0019 001a 0800 1b0a 001c 001d 0700 1e07 001f 0100 046e 616d 6501 0012 4c6a 6176 612f 6c61 6e67 2f53 7472 696e 673b 0100 0361 6765 0100 0149 0100 0761 6464 7265
......
magic(魔数):
The magic
item supplies the magic number identifying the class
file format; it has the value 0xCAFEBABE
.
cafe babe
minor_version, major_version
0000 0034 对应10进制的52,代表JDK 8中的一个版本
constant_pool_count
0027 对应十进制27,代表常量池中27个常量
1 ClassFile { 2 u4 magic; 3 u2 minor_version; 4 u2 major_version; 5 u2 constant_pool_count; 6 cp_info constant_pool[constant_pool_count-1]; 7 u2 access_flags; 8 u2 this_class; 9 u2 super_class; 10 u2 interfaces_count; 11 u2 interfaces[interfaces_count]; 12 u2 fields_count; 13 field_info fields[fields_count]; 14 u2 methods_count; 15 method_info methods[methods_count]; 16 u2 attributes_count; 17 attribute_info attributes[attributes_count]; 18 }
.class字节码文件
- 魔数与class文件版本
- 常量池
- 访问标志
- 类索引、父类索引、接口索引
- 字段表集合
- 方法表集合
- 属性表集合
2.4 javap文件分解器
javap -c Person.class > Person.txt
查看字节码信息:结构信息/元数据/方法信息
Compiled from "Person.java"
1 class Person { 2 Person(); 3 Code: 4 0: aload_0 5 1: invokespecial #1 // Method java/lang/Object."<init>":()V 6 4: return
public void say(); Code: 0: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream; 3: ldc #3 // String person say... 5: invokevirtual #4 // Method java/io/PrintStream.println:(Ljava/lang/String;)V 8: return
public int calc(int, int); Code: 0: iload_1 1: iload_2 2: iadd 3: ireturn }
3 类文件到虚拟机(类加载机制)
类加载机制
虚拟机把Class文件加载到内存
并对数据进行校验,转换解析和初始化
形成可以虚拟机直接使用的Java类型,即java.lang.Class
3.1 装载(Load)
查找和导入class文件
(1)通过一个类的全限定名获取定义此类的二进制字节流
(2)将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
(3)在Java堆中生成一个代表这个类的java.lang.Class对象,作为对方法区中这些数据的访问入口
3.2 链接(Link)
3.2.1 验证(Verify)
保证被加载类的正确性
- 文件格式验证
- 元数据验证
- 字节码验证
- 符号引用验证
3.2.2 准备(Prepare)
为类的静态变量分配内存,并将其初始化为默认值
3.2.3 解析(Resolve)
把类中的符号引用转换为直接引用
3.3 初始化(Initialize)
对类的静态变量,静态代码块执行初始化操作
3.4 类加载机制图解
使用和卸载不算是类加载过程中的阶段,只是画完整了一下
4 类装载器ClassLoader
在装载(Load)阶段,其中第(1)步:通过类的全限定名获取其定义的二进制字节流,需要借助类装载器完成,顾名思义,就是用来装载Class文件的。
(1)通过一个类的全限定名获取定义此类的二进制字节流
4.1 分类
- Bootstrap ClassLoader 负责加载$JAVA_HOME中 jre/lib/rt.jar里所有的class或Xbootclassoath选项指定的jar包。由C++实现,不是ClassLoader子类。
- Extension ClassLoader负责加载java平台中扩展功能的一些jar包,包括$JAVA_HOME中jre/lib/*.jar 或-Djava.ext.dirs指定目录下的jar包。
- App ClassLoader 负责加载classpath中指定的jar包及 Djava.class.path所指定目录下的类和jar包。
- Custom ClassLoader通过java.lang.ClassLoader的子类自定义加载class,属于应用程序根据自身需要自定义的ClassLoader,如tomcat、jboss都会根据j2ee规范自行实现ClassLoader。
4.2 图解
4.3 加载原则
检查某个类是否已经加载:顺序是自底向上,从Custom ClassLoader到BootStrap ClassLoader逐层检查,只要某个Classloader已加载,就视为已加载此类,保证此类只所有ClassLoader加载一次。
加载的顺序:加载的顺序是自顶向下,也就是由上层来逐层尝试加载此类。
双亲委派机制
定义:如果一个类加载器在接到加载类的请求时,它首先不会自己尝试去加载这个类,而是把这个请求任务委托给父类加载器去完成,依次递归,如果父类加载器可以完成类加载任务,就成功返回;只有父类加载器无法完成此加载任务时,才自己去加载。
优势:Java类随着加载它的类加载器一起具备了一种带有优先级的层次关系。比如,Java中的Object类,它存放在rt.jar之中,无论哪一个类加载器要加载这个类,最终都是委派给处于模型最顶端的启动类加载器进行加载,因此Object在各种类加载环境中都是同一个类。如果不采用双亲委派模型,那么由各个类加载器自己取加载的话,那么系统中会存在多种不同的Object类。
5 运行时数据区(Run-Time Data Areas)
在装载阶段的第(2),(3)步可以发现有运行时数据,堆,方法区等名词
(2)将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
(3)在Java堆中生成一个代表这个类的java.lang.Class对象,作为对方法区中这些数据的访问入口
说白了就是类文件被类装载器装载进来之后,类中的内容(比如变量,常量,方法,对象等这些数据得要有个去处,也就是要存储起来,存储的位置肯定是在JVM中有对应的空间)
5.1 官网概括
https://docs.oracle.com/javas...
Summary
The Java Virtual Machine defines various run-time data areas that are used during execution of a program. Some of these data areas are created on Java Virtual Machine start-up and are destroyed only when the Java Virtual Machine exits. Other data areas are per thread. Per-thread data areas are created when a thread is created and destroyed when the thread exits.
5.2 图解
5.3 常规理解
5.3.1 Method Area(方法区)
方法区是各个线程共享的内存区域,在虚拟机启动时创建。
用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却又一个别名叫做Non-Heap(非堆),目的是与Java堆区分开来。
当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常。
The Java Virtual Machine has a method area that is shared among all Java Virtual Machine threads.
The method area is created on virtual machine start-up.
Although the method area is logically part of the heap,......
If memory in the method area cannot be made available to satisfy an allocation request, the Java Virtual Machine throws an OutOfMemoryError.
此时回看装载阶段的第2步:
(2)将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
如果这时候把从Class文件到装载的第(1)和(2)步合并起来理解的话,可以画个图
值得说明的
(1)方法区在JDK 8中就是Metaspace,在JDK6或7中就是Perm Space
(2)Run-Time Constant Pool
Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息就是常量池,用于存放编译时期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。
Each run-time constant pool is allocated from the Java Virtual Machine's method area (§2.5.4).s
5.3.2 Heap(堆)
Java堆是Java虚拟机所管理内存中最大的一块,在虚拟机启动时创建,被所有线程共享。
Java对象实例以及数组都在堆上分配。
The Java Virtual Machine has a heap that is shared among all Java Virtual Machine threads. The heap is the run-time data area from which memory for all class instances and arrays is allocated.
The heap is created on virtual machine start-up.
此时回看装载阶段的第3步:
(3)在Java堆中生成一个代表这个类的java.lang.Class对象,作为对方法区中这些数据的访问入口
此时装载(1)(2)(3)的图可以改动一下
5.3.3 Java Virtual Machine Stacks(虚拟机栈)
经过上面的分析,类加载机制的装载过程已经完成,后续的链接,初始化也会相应的生效。
假如目前的阶段是初始化完成了,后续做啥呢?肯定是Use使用咯,不用的话这样折腾来折腾去有什么意义?那怎样才能被使用到?换句话说里面内容怎样才能被执行?比如通过主函数main调用其他方法,这种方式实际上是main线程执行之后调用的方法,即要想使用里面的各种内容,得要以线程为单位,执行相应的方法才行。
那一个线程执行的状态如何维护?一个线程可以执行多少个方法?这样的关系怎么维护呢?
虚拟机栈是一个线程执行的区域,保存着一个线程中方法的调用状态。换句话说,一个Java线程的运行状态,由一个虚拟机栈来保存,所以虚拟机栈肯定是线程私有的,独有的,随着线程的创建而创建。
每一个被线程执行的方法,为该栈中的栈帧,即每个方法对应一个栈帧。
调用一个方法,就会向栈中压入一个栈帧;一个方法调用完成,就会把该栈帧从栈中弹出。
Each Java Virtual Machine thread has a private Java Virtual Machine stack, created at the same time as the thread. A Java Virtual Machine stack stores frames (§2.6).
画图理解栈和栈帧
栈帧:每个栈帧对应一个被调用的方法,可以理解为一个方法的运行空间。
A frame is used to store data and partial results, as well as to perform dynamic linking, return values for methods, and dispatch exceptions.
A new frame is created each time a method is invoked. A frame is destroyed when its method invocation completes, whether that completion is normal or abrupt (it throws an uncaught exception).
......
Note that a frame created by a thread is local to that thread and cannot be referenced by any other thread.
每个栈帧中包括局部变量表(Local Variables)、操作数栈(Operand Stack)、指向运行时常量池的引用(A reference to the run-time constant pool)、方法返回地址(Return Address)和附加信息。
局部变量表:方法中定义的局部变量以及方法的参数存放在这张表中局部变量表中的变量不可直接使用,如需要使用的话,必须通过相关指令将其加载至操作数栈中作为操作数使用。
操作数栈:以压栈和出栈的方式存储操作数的
动态链接:每个栈帧都包含一个指向运行时常量池中该栈帧所属方法的引用,持有这个引用是为了支持方法调用过程中的动态连接(Dynamic Linking)。
方法返回地址:当一个方法开始执行后,只有两种方式可以退出,一种是遇到方法返回的字节码指令;一种是遇见异常,并且这个异常没有在方法体内得到处理。
5.3.4 The pc Register(程序计数器)
我们都知道一个JVM进程中有多个线程在执行,而线程中的内容是否能够拥有执行权,是根据CPU调度来的。
假如线程A正在执行到某个地方,突然失去了CPU的执行权,切换到线程B了,然后当线程A再获得CPU执行权的时候,怎么能继续执行呢?这就是需要在线程中维护一个变量,记录线程执行到的位置。
程序计数器占用的内存空间很小,由于Java虚拟机的多线程是通过线程轮流切换,并分配处理器执行时间的方式来实现的,在任意时刻,一个处理器只会执行一条线程中的指令。因此,为了线程切换后能够恢复到正确的执行位置,每条线程需要有一个独立的程序计数器(线程私有)。
如果线程正在执行Java方法,则计数器记录的是正在执行的虚拟机字节码指令的地址;
如果正在执行的是Native方法,则这个计数器为空。
The Java Virtual Machine can support many threads of execution at once (JLS §17). Each Java
Virtual Machine thread has its own pc (program counter) register. At any point, each Java Virtual
Machine thread is executing the code of a single method, namely the current method (§2.6) for
that thread. If that method is not native, the pc register contains the address of the Java
Virtual Machine instruction currently being executed. If the method currently being executed by
the thread is native, the value of the Java Virtual Machine's pc register is undefined. The Java
Virtual Machine's pc register is wide enough to hold a returnAddress or a native pointer on the
specific platform.
5.3.5 Native Method Stacks(本地方法栈)
如果当前线程执行的方法是Native类型的,这些方法就会在本地方法栈中执行。
5.4 结合字节码指令理解虚拟机栈
1 java 2 class Person{ 3 private String name="Jack"; 4 private int age; 5 private final double salary=100; 6 private static String address; 7 private final static String hobby="Programming"; 8 private Object obj=new Object(); 9 public void say(){ 10 System.out.println("person say..."); 11 } 12 public static int calc(int op1,int op2){ 13 op1=3; 14 int result=op1+op2; 15 Object o=obj; 16 return result; 17 } 18 public static void main(String[] args){ 19 System.out.println(calc(1,2)); 20 } 21 }
此时你需要一个能够看懂反编译指令的宝典
比如我给大家准备了一个:https://www.jianshu.com/p/0cd...
1 java 2 Compiled from "Person.java" 3 class Person { 4 Person(); 5 Code: 6 0: aload_0 7 1: invokespecial #1 // Method java/lang/Object."<init>":()V 8 4: aload_0 9 5: ldc #2 // String Jack 10 7: putfield #3 // Field name:Ljava/lang/String; 11 10: aload_0 12 11: ldc2_w #4 // double 100.0d 13 14: putfield #6 // Field salary:D 14 17: aload_0 15 18: new #7 // class java/lang/Object 16 21: dup 17 22: invokespecial #1 // Method java/lang/Object."<init>":()V 18 25: putfield #8 // Field obj:Ljava/lang/Object; 19 28: return
1 public void say(); 2 Code: 3 0: aload_0 4 1: getfield #8 // Field obj:Ljava/lang/Object; 5 4: astore_1 6 5: getstatic #9 // Field java/lang/System.out:Ljava/io/PrintStream; 7 8: ldc #10 // String person say... 8 10: invokevirtual #11 // Method java/io/PrintStream.println:(Ljava/lang/String;)V 9 13: return
1 public static int calc(int, int); 2 Code: 3 0: iconst_3 //将int类型常量3压入操作数栈 4 1: istore_0 //将int类型值存入局部变量0 5 2: iload_0 //从局部变量0中装载int类型值 6 3: iload_1 //从局部变量1中装载int类型值 7 4: iadd //执行int类型的加法 8 5: istore_2 //将int类型值存入局部变量2 9 6: iload_2 //从局部变量2中装载int类型值 10 7: ireturn //从方法中返回int类型的数据
1 public static void main(java.lang.String[]); 2 Code: 3 0: getstatic #9 // Field java/lang/System.out:Ljava/io/PrintStream; 4 3: iconst_1 5 4: iconst_2 6 5: invokestatic #12 // Method calc:(II)I 7 8: invokevirtual #13 // Method java/io/PrintStream.println:(I)V 8 11: return 9 }
5.5 结合类加载机制理解运行时数据区
5.5.1 装载
- 通过一个类的全限定名获取定义此类的二进制字节流
- 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
- 在Java堆中生成一个代表这个类的java.lang.Class对象,作为对方法区中这些数据的访问入口
值得探讨的两个方向:(1)类的装载方式有哪些?(2)类装载到底做了什么?
类的装载方式有哪些?
(1)本地系统加载
(2)网络下载.class文件
(3)从zip,jar等归档文件中加载.class文件
(4)从数据库中提取.class文件
(5)由java源文件动态编译成.class文件
(6)Class.forName()加载
(7)ClassLoader.loadClass()加载
类装载到底做了什么?
(1)通过一个类的全限定名获取定义此类的二进制字节流
这个阶段是可控性比较强的阶段,既可以用系统提供的类加载器进行加载,又可以自定义类加载器进行加载。
(2)将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
方法区用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
说明:类信息
类的版本、字段、方法、构造方法、接口定义等
(3)类加载的最终产品是位于堆区中的Class对象。
Class对象封装了类在方法区内的数据结构,并且向Java程序员提供了访问方法区内的数据结构的接口。
在Java堆中生成一个代表这个类的java.lang.Class对象,作为对方法区中这些数据的访问入口
Java对象实例以及数组都在堆上分配Class类
java public final class Class<T> implements java.io.Serializable, GenericDeclaration, Type, AnnotatedElement {
5.5.2 链接
5.5.2.1 验证
保证被加载类的正确性
文件格式验证
验证字节流是否符合Class文件格式规范,比如是否以0xCAFEBABE开头,主次版本号是否在当前虚拟机的处理范围之内,常量池中的常量是否有不被支持的类型。
元数据验证
对字节码描述的信息进行语义分析,保证其符合Java语言规范的要求。
字节码验证
通过数据流和控制流分析,确定程序语义是合法的、符合逻辑的。
符号引用验证
确保解析动作能正确执行。
小结:验证阶段很重要,但不是必须的。若所引用的类经过反复验证没问题,可以使用-Xverifynone参数关闭大部分类验证措施,从而缩短虚拟机类加载的时间。
5.5.2.2 准备
为类的静态变量分配内存,并将其初始化为默认值
在方法区中,为类变量分配内容并设置初始值
(1)内存分配仅仅是类变量,也就是static类型的变量。不包含实例变量,实例变量会在对象实例化时随对象分配在堆中。
(2)这里的默认值是根据类型赋值,不是在代码中显示赋予的值。
5.5.2.3 解析
把类中的符号引用转换为直接引用
Run-Time Constant Pool
Class文件中除了有类的版本、字段、方法、接口等描述 信息外,还有一项信息就是常量池,用于存放编译时期生
成的各种字面量和符号引用,这部分内容将在类加载后进 入方法区的运行时常量池中存放。
解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。
解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用限定符7类符号引用进行。
符号引用就是一组符号来描述目标,可以是任何字面量。
直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。
5.5.3 初始化
执行类构造器<clinit>,为类的静态变量赋予正确的初始值,有两种方式
(1)直接给类变量指定初始值
(2)通过静态代码块为类变量指定初始值
类的初始化步骤
(1)如果这个类还没有被加载和链接,那先进行加载和链接
(2)假如这个类存在直接父类,并且这个类还没有被初始化(在一个类加载器中,类只能初始化一次),那就初始化直接的父类(不适用于接口)
(3)假如类中存在初始化语句(如static变量和static块),那就依次执行这些初始化语句。
类什么时候才会被初始化?
(1)创建类的实例
(2)访问某个类或接口的静态变量,或者对该静态变量进行赋值
(3)调用类的静态方法
(4)反射[Class.forName("com.XXX")]
(5)初始化一个类的子类(因为会先初始化父类)
(6)JVM启动时表明的启动类
文章转载自微信公众号:Java架构师学习。
喜欢本文的朋友在下方点个推荐吧!