前言
作为一名 Java 从业者,虽然近几年,无论是使用规模、开发者人数,还是技术生态成熟度、相关工具的丰富程度,Java 都在后端开发语言中有着不可撼动的地位,也是开发各类业务系统的首选语言。
而且薪资也非常可观
(图源:职友集 2020年北京 Java 程序员的工资情况)
但很多同学却总有种“做不动”的感觉。项目还好说,用 Java 写系统代码都没有问题,可一旦有人问到 Java 程序运行起来以后内部发生了什么,怎么让它运行的更好?大多数同学就可能答不上来了。
而现在面试 Java 岗位,无论什么规模的公司,面试官必问到 JVM 相关的问题,什么线程、内存模型、JVM 运行时内存、垃圾回收与算法、GC 垃圾收集器、JAVA IO/NIO 、JVM 类加载机制等等知识点。
在面试中,这些问题如果答不好,可能直接影响你的薪资。
这里和大家分享一张 JVM 和性能优化大图,包含了 Java 工程师一定要花时间学会的 Java 内存区域、垃圾回收器和内存分配策略、JVM 的执行子系统、编写高效优雅 Java 程序、性能优化等等知识点。(感兴趣的同学可以关注公众号【程序员白楠楠】领取高清完整版图谱)
接下来就带大家详细了解一下,2020 年一线大厂技术面试 JVM 知识的必考问题,看看你能答出几道?
什么情况下会发生栈内存溢出。
详解JVM内存模型
JVM内存为什么要分成新生代,老年代,持久代。新生代中为什么要分为Eden和Survivor。
JVM中一次完整的GC流程是怎样的,对象如何晋升到老年代
你知道哪几种垃圾收集器,各自的优缺点,重点讲下cms和G1,包括原理,流程,优缺点。
说一说 JVM 运行时数据区?
GC 收集器有哪些?CMS 收集器与 G1 收集器的特点?
如何判断 Java 对象已经被回收?
垃圾回收算法有哪些?
堆和栈的区别是什么?
一什么情况下会发生栈内存溢出。
路思: 描述栈定义,再描述为什么会溢出,再说明一下相关配置参数,OK的话可以给面试官手写是一个栈溢出的demo。
我的答案:
- 栈是线程私有的,他的生命周期与线程相同,每个方法在执行的时候都会创建一个栈帧,用存储局部变量表,操作数栈,动态链接,方法出口等信息。局部变量表又包含基本数据类型,对象引用类型
- 如果线程请求的栈深度大于虚拟机所允许的最大深度,将抛出StackOverflowError异常,方递
- 归调用产生这种结果。
- 如果Java虚拟机栈可以动态扩展,并且扩展的动作已经尝试过,但是无法申请到足够的内去完成扩展,或者在新建立线程的时候没有足够的内存去创建对应的虚拟机栈,那么Java虚拟机将抛出一个OutOfMemory 异常。(线程启动过多)
- 参数 -Xss 去调整JVM栈的大小
二详解JVM内存模型
思路: 给面试官画一下JVM内存模型图,并描述每个模块的定义,作用,以及可能会存在的题,如栈溢出等。
我的答案:
JVM内存结构
程序计数器:当前线程所执行的字节码的行号指示器,用于记录正在执行的虚拟机字节指令地址,线程私有。
Java虚拟栈:存放基本数据类型、对象的引用、方法出口等,线程私有。
Native方法栈:和虚拟栈相似,只不过它服务于Native方法,线程私有。
Java堆:java内存最大的一块,所有对象实例、数组都存放在java堆,GC回收的地方,线程共享。
方法区:存放已被加载的类信息、常量、静态变量、即时编译器编译后的代码数据等。(即永久带),回收目标主要是常量池的回收和类型的卸载,各线程共享
三JVM内存为什么要分成新生代,老年代,持久代。新生代中为什么要分为Eden和Survivor。
思路: 先讲一下JAVA堆,新生代的划分,再谈谈它们之间的转化,相互之间一些参数的配(如: –XX:NewRatio,–XX:SurvivorRatio等),再解释为什么要这样划分,最好加一点自己的理解。
我的答案:
1)共享内存区划分
- 共享内存区 = 持久带 + 堆
- 持久带 = 方法区 + 其他
- Java堆 = 老年代 + 新生代
- 新生代 = Eden + S0 + S1
2)一些参数的配置
- 默认的,新生代 ( Young ) 与老年代 ( Old ) 的比例的值为 1:2 ,可以通过参数 –XX:NewRatio 配置。
- 默认的,Edem : from : to = 8 : 1 : 1 ( 可以通过参数 –XX:SurvivorRatio 来设定)
- Survivor区中的对象被复制次数为15(对应虚拟机参数 -XX:+MaxTenuringThreshold)
3)为什么要分为Eden和Survivor?为什么要设置两个Survivor区?
- 如果没有Survivor,Eden区每进行一次Minor GC,存活的对象就会被送到老年代。老年代很快被填满,触发Major GC.老年代的内存空间远大于新生代,进行一次Full GC消耗的时间比Minor GC长得多,所以需要分为Eden和Survivor。
- Survivor的存在意义,就是减少被送到老年代的对象,进而减少Full GC的发生,Survivor的预筛选保证,只有经历16次Minor GC还能在新生代中存活的对象,才会被送到老年代。
- 设置两个Survivor区最大的好处就是解决了碎片化,刚刚新建的对象在Eden中,经历一次MinorGC,Eden中的存活对象就会被移动到第一块survivor space S0,Eden被清空;等Eden区再满了,就再触发一次Minor GC,Eden和S0中的存活对象又会被复制送入第二块survivor spaceS1(这个过程非常重要,因为这种复制算法保证了S1中来自S0和Eden两部分的存活对象占用连续的内存空间,避免了碎片化的发生)
四说一说 JVM 运行时数据区?
不同虚拟机的运行时数据区可能略微有所不同,但都会遵从 Java 虚拟机规范, Java 虚拟机规范规定的区域分为以下 5 个部分:
程序计数器
当前线程所执行的字节码的行号指示器,字节码解析器的工作是通过改变这个计数器的值,来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能;
Java 虚拟机栈
用于存储局部变量表、操作数栈、动态链接、方法出口等信息;
本地方法栈
与虚拟机栈的作用是一样的,只不过虚拟机栈是服务 Java 方法的,而本地方法栈是为虚拟机调用 Native 方法服务的;
Java 堆
Java 虚拟机中内存最大的一块,是被所有线程共享的,几乎所有的对象实例都在这里分配内存;
方法区
用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译后的代码等数据。
五、GC 收集器有哪些?
并行收集器:串行收集器使用一个单独的线程进行收集,GC 时服务有停顿时间。
串行收集器:次要回收中使用多线程来执行。
CMS 收集器是基于“标记—清除”算法实现的,经过多次标记才会被清除。
G1 从整体来看是基于“标记—整理”算法实现的收集器,从局部(两个 Region 之间)上来看是基于“复制”算法实现的。
六、如何判断 Java 对象已经被回收?
1、引用计数算法
为每个对象创建一个引用计数,有对象引用时计数器 +1,引用被释放时计数 -1,当计数器为 0 时就可以被回收。它有一个缺点不能解决循环引用的问题;
2、可达性分析法
从 GC Roots 开始向下搜索,搜索所走过的路径称为引用链。当一个对象到 GC Roots 没有任何引用链相连时,则证明此对象是可以被回收的。
GC Roots:
1.虚拟机栈(本地变量表)引用的对象。
2.方法区静态属性引用的对象。
3.方法区常量引用的对象。
4.本地方法栈JNI(一般指naive方法)中引用的对象
图示 Object6、7、8 与起始点没有任何引用链,则说明不可用,需要被回收。
七、垃圾回收算法有哪些?
1、标记-清除(Mark-Sweep)
此算法执行分两阶段。第一阶段从引用根节点开始标记所有被引用的对象,第二阶段遍历整个堆,把未标记的对象清除。此算法需要暂停整个应用, 同时,会产生内存碎片。
2、复制(Copying)
此算法把内存空间划为两个相等的区域,每次只使用其中一个区域。垃圾回收时,遍历当前使用区域,把正在使用中的对象复制到另外一个区域中。
每次只处理正在使用中的对象,因此复制成本比较小,同时复制过去以后还能进行相应的内存整理,不会出现“碎片”问题。当然,缺点也是很明显的,需要两倍内存间。
3、标记-整理(Mark-Compact)
结合了前两个算法的优点,也是分两阶段,第一阶段从根节点开始标记所有被引用对象,第二阶段遍历整个堆,清除标记对象,并未标记对象并且把存活对象“压缩”到堆的其中一块,按顺序排放。
此算法避免了“标记-清除”的碎片问题,同时也避免了“复制”算法的空间问题。
总结
以上资料均出自阿里P8架构师,整理的《2020Java技术栈面试总结合集》
划重点!这份Java资源中包括:
Java、面向对象、多态、接口、IDEA、异常、集合框架、IO流、多线程、企业级框架、HTML、数据库、Java web、项目实战、GitHub、Spring、多线程、JVM、集合、多线程、MyBatis、MySQL、Git、IDEA、Redis、算法、简历模板、高频面试题、技术书籍、工具包、面试题等内容...
由于篇幅限制,小编这里只将此笔记文档的所含内容的一部分展现出来了,需要获取完整文档用以学习的朋友们可以关注公众号【程序员白楠楠】免费领取!
重要的事情说三遍,转发+转发+转发,一定要记得点赞转发哦!!!