zoukankan      html  css  js  c++  java
  • 字符串常量池理解

    在JVM中,为了减少字符串对象的重复创建,维护了一块特殊的内存空间,这块内存就被称为字符串常量池。

    在JDK1.6及之前,字符串常量池存放在方法区中。到JDK1.7之后,就从方法区中移除了,而存放在堆中。以下是《深入理解Java虚拟机》第二版原文:

    对于HotSpot虚拟机,根据官方发布的路线图信息,现在也有放弃永久代并逐步改为采用Native Memory来实现方法区的规划了,在目前已经发布的JDK1.7 的HotSpot中,已经把原本放在永久代的字符串常量池移出。

    我们知道字符串常量一般有两种创建方式:

    1. 使用字符串字面量定义
    String s = "aa";
    
    1. 通过new创建字符串对象
    String s = new String("aa");
    

    那这两种方式有什么区别呢?

    第一种方式通过字面量定义一个字符串时,JVM会先去字符串常量池中检查是否存在“aa”这个对象。如果不存在,则在字符串常量池中创建“aa”对象,并将引用返回给s,这样s的引用就指向字符串常量池中的“aa”对象。如果存在,则不创建任何对象,直接把常量池中“aa”对象的地址返回,赋值给s。

    第二种方式通过new关键字创建一个字符串时,我们需要知道创建了几个对象,这也是面试中经常问到的。首先,会在字符串常量池中创建一个"aa"对象。然后执行new String时会在堆中创建一个“aa”的对象,然后把s的引用指向堆中的这个“aa”对象。

    思考以下代码的打印结果:

    public class StringTest {
        public static void main(String[] args) {
            //创建了两个对象,一份存在字符串常量池中,一份存在堆中
            String s = new String("aa");
            //检查常量池中是否存在字符串aa,此处存在则直接返回
            String s1 = s.intern();
            String s2 = "aa";
    
            System.out.println(s == s2);  //①
            System.out.println(s1 == s2); //②
    
            String s3 = new String("b") + new String("b");
            //常量池中没有bb,在jdk1.7之后会把堆中的引用放到常量池中,故引用地址相等
            String s4 = s3.intern();
            String s5 = "bb";
    
            System.out.println(s3 == s5 ); //③
            System.out.println(s4 == s5);  //④
    
        }
    }
    

    以上的①②③④四个地方应该输出true还是false呢?别着急,先看下,代码中用到了intern方法。这个方法的作用是,在运行期间可以把新的常量放入到字符串常量池中。

    看下String源码中对intern方法的解释:

    file

    字面意思就是,当调用这个方法时,会去检查字符串常量池中是否已经存在这个字符串,如果存在的话,就直接返回,如果不存在的话,就把这个字符串常量加入到字符串常量池中,然后再返回其引用。

    但是,其实在JDK1.6和 JDK1.7的处理方式是有一些不同的。

    在JDK1.6中,如果字符串常量池中已经存在该字符串对象,则直接返回池中此字符串对象的引用。否则,将此字符串的对象添加到字符串常量池中,然后返回该字符串对象的引用。

    在JDK1.7中,如果字符串常量池中已经存在该字符串对象,则返回池中此字符串对象的引用。否则,如果堆中已经有这个字符串对象了,则把此字符串对象的引用添加到字符串常量池中并返回该引用,如果堆中没有此字符串对象,则先在堆中创建字符串对象,再返回其引用。(这也说明,此时字符串常量池中存储的是对象的引用,而对象本身存储于堆中)

    于是代码中,String s = new String("aa");创建了两个“aa”对象,一个存在字符串常量池中,一个存在堆中。

    String s1 = s.intern(); 由于字符串常量池中已经存在“aa”对象,于是直接返回其引用,故s1指向字符串常量池中的对象。

    String s2 = "aa"; 此时字符串常量池中已经存在“aa”对象,所以也直接返回,故 s2和 s1的地址相同。②返回true。

    System.out.println(s == s2); 由于s的引用指向的是堆中的“aa”对象,s2指向的是常量池中的对象。故不相等,①返回false。

    String s3 = new String("b") + new String("b"); 先说明一下,这种形式的字符串拼接,等同于使用StringBuilder的append方法把两个“b”拼接,然后调用toString方法,new出“bb”对象,因此“bb”对象是在堆中生成的。所以,这段代码最终生成了两个对象,一个是“b”对象存在于字符串常量池中,一个是 “bb”对象,存在于堆中,但是此时字符串常量池中是没有“bb”对象的。 s3指向的是堆中的“bb”对象。

    String s4 = s3.intern(); 调用了intern方法之后,在JDK1.6中,由于字符串常量池中没有“bb”对象,故创建一个“bb”对象,然后返回其引用。所以 s4 这个引用指向的是字符串常量池中新创建的“bb”对象。在JDK1.7中,则把堆中“bb”对象的引用添加到字符串常量池中,故s4和s3所指向的对象是同一个,都指向堆中的“bb”对象。

    String s5 = "bb"; 在JDK1.6中,指向字符串常量池中的“bb”对象的引用,在JDK1.7中指向的是堆中“bb”对象的引用。

    System.out.println(s3 == s5 ); 参照以上分析即可知道,在JDK1.6中③返回false(因为s3指向的是堆中的“bb”对象,s5指向的是字符串常量池中的“bb”对象),在JDK1.7中,③返回true(因为s3和s5指向的都是堆中的“bb”对象)。

    System.out.println(s4 == s5); 在JDK1.6中,s4和s5指向的都是字符串常量池中创建的“bb”对象,在JDK1.7中,s4和s5指向的都是堆中的“bb”对象。故无论JDK版本如何,④都返回true。

    综上,在JDK1.6中,返回的结果为:

    false
    true
    false
    true
    

    在JDK1.7中,返回结果为:

    false
    true
    true
    true
    

    以上,可以在JDK1.7和JDK1.6中分别验证。注意一下,最好搞两个项目然后分别设置不同的JDK,因为如果在一个项目中直接更改JDK版本,有可能高版本编译之后,低版本编译不通过。

    原理搞懂了,我们再思考一下以下代码的结果:

    public class InternTest {
        public static void main(String[] args) {
            String str1 = "xy";
            String str2 = "z";
            String str3 = "xyz";
            String str4 = str1 + str2;
            String str5 = str4.intern();
            String str6 = "xy" + "z";
    
            System.out.println(str3 == str4); //⑤
            System.out.println(str3 == str5); //⑥
            System.out.println(str3 == str6); //⑦
        }
    }
    

    我们分析一下。

    str1、str2和str3都是简单的定义字符串,所有它们都是在字符串常量池中创建对象,然后引用指向字符串常量池中的对象。

    String str4 = str1 + str2; 这段代码和之前的 String s3 = new String("b") + new String("b"); 原理相同,因此在堆中创建了一个“xyz”对象,然后str4指向堆中的这个对象。故⑤处返回false。(str3指向的是字符串常量池中的“xyz”对象)

    String str5 = str4.intern(); 由于字符串常量池中已经存在“xyz”对象,因此不论是JDK1.6还是JDK1.7,此处返回的都是字符串常量池中对象的引用。所以str5指向字符串常量池中的对象,故 ⑥返回true。

    String str6 = "xy" + "z"; 这段代码需要说明一下,它不同于两个字符串的引用拼接(如str1 + str2)。JVM会对其优化处理,也就是在编译阶段会把“xy”和“z”进行拼接成为“xyz”,存放在字符串常量池。因此,str6指向的是字符串常量池的对象,故⑦返回true。

  • 相关阅读:
    IDEA 基本配置
    IDEA 创建一个普通的java项目
    Intellij Idea 创建一个Web项目
    override的实现原理
    elasticsearch 复杂查询小记
    post 中文数据到elasticsearch restful接口报json_parse_exception 问题
    String intern()方法详解
    JVM的DirectMemory设置
    深入浅出 JIT 编译器
    为什么 JVM 不用 JIT 全程编译
  • 原文地址:https://www.cnblogs.com/starry-skys/p/12285241.html
Copyright © 2011-2022 走看看