90%的同学都没搞清楚的 Java 字符串常量池问题(图文并茂)

来自公众号:古时的风筝
作者:风筝

字符串问题可谓是 Java 中经久不衰的问题,尤其是字符串常量池经常作为面试题出现。可即便是看似简单而又经常被提起的问题,还是有好多同学一知半解,看上去懂了,仔细分析起来却又发现不太明白。

背景说明

本文以 JDK 1.8 为讨论版本,虽然现在都已经 JDK 14了,奈何我们还是钟爱 1.8。

一个提问引起的讨论

为什么说到字符串常量呢,源于群里为数不多的一个程序员小姐姐的提问。

image

这本来和字符串常量没有关系,后来,一个同学说不只是 int ,换成 String 一样可以。

image

为什么会有"Java开发_北京"这么奇特的字符串乱入呢,因为提出问题的这位小姐姐的群昵称叫这个,所以群里的同学开玩笑说,以为她是某个房地产大佬,要来开发北京。

image

以上是开个玩笑,好了,收。

字符串用 == 比较也是 true,这就有意思了。马上有机灵的小伙伴说这和字符串常量池有关系。没错,就是因为字符串常量池的原因。

第一张图其实没什么好说的,在 JDK 1.8 之后已经不允许 Object 和 int 类型用 == 相比较了,编译直接报错。

第二张图中的代码才是重点要说的,我们可以把它简化成下面这段代码,用 == 符号比较字符串,之后的内容都从这几行代码出发。

public static void main(String[] args) {
  String s1 = "古时的风筝";
  System.out.println(s1 == "古时的风筝");
}

当然,实际开发中强烈不推荐用 == 符号判断两个字符串是否相等,应该用 equals() 方法。

字符串常量池何许人也

为什么要有字符串常量池呢,像其他对象一样直接存在堆中不行吗,这就要问 Java 语言的设计者了,当然,这么做也并不是拍脑袋想出来的。

这就要从字符串说起。

首先对象的分配要付出时间和空间上的开销,字符串可以说是和 8 个基本类型一样常用的类型,甚至比 8 个基本类型更加常用,故而频繁的创建字符串对象,对性能的影响是非常大的,所以,用常量池的方式可以很大程度上降低对象创建、分配的次数,从而提升性能。

在 JDK 1.7 之后(包括1.7),字符串常量池已经从方法区移到了堆中。

字面量赋值

我们把上面的那个实例代码拿过来

String s1 = "古时的风筝";

这是我们平时声明字符串变量的最常用的方式,这种方式叫做字面量声明,也就用把字符串用双引号引起来,然后赋值给一个变量。

这种情况下会直接将字符串放到字符串常量池中,然后返回给变量。

image

那这时我再声明一个内容相同的字符串,会发现字符串常量池中已经存在了,那直接指向常量池中的地址即可。

image

例如上图所示,声明了 s1 和 s2,到最后都是指向同一个常量池的地址,所以 s1== s2 的结果是 true。

new String() 方式

与之对应的是用 new String() 的方式,但是基本上不建议这么用,除非有特殊的逻辑需要。

String s2 = new String("古时的风筝");

使用这种方式声明字符串变量的时候,会有两种情况发生。

第一种情况,字符串常量池之前已经存在相同字符串

比如在使用 new 之前,已经用字面量声明的方式声明了一个变量,此时字符串常量池中已经存在了相同内容的字符串常量。

  1. 首先会在堆中创建一个 s2 变量的对象引用;

  2. 然后将这个对象引用指向字符串常量池中的已经存在的常量;

image
第二种情况,字符串常量池中不存在相同内容的常量

之前没有任何地方用到了这个字符串,第一次声明这个字符串就用的是 new String() 的方式,这种情况下会直接在堆中创建一个字符串对象然后返回给变量。

image

我看到好多地方说,如果字符串常量池中不存在的话,就先把字符串先放进去,然后再引用字符串常量池的这个常量对象,这种说法是有问题的,只是 new String() 的话,如果池中没有也不会放一份进去。

基于 new String() 的这种特性,我们可以得出一个结论:

String s1 = "古时的风筝";
String s2 = new String("古时的风筝");
String s3 = new String("古时的风筝");
System.out.println(s1==s2); // false
System.out.println(s2==s3);  // false

以上代码,肯定输出的都是 false,因为 new String() 不管你常量池中有没有,我都会在堆中新建一个对象,新建出来的对象,当然不会和其他对象相等。

intern() 池化

那什么时候会放到字符串常量池呢,就是在使用 intern() 方法之后。

intern() 的定义:如果当前字符串内容存在于字符串常量池,存在的条件是使用 equas() 方法为ture,也就是内容是一样的,那直接返回此字符串在常量池的引用;如果之前不在字符串常量池中,那么在常量池创建一个引用并且指向堆中已存在的字符串,然后返回常量池中的地址。

第一种情况,准备池化的字符串与字符串常量池中的字符串有相同(equas()判断)
String s1 = "古时的风筝";
String s2 = new String("古时的风筝");
s2 = s2.intern();

这时,这个字符串常量已经在常量池存在了,这时,再 new 了一个新的对象 s2,并在堆中创建了一个相同字符串内容的对象。

image

这时,s1 == s2 会返回 fasle。然后我们调用 s2 = s2.intern(),将池化操作返回的结果赋值给 s2,就会发生如下的变化。

image

此时,再次判断 s1 == s2 ,就会返回 true,因为它们都指向了字符串常量池的同一个字符串。

第二种情况,字符串常量池中不存在相同内容的字符串

使用 new String() 在堆中创建了一个字符串对象

image

使用了 intern() 之后发生了什么呢,在常量池新增了一个对象,但是 并没有 将字符串复制一份到常量池,而是直接指向了之前已经存在于堆中的字符串对象。因为在 JDK 1.7 之后,字符串常量池不一定就是存字符串对象的,还有可能存储的是一个指向堆中地址的引用,现在说的就是这种情况,注意了,下图是只调用了 s2.intern(),并没有返回给一个变量。其中字符串常量池(0x88)指向堆中字符串对象(0x99)就是intern() 的过程。

image

只有当我们把 s2.intern() 的结果返回给 s2 时,s2 才真正的指向字符串常量池。

image

我明白了

通过以上的介绍,我们来看下面的一段代码返回的结果是什么

public class Test {
   public static void main(String[] args) {
       String s1 = "古时的风筝";
       String s2 = "古时的风筝";
       String s3 = new String("古时的风筝");
       String s4 = new String("古时的风筝");
       System.out.println(s1 == s2); // 【1】 true
       System.out.println(s2 == s3); // 【2】 false
       System.out.println(s3 == s4); // 【3】 false
       s3.intern();
       System.out.println(s2 == s3); // 【4】 false
       s3 = s3.intern();
       System.out.println(s2 == s3); // 【5】 true
       s4 = s4.intern();
       System.out.println(s3 == s4); // 【6】 true
  }
}

【1】:s1 == s2 返回 ture,因为都是字面量声明,全都指向字符串常量池中同一字符串。

【2】: s2 == s3 返回 false,因为 new String() 是在堆中新建对象,所以和常量池的常量不相同。

【3】: s3 == s4 返回 false,都是在堆中新建对象,所以是两个对象,肯定不相同。

【4】: s2 == s3 返回 false,前面虽然调用了 intern() ,但是没有返回,不起作用。

【5】: s2 == s3 返回 ture,前面调用了 intern() ,并且返回给了 s3 ,此时 s2、s3 都直接指向常量池的同一个字符串。

【6】: s3 == s4 返回 true,和 s3 相同,都指向了常量池同一个字符串。

为啥我字符串就不可变

字符串常量池的基础就是字符串的不可变性,如果字符串是可变的,那想一想,常量池就没必要存在了。假设多个变量都指向字符串常量池的同一个字符串,然后呢,突然来了一行代码,不管三七二十一,直接把字符串给变了,那岂不是 jvm 世界大乱。

字符串不可变的根本原因应该是处于安全性考虑。

我们知道 jvm 类型加载的时候会用到类名,比如加载 java.lang.String 类型,如果字符串可变的话,那我替换成其他的字符,那岂不是很危险。

项目中会用到比如数据库连接串、账号、密码等字符串,只有不可变的连接串、用户名和密码才能保证安全性。

字符串在 Java 中的使用频率可谓高之又高,那在高并发的情况下不可变性也使得对字符串的读写操作不用考虑多线程竞争的情况。

还有就是 HashCode,HashCode 是判断两个对象是否完全相等的核心条件,另外,像 Set、Map 结构中的 key 值也需要用到 HashCode 来保证唯一性和一致性,因此不可变的 HashCode 才是安全可靠的。

最后一点就是上面提到的,字符串对象的频繁创建会带来性能上的开销,所以,利用不可变性才有了字符串常量池,使得性能得以保障。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342