String源码分析2 字符串拼接

有关String的源码分析,可以查看一下我的前一篇文章:String源码分析

要理解String的拼接过程,先要理解以下几个概念

1.不可变的String


我们总是说String对象是不可变的,那到底是什么导致不可变?
首先谈一谈Java的机制,String在编译阶段会把已知的字面量放在常量池中,详细可以参考Java-常量池

String源码分析里可以看到,String实质是一个char数组,初始化字符串有两种方式:

String a = "java";
String b = new String("java");

当使用=赋值的时候,相当于把String的变量指java常量池中的"java";
而使用new赋值的时候则会在java堆中重新分配空间存放"java"。
无论是以上哪种方式生成的字符串,在生成结束后都是一个已知长度的char数组。大家都知道,数组的长度是不可改变的。

当String变量重新赋值的时候,实则是将变量指向java常量池的另一个制,又或者是在java堆中重新分配空间存放。
而String类中每一个看起来会修改String值的方法,实际上都是创建了一个全新的String对象,则新的char数组,以包含修改后的字符串内容。

因此说,String是不可变的。

2.重载“+”


在Java中,唯一被重载的运算符就是用于String的“+”与“+=”。除此之外,Java不允许程序员重载其他的运算符。

public class StringTest {
    String a = "abc";
    String b = "mongo";
    String info = a + b + 47;
}

String对象是不可变的,所以在上述的代码过程中可能会是这样工作的:
1. "abc" + "mongo" 创建新的String对象abcmongo;
2. "abcmongo" + "47" 创建新的String对象abcmongo47;
3. 引用info 指向最终生成的String。
但是这种方式会生成一大堆需要垃圾回收的中间对象,性能相当糟糕。

编译器的优化处理

Compiled from "StringTest.java"
public class StringTest {
  java.lang.String a;

  java.lang.String b;

  java.lang.String info;

  public StringTest();
    Code:
       0: aload_0
       1: invokespecial #12                 // Method java/lang/Object."<init>":
()V
       4: aload_0
       5: ldc           #14                 // String abc
       7: putfield      #16                 // Field a:Ljava/lang/String;
      10: aload_0
      11: ldc           #18                 // String mongo
      13: putfield      #20                 // Field b:Ljava/lang/String;
      16: aload_0
      17: new           #22                 // class java/lang/StringBuilder
      20: dup
      21: aload_0
      22: getfield      #16                 // Field a:Ljava/lang/String;
      25: invokestatic  #24                 // Method java/lang/String.valueOf:(
Ljava/lang/Object;)Ljava/lang/String;
      28: invokespecial #30                 // Method java/lang/StringBuilder."<
init>":(Ljava/lang/String;)V
      31: aload_0
      32: getfield      #20                 // Field b:Ljava/lang/String;
      35: invokevirtual #33                 // Method java/lang/StringBuilder.ap
pend:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      38: bipush        47
      40: invokevirtual #37                 // Method java/lang/StringBuilder.ap
pend:(I)Ljava/lang/StringBuilder;
      43: invokevirtual #40                 // Method java/lang/StringBuilder.to
String:()Ljava/lang/String;
      46: putfield      #44                 // Field info:Ljava/lang/String;
      49: return
}

反编译以上代码会发现,编译器自动引入了StringBuilder类。
编译器创建了一个StringBuilder对象,并调用StringBuilder.append()方法,最后调用toString()生成结果,从而避免中间对象的性能损耗。

编译器优化String对象的连接,而下面这种情况会直接连接作为常量。

public class StringTest {
    String info = "Andy" + "24" + "Developer";
}
Compiled from "StringTest.java"
public class StringTest {
  java.lang.String info;

  public StringTest();
    Code:
       0: aload_0
       1: invokespecial #10                 // Method java/lang/Object."<init>":
()V
       4: aload_0
       5: ldc           #12                 // String abcmongo47
       7: putfield      #14                 // Field info:Ljava/lang/String;
      10: return
}

3.编译器的优化是有限度的


  • 性能较低的代码
public void  implicitUseStringBuilder(String[] values) {
   String result = "";
   for (int i = 0 ; i < values.length; i ++) {
       result += values[i];
   }
   System.out.println(result);
 }
public void implicitUseStringBuilder(java.lang.String[]);
Code:
  0: ldc           #11                 // String 
  2: astore_2
  3: iconst_0
  4: istore_3
  5: iload_3
  6: aload_1
  7: arraylength
  8: if_icmpge     38
 11: new           #5                  // class java/lang/StringBuilder
 14: dup
 15: invokespecial #6                  // Method java/lang/StringBuilder."<init>":()V
 18: aload_2
 19: invokevirtual #7                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
 22: aload_1
 23: iload_3
 24: aaload
 25: invokevirtual #7                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
 28: invokevirtual #8                  // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
 31: astore_2
 32: iinc          3, 1
 35: goto          5
 38: getstatic     #9                  // Field java/lang/System.out:Ljava/io/PrintStream;
 41: aload_2
 42: invokevirtual #10                 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
 45: return

其中8: if_icmpge 3835: goto 5构成了一个循环。

8: if_icmpge 38的意思是如果(i < values.length的相反结果)成立,则跳到第38行(System.out)。

35: goto 5则表示直接跳到第5行。

但是这里面有一个很重要的就是StringBuilder对象创建发生在循环之间,也就是意味着有多少次循环会创建多少个StringBuilder对象,这样明显性能较低。

  • 性能较高的代码
public void explicitUseStringBuider(String[] values) {
   StringBuilder result = new StringBuilder();
   for (int i = 0; i < values.length; i ++) {
       result.append(values[i]);
   }
 }
public void explicitUseStringBuider(java.lang.String[]);
Code:
  0: new           #5                  // class java/lang/StringBuilder
  3: dup
  4: invokespecial #6                  // Method java/lang/StringBuilder."<init>":()V
  7: astore_2
  8: iconst_0
  9: istore_3
 10: iload_3
 11: aload_1
 12: arraylength
 13: if_icmpge     30
 16: aload_2
 17: aload_1
 18: iload_3
 19: aaload
 20: invokevirtual #7                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
 23: pop
 24: iinc          3, 1
 27: goto          10
 30: return

从上面可以看出,13: if_icmpge 3027: goto 10构成了一个loop循环,而0: new #5位于循环之外,所以不会多次创建StringBuilder.

综上,循环体中需要尽量避免隐式或者显式创建StringBuilder。

不过有种特殊情况,当final修饰的变量发生连接动作时,虚拟机会进行优化,将表达式结果直接赋值给目标变量:

public class StringTest {
    public static void main(String[] args) {
        final String a = "hello ";
        final String b = "world";
        String c = a + b;
        String d = "hello world";
    }
}

编译后字节码如下:

4.StringBuilder


连接符号 "+" 本质
在上文讨论后得知,字符串变量(非final修饰)通过 "+" 进行拼接,在编译过程中会转化为StringBuilder对象的append操作,注意是编译过程,而不是在JVM中。

性能问题
StringBuilder内部维护了一个char[]类型的value,用来保存通过append方法添加的内容,通过 new StringBuilder()初始化时,char[]的默认长度为16,如果append第17个字符,会发生什么?

void expandCapacity(int minimumCapacity) {
    int newCapacity = value.length * 2 + 2;
    if (newCapacity - minimumCapacity < 0)
        newCapacity = minimumCapacity;
    if (newCapacity < 0) {
        if (minimumCapacity < 0) // overflow
            throw new OutOfMemoryError();
        newCapacity = Integer.MAX_VALUE;
    }
    value = Arrays.copyOf(value, newCapacity);
}

如果value的剩余容量,无法添加全部内容,则通过expandCapacity(int minimumCapacity)方法对value进行扩容,其中minimumCapacity = 原value长度 + append添加的内容长度。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342

推荐阅读更多精彩内容

  • 1.不可变的String String对象是不可变的。String类中每一个看起来会修改String值的方法,实际...
    梦工厂阅读 7,584评论 4 9
  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 31,560评论 18 399
  • 1. Java中的多态性理解(注意与C++区分) Java中除了static方法和final方法(private方...
    小敏纸阅读 1,436评论 0 19
  • 下面说一些平时可能不太注意的知识点: String 对象具有只读特性,所以指向它的任何引用都不可能改变它的值,因此...
    扈扈哈嘿阅读 375评论 0 1
  • 冬有冬的来意, 寒冷像花,—— 花有花香,冬有回忆一把。 一条枯枝影,青烟色的瘦细, 在午后的窗前拖过一笔画; 寒...
    青木川_阅读 1,501评论 0 0