Scala ArrayBuffer/ListBuffer vs Java ArrayList

在我们编写Scala代码的时候,由于ListBuffer方便的特性,所以经常会使用ListBuffer。过去也一直没有什么问题。

但是呢,最近在我们的项目中,出现了一个非常严重的性能问题。通过JProfiler分析,发现是调用ListBuffer的获取数据的方法时,太慢导致的。

差距有多大呢?以前需要运行12个小时,改成了Java的List以后,直接缩短了四个小时。

这篇文章中,我不会具体分析ArrayBuffer/ScalaBuffer等的代码,只会给出测试的结果。

Scala ArrayBuffer

package com.hyper

import scala.collection.JavaConverters._
import scala.collection.mutable.ArrayBuffer

object TestScalaList {

    def main(args: Array[String]): Unit = {

        val scalaListBuffer: ArrayBuffer[String] = ArrayBuffer[String]()
        val itemNumber = 100000

        for (i <- 0 until itemNumber) {
            scalaListBuffer += i.toString
        }

        IterateList.iterate(scalaListBuffer.toList.asJava)
    }

}

IterateList的代码如下:

package com.hyper;

import com.google.common.base.Stopwatch;

import java.util.List;
import java.util.concurrent.TimeUnit;

public class IterateList {

    public static void iterate(List<String> list) {
        int listLength = list.size();

        System.out.println("List length: " + listLength);

        Stopwatch stopwatch = new Stopwatch();
        stopwatch.start();

        System.out.println("List class: " + list.getClass());
        for (int i = 0; i < listLength; i++) {
            list.get(i);
        }

        long elapse = stopwatch.elapsed(TimeUnit.SECONDS);
        System.out.println("elapse: " + elapse);
    }

}

运行上面的代码,我们可以看到如下结果:


运行了15s。时间不短。它的底层还是数组实现的呢。

Java ArrayList

那我们再来看下Java ArrayList的性能。

package com.hyper;

import java.util.ArrayList;
import java.util.List;

public class TestJavaList {

    public static void main(String[] args) {
        List<String> list = new ArrayList<>();

        int itemNumber = 100000;

        for (int i = 0; i < itemNumber; i++) {
            list.add(String.valueOf(i));
        }

        IterateList.iterate(list);
    }

}

结果如下:


仅仅用了0s,1s都不到。

都是用数组实现的,差距咋这么大呢?

我没有仔细探究,猜测一个是因为SeqWrapper这东西,增加了调用栈的深度,进一步增加了运行时间,但是这个应该不会导致这么大的差距。所以更可能的原因是,Scala实现的这个ArrayBuffer就有问题。

有时间仔细研究一下源码和字节码,补充上来。

Scala ListBuffer

这个是我们Scala中最常用的数据结构,Spark代码中也有意无意的总用到这个数据结构。

我们都知道,Java中ArrayList和LinkedList这两种数据结构,各有各的优缺点,各有各的应用场景。在Scala中,ArrayBuffer就是ArrayList的另一个版本,而ListBuffer就是LinkedList的另一个版本。所以,拿ListBuffer那两个数据结构对比,有点不公平。毕竟ListBuffer不适合随机读取。

但是既然做了,这里还是贴上来。

package com.hyper

import scala.collection.JavaConverters._
import scala.collection.mutable.ListBuffer

object TestScalaList {

    def main(args: Array[String]): Unit = {

        val scalaListBuffer: ListBuffer[String] = ListBuffer[String]()
        val itemNumber = 100000

        for (i <- 0 until itemNumber) {
            scalaListBuffer += i.toString
        }

        IterateList.iterate(scalaListBuffer.toList.asJava)
    }

}

结果如下:


Oh My God,竟然运行了45s。

总结

从测试结果中,我们可以看到,Scala代码,性能跟Java代码还是有一定差距的。

所以能用Java还是尽量用Java为好。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,271评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,275评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,151评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,550评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,553评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,559评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,924评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,580评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,826评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,578评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,661评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,363评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,940评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,926评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,872评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,391评论 2 342

推荐阅读更多精彩内容

  • 在一个方法内部定义的变量都存储在栈中,当这个函数运行结束后,其对应的栈就会被回收,此时,在其方法体中定义的变量将不...
    Y了个J阅读 4,412评论 1 14
  • 函数式编程 引言 Scala中的函数是Java中完全没有的概念。因为Java是完全面向对象的编程语言,没有任何面向...
    义焃阅读 1,271评论 2 5
  • 读《快学Scala 》一书的摘要 Scala 运行于JVM之上,拥有海量类库和工具,兼顾函数式编程和面向对象。 在...
    abel_cao阅读 1,276评论 0 8
  • Overview 本节主要介绍几种语言中的数组和集合的对应用法。 数组在程序中一般用于表示一段连续的空间。通常来说...
    bookislife阅读 941评论 0 0
  • 因个人主观造成的问题变成客观存在的问题的时候,再花多少时间主观去忏悔,改正错误的时候,都无法回到过去,改变它的历史...
    Jessica未央阅读 189评论 0 0