Java8中的并行流

此笔记是我在阅读《Java8实战》时的一些记录。

Java8中增加了流(stream)的概念,为数据的处理带来了很大的方便。

并行流将数据分割成不同的块,并且用不同的线程处理不同的块。

现在要根据输入n,求从1到n的和,这里我们不使用n*(1+n)/2的方式,而是使用累加。我们分别写出迭代、顺序流、并行流的写法。

public class ParallelStreams {
    public static long sequentialSum(long n) {
        return Stream.iterate(1L, i->i+1)
                .limit(n)
                .reduce(0L, Long::sum);
    }

    public static long iterativeSum(long n) {
        long result = 0;
        for (long i = 1L; i <= n; i++) {
            result += i;
        }
        return result;
    }

    public static long parallelSum(long n) {
        return Stream.iterate(1L, i->i+1)
                .limit(n)
                .parallel()
                .reduce(0L, Long::sum);
    }
}

我们可以看到,将顺序流转换为并行流只需要parallel()方法即可。

现在我们来测量这几个方法的性能:

public static long measureSumPerf(Function<Long, Long> adder, long n) {
    long fastest = Long.MAX_VALUE;
    for (int i = 0; i < 10; i++) {
        long start = System.nanoTime();
        long sum = adder.apply(n);
        long duration = (System.nanoTime() - start) / 1_000_000; //毫秒
        System.out.println("Result: "+sum);
        if(duration < fastest) fastest = duration;
    }
    return fastest;
}

然后分别测试这三个方法:

public static void main(String[] args) {
    System.out.println("顺序流:" + measureSumPerf(ParallelStreams::sequentialSum, 10_000_000)+" 毫秒");
    System.out.println("循环:" + measureSumPerf(ParallelStreams::iterativeSum, 10_000_000)+" 毫秒");
    System.out.println("并行流:" + measureSumPerf(ParallelStreams::parallelSum, 10_000_000)+" 毫秒");
}

结果出乎我们的预料:

顺序流:173 毫秒
循环:4 毫秒
并行流:697 毫秒

为什么会这样?

  • iterate生成的是Stream<Long>对象,需要拆箱才能求和;
  • iterate很难分割成独立的小块,因为每次应用这个函数都需要前一次应用的结果,也就是说它其实是顺序执行的。这样反而在并行时增加了分配线程的开销。

这里我们使用LongStream.rangeClosed方法来优化,它的特点有:

  • LongStream.rangeClosed直接产生原始类型的long数字,没有拆箱与装箱的开销。
  • LongStream.rangeClosed产生一个数字范围,很容易拆分成多个小块。

我们再用LongStream.rangeClosed写出顺序和并行计算的版本:

public static long parallelRangedSum(long n) {
    return LongStream.rangeClosed(1, n)
            .parallel()
            .reduce(0, Long::sum);
}

public static long measureSumPerf(Function<Long, Long> adder, long n) {
    long fastest = Long.MAX_VALUE;
    for (int i = 0; i < 10; i++) {
        long start = System.nanoTime();
        long sum = adder.apply(n);
        long duration = (System.nanoTime() - start) / 1_000_000; //秒
        System.out.println("Result: "+sum);
        if(duration < fastest) fastest = duration;
    }
    return fastest;
}

然后进行测试:

System.out.println("顺序Range流:" + measureSumPerf(ParallelStreams::rangedSum, 10_000_000)+" 毫秒");
System.out.println("并行Range流:" + measureSumPerf(ParallelStreams::parallelRangedSum, 10_000_000)+" 毫秒");

执行结果如下:

顺序Range流:7 毫秒
并行Range流:3 毫秒

这个速度就快多了,但是我们要记住,使用并行时,在多个内核直接移动数据的代价也比较大,因此,要保证在内核中并行执行工作的时间比在内核之间传输数据的时间要长才比较划算。

现在我们来总结一下如何高效使用并行流:

  • 如果用循环还是顺序流或者是并行流,像我们上面那样测试一下;
  • 注意装箱,尽量使用IntStream, LongStream,和DoubleStream来避免装箱拆箱;
  • 有些操作在并行流上性能很差,比如limit,findFirst等依赖顺序的操作。unordered方法可以把有序流转为无序流,使用findAny等好很多,在无序流上用limit也好很多;
  • 计算流水线操作总成本,处理单个元素用时越多,并行就越划算;
  • 对于较小的数据量,用并行不一定是好事儿;
  • 数据结果是否易于分解,比如ArrayListLinkedList易于分解,range创建的原始流也易于分解;
  • 终端操作中的合并大家是否很大,大了也不划算。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容

  • Java8 in action 没有共享的可变数据,将方法和函数即代码传递给其他方法的能力就是我们平常所说的函数式...
    铁牛很铁阅读 1,208评论 1 2
  • 绪论 之前的几章中,我们已经看到了新的Stream接口可以让你以声明性方式处理数据集。我们还解释了将外部迭代换为内...
    浔它芉咟渡阅读 3,218评论 0 2
  • 概要 流让你从外部迭代转向内部迭代。这样,你就用不着写下面这样的代码来显式地管理数据集合的迭代(外部迭代)了: 现...
    浔它芉咟渡阅读 1,483评论 1 2
  • 水龙湾的范二麻子是一家绸缎庄的老板,家财万贯。但有一缺憾:夫人只生有五个女儿。范二麻子愁啊,将来偌大的产业交给谁呢...
    篱笆影阅读 611评论 3 6
  • 《淡淡的忘》 很多事情 都可以发生得 轰轰烈烈 但忘记 从来都是淡淡...
    涵芷依阅读 410评论 0 2