imarch1 - 简书

发简信

imarch1

1
关注
23
粉丝
9
文章
4738

字数
16

收获喜欢
1

总资产

IP属地：北京

imarch1

siddontang
写了 265188 字，被 3494 人关注，获得了 1961 个喜欢

一位爱好文学的资深程序开发工程师。热爱工作又极度顾家的有为社会青年。<br><br>带货 <a href="https://links.jianshu.com/go?to=https%3A%2F%2Fasktug.com%2F" target="_blank">https://asktug.com/</a>
imarch1

Spark Sort Shuffle Write
Spark sort shuffle write的过程大致如下： ShuffleMapTask的runTask()方法首先得到shuffleManager，shuffleM...

imarch1
464 0 1

imarch1

Spark Streaming Backpressure Rate Control
Spark Streaming整体流程如下图所示。图中左边部分负责流数据的接收，右边部分负责流数据的处理。对于数据处理部分，JobGenerator 维护了一个定时器，定时为...

1606 0 1
imarch1

Spark TorrentBroadcast
Broadcast 就是将数据从一个节点发送到其他各个节点上去。Spark有两种方式：一种是HttpBroadcast，另一种是TorrentBroadcast。 Drive...

1662 0 2
imarch1

RDD介绍
全称Resilient Distributed Datasets。Resilient（弹性）：数据集的划分（进而决定了并行度）可变内部接口：分区（Partition）依...

687 0 0
imarch1

Spark Tungsten Shuffle Write
ShuffleMapTask的runTask()方法首先得到shuffleManager，shuffleManager分为三种SortShuffleManager，Hash...

514 0 1
imarch1

Spark Shuffle Write的演化
目前，spark shuffle write有三种方法：hash shuffle、sort shuffle和tungsten-sort shuffle。从1.2版本开始默认为...

1319 0 2

imarch1

Spark Sort Shuffle Write
Spark sort shuffle write的过程大致如下： ShuffleMapTask的runTask()方法首先得到shuffleManager，shuffleM...

464 0 1
imarch1

Spark Sort Shuffle Read
Shuffle read 是等到Mapper stage结束后才开始读取数据。边读取数据边处理，数据先放在内存，最后落盘。下面先介绍Shuffle read 的详细过程，然后...

679 0 0
imarch1

Spark Job 详细执行流程（二）
Spark Job执行流程大体如下：用户提交Job后会生成SparkContext对象，SparkContext向Cluster Manager（在Standalone模式下...

imarch1
3659 0 7
imarch1

Spark Job 详细执行流程（二）
Spark Job执行流程大体如下：用户提交Job后会生成SparkContext对象，SparkContext向Cluster Manager（在Standalone模式下...

3659 0 7
imarch1

Spark Job 详细执行流程（一）
本文以Spark 1.6 Standalone模式为例，介绍用户提交Spark Job后的Job的执行流程。大体流程如下图所示用户提交Job后会生成SparkContext...

imarch1
6590 1 2

imarch1

Spark Job 详细执行流程（一）
本文以Spark 1.6 Standalone模式为例，介绍用户提交Spark Job后的Job的执行流程。大体流程如下图所示用户提交Job后会生成SparkContext...

6590 1 2
imarch1

个人介绍

热爱大数据