f43a49dbcfb0 - 简书

发简信

2
关注
0
粉丝
0
文章
0

字数
0

收获喜欢
1

总资产

IP属地：香港

f43a49dbcfb0

git Bash 命令行大全
1、目录、文件操作 pwd ( print working directory )查看当前所在路径--绝对路径 cd (change directory )切换目标 cd ....

木子9268
2453 0 3
f43a49dbcfb0

Spark远程调试
start-all.sh -> start-master.sh -> start-slaves.sh 1.Master启动的脚本start-master.sh -> spa...

sparkle123
1323 1 3

f43a49dbcfb0

Hadoop重新格式化HDFS的方法
一、记一次“不合格”的方法这种方法也是网上参考博客得来的，一开始就觉得有问题，后来真的发现了问题。首先停止已经启动的hadoop：然后查看hadoop配置文件hdfs-...

鹅鹅鹅_
19095 0 2
f43a49dbcfb0

为VMware虚拟机内安装的Ubuntu 16.04设置静态IP地址
1.安装环境 VMware 10.0.4 build-2249910 Ubuntu 16.04 x86_64 2.在VMware中，配置网络环境 VMware在默认安装完成之...

ALTHE
17103 1 7
f43a49dbcfb0

Spark Core源码精读计划#5：事件总线及ListenerBus
目录前言 Spark事件总线概述 ListenerBus特征addListener()与removeListener()方法doPostEvent()方法postToAll...

LittleMagic
1074 7 9 1
f43a49dbcfb0

一张图读懂非公平锁与公平锁
在Java并发编程中，公平锁与非公平锁是很常见的概念，ReentrantLock、ReadWriteLock默认都是非公平模式，非公平锁的效率为何高于公平锁呢？究竟公平与非公...

徐志毅
21644 14 87
f43a49dbcfb0

Spark延迟任务调度-实例分析
最近在看Spark任务调度，尤其是延迟调度这块，翻了好多资料与博客都是发现延迟调度中是这样介绍的：“在为任务分配节点时（executor），先判断任务的最佳运行节点是否空闲，...

sf705
1702 0 1

f43a49dbcfb0

有结论了吗请问

Spark的位置优先: TaskSetManager 的有效 Locality Levels
based on spark-1.5.1 standalone mode 在Spark Application Web UI的 Stages tag 上，我们可以看到这个的表...

牛肉圆粉不加葱
14692 8 22
f43a49dbcfb0 ·

此处猜想了一下，如果是Shuffle过程中的ReduceTask，则其输入RDD的 PreferredLocations 是什么呢？其数据来自许多host，locality levels 该是什么呢？如果按照延迟调度中的说法，NO_PREF没有本地性偏好（maxLocality ！= TaskLocality.NO_PREF ），是不是ReduceTask所对应的locality level 为NO_PREF? 不知道是否正确

sf705 评论自Spark的位置优先: TaskSetManager 的有效 Locality Levels
f43a49dbcfb0

灯火gg
写了 55305 字，被 64 人关注，获得了 115 个喜欢
f43a49dbcfb0

Spark shuffle中 reduce task是怎么拉取数据的？
1.map task 执行完毕后会将计算状态以及磁盘小文件位置等信息分装到mapStatue对象中，然后由本进程中的MapOutPutTrackerWorker对象将mapS...

0_9f3a
2793 1 3
f43a49dbcfb0

憨人Zoe
写了 19852 字，被 69 人关注，获得了 57 个喜欢

Java开发，不定期更新（没啥事不会更新）。

f43a49dbcfb0

Spark Core源码精读计划#14：Spark Web UI界面的实现
目录前言创建SparkUISparkContext中的操作初始化SparkUI WebUI的具体实现属性成员和Getter方法WebUI提供的attach/detach类...

LittleMagic
2758 1 10
f43a49dbcfb0

楼主，如果不指定分区，shuffle前和shuffle后的分区数量是不变的吧。

Java Spark 简单示例（七） RDD分区分区划分器
大数据学习交流微信群更多RDD的信息参考：https://www.cnblogs.com/qingyunzong/p/8899715.html 分区在Spark程序中，R...

憨人Zoe
2081 2 1
f43a49dbcfb0

机器学习----朴素贝叶斯算法浅析和spark MLlib实现
文/michael 前言最近研究下Machaine Learning，这篇文章作为开始吧。贝叶斯贝叶斯（Bayes）算法是什么？我们在大学时都知道概率论吧，条件概率，...

michaelgbw
4848 0 9 1
f43a49dbcfb0

程序员谈求职系列之求内推的正确姿势
前言大家好，我是光源。我曾经在学生时代各种找内推（基本都得到了内推），也在来到网易后各种被找内推，所以对内推的套路还是挺了解。 “求内推”可是个技术活，你找准姿势了么？ ...

光源_Android
5490 42 141 2
f43a49dbcfb0

暂无个人介绍