搞什么呀 - 简书

搞什么呀

IP属地：广东

spark 启动过程
spark1.4.1 启动过程今天稍微没那么忙了，趁着这个时间，准备把spark的启动过程总结一下（），分享给大家。现在使用的spark1.4...

1359 0 0
Hdfs读写原理
介绍首先，它是一个文件系统，有一个统一的命名空间——目录树其次，它是分布式的，由很多服务器联合起来实现功能； 1.hdfs文件系统会给客户端...

1278 0 0

spark streaming 与kafaka结合低阶高阶api的一些理解
1. createStream会使用 Receiver；而createDirectStream不会,数据会通过driver接收。 2.creat...

459 0 0
cdh部署
0、注意安装时需要给server免密ssh登陆所有机器的权限需要用到的命令：ssh -p 端口号用户@ip scp -P 端口号文件名...

462 0 1
BlockManager
架构简介 BlockManager 是一个嵌入在 spark 中的 key-value型分布式存储系统，是为 spark 量身打造的，Block...

659 2 0
Shuffle
# 简介 shuffle 是spark 计算核心的的部分之一，很多优化也是基于shuffle来做，所以了解它也是必要的。stage按照是否是宽依...

644 0 0
druid 架构
druid被设计成一个系统组合，每个系统都有不同的角色，一起构成一个工作系统。结构图

391 0 0

数据流走向

557 0 0
durid 概念
概念 druid是基于olap的数据库查询系统。有点类似现在开源的kylin。下面我先简单介绍druid的一下基本概念，一些我认为需要重点展开和...

910 0 1