240 发简信
IP属地:广东
  • Resize,w 360,h 240
    spark 启动过程

    spark1.4.1 启动过程 今天稍微没那么忙了,趁着这个时间,准备把spark的启动过程总结一下(),分享给大家。现在使用的spark1.4...

  • Resize,w 360,h 240
    Hdfs读写原理

    介绍 首先,它是一个文件系统,有一个统一的命名空间——目录树 其次,它是分布式的,由很多服务器联合起来实现功能; 1.hdfs文件系统会给客户端...

  • spark streaming 与kafaka结合 低阶 高阶api的一些理解

    1. createStream会使用 Receiver;而createDirectStream不会,数据会通过driver接收。 2.creat...

  • cdh部署

    0、注意安装时需要给server免密ssh登陆所有机器的权限 需要用到的命令:ssh -p 端口号 用户@ip scp -P 端口号 文件名...

  • Resize,w 360,h 240
    BlockManager

    架构简介 BlockManager 是一个嵌入在 spark 中的 key-value型分布式存储系统,是为 spark 量身打造的,Block...

  • Shuffle

    # 简介 shuffle 是spark 计算核心的的部分之一,很多优化也是基于shuffle来做,所以了解它也是必要的。stage按照是否是宽依...

  • Resize,w 360,h 240
    druid 架构

    druid被设计成一个系统组合,每个系统都有不同的角色,一起构成一个工作系统。 结构图

  • Resize,w 360,h 240
  • durid 概念

    概念 druid是基于olap的数据库查询系统。有点类似现在开源的kylin。下面我先简单介绍druid的一下基本概念,一些我认为需要重点展开和...