240 发简信
IP属地:天津
  • Resize,w 360,h 240
    Spark源码分析(3) RDD 的转换

    如上图,外圈是 RDD 的转换,内圈红色 RDD 是转换产生的新 RDD。按颜色区分转换: 绿色是单 RDD 窄依赖转换 黑色是多 RDD 窄依...

  • Resize,w 360,h 240
    Spark 源码分析(2)RDD 的依赖

    源码 Dependency代码主要在一个源文件中:core/Dependency代码中有5个类。除此以外在 core/rdd/Partition...

  • Spark源码分析(1) RDD是什么

    RDD是Spark的基础,是对大数据的抽象,所以先破解Spark,首先从RDD开始。 RDD 是什么?有什么特点? RDD 包含什么? RDD ...