240 投稿
收录了2篇文章 · 1人关注
  • Spark 常用算子及代码

    sc.parallelize 和 sc.markRDD parallelize()源码 makeRDD(),有两种重构方法 注释的意思为:分配一...

  • Spark基本组件与概念

    数据结构 RDD 弹性分布式数据集。 Resilient Distributed Datasets,意为容错的、并行的数据结构,可以让用户显式地...

专题公告

大数据技术