sc.parallelize 和 sc.markRDD parallelize()源码 makeRDD(),有两种重构方法 注释的意思为:分配一...

收录了2篇文章 · 1人关注
sc.parallelize 和 sc.markRDD parallelize()源码 makeRDD(),有两种重构方法 注释的意思为:分配一...
数据结构 RDD 弹性分布式数据集。 Resilient Distributed Datasets,意为容错的、并行的数据结构,可以让用户显式地...
专题公告
大数据技术