sc.parallelize 和 sc.markRDD parallelize()源码 makeRDD(),有两种重构方法 注释的意思为:分配一...
![240](https://upload.jianshu.io/collections/images/1869911/%E8%B5%84%E6%BA%90_5.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
收录了2篇文章 · 1人关注
sc.parallelize 和 sc.markRDD parallelize()源码 makeRDD(),有两种重构方法 注释的意思为:分配一...
数据结构 RDD 弹性分布式数据集。 Resilient Distributed Datasets,意为容错的、并行的数据结构,可以让用户显式地...
专题公告
大数据技术