2
0
写了 54765 字,被 68 人关注,获得了 85 个喜欢
在对RDDPair(一种特殊的 RDD,即RDD[(key, Row)])进行操作时经常会用到 reduceByKey() 和 groupByKey() 两个算子。下面看看两...
写了 17623 字,被 44 人关注,获得了 204 个喜欢
性能优化概览 why Spark是基于内存的计算,所以集群的CPU、网络带宽、内存等都可能成为性能的瓶颈。 when Spark应用开发成熟时,满足业务要求后,就可以开展性能...