2
3
3307
1
关于spark的算子有很多,今天详细介绍下3个算子aggregateByKey、foldByKey、combineByKey aggregate...
Presto是一个开源的分布式SQL查询引擎,数据量支持GB到PB级别,主要用来处理秒级查询的场景。其他概念性的知识点以及Presto的优缺点这...