240 发简信
IP属地:北京
  • 为什么不用repartition

    Spark On Yarn 如何提高CPU利用率

    问题描述: Spark on Yarn是利用yarn进行资源调度,这两天我写的一个程序处理大概100W行文本,文本格式是txt,数据大小为50M左右。我将Scala写的...

  • 算法学习笔记

    作者:@移动开发小冉原文地址:https://github.com/nonstriater/Learn-Algorithms 算法虐我千百遍,我待算法如初恋。 这里的内容是我...