240 发简信
IP属地:浙江
  • Resize,w 360,h 240
    spark hashshuffle流程分析

    弊端:随着Task数量增多,ShuffleMapTask会创建许多ShuffleBlockFile小文件,增大了磁盘IO 优化:开启consol...

  • Resize,w 360,h 240
    week one 数据的描述性统计

    众数是指一组数据中出现次数最多的那个数据,一组数据可以有多个众数,也可以没有众数。 中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中...