240 发简信
IP属地:浙江
  • 120
    spark hashshuffle流程分析

    弊端:随着Task数量增多,ShuffleMapTask会创建许多ShuffleBlockFile小文件,增大了磁盘IO 优化:开启consolidation机制,复用缓冲区...

  • 我还真以为是个大叔呢,原来是同龄人,而且是老乡,:joy:

    【简书交友】坑货常有,而逗比不常有

    在写了几篇逗比列传后,本人对人生进行了严肃的思考,对自己进行了深刻的反思,得出了一个重要的结论——本人也是个逗比。 刘小博,于一九九×年出品,原产于山东,现仍于山东接受社会主...

  • 120
    week one 数据的描述性统计

    众数是指一组数据中出现次数最多的那个数据,一组数据可以有多个众数,也可以没有众数。 中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。中位数用Me...