240 发简信
IP属地:四川
  • 120
    「Hive进阶篇」万字长文超详述hive企业级优化

    肝了几个晚上,梳理总结了一份万字长文超详述hive企业级优化文章,也整理了一份hive优化总结思维导图和hive优化详细PDF文档,有需要可关注公众号《大数据阶梯之路》找小编...

  • 120
    数据结构——红黑树

    前言 红黑树是计算机科学内比较常用的一种数据结构,它使得对数据的搜索,插入和删除操作都能保持在O(㏒ n)的时间复杂度。然而,相比于一般的数据结构,红黑树的实现的难度有所增加...

  • 120
    wordcount详解shuffle机制

    一、map方法执行之前 我们知道,HDFS里的文件是分块存放在Datanode上面的,而我们写的mapper程序也是跑在各个节点上的。这里就涉及到一个问题,哪一个节点上的ma...