240 发简信
IP属地:广东
  • 240
    Spark Shuffle Write 和Read

    本文基于spark源码2.11 1. 前言 shuffle是spark job中一个重要的阶段,发生在map和reduce之间,涉及到map到reduce之间的数据的移动,以...

  • 240
    数据仓库ODS、DW和DM概念区分

    今天看了一些专业的解释,还是对ODS、DW和DM认识不深刻,下班后花时间分别查了查它们的概念。 ODS——操作性数据 DW——数据仓库 DM——数据集市 1.数据中心整体架构...

  • 大数据不就是写SQL吗?

    【原创,转载请注明出处】 应届生小祖参加了个需求分析会回来后跟我说被产品怼了一句: "不就是写SQL吗,要那么久吗" 我去,欺负我小弟,这我肯定不能忍呀,于是我写了一篇文章发...

  • 240
    大数据需要学什么?

    注意本文非广告,阅读时间四分钟左右,适合大数据入门级读者阅读 大数据需要学习什么?很多人问过我这个问题。每一次回答完都觉得自己讲得太片面了,总是没有一个合适的契机去好好总结这...

个人介绍
公众号:Apache Bigdata Projects