240 发简信
IP属地:山东
  • 120
    SQL on Hadoop 之查询效率分析

    本文选择了一句比较有代表性的查询语句,分别用不同的执行引擎执行,hive on mr 用时278s,hive on tez用时44s,spark SQL 用时24s,而pre...

  • 120
    Calcite 原理解析

    Apache Calcite 是独立于存储与执行的SQL解析、优化引擎,广泛应用于各种离线、搜索、实时查询引擎,如Drill、Hive、Kylin、Solr、flink、Sa...

  • APACHE ZOOKEEPER 3.5.3 CODE REVIEW

    导语 zab协议包含两个阶段崩溃恢复与消息广播,基于zookeeper 3.5.3集群启动以及ZooKeeper.setData来分别说明下两阶段的流程。 一.Index 1...

  • APACHE HBASE 1.2.0 CODE REVIEW

    导语 以下基于hbase1.2,目前已经出了2.0版本,2.0具体细节没跟过,但是基本思路不变,优化了offheap、AssignmentManager(不再依赖zk做sta...

  • APACHE KAFKA 0.10.0 CODE REVIEW

    导语 Kafka 0.10.0还未实现Exactly-Once[1],consume虽然可以基于事务实现Exactly-Once,但是produce流程如果ack阶段丢失响应...

  • APACHE YARN 2.6.0 CODE REVIEW

    导语 YARN 2.6.0 版本还未支持GPU,且未启用DRF的DominantResourceCalculator的情况下,默认的DefaultResourceCalcul...

  • HOTSPOT JVM 1.6 CODE REVIEW

    导语 HOTSPOT JVM执行引擎OpenJDK 1.6版本跟1.8版本变化不大,整理了一份index,一是为了梳理思路,二是为了后续查问题可以基于index快速troub...

个人介绍
分布式计算架构方向研发,努力入门 ing ~