240 发简信
IP属地:北京
  • Resize,w 360,h 240
    Interval Join流程解析

    以下文章全部基于 Flink 1.14 Interval Joins 支持 Join Type 经过自己测试支持情况如下表 (如有误,请指正) ...

  • Resize,w 360,h 240
    Regular Join流程解析

    以下文章全部基于 Flink 1.14 StreamingJoinOperator.java debug 代码可以看到 Regular Join...

  • Resize,w 360,h 240
    MySQL索引

    索引的作用类似指向表中行的指针,能够提高查询速度。尽管索引可以提高查询速度,但是不必要的索引会浪费空间,并且在进行插入、修改 和删除时需要花费额...

  • Resize,w 360,h 240
    Linux三剑客之一awk

    1. 使用方法 1.1 命令格式 pattern表示 AWK 在数据中查找的内容,可以用正则表达式来进行匹配,用/斜杠括起来。action是在找...

  • Hive开窗函数

    1. 介绍 普通聚合函数聚合的行集是组,开窗函数聚合的行集是窗口。因此,普通聚合函数每组(Group by)只有一个返回值,而开窗函数则可以为窗...

  • Resize,w 360,h 240
    Hadoop文件分片split的原理解析

    1. 定义 1.1 block block是物理块,文件存放到HDFS上后,会将大文件按照每块128MB的大小切分,存放到不同的DataNode...

  • Resize,w 360,h 240
    Hadoop Shuffle详解

    1. Shuffle流程 2. Map端 2.1 partition阶段 查看MapTask.runNewMapper方法源码可以看到这里创建了...

  • Spring与设计模式

    1. 简单工厂模式 实现:BeanFactory接口如图,BeanFactory是Spring中最底层的接口之一,它提供了Spring IoC的...

  • Resize,w 360,h 240
    如何查看HBase的HFile

    1. 建表并填入测试数据 首先创建表test,并指定一个名为t1的列簇 随意填几条测试数据 2. 查看HFile 查看命令 内容如下: 注:可以...