一、拉链表介绍 1.什么是拉链表 拉链表:记录每条信息的生命周期,一旦一条记录的生命周期结束,就重新开始一条新的记录,并把当前日期放入生效开始日...
一、需求背景 将电影分类中的数组数据展开。结果如下: 二、建表 三、插入数据 四、按需求查询数据 五、输出结果 六、总结 1.函数说明EXPLO...
一、需求背景 需要把星座和血型一样的人归类到一起,如下: 二、建表 三、插入数据 四、按需求查询数据 五、输出结果 六、总结 (1)CONCAT...
一、窗口函数 1.相关函数说明OVER():指定分析函数工作的数据窗口大小,这个数据窗口大小可能会随着行的变而变化 CURRENT ROW:当前...
一、介绍 首先,我们来看看Hadoop的计算框架特性,在此特性下会衍生哪些问题? (1)数据量大不是问题,数据倾斜是个问题。(2)jobs数比较...
一、背景: 当我们书写一些结构相对复杂的SQL语句时,可能某个子查询在多个层级多个地方存在重复使用的情况,这个时候我们可以使用 with as ...
1、to_date:日期时间转日期函数 select to_date('2015-04-02 13:34:12');输出:2015-04-02 ...
需求 HIVE中怎么取最后一条记录? 解决方案 使用函数:row_number() over([partition_by_clause] ord...
一、前言 Hive分区是为了方便数据管理Hive的分区方式:由于Hive实际是存储在HDFS上的抽象,Hive的一个分区名对应一个目录名,子分区...
文集作者