1 分组聚合的原因 SQL中分组函数和聚合函数之前的文章已经介绍过,单说这两个函数有可能比较好理解,分组函数就是group by,聚合函数就是C...
HIVE是一个数据仓库,该仓库基于hadoop框架,可以将存在hdfs上的结构化数据文件映射为一张数据库表。HIVE可以使用类SQL语句来处理结...
窗口函数 窗口函数也称为OLAP(Online Analytical Processing)函数,意思是对数据库数据进行实时分析处理,窗口函数在...
1 准备知识 HDFS:hadoop集群分布式文件系统,用来存储海量数据。HDFS采用分而治之的设计思想,将文件切分为文件块进行存储,存储数据的...
1 阿里云服务器选配 首先附上官网链接:阿里云官网[https://www.aliyun.com/] 点击上边链接,注册后登陆官网,选择产品选项...
1 前言 在讲述Hadoop集群搭建之前,首先要了解Hadoop和集群两个名词,Hadoop是由Apache基金会开发的分布式系统基础架构,简单...
1 前言 SQL进阶主要介绍谓词、CASE表达式、嵌套子查询、连接(以列为单位对表进行连接)和UNION运算(表为单位)。 SQL进阶在如下两个...
1 前言 SQL函数主要介绍内建函数,其实跟Excel中的内建函数类似,后续Python中也是类似。有时候学习语言,真的没有那么难,都是相通的,...
1 前言 数据库(DB)是按照数据结构存储数据的仓库,数据库管理系统(DBMS)是操纵和管理数据库的一套软件,可分为关系型的数据库管理系统和非关...