240 投稿
收录了7篇文章 · 9人关注
  • Resize,w 360,h 240
    数仓实战07:数仓搭建-ADS层

    1.设备主题 1.1 活跃设备数(日、周、月)需求定义:日活:当日活跃的设备数周活:当周活跃的设备数月活:当月活跃的设备数1)建表语句 2)导入...

  • Resize,w 360,h 240
    数仓实战06:数仓搭建-DWT层

    1.设备主题宽表 1)建表语句 2)数据装载 3)查询加载结果hive (gmall)> select * from dwt_uv_topic ...

  • Resize,w 360,h 240
    数仓实战05:数仓搭建-DWS层

    1.业务术语 1)用户用户以设备为判断标准,在移动统计中,每个独立设备认为是一个独立用户。Android 系统根据 IMEI 号,IOS 系统根...

  • Resize,w 360,h 240
    数仓实战04:数仓搭建-DWD层

    1)对用户行为数据解析2)对核心数据进行判空过滤。3)对业务数据采用维度模型重新建模,即维度退化。 1.用户行为启动表数据解析 1.1创建启动表...

  • Resize,w 360,h 240
    数仓实战03:数仓搭建-ODS 层

    1.创建数据库 1)启动hive[atguigu@hadoop102 hive]$ nohup bin/hive --service metas...

  • Resize,w 360,h 240
    数仓实战02:数仓理论

    1.范式理论 1. 范式概念1)定义范式可以理解为设计一张数据表的表结构,符合的标准级别。 规范和要求2)优点关系型数据库设计时,遵照一定的规范...

  • Resize,w 360,h 240
    数仓实战01:数仓分层

    1.为什么分层 1.1 数仓分层: 1.2 为什么分层 2.数据集市和数据仓库概念 3.数仓命名规范 3.1 表命名ODS层命名为ods_表名D...