Avatar notebook default
5篇文章 · 5893字 · 2人关注
  • hive 优化方案

    目前越来越多的公司开始基于Hive搭建数据仓库,所以本文主要针对Hive介绍几种优化方式。尽管Hive已经做了很多原生的优化工作,但是仍然有优化...

  • 数据仓库值事实表基础

    事实表基本结构 操作性事件中产生的可度量数值,存储在事实表中,事实表肯定会包含外键,用来与维度表进行关联,也包含可选的退化维度键和日期/时间戳。...

  • 数据仓库之高级事实表

    事实表代理键 代理键可用作所有维度表的主键。不与任何维度关联的事实表代理键,是在ETL加载过程中顺次分配的,可用于作为事实表的唯一主键列;在ET...

  • 缓慢变化维的类型以及处理方式

    类型0:原样保留 对维度属性值不会发生变化的,事实表以原始值分组。例如持久型标识符和日期维度的大多数属性 类型1:重写 维度行中原来的属性值被新...

  • 维度建模的流程

    一、收集业务需求和数据实现 开始维度建模工作前,需要理解业务需求,以及作为基础的源数据的实际情况。通过与业务代表交流来发现需求,用于理解他们的基...

文集作者