一、数据仓库的基本定义:
1.数据仓库:简称DW或DWH,是数据库的一种概念上的升级,是为企业所有级别的决策制定过程,出于分析性报告和决策支持目的而创建。主要有两种分类:
(1)操作型数据库,具有的特点:业务支撑、细节数据、日常收录、量少频率高,如mysql
(2)分析型数据库,具有的特点:历史数据、汇总数据、定期更新、量大频率低,如hive
2.数据仓库特点:
2.1.面向主题:决策关心的重点领域,一个主题,多个操作型数据库
2.2.集成:多个数据源→汇总,具有一致关联性
2.3.相对稳定:长期保存,大量查询,少量更新
2.4.反映历史变化:几年以上的数据、过去时间分析、将来预测
二、数据仓库的组成和分成:
1.数据仓库的组成:
2.数据仓库的分层:
三、数据仓库的建模方式
1.建模方法主要有两种:范式建模与维度建模。
2.第三范式:表中的所有数据元素不但要能唯一地被主关键字所标识,而且它们之间还必须相互独立,不能存在其他的函数关系。
第三范式满足以下三个条件:
(1)每个属性的值唯一,不具有多义性;
(2)每个非主属性必须完全依赖于整个主键,而非主键的一部分;
(3)每个非主属性不能依赖于其他关系中的属性,因为这样的话,这种属性应该归到其他关系中去
3.维度建模:维度建模的表主要分为两类,维度表和事实表。