STAR SCHEMA(七)

N7. 层次结构与雪花模式

一. 钻取

我们经常将分析当作”钻取数据”的过程.例如,在阅读一份报表时,我们可能想知道更多的东西,此时可以选择”向下钻取”.采用更加详细的细节视图替换汇总视图.可能选择更深入的钻取或者上下反复,用不同的方法来观察某一事情

钻取的定义

钻取这个次意味着对某些事情的深入挖掘.从维度环境来看,某些事情代表事实.钻取的一般概念简单来说就是添加维度细节,下图对此概念进行了说明,图的左边显示的基本报表展示的时一个事实,order dollars是按照被称为category的维度进行划分的

Untitled.png (1310×765) (amazonaws.com)

增加维度细节

二. 属性层次和钻取

属性层次

许多维度可以被理解为包含连续主从关系的属性层次.此类层级的最底层代表维度表中描述的最低级别的详细信息,最高层代表最高级别的概要信息.每一级别都有可能有一个属性的集合,该集合与下一级别存在主从关系

Untitled.png (1270×950) (amazonaws.com)

产品表中的属性层次

在属性层次中钻取

一些软件工具将钻取的概念与属性层次的概念关联起来,这些工具将层次作为预先定义的钻取路径.查询事实时,通过在层级的下一个级别中添加一个维度属性来完成向下钻取.这种方法对于理解事实表中的信息非常有用 — 连续地提供有关事实的详细视图.依照这样的思路,上钻操作是通过去除属于当前层次结构级别的属性而开展的

钻取的其他方法

  1. 维度的多重层次结构
  2. 维度交叉
  3. 回避层次结构
  4. 实例层次结构

文档化属性层次结构

  1. 配置基于属性的钻取特征
  2. 信息收集

Untitled.png (1312×890) (amazonaws.com)

文档属性层次结构

三. 雪花模式

规范化原则适用于操作型系统的应用模式,支持各种能更新数据的并发事务,分析型数据库不能共享该应用模式且不需要此类规范化.没有必要为确保数据的完整性而增加复杂性,规范化降低了可用性,使得ETL过程复杂化,并且可能会对性能产生影响.事实上,数据冗余带来了一些好处,其中一个优点就是可理解性.商业用户能容易理解星型模式的含义.相对度量处于星型模式的中间部分,围绕中间部分的是对其过滤和分组的选项,许多查询可以按照简单的模板构造.

四. 支架表

Untitled.png (575×897) (amazonaws.com)

维度表中重复的地点和日期属性

有时,属性的重复集合可能导致忽视表达的不一致的情况,特别是当属性在多表中重复出现时.如果属性集合比较大,属性对行长度的影响这一次要问题可能会变的重要.出现这些情况时,设计者可能会考虑放松对雪花模式的限制,将重复属性放置在新表中,并通过主键/外键关系连接到维度.这样的表称为支架表.支架表可以确保采用单一的ETL过程和一致性的表示,但是对可用性和性能有一定的影响.维度表设计的一个常见问题是属性的重复组问题.当维度表中包含的一组属性多次出现或者出现在多个维度表中,可能需要关注行的长度或者一致性.如果其他解决该问题的机制不能高效的解决此问题时,可以采用支架表解决方案

通过支架表消除重复组

Untitled.png (1313×1004) (amazonaws.com)

销售人员维度的两个支架表

其实很好理解就是抽象出来两张维度表,日期表和地点支架表,这两张表比较通用,可以同时关联用户维度表,门店维度表,订单事实表,可以看到,冗余被大量减少了,结构也看起来舒服多了,常见的支架有:日期表,时间表,地点表等.(正如雪花模型的ETL令人头痛一样,支架表的ETL也极为复杂)

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342

推荐阅读更多精彩内容

  • N5. 维度一致性问题 一. 星型模式之间的协同 维度设计通常分成多个部分来实现,除了结构风格以外,采用单一主题涵...
    冰菓_阅读 172评论 0 1
  • 一. 将维度分组到表中 经验丰富的设计人员通常不难确定如何将维度属性分组到表中.多数对应分析类别的维度表具有深刻的...
    冰菓_阅读 233评论 0 1
  • N1. 分析型数据库与维度设计 一. 维度设计 从业务过程的角度考虑,信息系统可以划分为两个主要的类别:一类用于支...
    冰菓_阅读 418评论 0 1
  • 一. Inmon的企业信息化工厂 Untitled.png (1016×841) (amazonaws.com)[...
    冰菓_阅读 126评论 0 1
  • 1. R Markdown 简介 1.1 Markdown 简介 Markdown是⼀种轻量级标记语⾔,它允许我们...
    一只小蛮要阅读 8,471评论 0 4