240 投稿
收录了14篇文章 · 5人关注
  • 多事务事实表实践

    一:企业级数仓多事务事实表的重要性 整个企业级的数据仓库,从表的性质来分,有维度表和事实表,事务表又分为多事务事实表,累积快照事实表,周期型快照...

  • Resize,w 360,h 240
    大数据思维与数据驱动

    一:大数据的概念 时代的发展变迁,单从互联网的角度来讲,从最初的IBM巨型机到后来的单机时代,在到后来家家户户都拥有了PC机,笔者就是从PC机那...

  • 浅谈数据治理

    一、数据治理是什么? 1.1、说在前头的话 其实在网上也看了很多数据治理相关的文章,说的也很条理,可能那些作者站的高度很高,他们视角也会很广,感...

  • Resize,w 360,h 240
    漫谈事实表如何设计(四)

    一.累积型快照事实表的应用场景介绍 针对电商交易,设计了交易下单/支付/确认收货事务事实表, 用于统计下单/支付/确认收货的子订单数、GMV等。...

  • 漫谈事实表如何设计(三)

    一.周期性快照事实表的特性 1.1用快照采样状态 理解状态,状态可以指一段时间内某个事实的汇总,比如说近一个月用户下单汇总金额,这就是一个状态值...

  • Resize,w 360,h 240
    基于flink sql构建实时数据仓库

    1、需求背景 根据目前大数据这一块的发展,已经不局限于离线的分析,挖掘数据潜在的价值,数据的时效性最近几年变得刚需,实时处理的框架有storm,...

  • Resize,w 360,h 240
    漫谈事实表如何设计(二)

    一:事实表的设计过程 1:选择业务过程如果是单事务事实表,那么业务过程就一个,如果是多事务事实表,那么会存在多个事务。事务描述的是一个业务过程。...

  • 漫谈事实表如何设计(一)

    一:事实表的特性 粒度:事实表中一条记录所表达的业务细节程度被称为粒度。通常粒度可以通过两种方式来表述:一种是维度属性组合所表示的细节程度:一种...

  • Resize,w 360,h 240
    漫谈纬度表如何设计(四)

    一:均衡层次结构和非均衡层次结构 先来看看均衡层次结构和非均衡层次结构的定义吧。 均衡层次结构:纬度有多个递归层次,比如说商品的类目级别有:叶子...

  • 漫谈纬度表如何设计(三)

    一:缓慢变化维如何处理? 有了之前两篇纬度设计的知识铺垫,这篇就会相对于好理解一些。实际的业务是很复杂的,如果按照之前的建模理论来设计纬度表,设...