Avatar notebook default
11篇文章 · 4540字 · 3人关注
  • Resize,w 360,h 240
    一个指标的诞生

    一个指标的诞生过程 指标创建涉及到的团队主要有业务需求方和数据管理团队。指标在创建的时候要以数据为基础、以业务需求为导向。以业务需求为导向即首先...

    1.1 1040 0 12
  • 指标体系(前言)

    数据的存在是为了创造价值,指标是最简单直接的方式。指标体系=指标+体系。指标即对于某种业务属性的度量,这个定义有三层含义:1.可描述性。指标的定...

  • 数据血缘

    数据血缘的定义 数据血缘即数据的来龙去脉,主要包含数据的来源、数据的加工方式、映射关系以及数据出口。数据血缘属于元数据的一部分,清晰的数据血缘是...

  • Resize,w 360,h 240
    数据分层的思考

    数据分层的目的在于让数据有序的流转,在数据的整个生命周期中更清晰的被感知到。 关于数据分层,重点应该是在于功能、数据流,而不是形式,例如一定要分...

  • 数据汇集-数据汇集范围

    整体思路 数据仓库建设的第一步即数据汇集。在数据汇集时总要先明确数据要同步的范围。一般情况下,只有有意义的数据才会进行汇集。有意义的数据即:1....

  • Flume同步数据到hive

    一.检查flume/lib下是否有一下jar包: 没有的话可以在服务器上find然后cp一波,后面八个在同一个文件夹下二.建表时一定满足条件1....

  • Resize,w 360,h 240
    数据在金融行业和互联网行业之二

    基于上一篇很水的说明,结合自己现在的认识,总结了上面的两个图。由图可得金融行业的各个系统都是相辅相成,这源于整个行业的链条特别长,一笔交易会涉及...

  • 2019-07-06工作小结

    1、使用datax抽取的时候源端和目的端都要是主节点,有报错提示权限不足的时候可以查看下2、hive中默认的分隔符和sqoop默认的分隔符不一致...

  • XXXX项目抽取工作

    进行数据探查时,如果源库是oracle,记得一定加上这句话!切记切记import osos.environ['NLS_LANG'] = 'SIM...

文集作者