240 发简信
IP属地:北京
  • 用人话解释基金行业术语(有偏差,轻喷)

    交易份额和交易金额:购买基金的两种方式,可以简单理解为,前者是买猪肉的时候说要买几斤,后者是直接告诉店家说要买多少钱的肉。不过最终在基金公司都会...

  • spark支持hive

    要把hive下的hive-site.xml拷贝到spark的conf文件夹下。py4j.protocol.Py4JJavaError: An e...

  • Resize,w 360,h 240
    一个指标的诞生

    一个指标的诞生过程 指标创建涉及到的团队主要有业务需求方和数据管理团队。指标在创建的时候要以数据为基础、以业务需求为导向。以业务需求为导向即首先...

    1.1 1039 0 12
  • 指标体系(前言)

    数据的存在是为了创造价值,指标是最简单直接的方式。指标体系=指标+体系。指标即对于某种业务属性的度量,这个定义有三层含义:1.可描述性。指标的定...

  • 数据血缘

    数据血缘的定义 数据血缘即数据的来龙去脉,主要包含数据的来源、数据的加工方式、映射关系以及数据出口。数据血缘属于元数据的一部分,清晰的数据血缘是...

  • Resize,w 360,h 240
    数据分层的思考

    数据分层的目的在于让数据有序的流转,在数据的整个生命周期中更清晰的被感知到。 关于数据分层,重点应该是在于功能、数据流,而不是形式,例如一定要分...

  • 数据汇集-数据汇集范围

    整体思路 数据仓库建设的第一步即数据汇集。在数据汇集时总要先明确数据要同步的范围。一般情况下,只有有意义的数据才会进行汇集。有意义的数据即:1....

  • Flume同步数据到hive

    一.检查flume/lib下是否有一下jar包: 没有的话可以在服务器上find然后cp一波,后面八个在同一个文件夹下二.建表时一定满足条件1....