
1. 方法 1.1. 解析建模 1.1.1. 实时访问可以解决批处理中的许多延迟问题 1.1.2. Apache Mahout是一个开源项目,旨...
1. 定义大数据战略和业务需求 1.1. 组织的大数据战略需要与其整体业务战略和业务需求保持一致并提供支持,并成为其数据战略的一部分 1.2. ...
1. 业务驱动 1.1. 期望抓住从多种流程生成的数据集中发现的商机,是提升一个组织大数据和数据科学能力的最大业务驱动力 1.2. 大数据可以通...
1. 工具 1.1. 应在企业数据质量项目的规划阶段建立工具架构并选择相应工具 1.2. 工具可以提供部分规则集的启动工具包,但是组织需要在工具...
1. 定义高质量数据 1.1. 高质量的数据能满足数据消费者的需要 1.2. 在启动数据质量方案之前,有益的做法是了解业务需求、定义术语、识别组...
1. 数据质量和元数据 1.1. 元数据对于管理数据质量至关重要 1.1.1. 元数据定义数据所代表的内容,拥有一个强大的数据定义流程,有助于组...
1. 数据质量 1.1. “数据质量”一词既指高质量数据的相关特征,也指用于衡量或改进数据质量的过程 1.1.1. 如果数据满足数据消费者应用需...
1. 定义元数据战略 1.1. 元数据战略描述组织应如何管理其自身元数据,以及元数据从当前状态到未来状态的实施线路 1.2. 步骤 1.2.1....
1. 元数据来源 1.1. 元数据的来源各异 1.1.1. 大多数操作元数据是在处理数据时生成的 1.1.2. 最好是有意识地重新定义而不是简单...