关注公众号:大数据技术派,领取资料,学习大数据技术。 建模方法论 数仓的建模或者分层,其实都是为了更好的去组织、管理、维护数据,所以当你站在更高的维度去看的话,所有的划分都是...
关注公众号:大数据技术派,领取资料,学习大数据技术。 建模方法论 数仓的建模或者分层,其实都是为了更好的去组织、管理、维护数据,所以当你站在更高的维度去看的话,所有的划分都是...
传说:一入IT深似海,从此菜鸟泪成河。 老师,搞IT真有传说中****的****这么惨吗,那我从此要珍爱生命、远离IT了。 话说这时代,应该是最好的时代了。知识的获取相当便利...
数据血缘 数据血缘(data lineage)是数据治理(data governance)的重要组成部分,也是元数据管理、数据质量管理的有力工具。通俗地讲,数据血缘就是数据在...
不同来源的异构数据间存在着千丝万缕的关联,这种数据之间隐藏的关联关系和网络结构特性对于数据分析至关重要,图计算就是以图作为数据模型来表达问题并予以解决的过程。 一、背景 随着...
一、Flink概述 Flink起源于Stratosphere项目,Stratosphere是德国科学基金会(DFG)赞助的一个研究项目,目标是建立下一代大数据分析引擎。201...
DDD理论学习系列——案例及目录 1.引言 我们还是先来拆词理解,领域模型可以拆为“领域”和“模型”二词。 领域:按照我们之前的文章的理解,DDD中的领域是指软件系统要解决的...
大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆,各有各的用...
大数据技术框架 1. 简介 2. Hadoop框架2.1. Hadoop-MapReduce2.1.1. 简介:2.1.2. 特点2.1.3. 架构2.1.4. 执行流程:2...
从数据在信息系统中的生命周期看,大数据从数据源开始,经过分析、挖掘到最终环节获得价值一般需要经过6个主要环节:数据收集、数据存储、资源管理与服务协调、计算引擎、数据分析和数据...