欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos...
欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos...
本文目录: 一、大数据时代还需要数据治理吗? 二、如何面向用户开展大数据治理? 三、面向用户的自服务大数据治理架构 四、总结 一、大数据时代还需...
维表是数仓中的一个概念,维表中的维度属性是观察数据的角度,在建设离线数仓的时候,通常是将维表与事实表进行关联构建星型模型。在实时数仓中,同样也有...
前言 前面几篇讲过,元数据侧重于配置【驱动】编程的思想,通过建立统一的数据资产,进一步【驱动】企业数字化升级。 但数字化升级是个战略性的目标,短...
不想看文章直接访问mysql-protocal(Java版本的Mysql)、calcite-test,这里有关于Calcite RBO,CBO使...
关注公众号:大数据技术派,领取资料,学习大数据技术。 建模方法论 数仓的建模或者分层,其实都是为了更好的去组织、管理、维护数据,所以当你站在更高...
Apache Ozone旨在解决HDFS对于小文件和文件系统对象总数的规模限制。在当前的数据中心硬件上,HDFS的限制约为3.5亿个文件和7亿个...
背景 MapReduce不能满足大数据快速实时adhoc查询计算的性能要求,Facebook2012年开发,2013年开源 是什么 基于内存的并...
1 大数据平台的数据质量概述 数据质量是大数据挖掘能否卓有成效的基础,在大数据领域里有一句广为流传的话叫“Garbage In,Garbage ...
马蜂窝数据仓库的架构、模型与应用实践 (马蜂窝技术原创内容,公众号ID:mfwtech) 一、马蜂窝数据仓库与数据中台 最近几年,数据中台概念的...
专题公告
数仓相关文章