前言 Apache BookKeeper 是企业级存储系统,旨在保证高持久性、一致性与低延迟。自 2011 年起,BookKeeper 开始在 Apache ZooKeepe...
IP属地:湖南
前言 Apache BookKeeper 是企业级存储系统,旨在保证高持久性、一致性与低延迟。自 2011 年起,BookKeeper 开始在 Apache ZooKeepe...
1 大数据平台的数据质量概述 数据质量是大数据挖掘能否卓有成效的基础,在大数据领域里有一句广为流传的话叫“Garbage In,Garbage Out”, 也就是说输入数据的...
常见的HBase数据迁移和备份的方式 我们知道目前HBase可以通过如下几种方式对数据进行数据的迁移和备份: 1、通过distcp命令拷贝hdfs文件的方式实现数据的迁移和备...
引言 一名优秀数据分析师的‘好苗子’的判断有三个:有数据逻辑、有结构化思维、有商业认知能力。 第1章 建立电商运营的“上帝视角” 第1课 服装与电商发展近史 纵观最近十几年,...
大数据存储引擎之哈希 数据结构就是键值对 优点:检索快 缺点:不支持范围扫描 如果数据都在内存中,那就很快的,比如常用redis 作为缓存组件(数据转到硬盘就另说了) 如果要...
Flink+Clickhouse实时数仓在广投集团的最佳实践 一、业务背景 由于历史原因,大型集团企业往往多个帐套系统共存,包括国内知名ERP厂商浪潮、用友、金蝶、速达所提供...