IP属地:四川
1.Spark的应用执行机制 用户提交一个Application到Spark集群执行的基础流程如下图所示: (1)Driver进程启动,构建Sp...
以列式数据存储格式parquet介绍两者区别。 三个概念: 存储格式,是数据的二进制组织表示形式,如parquet 数据对象转换器,其任务是在外...
roaring bitmap存储格式规范 通用格式 说明: 有一个初始化“ cookie头”,它使我们能够识别出位流是一个roaring bit...
一、了解关系代数 关系代数是一种过程化查询语言。它包括一个运算的集合,这些运算以一个或两个关系为输入,产生一个新的关系作为结果。关系代数是关系型...
Java应用程序因某种因素,加载不到正确的类而导致其行为跟预期不一致。 具体来说可分为两种情况:1)应用程序依赖的同一个Jar包出现了多个不同版...
Antlr简介 ANTLR 语言识别的一个工具 (ANother Tool for Language Recognition ) 是一种语言工具...
背景 Facebook的数据仓库存储在少量大型Hadoop/HDFS集群。Hive是Facebook在几年前专为Hadoop打造的一款数据仓库工...
1-概述 该篇论文主题是广告系统中针对广告收入异常波动根本原因分析; 提出的Adtributor算法主要是基于指标期望值和实际值的分布,计算其j...