240 发简信
IP属地:四川
  • Resize,w 360,h 240
    spark应用执行流程

    1.Spark的应用执行机制 用户提交一个Application到Spark集群执行的基础流程如下图所示: (1)Driver进程启动,构建Sp...

  • Resize,w 360,h 240
    数据模型和数据存储格式

    以列式数据存储格式parquet介绍两者区别。 三个概念: 存储格式,是数据的二进制组织表示形式,如parquet 数据对象转换器,其任务是在外...

  • RoaringFormatSpec

    roaring bitmap存储格式规范 通用格式 说明: 有一个初始化“ cookie头”,它使我们能够识别出位流是一个roaring bit...

  • Resize,w 360,h 240
    数据库查询及优化艺术

    一、了解关系代数 关系代数是一种过程化查询语言。它包括一个运算的集合,这些运算以一个或两个关系为输入,产生一个新的关系作为结果。关系代数是关系型...

  • maven中jar包冲突

    Java应用程序因某种因素,加载不到正确的类而导致其行为跟预期不一致。 具体来说可分为两种情况:1)应用程序依赖的同一个Jar包出现了多个不同版...

  • Resize,w 360,h 240
    Antlr

    Antlr简介 ANTLR 语言识别的一个工具 (ANother Tool for Language Recognition ) 是一种语言工具...

  • Resize,w 360,h 240
    Presto

    背景 Facebook的数据仓库存储在少量大型Hadoop/HDFS集群。Hive是Facebook在几年前专为Hadoop打造的一款数据仓库工...

  • 论文- Revenue Debugging in Advertising Systems

    1-概述 该篇论文主题是广告系统中针对广告收入异常波动根本原因分析; 提出的Adtributor算法主要是基于指标期望值和实际值的分布,计算其j...