240 投稿
收录了18篇文章 · 2人关注
  • 小伙子,你知道缓慢变化维有多少种处理方法吗?

    什么是缓慢变化维?缓慢变化维有多少种处理方法?缓慢变化维,即同一维表中属性随时间发生变化,那对于这种变化的维度,在数据仓库建设时有多少种处理方法...

  • Resize,w 360,h 240
    hive连续登录问题

    现在有一张用户消费信息表,求问连续三天登录用户有多少个,用户连续交易的总额、连续登陆天数、连续登陆开始和结束时间、间隔天数: user_id b...

  • 数据仓库日期维表怎么做

    最近终于有点时间了,东拼西凑的设计了一个日期维表,也是数仓设计时比较常用的。表结构如下: dt string COMMENT '日历日期',lu...

  • Resize,w 360,h 240
    Doris调研学习

    简介:Doris(原百度 Palo)是一款基于大规模并行处理技术的分布式 SQL 数据库,由百度在 2017 年开源,2018 年 8 月进入A...

  • Resize,w 360,h 240
    Map Reduce执行过程

    Map Reduce 执行过程是数仓hql调优所必须熟知的,也是初高级数仓工程师面试基本必问的一块内容,所以为了面包,巩固学习一下。 Map R...

  • hive谓词下放

    保留表(Preserved Row table) 在outer join中需要返回所有数据的表叫做保留表,也就是说在left outer joi...

  • Resize,w 360,h 240
    hive 参数调优手册

    1. reduce 个数设置 方法1.调整hive.exec.reducers.bytes.per.reducer和hive.exec.redu...

  • Resize,w 360,h 240
    hive窗口函数使用

    hive窗口函数基本面试面sql必考项目,这里画一下重点猴,那现在就操练起来~窗口函数格式: 窗口说明:n PRECEDING:往前n行数据n ...

  • Resize,w 360,h 240
    数仓基础入门-10-实践篇

    有不少没涉及过数仓的同学问我一些比较基础的问题,为了更好的理解前面讲到的一些理论,写一个小小的demo体会一下~~我们要构建一个订单主题,构建订...

  • 数仓入门基础-9-缓慢变化维

    缓慢变化维的提出是因为维度的属性并不是静态的,他会随着时间线延长发生缓慢的变化。常用的三种处理方式: 1.重写维度值,不保留历史,始终取最新数据...

专题公告

分享学习大数据各个模块知识