240 投稿
收录了32篇文章 · 8人关注
  • Resize,w 360,h 240
    hive的高阶函数

    问题: 1,如果让你计算5月21号这个日期前3天到后面3天的数据和?(不只是5月21号这一天,所有天的前3天加上后3天的和) 2,对于组内排序的...

  • 数仓--Hive-面试之Hive优化策略

    Hive的优化策略大致分为:配置优化(hive-site.xml和hive-cli执行前配置)、表优化、hive数据倾斜解决方案。回答的时候需要...

  • Resize,w 360,h 240
    结合Hive、Sqoop统计日志pv和uv

    分析 数据源格式 需求分析现在每天中的每一个小时,都有一个日志文件,想要统计每天内每个时段的PV和UV(根据guid然后去重计数)。最后的结果形...

  • Resize,w 360,h 240
    HDFS中的HA原理解析

    前言Hadoop2.0之前,NameNode是单个集群的故障点,NameNode作为集群首脑,存放着集群中所有的元数据,一旦节点出错,将导致整个...

  • Resize,w 360,h 240
    Hive【基础03】| 视图 View 操作

    一、视图的作用 二、视图基本操作 1. 查找所有视图 2. 新增视图 3. 查看视图结构信息 4. 删除视图 一、视图的作用 视图是基于数据库的...

    0.6 Ada54 0 3
  • Resize,w 360,h 240
    Hive平滑过渡到Spark Sql

    Hive概述 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的 SQL 查询功能,将类...

    3.9 董二弯 0 10
  • 用HiveQL计算连续天数问题的方法

    昨晚简书服务器可能出了什么bug,文章发布出去都会变成完全空白。没办法,只能断更一天,放在今天发了,大概能达到十万字里程碑了吧。 在日常工作中,...

  • Resize,w 360,h 240
    Hive 远程模式

    版本: 2.3.3 配置mysql数据库: 配置metastore thrift : 3.开启允许并发执行 HiveServer2的配置 使用s...

  • Resize,w 360,h 240
    Hive | Hive 安装详解

    一、Hive 介绍 二、准备工作 三、Hive下载 四、Hive 安装 五、Hive 启动 一、Hive 介绍 Hive 是构架在 hadoop...

    0.9 Ada54 0 7
  • Resize,w 360,h 240
    数仓--DW--Hadoop数仓实践Case-08-退化维度

    退化维度概述 退化维度,该技术减少维度的数量, 简化维度数据仓库模式。 简单的模式比复杂的更容易理解, 也有更好的查询性能。 有时, 维度表中除...

专题公告

大数据相关的学习记录