240 发简信
IP属地:广东
  • HIVE-DML

    DML LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename...

  • HIVE-DDL

    DATABASE CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name [COMMENT...

  • MR读文件过程

    Read阶段的流程 根据InputFormat ①切片, getSplit() ②使用输入格式的RR读取数据, createRecordRead...

  • Resize,w 360,h 240
  • Yarn 和 Zookeeper

    Yarn的作用 Yarn是一个分布式资源调度器组件。这个组件的主要作用是在每次接收到请求后,会查看当下的各个子节点的状况,统筹出运算资源的调度方...

  • Resize,w 360,h 240
    缺失值处理

    1. 删除 主要有简单删除法和权重法。简单删除法是对缺失值进行处理的最原始方法。 (1) 简单删除法 此方法将存在缺失值的数据条目(对象,元组,...

  • Resize,w 360,h 240
    异常值检查与处理

    异常值的定义: 异常值,即在数据集中存在不合理的值,又称离群点,如下所示: 异常值判别方法: 1.简单统计法 对属性值进行一个描述性的统计,从而...

  • Hive SQL (HQL)小结

    *Hive创建表的方式 1、使用create命令创建一个新表 例如: create table if not exists db_web_dat...

  • Hive1

    ##数据库与数据仓库 数据库:mysql,roacle,sqlserve,DB,MDB,... 数据仓库:Hive,是MR的客户端,也就是说不必...