240 发简信
IP属地:安徽
  • FileStatus类介绍

    原文链接 FileStatus对象封装了文件系统中文件和目录的元数据,包括文件的长度、块大小、备份数、修改时间、所有者以及权限等信息。 File...

  • Resize,w 360,h 240
    Hadoop InputFormat介绍

    Hadoop InputFormat介绍 1 概述 我们在编写MapReduce程序的时候,在设置输入格式的时候,会调用如下代码: 通过上面的代...

  • Resize,w 360,h 240
    Kafka背景及架构介绍

    Kafka背景及架构介绍 Kafka是由LinkedIn开发的一个分布式的消息系统,使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用。目...

  • HBase扫描操作Scan

    HBase扫描操作Scan 1 介绍 扫描操作的使用和get()方法类似。同样,和其他函数类似,这里也提供了Scan类。但是由于扫描工作方式类似...

  • HBase CURD之Delete

    HBase CURD之Delete HTable提供了删除方法,同时与之前的方法一样有一个相应的类为Delete。 1 单行删除 delete(...

  • HBase CURD之Get

    下面我们将介绍从客户端API中获取已存数据的方法。HTable类中提供了get()方法,同时还有与之对应的Get类。get方法分为两类:一类是一...

  • Resize,w 360,h 240
    HBase CURD之Put

    HBase数据插入使用Put对象,Put对象在进行数据插入时,首先会向HBase集群发送一个RPC请求,得到相应之后将Put类中的数据通过序列化...

  • Resize,w 360,h 240
    HBASE 概述

    HBASE 概述 HBase是什么 HBase是一种构建在HDFS之上的分布式、面向列的存储系统。在需要实时读写、随机访问超大规模数据集时,可以...

  • Hive分析函数和窗口函数

    Hive分析函数和窗口函数 在Hive 0.11之后支持的,扫描多个输入的行计算每行的结果。通常和OVER,PARTITION BY, ORDE...