Avatar notebook default
8篇文章 · 9212字 · 1人关注
  • Pig从入门到精通8:Pig的自定义函数

    Pig支持使用Java,Python,JavaScript三种语言编写的自定义函数UDF。一般情况下常用Java来实现Pig的自定义函数,本质上...

  • Pig从入门到精通7:Pig实现WordCount程序

    1.环境准备(1)启动Hadoop集群 [root@bigdata ~]# start-all.sh[root@bigdata ~]# jps2...

  • Pig从入门到精通6:PigLatin语句

    PigLatin语句类似于SQL语句,但是具有自己的语法格式。本节就来介绍一下PigLatin语句的使用。 1.PigLatin语句常用的Pig...

  • Pig从入门到精通5:Pig数据模型

    1.关系型数据库中的表结构 传统的关系型数据库中,表结构如下图所示: 为了保持数据的一致性,每一行记录都具有相同的列,而且每一列都要有值,哪怕是...

  • Pig从入门到精通4:Pig常用命令(2)

    本节来介绍一些Pig常用的数据分析命令。 1.load命令load命令用来加载数据到指定的表结构,语法格式如下: load '数据文件' [us...

  • Pig从入门到精通3:Pig常用命令(1)

    Pig的优点之一就是,操作HDFS文件系统特别快!我们知道,直接使用Hadoop自带的dfs命令操作HDFS文件系统,不管是查看目录下的内容,或...

  • Pig从入门到精通2:Pig安装配置

    Pig的安装模式有两种:本地模式和MapReduce模式(集群模式)。二者的区别是:本地模式操作的是本地Linux文件系统,不需要Hadoop的...

  • Resize,w 360,h 240
    Pig从入门到精通1:Pig简介

    1.什么是Pig Pig是一个用来处理大规模数据集的平台,最早是Yahoo!公司的项目,后来共享给了Apache公司。Pig可以看做是Hadoo...

文集作者