Hadoop 2.6.4单机和伪分布式模式安装

软件准备


  1. jdk-7u80-linux-x64.tar.gz
  2. hadoop-2.6.4.tar.gz
  3. ssh客户端

JDK安装配置


  1. 下载解压 jdk-7u80-linux-x64.tar.gz。

  2. 配置环境变量, 编辑 .bash_profile 文件,在文件末尾添加以下内容:

    # Java Env
    export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.7.0_80.jdk/Contents/Home
    export JRE_HOME=/Library/Java/JavaVirtualMachines/jdk1.7.0_80.jdk/Contents/Home/jre
    export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
    export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib
    

保存后,运行 source .bash_profile,使环境变量立即生效。

  1. 输入 java -version 可以看到成功安装的JDK版本信息。

Hadoop安装配置


  1. 下载解压 hadoop-2.6.4.tar.gz

  2. 修改 .bash_profile 文件配置 Hadoop 环境变量,在文件末尾添加以下内容:

     # Hadoop Env
     export HADOOP_HOME=/Users/jackiehff/Software/hadoop-2.6.4
     export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
    

保存后,运行 source .bash_profile, 使 Hadoop 环境变量立即生效。

  1. 修改 Hadoop 环境变量配置文件 etc/hadoop/hadoop-env.sh,在文件末尾添加以下内容:

     # The java implementation to use.
     export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.7.0_80.jdk/Contents/Home
     export HADOOP_PREFIX=/Users/jackiehff/Software/hadoop-2.6.4
    
  2. 输入 hadoop version 可以看到成功安装的 Hadoop 版本信息。

  3. 输入 hadoop 可以看到 hadoop 命令的用法。

单机模式


Hadoop默认配置运行于非分布式模式中,即作为单个的 Java 进程运行,这样调试起来会很方便。下面运行一下自带的 WordCount 程序。

mkdir input
cp etc/hadoop/*.xml input
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jar grep input output 'dfs[a-z.]+'

运行过程大致如下:



注意:output 目录必须事先不存在。查看运行结果:

cat outut/*

运行结果如下:


伪分布式模式


配置ssh

因为伪分布模式下,即使所有节点都在一台机器上,Hadoop 也需要通过 ssh 登录,这一步的目的是配置本机无密码 ssh 登录。

验证是否可以不需要密码 ssh 到 localhost:

ssh localhost

如果不行,执行如下命令:

 sh-keygen -t dsa -P '' -f ~/.ssh/id_dsacat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

再次执行 ssh localhost,就无需密码。


修改Hadoop配置文件


伪分布式模式主要涉及以下配置信息:

  1. 修改 Hadoop 的核心配置文件 core-site.xml, 主要是配置 HDFS 的地址和端口号。

     <configuration> 
         <property> 
             <name>fs.defaultFS</name> 
             <value>hdfs://localhost:9000</value> 
         </property> 
         <property> 
             <name>hadoop.tmp.dir</name> 
             <value>/Users/jackiehff/Software/hadoop-2.6.4/tmp</value> 
         </property>
      </configuration>
    
  2. 修改 Hadoop 中 HDFS 的配置文件 hdfs-site.xml, 主要是配置数据副本。

     <configuration> 
         <property> 
             <name>dfs.replication</name>
             <value>1</value> 
         </property>
     </configuration>
    
  3. 修改 Hadoop 中 MapReduce 配置文件 mapred-site.xml, 主要是配置 MapReduce 框架名称。
    <configuration>
    <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
    </property>
    </configuration>

  4. 修改 Hadoop 中 YARN 的配置文件 yarn-site.xml, 主要用于指定 shuffle server。
    <configuration>

    <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
    </property>
    </configuration>

运行Hadoop


  1. 格式化文件系统

     hdfs namenode -format
    
  2. 启动 NameNode 和 DataNode 守护进程 start-dfs.sh

Hadoop 守护进程日志输出写到 $HADOOP_LOG_DIR 指定的目录 (默认是 $HADOOP_HOME/logs) 输出结果如下:
16/04/11 21:38:26 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicableStarting namenodes on [localhost]
localhost: starting namenode, logging to /Users/jackiehff/Software/hadoop-2.6.4/logs/hadoop-jackiehff-namenode-jackiehff.local.out
localhost: starting datanode, logging to /Users/jackiehff/Software/hadoop-2.6.4/logs/hadoop-jackiehff-datanode-jackiehff.local.out
Starting secondary namenodes [0.0.0.0]0.0.0.0: starting secondarynamenode, logging to /Users/jackiehff/Software/hadoop-2.6.4/logs/hadoop-jackiehff-secondarynamenode-jackiehff.local.out
16/04/11 21:39:39 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable

使用 **jps** 命令查看当前所有 Java 进程

可以看到 HDFS 启动成功。

  1. 浏览器访问 NameNode, 地址:http://localhost:50070/

  2. 启动 ResourceManager 和 NodeManager 进程
    start-yarn.sh

输出信息如下:
starting yarn daemonsstarting resourcemanager, logging to /Users/jackiehff/Software/hadoop-2.6.4/logs/yarn-jackiehff-resourcemanager-jackiehff.local.out
localhost: starting nodemanager, logging to /Users/jackiehff/Software/hadoop-2.6.4/logs/yarn-jackiehff-nodemanager-jackiehff.local.out

使用 jps 查看当前所有 Java 进程

可以看到 NodeManager 和 ResourceManager 启动成功。

  1. 浏览器访问 ResourceManager, 地址:http://localhost:8088/

  2. 创建执行MapReduce 任务所需的HDFS 目录。

     hdfs dfs -mkdir /input
    
  3. 拷贝输入文件到分布式文件系统

     hdfs dfs -put etc/hadoop/* /input
    
  4. 运行示例程序

     hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jar grep /input output dfs'[a-z.]+'
    
  5. 查看运行结果

     hdfs dfs -cat output/*
    

结果如下图所示:


可以在浏览器中查看相关 Job

  1. 停止 HDFS

    stop-dfs.sh
    
  2. 停止 YARN

    stop-yarn.sh
    
点击并拖拽以移动

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,524评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,869评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,813评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,210评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,085评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,117评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,533评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,219评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,487评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,582评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,362评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,218评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,589评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,899评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,176评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,503评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,707评论 2 335

推荐阅读更多精彩内容