hadoop之旅2-centerOS7: 搭建分布式hadoop环境

大家可能在网上一搜索大数据,巴拉巴拉一大堆的理论性的东西扑面而来,都是这样过来的,当时一脸懵逼,所以在此就不给大家再介绍理论性的知识了,直接带大家搭建分布式的开发环境。

hadoop的分布式架构 (一主二从)

主机名 ip地址 namenode datanode
master 192.168.6.133
slave1 192.168.6.131
slave2 192.168.6.132

第一步

虚拟机,java环境准备

需要有一台centerOS7虚拟机,同时已经搭建好了jdk的环境,如有疑问可移驾
hadoop之旅1-centerOS7: 搭建java环境

第二步

软件准备

准备好hadoop的开发包

  1. apache官网下载
  2. apache历史版本库下载
  3. 我给大家分享的百度云链接下载 版本:hadoop-2.7.3
  4. 我使用filezilla软件将解压包放入linux系统,大家也可以通过wget命令直接下载到linux系统中

第三步

解压hadoop,重命名

  1. 在下载的hadoop压缩包的目录下解压hadoop压缩包
[root@localhost mmcc]# tar -zxvf hadoop-2.7.3.tar.gz 
....
//重命名目录名称(可选)
[root@localhost mmcc]# mv hadoop-2.7.3/ hadoop2.7.3
  1. 查看hadoop的根路径
[root@localhost mmcc]# cd hadoop2.7.3/
[root@localhost hadoop2.7.3]# pwd
/home/mmcc/hadoop2.7.3   //配置环境变量时会用到

第四步

配置环境变量

  1. /etc/profile最下面,hadoop之旅1-centerOS7: 搭建java环境章节配置的PATH,CLASSPATH上面增加环境变量配置
HADOOP_HOME=/home/mmcc/hadoop2.7.3
PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$JAVA_HOME/bin:$PATH:.
  1. 使环境变量生效
[root@localhost jdk1.8]# source /etc/profile
  1. 配置hadoop的java环境,编辑hadoop根目录下/etc/hadoop/下的hadoop.env.sh脚本文件
vi /hadoop-2.7.3/etc/hadoop/hadoop.env.sh
export JAVA_HOME=/home/mmcc/jdk1.8  //配置java的环境目录
  1. 配置hadoop的启动环境,编辑hadoop根目录下/etc/hadoop/下的core-site.xml文件。
<property>
       <name>fs.defaultFS</name>
       <value>hdfs://master:9000</value>  (master处为当前主机ip或主机名)  
</property>

此处的master后面会教大家

第五步

分布式环境搭建

  1. 此处为了方便,直接通过虚拟机克隆的方式,将镜像克隆多份,这样在此之前搭建的所有环境都是同步存在的
image
  1. 使用该命令给每个节点的设置对应的主机名
[root@localhost mmcc]# hostnamectl set-hostname master/slave1/slave2
  1. 检测网络
[root@localhost mmcc]# ifconfig
ens33: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 192.168.6.133  netmask 255.255.255.0  broadcast 192.168.6.255
        inet6 fe80::3d1d:5127:6666:c62d  prefixlen 64  scopeid 0x20<link>
        ether 00:0c:29:f4:ef:5d  txqueuelen 1000  (Ethernet)
        RX packets 317168  bytes 315273916 (300.6 MiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 149675  bytes 14400069 (13.7 MiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0
lo: flags=73<UP,LOOPBACK,RUNNING>  mtu 65536
        inet 127.0.0.1  netmask 255.0.0.0
        inet6 ::1  prefixlen 128  scopeid 0x10<host>
        loop  txqueuelen 1  (Local Loopback)
        RX packets 12826  bytes 3163428 (3.0 MiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 12826  bytes 3163428 (3.0 MiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

如果查询不到ip地址,需要配置网络

cd  /etc/sysconfig/network-scripts/
vi ifcfg-ens33 (我的虚拟机版本,别的版本可能不一样)
ONBOOT="yes"  表开启网络。
  1. 设置网络别名,即IP对应的别名 如:hdfs://master:9000
[root@localhost network-scripts]# vi /etc/hosts
127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
192.168.6.133   master
192.168.6.131   slave1
192.168.6.132   slave2

重启网络

service network restart  重启网络

然后大家可以试着ping master/slave1/slave2如果ping通说明配置成功

  1. 格式化hdfs,在每台节点上执行以下命令
hdfs namenode -format

启动之前进行格式化,如果没有error和Exception 表示格式化成功

6. master主机配置hadoop集群节点

cd /home/mmcc/hadoop2.7.3/etc/hadoop
[root@localhost hadoop]# vi slaves 
//增加以下内容
slave1
slave2

7. 关闭每个节点防火墙,启动hdfs服务,

[root@localhost mmcc]# systemctl stop firewalld
[root@localhost mmcc]# hadoop-daemon.sh start namenode //主节点master
[root@localhost mmcc]# hadoop-daemon.sh start datanode //从节点slave1,slave2

然后可以在网页上输入主节点的地址master:50070ip地址:50070查看当前的状态及其节点状态哦。到此一个分布式的hadoop环境已经成功启动。
下一节会教大家如何进行免密登录,一键启动集群,及一些简单的hdfs文件存储命令,
大家在配置过程中如果有什么问题可以查看log日志进行问题排查。欢迎加我微信一起学习一起进步哈

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342

推荐阅读更多精彩内容

  • 一、系统参数配置优化 1、系统内核参数优化配置 修改文件/etc/sysctl.conf,添加如下配置,然后执行s...
    张伟科阅读 3,720评论 0 14
  • 终极算法 关注微信号每天收听我们的消息终极算法为您推送精品阅读 前言 Hadoop 在大数据技术体系中的地位至关...
    Yespon阅读 129,602评论 12 168
  • 说明:本文所有操作均在 64位 ubuntu 16.04 操作系统下进行 准备 通过物理机器虚拟化 4 台虚拟机:...
    kviccn阅读 2,750评论 4 5
  • 摘要:大数据门槛较高,仅仅环境的搭建可能就要耗费我们大量的精力,本文总结了作者是如何搭建大数据环境的(单机版和集群...
    杨赟快跑阅读 15,005评论 3 65
  • 禅寺 在依稀温暖的阳光下,我站在宁静的禅寺,这里远离城市的喧嚣,这世界上仿佛只有我一个人的...
    心若安一切安好阅读 206评论 0 3