1. 分布式协调技术
图中有三台机器,每台机器各跑一个应用程序。将这三台机器通过网络将其连接起来,构成一个系统来为用户提供服务,对用户来说这个系统的架构是透明的,他感觉不到我这个系统是一个什么样的架构。我们可以把这种系统称作一个分布式系统。
接下来再分析一下,在这个分布式系统中如何对进程进行调度,假设在第一台机器上挂载了一个资源,然后这三个物理分布的进程都要竞争这个资源,但又不希望他们同时进行访问,这时候就需要一个协调器,让他们有序的访问这个资源。这个协调器就是我们经常提到的锁,比如说"进程-1"在使用该资源的时候,会先去获得锁,"进程1"获得锁以后会对该资源保持独占,这样其他进程就无法访问该资源,"进程1"用完该资源以后就将锁释放掉,让其他进程来获得锁,那么通过这个锁机制,我们就能保证了分布式系统中多个进程能够有序的访问该临界资源。那么我们把这个分布式环境下的这个锁叫作分布式锁。这个分布式锁也就是我们分布式协调技术实现的核心内容.
2. Zookeeper原理
ZooKeeper是一种为分布式应用所设计的高可用、高性能且一致的开源协调服务,它提供了一项基本服务:分布式锁服务。由于ZooKeeper的开源特性,后来我们的开发者在分布式锁的基础上,摸索了出了其他的使用方法:配置维护、组服务、分布式消息队列、分布式通知/协调等。
ZooKeeper在实现这些服务时,首先它设计一种新的数据结构——Znode,然后在该数据结构的基础上定义了一些原语,也就是一些关于该数据结构的一些操作。有了这些数据结构和原语还不够,因为我们的ZooKeeper是工作在一个分布式的环境下,我们的服务是通过消息以网络的形式发送给我们的分布式应用程序,所以还需要一个通知机制——Watcher机制。那么总结一下,ZooKeeper所提供的服务主要是通过:数据结构+原语+watcher机制,三个部分来实现的。
具体原理可以看文章
3. Zookeeper安装
3.1 安装JAVA
[web@master ~]$ java –version #查看已经安装
java version "1.7.0_79"
Java(TM) SE Runtime Environment (build 1.7.0_79-b15)
Java HotSpot(TM) 64-Bit Server VM (build 24.79-b02, mixed mode)
如没有安装上传需要的java版本的rpm包. JDK
rpm -ivh jdk-7u79-linux-x64.rpm
vim /etc/profile
在文件最下方添加以下内容
JAVA_HOME=/usr/java/jdk1.7.0_79
PATH=$JAVA_HOME/bin:$PATH
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export JAVA_HOME
export PATH
export CLASSPATH
保存文件后,使环境变量生效
source /etc/profile
3.2 安装zookeeper
将zookeeper源码包上传到指定的位置
tar -zxvf zookeeper-3.4.10.tar.gz
使用默认的配置文件
cp zookeeper-3.4.10/conf/zoo_sample.cfg zookeeper/conf/zoo.cfg
3.3 配置文件zoo.cfg
# The number of milliseconds of each tick
tickTime=2000 #心跳时间间隔
# The number of ticks that the initial
# synchronization phase can take
initLimit=10 #初始化连接中leader和follower最大间隔多少个心跳。10X2000=20秒
# The number of ticks that can pass between
# sending a request and getting an acknowledgement
syncLimit=5 #leader和follower发送消息,请求和应答时间长度
# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just
# example sakes.
dataDir=/tmp/zookeeper#zookeeper保存数据的位置,默认日志也在该文件夹下
# the port at which the clients will connect
clientPort=2181 #服务端口
# the maximum number of client connections.
# increase this if you need to handle more clients
#maxClientCnxns=60
#
# Be sure to read the maintenance section of the
# administrator guide before turning on autopurge.
#
# http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance
#
# The number of snapshots to retain in dataDir
#autopurge.snapRetainCount=3
# Purge task interval in hours
# Set to "0" to disable auto purge feature
#autopurge.purgeInterval=1
4. Zookeeper实例
上述的配置文件是单体的实例.
启动和关闭服务:在/home/web/zookeeper-3.4.10/bin
[web@master bin]$ pwd
/home/web/zookeeper-3.4.10/bin
[web@master bin]$ ./zkServer.sh start #启动
ZooKeeper JMX enabled by default
Using config: /home/web/zookeeper-3.4.10/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
[web@master bin]$ ps -ef|grep zookeeper#查看服务进程
web 3219 1 2 10:04 pts/2 00:00:00 /usr/java/jdk1.7.0_79/bin/java -Dzookeeper.log.dir=. -Dzookeeper.root.logger=INFO,CONSOLE -cp /home/web/zookeeper-3.4.10/bin/../build/classes:/home/web/zookeeper-3.4.10/bin/../build/lib/*.jar:/home/web/zookeeper-3.4.10/bin/../lib/slf4j-log4j12-1.6.1.jar:/home/web/zookeeper-3.4.10/bin/../lib/slf4j-api-1.6.1.jar:/home/web/zookeeper-3.4.10/bin/../lib/netty-3.10.5.Final.jar:/home/web/zookeeper-3.4.10/bin/../lib/log4j-1.2.16.jar:/home/web/zookeeper-3.4.10/bin/../lib/jline-0.9.94.jar:/home/web/zookeeper-3.4.10/bin/../zookeeper-3.4.10.jar:/home/web/zookeeper-3.4.10/bin/../src/java/lib/*.jar:/home/web/zookeeper-3.4.10/bin/../conf:.:/usr/java/jdk1.7.0_79/lib/dt.jar:/usr/java/jdk1.7.0_79/lib/tools.jar -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.local.only=false org.apache.zookeeper.server.quorum.QuorumPeerMain /home/web/zookeeper-3.4.10/bin/../conf/zoo.cfg
web 3241 5561 0 10:04 pts/2 00:00:00 grep zookeeper
[web@master bin]$ sudo netstat -an |grep 2181 #查看监听端口
tcp 0 0 :::2181 :::* LISTEN
[web@master bin]$ sudo netstat -anltp |grep java #查看端口
tcp 0 0 :::59760 :::* LISTEN 3219/java
tcp 0 0 :::2181 :::* LISTEN 3219/java
[web@master bin]$ ./zkServer.sh stop #停止服务
ZooKeeper JMX enabled by default
Using config: /home/web/zookeeper-3.4.10/bin/../conf/zoo.cfg
Stopping zookeeper ... STOPPED
[web@master bin]$ ps -ef|grep zookeeper #查看服务是否停止
web 3585 5561 0 10:09 pts/2 00:00:00 grep zookeeper
集群配置:
在配置文件zoo.cnf最后加入集群服务器信息(每个机器都要配置):
server.1=192.168.199.1:2888:3888
server.2=192.168.199.2:2888:3888
server.3=192.168.199.3:2888:3888
改成你的ip地址,另外一般是奇数个服务器。后面的2888和3888端口,对等体使用前端口连接到其他对等体,后面端口进行领导选举
最后在每台机器上面启动配置即可。
一定要注意主机防火墙 2181 2888 3888端口
否则你会发现启动报错。
备注:
通过上述我们发现使用zookeeper非常简单,但是要理解里面的原理有一定难度。理解原理对整个技术架构非常重要,对后续故障处理,瓶颈分析都很重要,因此建议还是多学习下原理。