一、Redis集群简介
目前redis的集群有3种搭建方式:
1)keepalived:通过 keepalived 的虚拟 IP,提供主从的统一访问,在主出现问题时, 通过 keepalived 运行脚本将从提升为主,待主恢复后先同步后自动变为主,该方案的好处是主从切换后,应用程序不需要知道(因为访问的虚拟 IP 不变),坏处是引入 keepalived 增加部署复杂性,在有些情况下会导致数据丢失
2)redis-trib:ruby提供的串联插件
3)Sentinel:官方提供的方式,在2.4版本以后才出来的方式,在2.4版本前都会选择前面两种方式。
我们将采用第三种方式进行集群搭建。
二、Redis集群原理
1):Master的状态检测
2):如果Master异常,则会进行Master-Slave切换,将其中一个Slave作为Master,将 之前的Master作为Slave
3):Master-Slave切换后,master_redis.conf、slave_redis.conf和sentinel.conf的内容都 会发生改变,即master_redis.conf中会多一行slaveof的配置,sentinel.conf的监控目标 会随之调换
三、Redis集群工作方式
1):每个Sentinel以每秒钟一次的频率向它所知的Master,Slave以及其他 Sentinel 实 例发送一个PING命令
2):如果一个实例(instance)距离最后一次有效回复 PING 命令的时间超过 down-after-milliseconds选项所指定的值, 则这个实例会被 Sentinel 标记为主观下线。
3):如果一个Master被标记为主观下线,则正在监视这个Master的所有 Sentinel 要以 每秒一次的频率确认Master的确进入了主观下线状态。
4):当有足够数量的 Sentinel(大于等于配置文件指定的值)在指定的时间范围内确认 Master的确进入了主观下线状态, 则Master会被标记为客观下线
5):在一般情况下, 每个 Sentinel 会以每 10 秒一次的频率向它已知的所有Slave发 送INFO命令
6):当Master被 Sentinel 标记为客观下线时,Sentinel 向下线的 Master 的所有 Slave 发送INFO命令的频率会从 10 秒一次改为每秒一次
7):若没有足够数量的 Sentinel 同意 Master 已经下线, Master 的客观下线状态就会 被移除。 若Master重新向 Sentinel 的 PING 命令返回有效回复, Master 的主观下线状态就 会被移除。
四、Sentinel环境搭建
环境准备:
我们目前需要3个全新的redis,我这里有3个虚拟机分别为192.168.159.128、192.168.159.129、192.168.159.130。
保证3个redis分别都能正常使用。
修改192.168.159.129和192.168.159.130 中redis.conf文件信息,增加
masterauth "123456"
slaveof 192.168.159.128 6379
修改192.168.159.128中redis.conf文件信息,增加
masterauth "123456"
此时分别启动三个系统中的redis
cd /usr/local
./src/redis-server /usr/local/redis-3.2.1/redis.conf &
数据正常同步,此时是一个标准的主从关系
修改三个系统中的sentinel.conf
port 26379
daemonize yes
sentinel monitor mymaster 192.168.159.128 6379 2
sentinel down-after-milliseconds mymaster 5000
sentinel parallel-syncs mymaster 1
sentinel failover-timeout mymaster 10000
sentinel auth-pass mymaster 123456
protected-mode no
logfile "/usr/local/redis-3.2.1/sentinel.log"
#上面配置文件说明如下:
#第一行指定sentinel端口号
#第二行指定sentinel为后台启动
#第三行指定Sentinel去监视一个名为 mymaster 的Master,Master的IP地址为192.168.159.128,端口号为6379,最后的2表示当有2个Sentinel检测到Master异常时才会判定其失效,即只有当2个Sentinel都判定Master失效了才会自动迁移,如果Sentinel的数量不达标,则不会执行自动故障迁移。
#第四行指定Sentinel判定Master断线的时间。(单位为毫秒,判定为主观下线SDOWN)
#第五行指定在执行故障转移时,最多可以有多少个Slave同时对新的Master进行同步。这个数字设置为1,虽然完成故障转移所需的时间会变长,但是可以保证每有1个Slave处于不能处理命令请求的状态
分别启动三个系统中的哨兵
cd /usr/local
./src/redis-sentinel /usr/local/redis-3.2.1/sentinel.conf &
查看哨兵日志文件,发现主节点为192.168.159.128
停止主节点
查看日志发现主节点变为192.168.159.130
插入数据
查看数据,发下数据在192.168.159.130和192.168.159.129中正常同步
此时再启动192.168.159.128
查看192.168.159.128中的数据,发现及时同步了