Serf是什么?
Serf是hashicorp开源的去中心化成员管理、失败检测和服务编排工具,具有轻量级、高可用和分区容错的特点。Serf底层采用gossip协议,通过在集群中广播消息,从而实现了集群中节点下线自动感知。由于gossip协议实现了最终一致性,所以Serf是一个AP系统。Serf可应用于负载均衡器、Memcached或者Redis集群管理、DNS记录更新等场景。
Serf如何工作?
Serf建立在gossip协议之上,实现了"SWIM: Scalable Weakly-consistent Infection-style Process Group Membership Protocol"论文中算法,集群中每个节点维护一个成员列表,通过失效检测器模块检测节点是否宕机,传播组件将节点成员列表进行交换合并,从而更新集群几点状态。
Serf传播组件
传播组件中,节点将维护的成员列表随机的发往集群中若干节点,从而进行信息交换。一般有两种交换模式:Anti-entropy和Rumor mongering。Anti-entropy会交换节点的全量信息,Rumor mongering会交换节点的增量信息。对于每种模式,具体实施时,可以采用Push、Pull或者Push-Pull混合方式。Push方式会主动推出新信息到其他节点;Pull方式需要随机选择若干节点,推送自己的信息;Push-Pull混合方式则需要结合Push和Pull进行信息双向交换。Serf采用了Anti-entropy模式,交换信息时使用Push-Pull混合方式。
Serf实效检测器
失效检测器则通过轮询成员列表,定期发送心跳信息来检测节点状态。心跳信息会通过多种通信方式进行发送,首先会定向发送UDP包,如果在超时时间内没有收到确认回复,则会随机选择若干节点,通过向中继节点发送间接心跳信息,委托中继节点确定节点状态;如果中继节点仍然没有收到回复,则会将该节点标记为疑似实效节点,在确定的阈值范围内,如果没有收到回复信息,才会将节点最终标记为实效。
在Serf所采用的gossip协议中,同时融入了网络诊断功能,该功能实现了"Vivaldi: A Decentralized Network Coordinate System"论文中的算法。通过维持节点在集群中的多维度坐标,来计算节点间RTT时间。
Serf集群搭建
Serf支持接收命令行请求,从而实现节点添加,用户查询及事件处理。下面以搭建2个节点的集群为例,说明Serf如何处理命令行请求。
首先,从官网下载二进制压缩包,解压后及为二进制可执行文件。
执行agent命令启动Serf节点1,该节点具有集群唯一的名字foo,gossip端口绑定地址127.0.0.1:5000,集群间rpc通信端口绑定127.0.0.1:7373。
serf agent -node=foo -bind=127.0.0.1:5000 -rpc-addr=127.0.0.1:7373
同样格式的命令启动Serf节点2:
serf agent -node=bar -bind=127.0.0.1:5001 -rpc-addr=127.0.0.1:7374
虽然此时已经有两个节点启动,但是这两个节点并不知道彼此的存在,也就是说没有形成一个集群。为了能够让节点能够彼此发现,需要手动将节点添加到一个已知的集群,这需要执行Serf的join命令:
serf join 127.0.0.1:5001
该命令告诉foo节点,加入节点bar所在的集群。此时通过查询命令members,则可以看到集群节点状态:
$ serf members
foo 127.0.0.1:5000 alive
bar 127.0.0.1:5001 alive
可以看到集群中已经有两个状态为alive的节点,至此一个测试使用的Serf集群搭建成功。