猜测
如果是我自己来写这样一个系统,那么启动过程会是怎样呢?
- 首先会有一个配置文件,我们去解析其中的监听端口,数据存储路径等等,所以第一步当然是解析配置;
- 根据配置创建每个es节点;
- 启动节点:节点运行会包含相应的服务,比如接受用户创建文档的请求并服务,以及其他的搜索请求等;同时可能也会需要一些服务来进行集群内部状态的同步等。
接下来,就带着这样一个想法去看看它是怎么实现的。
实现过程
初始化
系统由org.elasticsearch.bootstrap.Elasticsearch中的main开始,其中主要的过程在org.elasticsearch.bootstrap.Bootstrap中的init完成。
- 解析命令行参数,是否是合法命令(start,version,help,exit),若不是则退出;
- 从配置文件(.yml, .yaml, .json, .properties)中解析配置,针对不同的配置会有不同的配置解析器进行解析;
- 创建pid文件,同时获取jvm信息,若为client vm则会提示,建议为Server vm; 同时会对JAVA版本进行检查
$java -version
java version "1.8.0_121"
Java(TM) SE Runtime Environment (build 1.8.0_121-b13)
Java HotSpot(TM) 64-Bit Server VM (build 25.121-b13, mixed mode)
- 检查外部资源:mlockall(用于锁住es内存,不会导致ES内存经常swap等),seccomp(安全运行模式),crtlHandler(windows下的退出注册),主要通过JNA方式实现;
- 注册两种内部探针:ProcessProbe(进程层面的数据),OsProbe(操作系统层面的数据);
- 增加shutdown的hook,当集群shutdown的时候,会主动调用node的close方法,即让本node安全退出;
- 创建节点Node并启动。
节点的创建与启动
- 节点的创建是通过nodeBuilder来完成的,这里使用了Guice的Injector进行注入与获取实例。elasticsearch里面的组件基本都是用上面的方式进行模块化管理,elasticsearch对guice进行了封装,通过ModulesBuilder类构建es的模块;
- 节点的启动就是上述模块的启动,包括:
org.elasticsearch.node
- 启动后日志
[2018-05-07 20:46:57,782][INFO ][node ] [es-local] version[2.1.0-SNAPSHOT], pid[28348], build[NA/NA]
[2018-05-07 20:46:57,782][INFO ][node ] [es-local] initializing ...
objc[28348]: Class JavaLaunchHelper is implemented in both /Library/Java/JavaVirtualMachines/jdk1.8.0_121.jdk/Contents/Home/bin/java (0x1032c64c0) and /Library/Java/JavaVirtualMachines/jdk1.8.0_121.jdk/Contents/Home/jre/lib/libinstrument.dylib (0x10334a4e0). One of the two will be used. Which one is undefined.
[2018-05-07 20:46:59,710][INFO ][plugins ] [es-local] loaded [], sites []
[2018-05-07 20:46:59,784][INFO ][env ] [es-local] using [1] data paths, mounts [[/ (/dev/disk1s1)]], net usable_space [14.8gb], net total_space [112.8gb], spins? [unknown], types [apfs]
[2018-05-07 20:47:07,748][INFO ][node ] [es-local] initialized
[2018-05-07 20:47:07,748][INFO ][node ] [es-local] starting ...
[2018-05-07 20:47:07,951][INFO ][transport ] [es-local] publish_address {172.18.24.42:9300}, bound_addresses {172.18.24.42:9300}
[2018-05-07 20:47:08,014][INFO ][discovery ] [es-local] es-test/bWDpm_cxSVOpHTfAJ5UsTw
[2018-05-07 20:47:11,114][INFO ][cluster.service ] [es-local] new_master {es-local}{bWDpm_cxSVOpHTfAJ5UsTw}{172.18.24.42}{172.18.24.42:9300}, reason: zen-disco-join(elected_as_master, [0] joins received)
[2018-05-07 20:47:11,158][INFO ][http ] [es-local] publish_address {172.18.24.42:8201}, bound_addresses {172.18.24.42:8201}
[2018-05-07 20:47:11,158][INFO ][node ] [es-local] started
[2018-05-07 20:47:11,227][INFO ][gateway ] [es-local] recovered [0] indices into cluster_state
[2018-05-07 20:47:41,171][INFO ][cluster.routing.allocation.decider] [es-local] low disk watermark [85%] exceeded on [bWDpm_cxSVOpHTfAJ5UsTw][es-local][/Users/tangximing/workspace/research/es-research/data/es-test/nodes/0] free: 14.8gb[13.2%], replicas will not be assigned to this node
至此,ES的启动流程和最开始的想法基本相同,后续将开始对上述模块的实现进行分析。