最近在看《Tomcat内核设计剖析》,发现这本书写的真的很好,并没有陷在源码当中,从整体设计的角度对Tomcat进行了讲解。当涉及到具体逻辑讲解的时候,大多使用伪代码,简洁明了。回头再看我写的浅析ConcurrentHashMap(1.8)一文,陷入了单纯阅读源码的泥沼,并没有从全局的角度讲述ConcurrentHashMap的设计理念以及优秀的实现,一叶障目。等有时间的时候我会重构一下那篇文章。
整体浏览Tomcat
整体结构及组件介绍
Server组件:Server是最顶级的组件,代表Tomcat的运行实例;包含Listener组件用以监听生命周期中的各种事件;包含GlobalNamingResources组件用以集成JNDI;包含Service组件用以提供服务。
Service组件:Service是服务的抽象,代表请求从接受到处理的所有组件的集合;Server组件可以包含多个Service组件;包含Connector组件用以接收客户端的信息;包含Engine组件用以处理请求;包含Executor用以提供线程池执行任务。
Connector组件:接收客户端连接并接收信息报文,信息报文经由它解析后送往容器中处理;包含Mapper组件对请求地址进行路由;包含CoyoteAdaptor组件用以将Connector组件和Engine等容器组件适配起来;包含Protocol组件用以接收客户端连接、接收客户端信息报文、报文解析处理、对客户端响应等整个过程。
Protocol组件:包含JioEndPoint组件,其中的Acceptor组件将启动某个端口的监听,将监听到的请求放入线程池Executor组件,其中的Processor组件对HTTP协议解析并传递到Engine容器继续处理;NIO模式下NioEndPoint多了一个Poller组件轮询多个客户端连接处理事件。
Engine组件:代表全局Servlet引擎;每个Service组件只能包含一个Engine容器组件;包含Listener组件用以在生命周期中对Engine相关的事件进行监听;包含AccessLog组件以记录访问日志;包含Cluster组件以提供集群功能,将需要共享的数据同步到集群中的其他Tomcat实例中;包含Pipeline组件用以处理请求;包含Realm组件用以提供安全权限功能。
Host组件:代表虚拟主机;一个Engine组件可以包含若干个Host容器组件;包含Listener组件用以在生命周期中对Host相关的事件进行监听;包含AccessLog组件以记录访问日志;包含Cluster组件以提供集群功能,将需要共享的数据同步到集群中的其他Tomcat实例中;包含Pipeline组件用以处理请求;包含Realm组件用以提供安全权限功能。
Context组件:是Web应用的抽象,Web应用部署到Tomcat后运行时就会转化成Context对象;包含了各种静态资源、若干Servlet(Wrapper容器)以及各种其他动态资源;包含Listener组件用以在生命周期中对Context相关的事件进行监听;包含AccessLog组件以记录访问日志;包含Pipeline组件用以处理请求;包含Realm组件用以提供安全权限功能;包含Loader组件用以加载Web应用的资源,保证不同Web应用之间的资源隔离;包含Manager组件用以管理Web容器的会话,包括维护会话的生成、更新和销毁;包含NamingResource组件将Tomcat配置文件的server.xml和Web应用的context.xml资源和属性映射到内存中;Mapper组件用以作为路由映射Servlet。
Wrapper组件:对应的是Servlet;包含Web应用开发常用的Servlet组件;包含ServletPool组件用以存放Servlet对象,当Web应用的Servlet实现了SingleThreadModel接口时则会再Wrapper中产生一个Servlet对象池,线程执行时,需先从对象池中获取到一个Servlet对象,ServletPool组件能保证Servlet对象的线程安全;包含Pipeline组件用以处理请求。
请求处理的整个过程
1:Tomcat启动后,Connector组件的接收器(Acceptor)将会监听是否有客户端套接字连接并接收Socket。
2:监听到客户端连接后将连接交由线程池Executor处理,开始执行请求响应任务。
3:Http11Processor组件负责从客户端连接中读取信息报文,解析HTTP的请求行、请求头部、请求体;将解析后的报文封装成Request对象,方便后面处理时通过Request对象获取HTTP协议的相关值。
4:Mapper组件根据HTTP协议请求行的URL属性值和请求头部的Host属性值匹配对应的Servlet;将路由的结果封装到Request对象中。
5:CoyoteAdaptor组件负责将Connector组件和Engine容器连接起来,将Request和Response传递到Engine容器,调用它的管道。
6:Engine容器的管道(Pipeline)开始处理请求,管道里包含若干阀门(Valve),每个阀门负责某些处理逻辑;可以根据自己的需要往管道中添加自定义的阀门;最后执行基础阀门EngineValve,负责调用Host容器的管道。
7:Host容器的管道开始处理请求;执行完若干阀门后执行基础阀门HostValve,调用Context容器的管道。
8:Context容器的管道开始处理请求;执行完若干阀门后执行基础阀门ContextValve,调用Wrapper容器的管道。
9:Wrapper容器的管道开始处理请求;执行若干阀门后执行基础阀门WrapperValve,执行该Wrapper容器对应的Servlet对象的处理方法,对请求进行逻辑处理并将结果输出到客户端。
Server组件与Service组件
Server组件
Server组件作用:提供了监听器机制,用于在Tomcat整个生命周期中对不同事件进行处理;提供了Tomcat容器全局的命名资源实现;监听某个端口以接收SHUTDOWN命令。
AprLifeCycleListener监听器:监听器对初始化前的事件和销毁后的事件感兴趣;在Tomcat初始化前,该监听器会尝试初始化APR库;在Tomcat销毁后,该监听器会做APR的清理工作。
JasperListener:在Tomcat初始化前该监听器会初始化Jasper组件(Tomcat的JSP编译器核心引擎)。
JreMemoryLeakPreventionListener监听器:提供解决JRE内存泄露和锁文件的一种措施;该监听器会在Tomcat初始化时使用系统类加载起先加载一些类和设置缓存属性,以避免内存泄漏和锁文件。
GlobalResourcesLifecycleListener监听器:实例化Server组件里面JNDI资源的MBean并交由JMX管理;监听器对生命周期内的启动事件和停止事件感兴趣;启动时创建MBean,终止时销毁MBean。
ThreadLocalLeakPreventionListener监听器:解决ThreadLocal的使用可能带来的内存泄漏问题;当Web应用重加载时销毁线程池的线程并重新创建新线程。
NamingContextListener监听器:负责Server组件内全局命名资源在不同生命周期的不同操作;在Tomcat启动时创建命名资源、绑定命名资源;在Tomcat停止前解绑命名资源、反注册MBean。
全局命名资源:提供的命名对象通过ResourceLink可以给所有Web应用使用。
监听SHUTDOWN命令:Server会另外开放一个端口用于监听关闭命令;客户端传输的第一行如果能匹配关闭命令(默认为SHUTDOWN)则整个Server将关闭;主线程在完成所有启动工作后进入等待SHUTDOWN命令的环节,一旦匹配SHUTDOWN命令则跳出循环执行Tomcat关闭工作。
Service组件
Service组件:若干Connector组件和Executor组件组合合成的概念;Connector组件负责监听某端口的客户端请求,不同的端口对应不同的Connector;Executor组件在Service抽象层面提供了线程池。
Connector组件
Http11Protocol
JioEndpoint:负责启动某端口监听客户端的请求,负责接受套接字连接,负责提供一个线程池供系统处理接收到的套接字连接,负责对连接数的控制,负责安全与非安全套接字连接的实现;包含连接数控制器LimitLatch,Socket接收器Acceptor,套接字工厂ServerSocketFactory,任务执行器Executor,任务定义器SocketProcessor。
连接数控制器LimitLatch:通过控制套接字连接个数来控制流量;通过AQS并发框架实现;接收套接字前将连接数控制器中的计数器加1,接收套接字后将套接字交由线程池中的线程处理,接着去接收下一个套接字,计数器到达最大值时堵塞,直到线程池中的线程处理完套接字后将计数器减1;到达最大连接数后操作系统底层还是会接收客户端连接,但用户层已经不再接收,默认队列长度为100。
Socket接收器Acceptor:监听是否有客户端套接字连接并接收套接字,再将套接字交由任务执行器执行;接收线程默认为1条。
套接字工厂ServerSocketFactory:为Acceptor提供HTTP套接字通道与HTTPS套接字通道。
任务执行器Executor:用以处理客户端请求的线程池;ThreadPoolExecutor实现;分为共享Executor和私有Executor。
任务定义器SocketProcessor:定义线程池中线程所执行的任务;对套接字处理并输出响应报文、连接数计数器减1腾出通道、关闭套接字;处理套接字包括对底层套接字字节流的读取,HTTP协议请求报文的解析,根据请求行解决得到的路径去寻找相应虚拟主机上的Web项目资源,根据处理的结果组装好HTTP协议响应报文输出到客户端。
Http11Processor:提供了对HTTP协议通信的处理,包括对套接字的读写和过滤,对HTTP协议的解析以及封装成请求对象,Http协议响应对象的生成等操作。
套接字输入缓冲装置InternalInputBuffer:读取客户端的请求数据时提供一个缓冲区;提供一种缓冲模式,以从Socket中读取字节流,提供填充缓冲区的方法,提供解析HTTP协议请求行的方法,提供解析HTTP协议请求头的方法,以及按照解析的结果组装请求对象Request;一个完整的过程是从底层字节流的读取到对这些字节流的解析并组装成一个请求对象request。
套接字输出缓冲装置InternalOutputBuffer:向客户端提供相应输出的组件。
请求Request:包含HTTP请求行相关的字段值,HTTP请求头部,常用的Cookies,一些非HTTP协议的属性;门面模式;
响应Response;包含了HTTP协议响应相关的参数;门面模式;提供了钩子机制;使用缓冲机制。
长连接:客户端连接被Acceptor接来后创建一个包含了N次请求响应周期的SocketProcessor任务,然后放到线程池里。
Http11NioProtocol
NioEndpoint:非阻塞I/O终端的抽象;包括连接数控制器LimitLatch、套接字接收器Acceptor、轮询器Poller、Poller池、任务定义器SocketProcessor以及任务执行器Executor。
连接数控制器LimitLatch:阈值大小与BIO不同,默认为10000。