Tomcat 总体架构
我们知道如果要设计一个系统,首先是要了解需求,我们已经了解了Tomcat要实现2个核心功能:
处理Socket连接,负责网络字节流与Request和Response对象的转化.
加载和管理Servlet,以及具体处理Request请求.
因此Tomcat设计了两个核心组件连接器(Connector)和容器(Container)来分别做这两件事情.连接器负责对外交流,容器负责内部处理.
所以连接器和容器可以说是Tomcat架构里最重要的两部分,需要你花些精力理解清楚.这两部分内容会分两期,今天分析连接器是如何设计的,下一期介绍容器的设计.
在开始讲连接器前,先铺垫一下Tomcat支持的多种I/O模型和应用层协议.
Tomcat支持的I/O模型有:
NIO:非阻塞I/O,采用Java NIO类库实现.
NIO.2:异步I/O,采用JDK 7最新的NIO.2类库实现.
APR:采用Apache可移植运行库实现,是C/C++编写的本地库.
Tomcat支持的应用层协议有:
HTTP/1.1:这是大部分Web应用采用的访问协议.
AJP:用与和Web服务器集成(如Apache).
HTTP/2:HTTP2.0大幅度的提升了Web性能
Tomcat为了实现支持多种I/O模型和应用层协议,一个容器可能对接多个连接器,就好比一个房间有多个门.但是单独的连接器或者容器都不能对外提供服务,需要把他们组装起来才能工作,组装后这个整体叫做Service组件,这里请你注意,Service本身没有做什么重要的事情,只是在连接器和容器外面多包了一层,把他们组装在一起.Tomcat内可能有多个Service.这样的设计也是处于灵活性的考虑.通过在Tomcat中配置多个Service,可以实现通过不同的端口号来访问同一台机器上部署的不同应用.
到此我们得到这样一张关系图:
从图上你可以看到,最顶层是Server,这里的Server指得就是一个Tomcat实例.一个Server中有一个或多个Service,一个Service中有多个连接器和容器,连接器与容器之间通过标准得ServletRequest和ServletResponse通信.
连接器
连接器对Servlet容器屏蔽了协议及I/O模型等得区别,无论是HTTP还是AJP,在容器中获取到得都是一个标准得ServletRequest对象.
我们可以把连接器得功能需求进一步细化,比如:
监听网络端口.
接受网络连接请求.
读取网络请求字节流.
根据具体应用层协议(HTTP/AJP)解析字节流,生成统一得Tomcat Request对象.
将Tomcat Request对象转成标准的ServletRequest.
调用Servlet容器,得到ServletResponse.
将ServletResponse转成Tomcat Response对象.
将Tomcat Response转成网络字节流.
将响应字节流写回浏览器.
需求列清楚后,我们要考虑的下一个问题是,连接器应该有哪些子模块?优秀的模块化设计应该考虑高内聚,低耦合.
高内聚是指相关度比较搞得功能要尽可能几种,不要分散.
低耦合是指两个相关得模块要尽可能减少依赖得部分和降低依赖得程度,不要让两个模块产生强依赖.
通过分析连接器得详细功能列表,我们发现连接器需要完成3个高内聚的功能:
网络通信.
应用层协议解析
Tomcat Request/Response与ServletRequest/ServletResponse的转化.
因此Tomcat的设计者设计了3个组件来实现这3个功能,分别是Endpoint,Processor和Adapter.
组件之间通过抽象接口交互,这样做还有一个好处是封装变化,这是面向对象设计的精髓,将系统中经常变化的部分和稳定的部分隔离,有助于增加复用性,并降低系统耦合度.
网络通信的I/O模型是变化的,可能是非阻塞I/O,异步I/O或者APR.应用层协议也是变化的,可能是HTTP,HTTPS.AJP.浏览器端发送的请求信息也是变化的.
但是整体的处理逻辑是不变的,.Endpoint负责提供字节流给Processor,Processor负责提供Tomcat Request对象给Adapter,Adapter负责提供ServletRequest对象给容器.
如果要支持新的I/O方案,新的应用层协议,只需要实现相关的具体之类,上层通过的处理逻辑是不变的.
由于I/O模型和应用层协议可以自由组合,比如NIO+HTTP或者NIO.2+AJP.Tomcat的设计者将网络通信和应用成后协议解析放在一起考虑,设计了一个叫ProtocolHandler的接口来封装这两种变化点.各种协议和通信模型的组合有响应的具体实现类.比如:Http11NioProtocol和AjpNioProtocol.
除了这些变化点,系统也存在一些相对稳定的部分,因此Tomcat设计了一系列抽象基类来封装这些稳定的部分,抽象基类AbstractProtocol实现了ProtocolHandler接口.每一种应用层协议有自己的抽象基类,比如AbstractAjpProtocol和AbstractHttp11Protocol,具体协议的实现类扩展了协议层抽象基类,下面我整理一下他们的继承关系.
通过上面的图,你可以清晰地看到他们的继承关系和层次关系,这样设计的目的是尽量将稳定的部分放到抽象基类,同时每一种I/O木星和协议的组合都有相应的具体实现类,我们在使用时可以只有选择.
小结一下,连接器模块用三个核心组件:Endpoint,Processor和Adapter来分别做三件事情,其中Endpoint和Processor放在一起抽象成了ProtocolHandler组件,他们的关系如下图所示.
下面我来详细介绍这两个顶层组件ProtocolHandler和Adapter
ProtocolHandler组件
由上文我们知道,连接器用ProtocolHandler来处理网络连接和应用层协议,包含了2个重要部件:EndPoint和Processor,下面我来详细介绍他们的工作原理.
EndPoint
Endpoint是通信端点.即通信监听的接口.是具体的Socket接收和发送处理器,是对传输层的抽象,因此Endpoint是用来实现TCP/IP协议的.
EndPoint是一个接口,对应的抽象实现类是AbstractEndpoint,而AbstractEndpoint的具体子类,比如在NioEndpoint和Nio2Endpoint中,有两个重要的子组件:Acceptor和SocketProcessor.
其中Acceptor用于监听Socket连接请求,SocketProcessor用于处理接收到的Socket请求,它实现Runable接口,在run方法里调用协议处理组件Processor进行处理,为了提高处理能力,SocketProcessor被提交到线程池来处理,为了提高处理能力,SocketProcessor被提交到线程池执行,而这个线程池叫做执行器(Executor),我在后面的专栏会详细介绍Tomcat如何扩展原生的Java线程池.
Processor
如果说Endpoint是用来实现TCP/IP协议的,那么Processor用来实现HTTP协议.Process用来实现HTTP协议,.Processor接受来自Endpoint的Socket,读取字节流解析成Tomcat Request和Response对象,并通过Adapter将其提交到容器处理,Processor是对应用层协议的抽象.
Processor是一个接口,定义了请求的处理等方法.它的抽象实现类AbstractProcessor对一些协议共有的属性进行封装,没有对方法进行实现.具体的实现有AjpProcessor.Http11Processor等,这些具体实现类实现了特定协议的解析方法和请求处理方式.
我们再来看看连接器的组件图:
从图中我们看到,Endpoint接收到Socket连接后,生成一个SocketProcessor任务提交到线程池去处理,SocketProcessor的run方法会调用Processor组件去解析应用层协议,Processor通过解析生成request对象后,会调用Adapter的Service方法.
Adapter组件
由于协议不同,客户端发过来的请求信息也不尽相同,Tomcat定义了自己的Request类来"存放"这些请求信息.ProtocolHandler接口负责解析请求并生成TomcatRequest类.但是这个Request对象不是标准的ServletRequest,也就意味着,不能用Tomcat Request作为参数来调用容器.Tomcat设计者的解决方案是引入CoyoteAdapter,这是适配器模式的经典运用,连接器调用CoyoteAdapter的service方法,传入的是Tomcat Request对象,CoyoteAdapter负责将Tomcat Request转成ServletRequest,在调用容器的service方法.
本期精华
Tomcat的整体架构包含了两个核心组件连接器和容器.连接器负责对外交流,容器负责内部处理,连接器用ProtocolHandler接口来封装通信协议和I/O模型的差异,ProtocolHandler内部有分为Endpoint和Processor模块,Endpoint负责底层Socket通信,Processor负责应用层协议解析.连接器通过适配器Adapter调用容器.