续上篇所述,Java线程池作为jdk组件箱中重要的一员,其产生的背后是要来解决一些需求,如线程的管理,任务的管理,自身的生命周期的管理等。
有了需求,就有了一张蓝图,其描绘了程序最初的样子,程序设计由此便有了依据。按照古老的 “程序 = 数据结构+ 算法” 的指挥思想,我们首先得确定线程池的数据结构。而数据结构说白就是数据的组织与存储的方式,就像是好的仓库管理员对货物分门别类的放置一样,我们需要对线程池所管理的数据的进行妥当的安置。
首先,我们先明确线程池所管理的核心数据有哪些:一组线程及其描述量,一组任务及其描述量以及自身的状态量(描述自身生命周期)。
我们先讲一组线程及其描述量,线程池要持有一组线程的所有引用,这些线程得在线程池里创建,但创建的数量应该有一个上限,不能无限创建,故我们需要一个描述量maximumPoolSize来描述线程池能承受的实际最大线程数,另外,为了进一步细粒度地约束线程池的大小,避免过多的线程空转闲置,线程池需要另一个描述量corePoolSize来描述久住线程池的最小线程数。综上,线程池需要一个容器,三个描述量来封装线程的相关操作。
接着我们来讲一组任务及其描述量,线程池作为任务的调度和分配者,当任务过多时,需要一个任务的缓冲区来暂存待执行的任务,为了了解任务完成的总体情况,需要一个描述量completedTaskCount来描述当前线程池的完成的任务总数,综上,线程池需要另外一个容器,一个描述量来封装任务的相关操作。
最后,我们讲线程池自身的状态量,线程池是一个独立的组件,组件内部对调用者来说是黑盒,虽说是黑盒,也要有一些必要的信息暴露给调用者,以便调用者了解并根据这些信息做出对应的决策。这里就包括RUNNING(正在运行),SHUTDOWN(关闭),STOP(停止),TIDYING(清理),TERMINATED(结束)五种状态,那为什么需要这五种状态,这里就需要联系线程池的优雅停止处理的考虑,多出来的SHUTDOWN(关闭),STOP(停止),TIDYING(清理)三种中间状态能够更加具体的描述线程池所处的阶段。(后续会对其扩展讲)。
至此,我描述完了线程池的数据结构,打个比方作为结束:想像线程池是一个实体的工厂,线程是工厂的员工,任务是工厂的加工的原料。员工需要工位(容器),员工有正式员工和非正式员工(外包或者临时工),正式员工有corePoolSize人,工厂员工有maximumPoolSize人;原料需要仓库来暂存(容器),completedTaskCount描述了原料的消耗量。工厂也有开工,没工开,破产清理,倒闭等不同的状态。
希望上诉比喻能增强对线程池数据结构的理解。下一篇我们讲:
《java线程池算法》