什么是线程池
我们都知道线程是什么,但是一提到线程池,给人的第一个感觉就是一堆线程,这样的理解其实不太对,线程池可以只有一个线程,也可以有多个线程,而线程池最大的作用是管理和复用线程。一提到管理线程,我们都知道线程池可以帮我们创建线程,也可以帮我们销毁线程。但是一提到复用线程,相信大多数人都愣了,要知道 Thread.start 执行完 Runnable.run 方法之后线程就自动停止了,也就是说 Thread 对象只能调用一次 start 方法,那么在这种情况下线程池是如何复用线程的呢?
都说源码是最好的老师,接下来让我们通过源码来看看这葫芦里面卖的什么药
线程池的原理
- 我们还是从线程池的写法入手源码
- 在线程池的执行方法中,我们发现了一个出现频率很高的 API,接下来让我们看看这句代码干了什么事
- 我们可以看到,线程池拿到任务之后丢给了 Worker 类处理
- 进 Worker 类一看,不看不知道,一看吓一跳,这个类还创建了 Thread 对象
- 有一个非常重要细节,就是创建线程的时候,传入的并不是我们给线程池的那个 Runnable 对象,而是 Worker 对象本身,也就是说线程 start 的时候,Worker 类的 run 方法会被执行
在这里可以看到我们刚刚传入 Runnable 对象,然后开启了一个 while 循环,循环的意思是:只要 task 对象不为空,那么就会一直调用 task = getTask(),直到获取到的 task 对象为空了才会停止循环
那么 getTask 方法里面到底干了什么,让我们接着看
- 通过这两段代码,我们可以得知,getTask 其实就是往阻塞队列中取出 Runnable 对象
- 通过这些,我们可以得出,线程池复用线程的原理,创建 Thread 对象的时候传入的不是我们的 Runnable 对象,而是通过线程池自定义的 Runnable 类,这个类主要的作用不仅是执行我们的 Runnable 对象,当我们传入的任务被某个线程执行完毕之后,它还会遍历阻塞队列中其他未执行的任务,这样就能达到一个线程执行多个 Runnable 对象的效果,这个就是线程池复用线程的原理。
什么时候该用线程池
通过源码我们了解到了线程池的工作机制,那么问题来了,什么情况下该用线程池,什么情况下不该用线程池?
这个问题其实很简单,源码已经告诉我们答案了,当线程池中只有一个线程并且只执行一次任务的时候,我们可以考虑不用线程池,直接创建 Thread 对象来执行这个任务。
也就是说线程池的生命周期只有单个任务的情况下,没有任何优势可言,但是如果在多任务同时并发的情况下,线程池是可以帮我们减少线程数量的,用一句最简单的话来理解就是,用最少的人力干完所有的活,人太少活太多不行,人太多活太少也不行。
线程池核心参数
- 接下来让我们讲讲创建线程池的几个核心参数
- corePoolSize 是核心线程数,何为核心线程数?源码注释已经写得很明白了,也就是最小线程数,规定线程池里面最少必须有几个线程在工作,这些核心线程在没有任务可以执行的时候还必须存活着,除非我们设定了核心线程的存活时间,否则这些核心线程永远不会停止工作。
maximumPoolSize 是最大线程数,这里面不仅包含了核心线程数,还包含了非核心线程数,那么问题来了,何为非核心线程?
这不得不来场比较了,核心线程和非核心线程最大的区别是:核心线程在没有任务的情况下不会被回收,而非核心线程一旦没有了任务就会被回收。
举一个生活中最常见的例子,我们如果把核心线程比作一个正式工,那么非核心线程就是一个外包工。正式工没活干没事,但如果外包工没活干了的话是要面临被裁员的。
workQueue 是阻塞队列,为什么要用队列(Queue),因为队列是先进先出,先进来的任务先取出,最终先进来的任务最先执行完毕的可能性就大,但这还得考虑任务具体的耗时情况而定,在耗时相同的情况下,先进来的任务就先执行完毕。当然这个队列还有其他用处,那就是存放一些未执行的任务,具体有什么作用,可以让我们来一场实验。
-
实验场景:核心线程数 = 1 ,最大线程数 = 3,开启 for 循环执行 10 个任务,任务内容:sleep 1 秒并打印当前线程名
当阻塞队列容量无限大时,10 个任务只出现 1 个线程在排队执行
当阻塞队列容量设置为 10 个或者 9 个时,10 个任务也是只出现 1 个线程在排队执行
当阻塞队列容量设置为 8 个时,10 个任务出现了 2 个线程在并发执行
当阻塞队列容量设置为 7 个时,10 个任务出现了 3 个线程在并发执行
当阻塞队列容量设置为 6 个时,线程池抛出异常,表示拒绝执行任务
实验结论:往线程池添加一个新的任务时,如果核心线程处于空闲状态,任务会直接交由核心线程处理,否则任务会存放到阻塞队列中,当阻塞队列中的任务数量超过设定的最大值时,才会开启非核心线程去执行,如果当前任务总量 > 阻塞队列的最大容量 + 最大线程数时,线程池则会拒绝执行该任务。
keepAliveTime 是非核心线程的存活时间,当线程池中的非核心线程没有任务执行的时候,如果超过了指定的时间还是没有执行任何任务的时候,那么这个非核心线程会在超时后被回收掉,如果我们不指定这个时间,那么这些非核心线程将永远不会被回收。
其他参数不是那么重要,这里直接略过不讲,接下来简单介绍一下系统 API 给我们提供的四种线程池。
系统提供的四种线程池
- 这里创建了一个核心线程数和最大线程数都为 1 的线程池,简单理解这个线程池只有一个线程,正如它的方法名一样(new Single Thread Executor)
- 这个线程池跟上一个线程池非常像,核心线程数和最大线程数都是用同一个数值,只不过上一个线程池是写死的 1,而这个线程池可以自定义这个数值。
- 这个线程池没有核心线程数,也没有限制最大线程数,那么可以得出这个线程池里面的线程都是非核心线程,并且还规定了非核心线程的存活时间不能超过 60 秒。
最后一个线程池的特点是:核心线程数是固定的,但不限制最大线程数,非核心线程的闲置时间不能超过 10 毫秒。
了解过后才发现,这四种线程池无非是核心线程数、最大线程数、非核心线程的存活时间这几个参数的定义上徘徊