前言
什么是线程
多线程模型
线程库
一、什么是线程
1.1 引入线程的原因
引入线程主要出于三方面因素考虑:性能、应用和硬件。
- 从性能角度来看,由于进程是重量级的,负载了程序运行中所有的内容,操作系统的开销比较大,另外切换进程需保存现场和恢复现场,消耗也是比较大。所以需要引入一种比进程开销更小的线程单位。
- 从应用角度来看,进程内的代码也有并行执行的要求。如PPT在编辑(输入、拼写、存盘等操作)的时候,也需要同时进行其他操作(如排版)。
- 从硬件角度来看,多核处理器是目前主流的硬件架构,为了充分利用多核处理器的性能,加速进程的运行,也是引入线程的重要原因。
1.2 线程概念
什么是线程?
线程是可在 CPU 上运行的基本执行单位。进程内部的一个代码片段可以被创建为一个线程。也就是说线程寄生在进程中。同进程一样,线程也有多种状态(就绪、运行、等待)和操作(创建、撤销、等待、唤醒)。但是有一点要注意,线程只是 CPU 上运行的基本执行单位,而进程是资源分配的基本单位。线程自己不拥有系统资源,只能通过进程申请资源。
1.3 线程和进程关系
线程和进程的关系可以从代码、资源、调度、切换和生命周期做比较,如下图:
1.4 线程结构
线程由代码和数据、各类资源、线程控制块(TCP)组成。其中代码和数据以及各类资源都来源于进程。线程控制块由线程ID、程序计算器PC、寄存器集、栈空间组成。
早期操作系统都是单线程,即一个进程只有一个线程。目前的操作系统都包含多个线程。如下图为单线程和多线程。PS:register为寄存器的意思。
1.5 线程优点
- 响应度高:线程创建开销小。
- 资源共享:进程中的线程可以共享进程资源。
- 经济性:线程创建、上下文切换比进程快。如Solaris 系统中,创建线程比进程快 30 倍,线程切换比进程切换快 5 倍。
- 可以充分利用多核处理器结构,并行运行缩短时间。
二、多线程模型
线程由两种状态用户态和核心态,分别对应用户线程和内核线程。按照用户线程和内核线程划分,可以分为三种线程模型: 一对一模型、多对一模型和多对多模型。
2.1 用户线程和内核线程
用户线程是由用户线程库进行管理的线程。系统内核看不到用户线程,用户线程的创建和调度始终存在于用户空间,内核无法干预。用户线程应用于传统的只支持进程的操作系统。常用的用于创建用户线程的线程库有:Java threads、Win32 threads。
内核线程是由内核进行管理的线程。需要内核的支持,由内核完成线程调度、创建和撤销。Windows XP/2000、Linux、Tru64 UNIX、Mac OS X等操作系统都支持内核线程。
2.2 多对一模型
主要应用在不支持内核线程只支持进程的操作系统中。该操作系统内核只能看到一个进程。为了在进程中创建线程就需要借助第三方线程库实现。此种情况下,进程中的用户线程由进程自己管理,无需内核干涉。缺点是一个线程的切换,会导致进程的阻塞。
2.3 一对一模型
该模型用于支持线程的操作系统,可以由操作系统统一管理线程。优点是并发性好,多个线程可并行运行在多个处理器上;缺点是内核开销较大。
2.4 多对多模型
该模型中,多个用户线程映射为相等或更小数目的内核线程。如下图四个用户线程映射为三个内核线程。该模型的有点是兼顾了并发性和效率;缺点应为映射的处理,复杂度增加,需要额外的线程管理模块实现映射。
上述说了三个用户线程模型,现在的操作系统中也有存在混合使用三种模型的情况。
三、线程库
为程序员提供API来创建和管理线程。线程库有两种模式:用户库和内核库。
用户库用于创建和管理用户线程,仅存在与用户空间,没有内核支持,不会产生系统调用;内核库用于创建内核线程,存在于内核,需要操作系统支持,会产生系统调用。
常用的线程库有Pthreads线程库、Java线程库、Win32线程库。Pthreads线程库常用与创建用户线程;Java线程库常用与创建用户线程;而Win32线程库常用于创建内核线程。