从 0 开始学习 Linux 系列之「25.Posix 线程」

多线程

版权声明：本文为 cdeveloper 原创文章，可以随意转载，但必须在明确位置注明出处！

多线程概念

多线程技术是应用开发中非常重要的技术之一，几乎大型的应用软件都使用这个技术，这次一起来学习下 Linux 中的多线程开发基础（其他的系统中概念也是类似的）。

在 Linux 中，一个简单的进程可以看成只有一个单线程（主线程），因为只有一个线程，所以进程在某一个时刻只能做一件事。为了能够使得进程可以在同一时刻做多件事情，可以让这个进程内部产生多个线程来分工同时完成。

例如典型的字处理程序，有一个线程在前台与用户进行图形界面的交互，有一个线程在进行语法和拼写检查，还有一个线程在周期性的保存文档，这 3 个线程共同完成了文档的编写和保存功能。想想假如只有一个主线程，那么你先键入文档，然后进行语法和拼写检查，最后才保存文档，这 3 个步骤是串行执行的，而使用多线程时这 3 个任务是并行执行的，效率提高了很多，也更加安全了，如下图：

单线程和多线程的区别

使用多线程技术有下面几个优点：

简化任务的代码：在单独的线程中执行一个任务可以使用简单的同步编程模式
共享进程资源：多个线程可以访问相同的进程地址空间
提高进程的吞吐量：使用多线程可以并行运行多个任务
优化程序体验：可以使用多线程分开处理程序的输入输出

总体来说使用多线程技术可以优化程序，提升用户的体验。了解了基本概念后，接下来看看操作系统实现线程的模型。

多线程模型

现在的操作系统有 2 种不同的方法来提供线程支持：

用户线程：受内核支持，无须内核管理
内核线程：由内核直接支持和管理

这两种方法之间有一定的联系，毕竟用户线程要受内核的支持，有 3 种常见的建立两者关系的模型：

多对一模型：多个用户线程映射到一个内核线程，多个线程不能并行执行
一对一模型：一个用户线程映射到一个内核线程，创建线程的开销较大
多对多模型：多个用户线程可以复用同样数量或更小数量的内核线程，没有前面 2 者的缺点

3 种模型图如下：

3 种模型图

实现的模型在不同的操作系统上都差不多，但是不同操作系统上的线程库的实现却是不大相同的。

线程库

操作系统为我们提供创建和管理线程的 API，线程操作也有 2 种实现方法：

内核支持的用户线程库：此库的代码和数据都存在用户空间中，API 不会进行系统调用
原始的内核级别的库：此库的代码和数据都存在内核空间，API 会进行系统调用

有 3 种主要的线程库：

Posix Pthread：POSIX 标准的拓展，可以提供用户级和内核级的库，但仅仅是线程行为规范，而不是实现，Linux，Solaris 等 OS 都实现了这个规范
Win 32：适用于 Windows OS 的内核级线程库
Java 线程：由于 JVM 运行在宿主 OS 上，所以 Java 线程 API 通常采用宿主 OS 上的线程库的实现

因为本次介绍的是 Linux 下的多线程技术，所以这里学习的就是 Posix Pthread 的规范定义的 API 了，下面来看看都有哪些常用的函数。

比较，获取线程 ID

就像每个进程有一个进程 ID 一样，每个线程也有一个线程 ID，线程 ID 只有在它所属的进程上下文中才有意义。在 Posix Pthread 中用 pthread_t 类型来表示一个线程 ID，该类型在 Linux 下是一个无符号长整型，并提供了 2 个相关的操作：

#include <pthread.h>

// 比较 2 个线程 ID
int pthread_equal(pthread_t t1, pthread_t t2);

// 获取自身线程 ID
pthread_t pthread_self(void);

这两个函数比较简单，就不介绍例子了，返回值等信息可以参考 man pthread_equal 和 man pthread_self 手册。

创建线程

Posix 线程定义下面的函数来创建新的线程：

#include <pthread.h>

/*
 * thread: 指向线程 ID
 * attr: 定制线程属性，传递 NULL 设置默认属性
 * start_routine: 要运行的线程函数
 * arg: 要传递的函数参数
 * return: 成功返回 0，失败返回错误码，但不会设置 erron
 */
int pthread_create(pthread_t *thread, const pthread_attr_t *attr,
void *(*start_routine) (void *), void *arg);

来看一个简单的创建线程的例子，这个例子创建一个子线程并打印子线程的进程 ID 和线程 ID：

// thread_create.c

#include <stdio.h>
#include <pthread.h>
#include <sys/types.h>
#include <unistd.h>

/* print pid and tid. */
void print_id(const char *s) {
    printf("%s pid %lu, tid 0x%lx\n", s, 
            (unsigned long)getpid(), 
            (unsigned long)pthread_self());
}

/* thread fun */
void *thread_fun(void *arg) {
    print_id("new  thread: ");
    return NULL;
}

int main(void) {
    pthread_t tid;
    
    // create pthread
    if (pthread_create(&tid, NULL, thread_fun, NULL) != 0) {
        printf("thread create failed.\n");
        return -1;
    }
    
    print_id("main thread: ");
    // 等待子线程执行完，后面会用 pthread_join 代替
    sleep(1);
    return 0;
}

编译需要链接 -lpthread 线程库，运行结果如下：

orange@ubuntu:~/$ gcc -Wall thread_create.c -lpthread -o thread_create
orange@ubuntu:~/$ ./thread_create
new  thread:  pid 21301, tid 0x7f05c2ee3700
main thread:  pid 21301, tid 0x7f05c36bf700

从结果可看出两个线程的进程 pid 是相同的，因为 2 者都所属同一个进程，但是线程 tid 就不同了。另外，大家以后在用 gcc 编译的时候尽量都加上 -Wall 来开启所有的警告，可以帮助我们编写更加严谨的代码。

线程终止，等待

单个线程可以通过 3 种方式退出，并且不会终止整个进程：

线程直接返回
线程被其他线程取消
线程调用 pthread_exit

这里主要介绍第 3 种方法，先来看看这个函数的定义：

#include <pthread.h>

void pthread_exit(void *retval);

其中 retval 返回的值可以通过调用 pthread_join 函数访问：

#include <pthread.h>

/*
 * thread: 要等待的线程 ID
 * retval: 线程的退出状态
 * return: 成功返回 0，失败返回错误编号
 */
int pthread_join(pthread_t thread, void **retval);

调用线程将一直阻塞，直到线程 ID 为 thread 的线程调用 pthread_exit，被取消或从启动例程中返回。并且，进程中的其他线程可以通过调用 pthread_join 函数获得该线程的退出状态。其中 retval 有 2 种情况：

如果不为 NULL，则拷贝线程的退出状态码到 retval
如果目标线程被取消，PTHREAD_CANCELED 被放到 retval 中

下面结合上面这两个函数来看一个例子：主线程开启 2 个子线程，然后分别使用 return 返回和 pthread_exit 退出，最后在主线程中获取线程的返回码。

#include <stdio.h>
#include <pthread.h>

void *thread_fun1(void *arg) {
    printf("thread 1 return.\n");
    return ((void *)1);
}

void *thread_fun2(void *arg) {
    printf("thread 2 exit.\n");
    pthread_exit((void *)2);
}

int main(void) {
    pthread_t tid1, tid2;
    void *ret_val = NULL;
    // create thread 1 and 2
    pthread_create(&tid1, NULL, thread_fun1, NULL);
    pthread_create(&tid2, NULL, thread_fun2, NULL);
    // wait thread 1
    pthread_join(tid1, &ret_val);
    printf("thread 1 exit code %ld\n", (long)ret_val);
    // wait thread 2
    pthread_join(tid2, &ret_val);
    printf("thread 2 exit code %ld\n", (long)ret_val);

    return 0;
}

编译，运行可以看到成功获得了 2 个线程的退出码：

gcc -Wall thread_join.c -o thread_join -lpthread

./thread_join
thread 1 return.
thread 1 exit code 1
thread 2 exit.
thread 2 exit code 2

线程分离

Posix 也给我们提供了分离线程的函数，当分离一个线程后，该线程在终止时，线程资源由系统自动释放，不需要其他线程再次 join 等待它。：

#include <pthread.h>

// thread: 要分离的线程 ID，成功返回 0，失败返回错误码
int pthread_detach(pthread_t thread);

注意，如果尝试分离一个已经分离的线程会产生未定义的行为。该函数的使用方法很简单，只需要一行代码：

#include <pthread.h>

// 在主线程创建 tid 线程
pthread_create(&tid, NULL, thread_fun, NULL);
// 从主线程分离 tid 线程
pthread_detach(tid);

线程同步

当多个线程同时访问共享资源时会产生线程安全的问题，我们需要使用一些技术来使得这些线程同步访问共享资源（一个一个访问，不同时访问），并且使它们访问变量的存储内存时不会访问到无效的值。

线程同步的方法主要有互斥锁，信号量等，前面在介绍 IPC 的时候使用信号量进行了进程间的通信，其中的信号量操作也是适用与线程的，所以这次主要介绍的同步方法是：互斥锁 Mutex。

使用互斥锁进行线程同步的基本思想是：线程在获取共享资源的访问前首先需要获得锁，没有获取则阻塞或返回，访问结束后必须释放锁，伪代码如下：

mutex_lock();
operate share resource
mutex_unlock();

Posix 线程给我们提供下面这些函数来操作互斥锁。

初始化和销毁 Mutex

#include <pthread.h>

// 动态初始化
int pthread_mutex_init(pthread_mutex_t *restrict mutex,
const pthread_mutexattr_t *restrict attr);

// 静态初始化
pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;

// 销毁
int pthread_mutex_destroy(pthread_mutex_t *mutex);

静态初始化比较简单，动态初始化需要和销毁 Mutex 的函数成对使用。

加锁，解锁 Mutex

#include <pthread.h>

// 加锁，如果不能获取锁会阻塞调用进程
int pthread_mutex_lock(pthread_mutex_t *mutex);

// 尝试加锁，不能获取锁就返回，不会阻塞
int pthread_mutex_trylock(pthread_mutex_t *mutex);

// 解锁
int pthread_mutex_unlock(pthread_mutex_t *mutex);

例子：使用 Mutex 来保护共享资源

虽然 Mutex 的函数比较多，但是使用起来是很简单的，只需要 4 步：初始化，加锁，解锁，销毁（静态初始化不需要），来看一个简单的程序：

#include <stdio.h>
#include <pthread.h>

// 静态初始化不需要 main 中的 1，2 两步
//pthread_mutex_t mymutex = PTHREAD_MUTEX_INITIALIZER;

pthread_mutex_t mymutex;

void* thread_fun(void* arg) {
    // lock
    pthread_mutex_lock(&mymutex);
    for(int i = 0; i < 5; i++)  
        printf("thread num = %d\n", (int)arg);
    // unlock
    pthread_mutex_unlock(&mymutex);
    return NULL;
}

int main() {
    // 1. 动态初始化
    pthread_mutex_init(&mymutex, NULL);
    pthread_t mythread[3];
    void* retval = NULL;
    for (int i = 0; i < 3; i++) {
        pthread_create(&mythread[i], NULL, thread_fun, (void *)i);
        pthread_join(mythread[i], &retval);
    }
    // 2. 销毁，与动态初始化成对使用
    pthread_mutex_destroy(&mymutex);
    return 0;
}

编译，运行：

gcc -Wall lock_thread.c -o lock_thread -lpthread

./lock_thread
thread num = 0
thread num = 0
thread num = 0
thread num = 0
thread num = 0
thread num = 1
thread num = 1
thread num = 1
thread num = 1
thread num = 1
thread num = 2
thread num = 2
thread num = 2
thread num = 2
thread num = 2

这是我的机器的运行结果，可以将 pthread_mutex_lock 和 pthread_mutex_unlock 注释掉，即不加锁查看最后的结果会不会乱序。

线程池

线程池概念也是经常遇到，这里来了解一下它的基本原理，这里没有给出实现，有兴趣可以 Google 相关的线程池技术。来看一个 Web 服务的例子，以来了解为何使用线程池会有优势。

假设现在有一个多线程的 Web 服务器，没有使用线程池前，每接受一个客户端的连接请求就创建一个独立线程来处理，但是如果请求较多就会严重影响系统性能，主要有 2 个原因：

创建很多线程需要耗费资源
一个线程做完任务后就被销毁，不能重复利用

基于这两个缺点，提出了线程池的概念：它的主要思想是在进程开始的时候就创建一定数量的线程，放到一起（称为池）等待分配工作：

当服务器收到请求即唤醒一个线程处理任务，在一个线程处理完后会重新回到池中等待下一次的任务，使得线程可以重复使用
如果池中没有可用线程，则服务器会等待直到有可用线程，使得系统不会再创建新的线程

线程池中的线程数量可以手动规定，也可以在系统运行时根据当前负荷动态调整，具有动态调整功能的线程池比较高级。

结语

多线程技术的应用非常广泛，这篇文章主要介绍了在 Linux 下的 Posix 的标准的线程库的使用方法，相关 API 的使用其实不难，关键是要理解多线程的概念及为和要使用它。另外多线程中比较重要的是如何处理线程安全（同步）的问题，常见的处理方法有互斥锁，信号量等，同步的话题比较复杂有兴趣可以深入学习。

最后，感谢你的阅读，我们下次再见 :)

最后编辑于：2018.04.25 10:16:49

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,802评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,109评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,683评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,458评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,452评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,505评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,901评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,550评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,763评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,556评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,629评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,330评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,898评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,897评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,140评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,807评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,339评论 2赞 342