根据运行环境和调度者的身份,线程可分为内核线程和用户线程。内核线程,在有的系统上也称为 LWP(Light Weight Process,轻量级进程),运行在内核空间,由内核来调度;用户线程运行在用户空间,由线程库来调度。当进程的一个内核线程获得 CPU 的使用权时,它就加载并运行一个用户线程。可见,内核线程相当于用户线程运行的“容器”。一个进程可以拥有 M 个内核线程和 N 个用户线程,其中 M≤N。并且在一个系统的所有进程中,M 和 N 的比值都是固定的。按照 M:N 的取值,线程的实现方式可分为三种模式:完全在用户空间实现、完全由内核调度和双层调度。
创建线程和结束线程
pthread_create
#include<pthread.h>
int pthread_create(pthread_t *thread, const pthread_attr_t *attr,
void* (*start_routine)(void*), void *arg);
功能
- 创建一个线程。
thread
- 新线程的标识符。
- Linux 上几乎所有的资源标识符都是一个整型数,比如 socket。
attr
- 用于设置新线程的属性(详情见文档)。
- 传递 NULL 表示使用默认的线程属性。
start_routine
- 指定新线程将运行的函数。
arg
- 函数 start_routine 的参数。
返回值
- 成功返回 0,失败时返回错误码。
pthread_exit
如果进程中的任一线程调用了 exit(),则整个进程会终止,所以,在线程的 start_routine 函数中,不能采用 exit() 结束该线程。
线程的终止有三种方式:
① 线程的 start_routine 函数代码结束,自然消亡;
② 线程的 start_routine 函数调用 pthread_exit 结束;
③ 被主进程或其它线程中止。
#include <pthread.h>
void pthread_exit(void *retval);
功能
- 在 start_routine 中调用,确保安全、干净地退出当前线程。
retval
- pthread_exit 通过 retval 向线程的回收者传递其退出信息,一般填空,即 0。
pthread_join
include <pthread.h>
int pthread_join(pthread_t thread, void** retval);
功能
- 一个进程中的所有线程都可以调用 pthread_join 函数来回收其他线程(前提是目标线程是可回收的,见后文),即等待其他线程结束。
thread
- 目标线程的标识符。
retval
- 目标线程返回的退出信息。
返回值
- 成功返回 0,失败返回错误码,可能的错误码如下。
- EDADLK:可能引起死锁。比如两个线程互相针对对方调用 pthread_join,或者线程对自身调用 pthread_join。
- EINVAL:目标线程是不可回收的,或者已经有其他线程在回收该目标线程。
- ESRCH:目标线程不存在。
注意事项
- 该函数会一直阻塞,直到被回收的线程结束为止。
pthread_cancel
#inlude <pthread.h>
int pthread_cancel(pthread_t thread);
功能
- 目标线程的标识符。
返回值
- 成功返回 0,失败返回错误码。
接收到取消请求的目标线程可以决定是否允许被取消以及如何取消,这分别由如下两个函数完成:
#include <pthread.h>
int pthread_setcancelstate(int state, int *oldstate);
int pthread_setcanceltype(int type, int *oldtype);
state
- 设置线程的取消状态(是否运行取消),有两个可选值。
- PTHREAD_CANCEL_ENABLE:运行被取消,是默认取消状态。
- PTHREAD_CANCEL_DISABLE:禁止线程被取消。这种情况下,如果一个线程收到取消请求,则它会将请求挂起,直到该线程允许被取消。
oldstate
- 记录线程原来的取消状态。
type
- 设置线程的取消类型(如何取消),有两个可选值。
- PTHREAD_CANCEL_ASYNCHRONOUS:线程随时都可以被取消。它将使得收到取消请求的目标线程立即采取行动。
- PTHREAD_CANCEL_DEFERRED:允许目标线程推迟行动,直到它到取消点。
oldtype
- 记录线程原来的取消类型。
线程资源的回收
线程有 joinable 和 unjoinable 两种状态,如果线程是 joinable 状态,当线程主函数终止时(自己退出或调用 pthread_exit 退出)不会释放线程所占用内存资源和其它资源,这种线程被称为“僵尸线程”。创建线程时默认是 joinable 状态的。
避免僵尸线程就是如何正确的回收线程资源,有四种方法:
-
方法一:创建线程后,在创建线程的程序中调用 pthread_join 等待线程退出,一般不会采用这种方法,因为 pthread_join 会发生阻塞。
pthread_join(pthid, NULL);
-
方法二:创建线程前,调用 pthread_attr_setdetachstate 将线程设为 detached,这样线程退出时,系统自动回收线程资源。
pthread_attr_t attr; pthread_attr_init(&attr); pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED); pthread_create(&pthid, &attr, pth_main, pth_main的参数);
-
方法三:创建线程后,在创建线程的程序中调用 pthread_detach 将新创建的线程设置为 detached 状态。
pthread_detach(pthid);
-
方法四:在线程主函数中调用 pthread_detach 改变自己的状态。
pthread_detach(pthread_self());
线程同步方式
信号量
Linux 信号量 API 有两组,一组是多进程中提到的信号量,一组是此处的信号量,且功能类似。
#include <semaphore.h>
int sem_init(sem_t *sem, int pshared, unsigned int value);
int sem_destroy(sem_t *sem);
int sem_wait(sem_t *sem);
int sem_trywait(sem_t *sem);
int sem_post(sem_t *sem);
sem_init
- 初始化一个信号量。
- pshared:指定信号量的类型。如果其值为 0,就表示这个信号量是当前进程的局部信号量,否则该信号量就可以在多个进程之间共享。
- value:指定信号量的初始值。此外,初始化一个已经被初始化的信号量将导致不可预期的结果。
sem_destroy
- 销毁信号量,以释放其占用的内核资源。
sem_wait
- 以原子操作的方式将信号量的值减 1。
- 如果信号量的值为 0,则 sem_wait 将被阻塞,直到这个信号量具有非 0 值。
sem_trywait
- 与 sem_wait 函数相似,不过它始终立即返回,而不论被操作的信号量是否具有非 0 值,相当于 sem_wait 的非阻塞版本。
- 当信号量的值非 0 时,sem_trywait 对信号量执行减 1 操作。
- 当信号量的值为 0 时,它将返回 -1 并设置 errno 为 EAGAIN。
sem_post
- 以原子操作的方式将信号量的值加 1。
- 当信号量的值大于 0 时,其他正在调用 sem_wait 等待信号量的线程将被唤醒。
返回值
- 上面这些函数成功时返回 0,失败则返回 -1 并设置 errno。
互斥锁
#include <pthread.h>
/* 初始化互斥锁属性对象 */
int pthread_mutexattr_init(pthread_mutexattr_t *attr);
/* 销毁互斥锁属性对象 */
int pthread_mutexattr_destroy(pthread_mutexattr_t *attr);
/* 获取和设置互斥锁的 pshared 属性 */
int pthread_mutexattr_getshared(const pthread_mutexattr_t *attr, int *pshared);
int pthread_mutexattr_setshared(pthread_mutexattr_t *attr, int pshared);
/* 获取和设置互斥锁的 type 属性 */
int pthread_mutexattr_gettype(const pthread_mutexattr_t *attr, int *type);
int pthread_mutexattr_settype(pthread_mutexattr_t *attr, int type);
-
pshared 指定是否运行跨进程共享互斥锁,可选值有两个:
- PTHREAD_PROCESS_SHARED:互斥锁可以被跨进程共享。
- PTHREAD_PROCESS_PRIVATE:互斥锁只能被和锁的初始化线程隶属于同一个进程的线程共享。
-
type 指定互斥锁的类型,Linux 支持 4 种类型的互斥锁:
- PTHREAD_MUTEX_NORMAL:普通锁。
- PTHREAD_MUTEX_ERRORCHECK:检错锁。
- PTHREAD_MUTEX_RECURSIVE:嵌套锁。
- PTHREAD_MUTEX_DEFAULT:默认锁。
条件变量
如果说互斥锁是用于同步线程对共享数据的访问的话,那么条件变量则是用于在线程之间同步共享数据的值。条件变量提供了一种线程间的通知机制:当某个共享数据达到某个值的时候,唤醒等待这个共享数据的线程。
#include <pthread.h>
/* 初始化条件变量 */
int pthread_cond_init(pthread_cond_t *cond, const pthread_condattr_t *cond_attr);
/* 销毁条件变量 */
int pthread_cond_destroy(pthread_cond_t *cond);
/* 以广播的方式唤醒所有等待目标条件变量的线程 */
int pthread_cond_broadcast(pthread_cond_t *cond );
/* 唤醒一个等待目标条件变量的线程 */
int pthread_cond_signal(pthread_cond_t *cond );
/* 等待目标条件变量 */
int pthread_cond_wait(pthread_cond_t *cond, pthread_mutex_t *mutex );
cond
- 要操作的目标条件变量,条件变量的类型是 pthread_cond_t 结构体。
cond_attr
- 指定条件变量的属性。如果设置为 NULL,则使用默认属性。
mutex
- mutex参数是用于保护条件变量的互斥锁,以确保 pthread_cond_wait 操作的原子性。
- 在调用 pthread_cond_wait 前,必须确保互斥锁 mutex 已经加锁,否则将导致不可预期的结果。pthread_cond_wait 函数执行时,首先把调用线程放入条件变量的等待队列中,然后将互斥锁 mutex 解锁。
进程和线程
如果一个多线程程序的某个线程调用了 fork 函数,那么新创建的子进程是否将自动创建和父进程相同数量的线程呢?
答案是“否”。子进程只拥有一个执行线程,它是调用 fork 的那个线程的完整复制。并且子进程将自动继承父进程中互斥锁(条件变量与之类似)的状态。也就是说,父进程中已经被加锁的互斥锁在子进程中也是被锁住的。这就引起了一个问题:子进程可能不清楚从父进程继承而来的互斥锁的具体状态(是加锁状态还是解锁状态)。这个互斥锁可能被加锁了,但并不是由调用 fork 函数的那个线程锁住的,而是由其他线程锁住的。如果是这种情况,则子进程若再次对该互斥锁执行加锁操作就会导致死锁。
评论区