Linux多线程学习总结
线程是程序中完成一个独立任务的完整执行序列,即一个可调度的实体;进程相当于运行中程序的一种抽象。根据运行环境的调度者的身份,线程可分为内核线程和用户线程。内核线程,在有的系统上称为LWP(Light Weight Process,轻量级线程),运行在内核空间,由内核调度;用户线程运行在用户空间,由线程库来调度。当进程的一个内核线程获得CPU的使用权时,它就加载并运行一个用户线程。可见,内核线程相当于用户线程运行的‘容器’,一个进程可以拥有M个内核线程和N个用户线程,其中M<=N,并且一个系统的所有进程中,M和N的比值是固定的。
线程控制函数
pthread_create
#include <pthread.h> int pthread_create(pthread_t * tidp, const pthread_attr_t *attr, void *(*start_rtn)(void *), void *arg); // 返回:成功返回0,出错返回错误编号
当pthread_create函数返回成功时,有tidp指向的内存被设置为新创建线程的线程ID,其类型pthread_t定义为:
#include <bits/pthreadtypes.h> typedef unsigned long int pthread_t;
attr参数用于设置各种不同的线程属性,为NULL时表示默认线程属性。新创建的线程从start_rtn函数的地址开始运行,该函数只有一个无类型指针的参数arg,如果需要向start_rtn函数传入的参数不止一个,可以把参数放入到一个结构中,然后把这个结构的地址作为arg的参数传入。
线程创建时并不能保证哪个线程会先运行:是新创建的线程还是调用线程。新创建的线程可以访问调用进程的地址空间,并且继承调用线程的浮点环境和信号屏蔽字,但是该线程的未决信号集被清除。那什么是未决信号呢,信号产生到信号被处理这段时间间隔,称信号是未决的。
pthread_exit
#include <pthread.h> void pthread_exit(void *rval_ptr); // 线程终止
线程在结束时最好调用该函数,以确保安全、干净的退出。pthread_exit函数通过rval_ptr参数向调用线程的回收者传递退出信息,进程中的其他线程可以调用pthread_join函数访问到这个指针。pthread_exit执行完后不会返回到调用者,而且永远不会失败。
线程可以通过以下三种方式退出,在不终止整个进程的情况下停止它的控制流:
- 线程只是从启动过程中退出,返回值是线程的退出码
- 线程可以被同一进程中的其他线程取消
- 线程调用pthread_exit
pthread_join
#include <pthread.h> int pthread_join(pthread_t thread, void **rval_ptr); // 返回:成功返回0,出错返回错误代码
thread是目标线程标识符,rval_ptr指向目标线程返回时的退出信息,该函数会一直阻塞,直到被回收的线程结束为止。可能的错误码为:
pthread_cancel
#include <pthread.h> int pthread_cancel(pthread_t thread); // 返回:成功返回0,出错返回错误代码
默认情况下,pthread_cancel函数会使有thread标识的线程的表现为如同调用了参数为PTHREAD_CANCEL的pthread_exit函数,但是,接收到取消请求的目标线程可以决定是否允许被取消以及如何取消,这分别由以下两个函数来控制:
#include <pthread.h> int pthread_setcancelstate(int state, int *oldstate); int pthread_setcanceltype(int type, int *oldstate);
注意pthread_cancel并不等待线程结束,它只是提出请求。
互斥量
互斥量本质是一把锁,在访问公共资源前对互斥量设置(加锁),确保同一时间只有一个线程访问数据,在访问完成后再释放(解锁)互斥量。在互斥量加锁之后,其他线程试图对该互斥量再次加锁时都会被阻塞,知道当前线程释放互斥锁。如果释放互斥量时有一个以上的互斥量,那么所有在该互斥量上阻塞的线程都会变成可运行状态,第一个变成运行的线程可以对互斥量加锁,其他线程看到互斥量依然是锁着的,只能再次阻塞等待该互斥量。
互斥量用pthread_mutex_t数据类型表示,在使用互斥量之前,必须使用pthread_mutex_init函数对它进行初始化,注意,使用完毕后需调用pthread_mutex_destroy。
#include <pthread.h> int pthread_mutex_init(pthread_mutex_t *mutex, const pthread_mutexattr_t *mutexattr); int pthread_mutex_destroy(pthread_mutex_t *mutex); // 两个函数返回值,成功返回0,否则返回错误码
pthread_mutex_init用于初始化互斥锁,mutexattr用于指定互斥锁的属性,若为NULL,则表示默认属性。除了用这个函数初始化互斥所外,还可以用如下方式初始化:pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER。
pthread_mutex_destroy用于销毁互斥锁,以释放占用的内核资源,销毁一个已经加锁的互斥锁将导致不可预期的后果。
#include <pthread.h> int pthread_mutex_lock(pthread_mutex_t *mutex); int pthread_mutex_trylock(pthread_mutex_t *mutex); int pthread_mutex_unlock(pthread_mutex_t *mutex); // 成功返回0,否则返回错误码
pthread_mutex_lock以原子操作给一个互斥锁加锁。如果目标互斥锁已经被加锁,则pthread_mutex_lock则被阻塞,直到该互斥锁占有者把它给解锁。
pthread_mutex_trylock和pthread_mutex_lock类似,不过它始终立即返回,而不论被操作的互斥锁是否加锁,是pthread_mutex_lock的非阻塞版本。当目标互斥锁未被加锁时,pthread_mutex_trylock进行加锁操作;否则将返回EBUSY错误码。注意:这里讨论的pthread_mutex_lock和pthread_mutex_trylock是针对普通锁而言的,对于其他类型的锁,这两个加锁函数会有不同的行为。
pthread_mutex_unlock以原子操作方式给一个互斥锁进行解锁操作。如果此时有其他线程正在等待这个互斥锁,则这些线程中的一个将获得它。
互斥锁使用示例:
/** * 使用3个线程分别打印 A B C */ #include <stdio.h> #include <stdlib.h> #include <string.h> #include <pthread.h> typedef struct ThreadInfo_t { char info; /* 'A' or 'B' or 'C' */ int n; /* remainder num */ int num; /* share num */ pthread_mutex_t mutex; }ThreadInfo; void *func(void *arg) { int cnt = 3; ThreadInfo *info = (ThreadInfo *)arg; int result = info->n; char show = info->info; while (cnt > 0) { if (info->num % 3 == result) { printf("---%c ", show); pthread_mutex_lock(&info->mutex); info->num++; cnt--; pthread_mutex_unlock(&info->mutex); } } return NULL; } int main(int argc, char **argv) { pthread_t t1, t2, t3; ThreadInfo info; memset(&info, 0, sizeof(ThreadInfo)); pthread_mutex_init(&(info.mutex), NULL); info.n = 0; info.info = 'A'; pthread_create(&t1, NULL, func, &info); sleep(1); info.n = 1; info.info = 'B'; pthread_create(&t2, NULL, func, &info); sleep(1); info.n = 2; info.info = 'C'; pthread_create(&t3, NULL, func, &info); pthread_join(t1, NULL); pthread_join(t2, NULL); pthread_join(t3, NULL); return 0; }
读写锁
读写锁和互斥体类似,不过读写锁有更高的并行性,互斥体要么是锁住状态,要么是不加锁状态,而且一次只有一个线程可以对其加锁。而读写锁可以有3个状态,读模式下锁住状态,写模式下锁住状态,不加锁状态。一次只有一个线程可以占有写模式的读写锁,但是多个线程可以同时占用读模式的读写锁。读写锁适合对数据结构读的次数远大于写的情况。
当读写锁是写加锁状态时,在这个锁被解锁之前,所有试图对这个锁加锁的线程都会被阻塞。当读写锁是读加锁状态时,所有试图以读模式对它进行加锁的线程都可以得到访问权,但是任何希望以写模式对此锁进行加锁的线程都会阻塞,直到所有的线程释放它们的读锁为止。
#include<pthread.h> int pthread_rwlock_init(pthread_rwlock_t *restrict rwlock, const pthread_rwlockaddr_t *restrict attr); int pthread_rwlock_destroy(pthread_rwlock_t *restrict rwlock); // 成功返回0,否则返回错误码
通过pthread_rwlock_init初始化读写锁,如果希望读写锁有默认属性,可以传一个NULL指针给attr。当不再需要读写锁时,调用pthread_rwlock_destroy做清理工作。
#include<pthread.h> int pthread_rwlock_rdlock(pthread_rwlock_t *restrict rwlock); int pthread_rwlock_wrlock(pthread_rwlock_t *restrict rwlock); int pthread_rwlock_unlock(pthread_rwlock_t *restrict rwlock); // 成功返回0,否则返回错误码
读写锁的读加锁、写加锁和解锁操作。
读写锁程序示例:
/** * 两个读线程读取数据,一个写线程更新数据 */ #include <stdio.h> #include <stdlib.h> #include <string.h> #include <pthread.h> #define READ_THREAD 0 #define WRITE_THREAD 1 int g_data = 0; pthread_rwlock_t g_rwlock; void *func(void *pdata) { int data = (int)pdata; while (1) { if (READ_THREAD == data) { pthread_rwlock_rdlock(&g_rwlock); printf("-----%d------ %d ", pthread_self(), g_data); sleep(1); pthread_rwlock_unlock(&g_rwlock); sleep(1); } else { pthread_rwlock_wrlock(&g_rwlock); g_data++; printf("add the g_data "); pthread_rwlock_unlock(&g_rwlock); sleep(1); } } return NULL; } int main(int argc, char **argv) { pthread_t t1, t2, t3; pthread_rwlock_init(&g_rwlock, NULL); pthread_create(&t1, NULL, func, (void *)READ_THREAD); pthread_create(&t2, NULL, func, (void *)READ_THREAD); pthread_create(&t3, NULL, func, (void *)WRITE_THREAD); pthread_join(t1, NULL); pthread_join(t2, NULL); pthread_join(t3, NULL); pthread_rwlock_destroy(&g_rwlock); return 0; }
条件变量
条件变量是线程可用的一种同步机制,条件变量给多个线程提供了一个回合的场所,条件变量和互斥量一起使用,允许线程以无竞争的方式等待特定的条件发生。条件变量本事是由互斥体保护的,线程在改变条件状态之前必须首先锁住互斥量,其他线程在获取互斥量之前就不会觉察到这种变化,因为互斥量必须锁定之后才改变条件。
#include<pthread.h> pthread_cond_init(pthread_cond_t *restrict cond, const pthread_condattr_t *restrict attr); pthread_cond_destroy(pthread_cont_t *cond); // 成功返回0,否则返回错误码
使用条件变量前调用pthread_cond_init初始化,使用完毕后调用pthread_cond_destroy做清理工作。除非需要创建一个具有非默认属性的条件变量,否则pthread_cond_init函数的attr参数可以设置为NULL。
#include<pthread.h> int pthread_cond_broadcast(pthread_cond_t *cond); int pthread_cond_signal(pthread_cond_t *cond); int pthread_cond_wait(pthread_cond_t *cond, pthread_mutex_t *mutex); // 成功返回0,否则返回错误码
传递给pthread_cond_wait的互斥量对条件进行保护,调用者把锁住互斥量传给函数,函数然后自动把调用线程放到等待条件的线程列表上,对互斥量解锁。这就关闭了条件检查和线程进入休眠状态等待条件改变这两个操作之间的时间通道,这样线程就不会错过条件的任何变化。pthread_cond_wait函数返回时,互斥量再次被锁住。
pthread_cond_broadcast用广播的形式唤醒所有等待条件变量的线程。pthread_cond_signal用于唤醒一个等待条件变量的线程,至于哪个线程被唤醒,取决于线程的优先级和调度机制。有时候需要唤醒一个指定的线程,但pthread没有对该需要提供解决方法。可以间接实现该需求:定义一个能够唯一表示目标线程的全局变量,在唤醒等待条件变量的线程前先设置该变量为目标线程,然后以广播形式唤醒所有等待条件变量的线程,这些线程被唤醒后都检查改变量是否是自己,如果是就开始执行后续代码,否则继续等待。
条件变量程序示例:
#include <stdio.h> #include <stdlib.h> #include <pthread.h> #define err_sys(msg) do { perror(msg); exit(-1); } while(0) #define err_exit(msg) do { fprintf(stderr, msg); exit(-1); } while(0) pthread_cond_t cond; void *r1(void *arg) { pthread_mutex_t* mutex = (pthread_mutex_t *)arg; static int cnt = 10; while(cnt--) { printf("r1: I am wait. "); pthread_mutex_lock(mutex); pthread_cond_wait(&cond, mutex); /* mutex参数用来保护条件变量的互斥锁,调用pthread_cond_wait前mutex必须加锁 */ pthread_mutex_unlock(mutex); } return "r1 over"; } void *r2(void *arg) { pthread_mutex_t* mutex = (pthread_mutex_t *)arg; static int cnt = 10; while(cnt--) { //pthread_mutex_lock(mutex); //这个地方不用加锁操作就行 printf("r2: I am send the cond signal. "); pthread_cond_signal(&cond); //pthread_mutex_unlock(mutex); sleep(1); } return "r2 over"; } int main(void) { pthread_mutex_t mutex; pthread_t t1, t2; char* p1 = NULL; char* p2 = NULL; pthread_mutex_init(&mutex, NULL); pthread_cond_init(&cond, NULL); pthread_create(&t1, NULL, r1, &mutex); pthread_create(&t2, NULL, r2, &mutex); pthread_join(t1, (void **)&p1); pthread_join(t2, (void **)&p2); pthread_cond_destroy(&cond); pthread_mutex_destroy(&mutex); printf("s1: %s ", p1); printf("s2: %s ", p2); return 0; }
自旋锁
自旋锁和互斥量类似,但它不是通过休眠使进程阻塞,而是在获取锁之前一直处于忙等(自旋)状态,自旋锁可用于下面的情况:锁被持有的时间短,并且线程不希望再重新调度上花费太多的成本。自旋锁通常作为底层原语用于实现其他类型的锁。根据他们所基于的系统架构,可以通过使用测试并设置指令有效地实现。当然这里说的有效也还是会导致CPU资源的浪费:当线程自旋锁变为可用时,CPU不能做其他任何事情,这也是自旋锁只能够被只有一小段时间的原因。
#include <pthread.h> int pthread_spin_init(pthread_spinlock_t *lock, int pshared); int pthread_spin_destroy(pthread_spinlock_t *lock);
pshared参数表示进程共享属性,表明自旋锁是如何获取的,如果它设为PTHREAD_PROCESS_SHARED,则自旋锁能被可以访问锁底层内存的线程所获取,即使那些线程属于不同的进程。否则pshared参数设为PTHREAD_PROCESS_PROVATE,自旋锁就只能被初始化该锁的进程内部的线程访问到。
#include <pthread.h> int pthread_spin_lock(pthread_spinlock_t *lock); int pthread_spin_trylock(pthread_spinlock_t *lock); int pthread_spin_unlock(pthread_spinlock_t *lock);
如果自旋锁当前在解锁状态,pthread_spin_lock函数不要自旋就可以对它加锁,试图对没有加锁的自旋锁进行解锁,结果是未定义的。需要注意,不要在持有自旋锁情况下可能会进入休眠状态的函数,如果调用了这些函数,会浪费CPU资源,其他线程需要获取自旋锁需要等待的时间更长了。
自旋锁使用示例:
#include <stdio.h> #include <stdlib.h> #include <pthread.h> pthread_spinlock_t g_lock; int g_data = 0; void *func(void *arg) { while (1) { pthread_spin_lock(&g_lock); g_data++; printf("----------- %d ", g_data); sleep(1); pthread_spin_unlock(&g_lock); } } int main(int argc, char **argv) { pthread_t tid; pthread_spin_init(&g_lock, PTHREAD_PROCESS_PRIVATE); pthread_create(&tid, NULL, func, NULL); pthread_create(&tid, NULL, func, NULL); pthread_create(&tid, NULL, func, NULL); pthread_join(tid, NULL); return 0; }
屏障
屏障是用户协调多个线程并行工作的同步机制,屏障允许每个线程等待,直到所有合作的线程都到达某一点,然后从该点出继续执行。pthread_join其实就是一种屏障,允许一个线程等待,直到另一个线程退出。但是屏障对象的概念更广,它们允许任意数量的线程等待,直到所有的线程完成处理工作,而线程不需要退出,所有线程达到屏障后可以继续工作。
#include <pthread.h> int pthread_barrier_init(pthread_barrier_t *restrict barrier, const pthread_barrierattr_t *restrict attr, unsigned int count); int pthread_barrier_destroy(pthread_barrier_t *barrier); // 成功返回0,否则返回错误编号
初始化屏障时,可以使用count参数指定,在允许所有线程继续运行前,必须达到屏障的线程数目。attr指定屏障属性,NULL为默认属性。
#include <pthread.h> int pthread_barrier_wait(pthread_barrier_t *barrier); // 成功返回0,否则返回错误编号
可以使用pthread_barrier_wait函数来表明,线程已完成工作,准备等所有其他线程赶过来。调用pthread_barrier_wait的线程在屏障计数未满足条件时,会进入休眠状态。如果该线程是最后一个调用pthread_barrier_wait的线程,则所有的线程会被唤醒。
一旦到达屏障计数值,而且线程处于非阻塞状态,屏障就可以被重复使用。
屏障使用示例:
#include <stdio.h> #include <stdlib.h> #include <pthread.h> pthread_barrier_t g_barrier; void *func(void *arg) { int id = (int )arg; if (id == 0) { printf("thread 0 "); sleep(1); pthread_barrier_wait(&g_barrier); printf("thread 0 come... "); } else if (id == 1) { printf("thread 1 "); sleep(2); pthread_barrier_wait(&g_barrier); printf("thread 1 come... "); } else if (id == 2) { printf("thread 2 "); sleep(3); pthread_barrier_wait(&g_barrier); printf("thread 2 come... "); } return NULL; } int main(int argc, char **argv) { pthread_t t1, t2, t3; pthread_barrier_init(&g_barrier, NULL, 3); pthread_create(&t1, NULL, func, (void *)0); pthread_create(&t2, NULL, func, (void *)1); pthread_create(&t3, NULL, func, (void *)2); pthread_join(t1, NULL); pthread_join(t2, NULL); pthread_join(t3, NULL); return 0; }
参考:
1、《UNIX环境高级编程 第三版》线程章节