线程
1.线程的概念
线程和进程的关系
- 轻量级进程(light-weight process),也有PCB,创建线程使用的底层函数和进程一样,都是clone。
- 从内核里看进程和线程是一样的,都有各自不同的PCB,但是PCB中指向内存资源的三级页表(下图)是相同的
- 进程可以蜕变成线程。(若进程只有一个线程,主控线程,线程和进程是一样的,若再创建几个线程,此时之前那个主控线程就完全是一个线程了)
- 在美国人眼里,线程就是寄存器和栈。每个PCB里边维持了一个内核栈,每个线程维持一个寄存器和栈。
- 在linux下,线程最小的执行单位;进程时最小的分配资源单位,每创建一个进程,分配一个pcb。
参看LWP
ps -Lf pid
ps -eLf
线程
调度单位是线程
线程间共享资源
- 文件描述符表
- 每种信号的处理方式
- 当前工作目录
- 用户ID和组ID
- 内存地址空间(0G-3G)
Text
data(已初始化的全局变量和静态变量)
bss(未初始化的全局变量和静态变量)
堆
共享库
线程间共享资源
线程间非共享资源
- 线程id(非LWP),只在进程内部有效
- 处理器现场和栈指针(内核栈)
- 独立的栈空间(用户空间栈)
- errno变量
- 信号屏蔽字
- 调度优先级
线程的优缺点
优点:
提高程序的并发性
开销小,不用重新分配内存
通信和共享数据方便
缺点:
线程不稳定(库函数实现)
线程调试比较困难(gdb支持不好)
线程无法使用unix经典事件,例如信号
pthread manpage
查看manpage关于pthread的函数
man -k pthread
安装pthread相关manpage
sudo apt-get install manpages-posix manpages-posix-dev
2.线程原语
pthread_create
创建线程
#include <pthread.h> int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg); pthread_t *thread:传递一个pthread_t变量地址进来,用于保存新线程的tid(线程ID) const pthread_attr_t *attr:线程属性设置,如使用默认属性,则传NULL void *(*start_routine) (void *):函数指针,指向新线程应该加载执行的函数模块 void *arg:指定线程将要加载调用的那个函数的参数 返回值:成功返回0,失败返回错误号。以前学过的系统函数都是成功返回0,失败返回-1,而错误号保存在全局变 量errno中,而pthread库的函数都是通过返回值返回错误号,虽然每个线程也都有一个errno,但这是为了兼容其它函数接口而提供的,
pthread库本身并不使用它,通过返回值返回错误码更加清晰。 Compile and link with -lpthread. typedef unsigned long int pthread_t;
pthread_self
获取调用线程tid
#include <pthread.h> pthread_t pthread_self(void)
#include <stdio.h> #include <string.h> #include <stdlib.h> #include <pthread.h> #include <unistd.h> pthread_t ntid; void printids(const char *s) { pid_t pid; pthread_t tid; pid = getpid(); tid = pthread_self(); printf("%s pid %u tid %u (0x%x) ", s, (unsigned int)pid, (unsigned int)tid, (unsigned int)tid); } void *thr_fn(void *arg) { printids(arg); return NULL; } int main(void) { int err; err = pthread_create(&ntid, NULL, thr_fn, "new thread: "); if (err != 0) { fprintf(stderr, "can't create thread: %s ", strerror(err)); exit(1); } printids("main thread:"); sleep(1); return 0; }
由于pthread_create的错误码不保存在errno中,因此不能直接用perror(3)打印错误信息,可以先用strerror(3)把错误码转换成错误信息再打印。如果任意一个线程调用了exit或_exit,则整个进程的所有线程都终止,由于从main函数return也相当于调用exit,为了防止新创建的线程还没有得到执行就终止,我们在main函数return之前延时1秒,这只是一种权宜之计,即使主线程等待1秒,内核也不一定会调度新创建的线程执行,下一节我们会看到更好的办法。
pthread_exit
调用线程退出函数,注意和exit函数的区别,任何线程里exit导致进程退出,其他线程未工作结束,主控线程退出时不能return或exit。需要注意,pthread_exit或者return返回的指针所指向的内存单元必须是全局的或者是用malloc分配的,不能在线程函数的栈上分配,因为当其它线程得到这个返回指针时线程函数已经退出了。exit关闭C标准文件流并刷新缓冲区。_exit是linux提供的底层函数,导致进程退出,关闭未关闭的文件描述符。
#include <pthread.h> void pthread_exit(void *retval); void *retval:线程退出时传递出的参数,可以是退出值或地址,如是地址时,不能是线程内部申请的局部地址。
pthread_join(等价于进程中的wait)
#include <pthread.h> int pthread_join(pthread_t thread, void **retval); pthread_t thread:回收线程的tid void **retval:接收退出线程传递出的返回值 返回值:成功返回0,失败返回错误号
调用该函数的线程将挂起等待,直到id为thread的线程终止。thread线程以不同的方法终止,通过pthread_join得到的终止状态是不同的,总结如下:
如果thread线程通过return返回,retval所指向的单元里存放的是thread线程函数的返回值。
如果thread线程被别的线程调用pthread_cancel异常终止掉,retval所指向的单元里存放的是常数PTHREAD_CANCELED。
如果thread线程是自己调用pthread_exit终止的,retval所指向的单元存放的是传给pthread_exit的参数。
如果对thread线程的终止状态不感兴趣,可以传NULL给retval参数。
pthread_cancel
在进程内某个进程可以取消另一个线程
#include <pthread.h>
int pthread_cancel(pthread_t thread);
被取消的线程,退出值,定义在Linux的pthread库中常数PTHREAD_CANCELED的值是-1。
可以在头文件pthread.h中找到它的定义:
#define PTHREAD_CANCELED ((void *) -1)
练习
#include <stdio.h> #include <stdlib.h> #include <pthread.h> #include <unistd.h> void *thr_fn1(void *arg) { printf("thread 1 returning "); return (void *)1; } void *thr_fn2(void *arg) { printf("thread 2 exiting "); pthread_exit((void *)2); } void *thr_fn3(void *arg) { while(1) { printf("thread 3 writing "); sleep(1); } } int main(void) { pthread_t tid; void *tret; pthread_create(&tid, NULL, thr_fn1, NULL); pthread_join(tid, &tret);//若第一线程没有结束,后面的的语句不会执行 printf("thread 1 exit code %d ", (int)tret); //tret接受返回值,强转输出 pthread_create(&tid, NULL, thr_fn2, NULL); pthread_join(tid, &tret); printf("thread 2 exit code %d ", (int)tret); pthread_create(&tid, NULL, thr_fn3, NULL); sleep(3); pthread_cancel(tid); pthread_join(tid, &tret); printf("thread 3 exit code %d ", (int)tret); return 0; } 执行 gcc pthread_join.c -lpthread 结果: thread 1 returning thread 1 exit code 1 thread 2 exiting thread 2 exit code 2 thread 3 writing thread 3 writing thread 3 writing thread 3 exit code -1
pthread_detach
#include <pthread.h> int pthread_detach(pthread_t tid); pthread_t tid:分离线程tid 返回值:成功返回0,失败返回错误号
一般情况下,线程终止后,其终止状态一直保留到其它线程调用pthread_join获取它的状态为止。但是线程也可以被置为detach状态,这样的线程一旦终止就立刻回收它占用的所有资源,而不保留终止状态。不能对一个已经处于detach状态的线程调用pthread_join,这样的调用将返回EINVAL。如果已经对一个线程调用了pthread_detach就不能再调用pthread_join了。
#include <stdio.h> #include <stdlib.h> #include <pthread.h> #include <unistd.h> #include <string.h> void *thr_fn(void *arg) { int n = 3; while (n--) { printf("thread count %d ", n); sleep(1); } return (void *)1; } int main(void) { pthread_t tid; void *tret; int err; pthread_create(&tid, NULL, thr_fn, NULL); / /第一次运行时注释掉下面这行,第二次再打开,分析两次结果 pthread_detach(tid); while (1) { err = pthread_join(tid, &tret); if (err != 0) fprintf(stderr, "thread %s ", strerror(err)); else fprintf(stderr, "thread exit code %d ", (int)tret); sleep(1); } return 0; }
pthread_equal
比较两个线程是否相等
#include <pthread.h>
int pthread_equal(pthread_t t1, pthread_t t2);