zoukankan      html  css  js  c++  java
  • Linux多线程编程

    前言:有这样一道面试题(来自http://blog.csdn.net/morewindows/article/details/7392749):

          “编写一个程序,开启3个线程,这3个线程的ID分别为ABC,每个线程将自己的ID在屏幕上打印10遍,要求输出结果必须按ABC的顺序显示;如:ABCABC.依次递推。”

    我们就从这样一题出发,认识多线程,了解其同步机制,最后正确解答这一类题目。本文框架如下:

    • 进程与线程
    • 多线程的优越性
    • 线程基本函数
    • 多线程同步
    • 题目代码

      

    一.进程与线程

          进程的定义:进程是为了描述程序在并发执行时对系统资源的共享,所需的一个描述程序执行时动态特征的概念。进程是具有独立功能的程序关于某个数据集合上的一次运行活动,是系统进行资源分配、调度和保护的独立单位。

          线程的定义:线程也成为轻量级进程,是进程中的一个运行实体,作为CPU的调度单位。一个进程由多个线程组成,线程与同属一个进程的其他的线程共享进程所拥有的全部资源。

          同一进程内的所有线程除了共享全局变量外还共享:

    • 进程指令;
    • 大多数数据;
    • 打开的文件(即描述符);
    • 信号处理函数和信号处置;
    • 当前工作目录;
    • 用户ID和组ID。

         每个线程拥有各自的:

    • 线程ID;
    • 寄存器集合,包括程序计数器和栈指针;
    • 栈(用于存放局部变量和返回地址);
    • errno;
    • 信号掩码;
    • 优先级。

          结构上的不同可以让我们更加了解进程和线程的相异之处:

          (1)进程是资源分配的基本单位;线程与资源分配无关,它属于某一个进程,并与进程内的其他线程共享进程的资源。

          (2)当进程发生调度时,不同的进程拥有不同的虚拟地址空间,而同一进程内的不同线程共享同一地址空间。

          (3)线程只由先关堆栈(系统栈或用户栈)寄存器和线程控制块组成。寄存器用来存储线程内的局部变量,但不能存储其他线程的相关变量。

          (4)进程切换时涉及有关资源指针的保存和地址空间的变化;线程切换时,由于处于同一进程内,所以不涉及资源信息的保存和地址空间的变化,从而减少了操作系统的时间开销。

    二.多线程的优越性

          在传统的UNIX模型中,当一个进程需要另一个实体来完成某事,它就fork一个子进程并让子进程去处理。但是fork的调用有如下缺点:

          (1)fork的代价是昂贵的。fork要把父进程的内存印象复制到子进程,并在子进程中复制所有描述符等。

          (2)fork返回之后父子进程之间信息的传递需要进程通信机制。调用fork之前父进程向尚未存在的子进程传递信息相当容易,因为子进程将从父进程数据空间及所有描述符的一个副本开始运行,但是从子进程向父进程返回信息却比较费力。

          针对这两点,多线程技术相应而生,它具有如下优越性:

          (1)它是一种非常"节俭"的多任务操作方式。而运行于一个进程中的多个线程,它们彼此之间使用相同的地址空间,共享大部分数据,启动一个线程所花费的空间远远小于启动一个进程所花费的空间,而且,线程间彼此切换所需的时间也远远小于进程间切换所需要的时间。

          (2)线程间方便的通信更加方便。由于同一进程下的线程之间共享数据空间,所以一个线程的数据可以直接为其它线程所用,这不仅快捷,而且方便。但是,同一进程内的所有线程共享相同的全局内存,这样线程之间的通信就变得相当简单,随之而来的就是同步问题

    三.基本线程函数

    1.pthread_create函数,创建线程

    int pthread_create(pthread_t *tid, const pthread_attr_t *attr, void *(*func)(void *), void *arg);
    

          pthread_t *tid:一个进程内的各个线程是由线程ID标识的,如果新线程创建成功,返回tid指针。

          const pthread_attr_t *attr:每个线程有多个属性,包括优先级、初始栈大小、是否是一个守护线程等等。

          void *(*func)(void *):线程启动函数,线程从调用这个函数开始,或显示结束(调用pthread_exit()),或隐式结束(让该函数返回)。

          void *arg:线程执行func函数的传递参数。

    2.pthread_join函数,等待一个线程终止

    int pthread_join(pthread_t *tid, void **status);
    

          void **status:二级指针,如果status指针非空,那么所等待线程的返回值将存放在status指向的位置。

    3.pthread_self函数,返回线程ID

    int pthread_self(void);

          跟进程比较,相当于getpid。

    4.pthread_detach函数,线程分离

    int pthread_detach(pthread_t tid);  

          线程或者是可汇合的(joinable),或者是脱离的(detach)。当可汇合的线程终止时,线程ID和退出状态将保留,知道另外一个线程调用pthread_join。脱离的线程终止时,释放所有的资源,因此我们不能等待它终止。若要一个线程知道另一个线程的终止时间,我们就要保留第二个线程的可汇合性。

    5.pthread_exit函数,线程终止

    int pthread_exit(void **status);  

          若线程未脱离,那么它的线程ID和退出状态将保留到另外一个线程调用pthread_join为止。

    四.多线程的同步

          有了上面的基本函数还不足以完成本题的要求,为什么呢?因为题目要求按照ABCABC...的方式打印,而3个线程却在抢占资源,所以无法控制排列顺序。这时就需要用到多线程编程中的同步技术。

          对于多线程编程来说,同步就是同一时间只允许一个线程访问资源,而其他线程不能访问。多线程有3种同步方式:

    • 互斥锁
    • 条件变量
    • 读写锁

    1.互斥锁

          互斥锁是最基本的同步方式,它用来保护一个“临界区”,保证任何时刻只由一个线程在执行其中的代码。这个“临界区”通常是线程的共享数据

          下面三个函数给一个互斥锁上锁和解锁:

    int pthread_mutex_lock(pthread_mutex_t *mptr);
    
    int pthread_mutex_trylock(pthread_mutex_t *mptr);
    
    int pthread_mutex_unlock(pthread_mutex_t *mptr);
    

      假设线程2要给已经被线程1锁住的互斥锁(mutex)上锁(即执行pthread_mutex_lock(mutex)),那么它将一直阻塞直到到线程1解锁为止(即释放mutex)。

          如果互斥锁变量时静态分配的,通常初始化为常值PTHREAD_MUTEX_INITIALIZER,如果互斥锁是动态分配的,那么在运行时调用pthread_mutex_init函数来初始化。

    2.条件变量

          互斥锁用于上锁,而条件变量则用于等待,通常它都会跟互斥锁一起使用。

    int pthread_cond_wait(pthread_cond_t *cptr,pthread_mutex_t *mptr);
    int pthread_cond_signal(pthread_cond_t *cptr);
    

      通常pthread_cond_signal只唤醒等待在相应条件变量上的一个线程,若有多个线程需要被唤醒呢,这就要使用下面的函数了:

    int pthread_cond_broadcast(pthread_cond_t *cptr);
    

    3.读写锁

          互斥锁将试图进入连你姐去的其他简称阻塞住,而读写锁是将读和写作了区分,读写锁的分配规则如下:

          (1)只要没有线程持有某个给定的读写锁用于写,那么任意数目的线程可以持有该读写锁用于读;

          (2)仅当没有线程持有某个给定的读写锁用于读或用于写时,才能分配该读写锁用于写。

    int pthread_rwlock_rdlock(pthread_relock_t *rwptr);
    int pthread_rwlock_wrlock(pthread_relock_t *rwptr);
    int pthread_rwlock_unlock(pthread_relock_t *rwptr);
    

      

    五.题目代码

          分析此题:

    1.主线程main创建3个线程tid0,tid1,tid2;

    2.设一个全局变量num,互斥锁mutex保护此临界区保证每次只有一个线程访问num;

    3.若抢占到资源的线程tid并不是我们需要的,那么让它阻塞;

    4.若抢占到资源的线程tid正好是我们需要的,那么就打印相应字母;

    5.解锁,唤醒其他两个等待线程;

    6.main函数等待3个线程打印结束才结束。

          代码如下:

    #include<stdio.h>
    #include<stdlib.h>
    #include<error.h>
    #include<unistd.h>
    #include<pthread.h>
    
    int num=0;
    
    static pthread_mutex_t mutex=PTHREAD_MUTEX_INITIALIZER;
    static pthread_cond_t cond=PTHREAD_COND_INITIALIZER;
    
    void *func(void *);
    
    int main()
    {
    	pthread_t tid[3];
    	int ret=0,i;
    	for(i=0;i<3;i++)
    		if((ret=pthread_create(&tid[i],NULL,func,(void*)i))!=0)
    			printf("create thread_%c error
    ",i+'A');
       	for(i=0;i<3;i++)
    		pthread_join(tid[i],NULL);
    	printf("
    ");
    	return 0;
    }
    
    void *func(void *argc)
    {
    	int i;
    	for(i=0;i<10;i++)
    	{
    		pthread_mutex_lock(&mutex);
    	    while(num!=(int)argc)
    			pthread_cond_wait(&cond,&mutex);
    		printf("%c",num+'A');
    		num=(num+1)%3;
    		pthread_mutex_unlock(&mutex);
    		pthread_cond_broadcast(&cond);
    	}
    	pthread_exit(0);
    }
    

    参考资料:

    1. 《UNIX网络编程卷2》

    2.http://www.cnblogs.com/skynet/archive/2010/10/30/1865267.html

    3.http://www.cnblogs.com/vamei/archive/2012/10/09/2715393.html

  • 相关阅读:
    RabbitMq 集群配置
    获取 input 单选框和多选框的值
    js 获取 通过 ”?“ 或者 ”&“ url 传过来参数值
    Java 对文件的读取操作
    java 链接jdbc
    了解EBP寄存器
    节后后遗症
    [转]web service实现原理与异步调用
    Javascript实现无刷新分页
    邮件发送
  • 原文地址:https://www.cnblogs.com/Rosanna/p/3576715.html
Copyright © 2011-2022 走看看