zoukankan      html  css  js  c++  java
  • 第四章学习笔记

    第四章学习笔记

    第四章 并发编程

    • 本章论述了并发编程,介绍了并行计算的概念,并指出了并行计算的重要性;比较了顺序算法与并行算法,以及并行性与并发性;解释了线程的原理及其相对于进程的优势;介绍了Pthread中的线程操作,包括线程管理函数,互斥量、连接、条件变量和屏障等线程同步工具;解释了死锁问题,并说明了如何防止并发程序中的死锁问题;讨论了信号量,并论证了它们相对于条件变量的优点;还解释了支持Linux中线程的独特方式,让我们更加深入地了解多任务处理、线程同步和并发编程的原理及方法。

    1.并行计算导论

    • 在早期,大多数计算机只有一个处理组件,称为处理器或中央处理器(CPU)。受这种硬件条件的限制,计算机程序通常是为串行计算编写的。
      要求解某个问题,先要设计一种算法,描述如何一步步地解决问题,然后用计算机程序以串行指令流的形式实现该算法。在只有一个CPU的情况下,每次只能按顺序执行某算法的一个指令和步骤。但是,基于分治原则(如二叉树查找和快速排序等)的算法经常表现出高度的并行性,可通过使用并行或并发执行来提高计算速度。并行计算是一种计算方案,它尝试使用多个执行并行算法的处理器更快速地解决问题。
    1. 顺序算法与并行算法
    • 顺序算法
      begin
        step_1
        step_2
        ···
        step_n
      end
    
    • 并行算法
     cobegin
        task_1
        task_2
        ···
        task_n
      coend
    
    • 顺序算法begin-end代码块中的顺序算法可能包含多个步骤。所有步骤都是通过单个任务依次执行的,每次执行一个步骤。当所有步骤执行完成时,算法结束。相反,并行算法使用cobegin-coend代码块来指定并行算法的独立任务。在cobegin-coend块中,所有任务都是并行执行的。紧接着cobegin-coend代码块的下一个步骤将只在所有这些任务完成之后执行。
    1. 并行性与并发性
    • 通常,并行算法只识别可并行执行的任务,但是它没有规定如何将任务映射到处理组件。在理想情况下,并行算法中的所有任务都应该同时实时执行。然而,真正的并行执行只能在有多个处理组件的系统中实现,比如多处理器或多核系统。在单 CPU 系统中—次只能执行一个任务。在这种情况下,不同的任务只能并发执行,即在逻辑上并行执行。在单CPU 系统中,并发性是通过多任务处理来实现的。

    2.线程

    1. 线程的原理
    • 线程是某进程同一地址空间上的独立执行单元。创建某个进程就是在一个唯一地址空间创建一个主线程。当某进程开始时,就会执行该进程的主线程。如果只有一个主线程,那么进程和线程实际上并没有区别。但是,主线程可能会创建其他线程。每个线程又可以创建更多的线程等。某进程的所有线程都在该进程的相同地址空间中执行,但每个线程都是一个独立的执行单元。
    • 在线程模型中,如果一个线程被挂起,其他线程可以继续执行。除了共享共同的地址空间之外,线程还共享进程的许多其他资源,如用户id、打开的文件描述符和信号等。
    1. 线程的优点
    • (1)线程创建和切换速度更快
    • (2)线程的响应速度更快
    • (3)线程更适合并行计算
    1. 线程的缺点
    • (1)由于地址空间共享,线程需要来自用户的明确同步。
    • (2)许多库函数可能对线程不安全,例如传统 strtok()函数将一个字符串分成一连串令牌。通常,任何使用全局变量或依赖于静态内存内容的函数,线程都不安全。为了使库函数适应线程环境,还需要做大量的工作。
    • (3)在单CPU系统上,使用线程解决问题实际上要比使用顺序程序慢,这是由在运行时创建线程和切换上下文的系统开销造成的。

    3.线程操作

    • 线程的执行轨迹与进程类似。线程可在内核模式或用户模式下执行。
      在用户模式下,线程在进程的相同地址空间中执行,但每个线程都有自己的执行堆栈。线程是独立的执行单元,可根据操作系统内核的调度策略,对内核进行系统调用,变为挂起、激活以继续执行等。

    4.进程管理函数

    1. 创建线程
    • 使用pthread_create()函数创建线程
    int pthread_create (pthread_t *pthread_id, pthread_attr_t *attr, 
    void *(*func)(void *), void *arg);
    
    • pthread_id是指向pthread_t类型变量的指针。它会被操作系统内核分配的唯一线程ID填充。在POSIX中,pthread_t是一种不透明的类型。程序员应该不知道不透明对象的内容,因为它可能取决于实现情况。线程可通过pthread_self()函数获得自己的ID。在 Linux 中,pthread_t类型被定义为无符号长整型,因此线程ID可以打印为%lu。
    • attr是指向另一种不透明数据类型的指针,它指定线程属性,下面将对此进行更详细的说明。
    • func是要执行的新线程函数的入口地址。 arg是指向线程函数参数的指针,可写为:void *func(void *arg)
    • attr参数
      • (1)定义一个pthread属性变量pthread_attr_t attr。
      • (2)用pthread_attr_init (&attr)初始化属性变量。
      • (3)设置属性变量并在pthread_create()调用中使用。
      • (4)必要时,通过pthread_attr_destroy (&attr)释放attr资源。
    1. 线程ID
    • 线程ID是一种不透明的数据类型,取决于实现情况。因此,不应该直接比较线程ID。如果需要,可以使用pthread_equal()函数对它们进行比较。
    int pthread_equal (pthread_t t1, pthread_t t2);
    

    如果是不同的线程,则返回0,否则返回非0。
    3. 线程终止
    线程函数结束后,线程即终止。或者,线程可以调用函数

    int pthread_exit (void *status);
    

    进行显式终止,其中状态是线程的退出状态。通常,0退出值表示正常终止,非0值表示异常终止。
    4. 线程连接
    一个线程可以等待另一个线程的终止,通过

    int pthread_join (pthread_t thread, void **status ptr);
    

    终止线程的退出状态以status_ptr返回。

    5.实践

    • 用线程快速排序
    #include <stdio.h>
    #include <stdlib.h>
    #include <pthread.h>
    typedef struct{
    	int upperbound;
    	int lowerbound;
    }PARM;
    #define N 10
    int a[N]={5,1,6,4,7,2,9,8,0,3};
    int print(){//print current a[] contents
    	int i;
    	printf("[");
    	for(i=0;i<N;i++)
    		printf("%d ",a[i]);
    	printf("]
    ");
    }
    void *Qsort(void *aptr){
    	PARM *ap, aleft, aright;
    	int pivot, pivotIndex,left, right,temp;
    	int upperbound,lowerbound;
    	pthread_t me,leftThread,rightThread;
    	me = pthread_self();
    	ap =(PARM *)aptr;
    	upperbound = ap->upperbound;
    	lowerbound = ap->lowerbound;
    	pivot = a[upperbound];//pick low pivot value
    	left = lowerbound - 1;//scan index from left side
    	right = upperbound;//scan index from right side
    	if(lowerbound >= upperbound)
    		pthread_exit (NULL);
    	while(left < right){//partition loop
    		do{left++;} while (a[left] < pivot);
    		do{right--;}while(a[right]>pivot);
    		if (left < right ) {
    			temp = a[left];a[left]=a[right];a[right] = temp;
    		}
    	}
    	print();
    	pivotIndex = left;//put pivot back
    	temp = a[pivotIndex] ;
    	a[pivotIndex] = pivot;
    	a[upperbound] = temp;
    	//start the "recursive threads"
    	aleft.upperbound = pivotIndex - 1;
    	aleft.lowerbound = lowerbound;
    	aright.upperbound = upperbound;
    	aright.lowerbound = pivotIndex + 1;
    	printf("%lu: create left and right threadsln", me) ;
    	pthread_create(&leftThread,NULL,Qsort,(void * )&aleft);
    	pthread_create(&rightThread,NULL,Qsort,(void *)&aright);
    	//wait for left and right threads to finish
    	pthread_join(leftThread,NULL);
    	pthread_join(rightThread, NULL);
    	printf("%lu: joined with left & right threads
    ",me);
    }
    	int main(int argc, char *argv[]){
    	PARM arg;
    	int i, *array;
    	pthread_t me,thread;
    	me = pthread_self( );
    	printf("main %lu: unsorted array = ", me);
    	print( ) ;
    	arg.upperbound = N-1;
    	arg. lowerbound = 0 ;
    	printf("main %lu create a thread to do QS
    " , me);
    	pthread_create(&thread,NULL,Qsort,(void * ) &arg);//wait for Qs thread to finish
    	pthread_join(thread,NULL);
    	printf ("main %lu sorted array = ", me);
    	print () ;
    }
    

  • 相关阅读:
    大数据技术之Kafka是什么
    大数据技术之Hadoop 基础认识
    在eclipse中运行Mapreduce & spark
    datatstage 中一直处于Ready 状态
    Datastage run 有时候太慢 有时候performance 还Okay
    不能重复造轮子,尤其是枯燥的轮子,要造就造有趣的、好玩的轮子
    什么是好?什么是优秀?
    字面量-上集
    图片切换-vue
    数据绑定
  • 原文地址:https://www.cnblogs.com/zhangwenying/p/15487198.html
Copyright © 2011-2022 走看看