zoukankan      html  css  js  c++  java
  • OpenMP入门教程

      什么是OpenMP

      Open Multi-Processing的缩写,是一个应用程序接口(API),可用于显式指导多线程、共享内存的并行性。

      在项目程序已经完成好的情况下不需要大幅度的修改源代码,只需要加上专用的pragma来指明自己的意图,由此编译器可以自动将程序进行并行化,并在必要之处加入同步互斥以及通信。当选择忽略这些pragma,或者编译器不支持OpenMp时,程序又可退化为通常的程序(一般为串行),代码仍然可以正常运作,只是不能利用多线程来加速程序执行。OpenMP提供的这种对于并行描述的高层抽象降低了并行编程的难度和复杂度,这样程序员可以把更多的精力投入到并行算法本身,而非其具体实现细节。对基于数据分集的多线程程序设计,OpenMP是一个很好的选择。

      OpenMP支持的语言包括C/C++、Fortran;而支持OpenMP的编译器VS、gcc、clang等都行。可移植性也很好:Unix/Linux和Windows

      OpenMP编程模型

      内存共享模型:OpenMP是专为多处理器/核,共享内存机器所设计的。底层架构可以是UMA和NUMA。即(Uniform Memory Access和Non-Uniform Memory Access)

      基于线程的并行性

    • OpenMP仅通过线程来完成并行
    • 一个线程的运行是可由操作系统调用的最小处理单
    • 线程们存在于单个进程的资源中,没有了这个进程,线程也不存在了
    • 通常,线程数与机器的处理器/核数相匹配,然而,实际使用取决与应用程序

      明确的并行

    • OpenMP是一种显式(非自动)编程模型,为程序员提供对并行化的完全控制
    • 一方面,并行化可像执行串行程序和插入编译指令那样简单
    • 另一方面,像插入子程序来设置多级并行、锁、甚至嵌套锁一样复杂

      Fork-Join模型

    • OpenMP就是采用Fork-Join模型
    • 所有的OpenML程序都以一个单个进程——master thread开始,master threads按顺序执行知道遇到第一个并行区域
    • Fork:主线程创造一个并行线程组
    • Join:当线程组完成并行区域的语句时,它们同步、终止,仅留下主线程

      数据范围

    • 由于OpenMP时是共享内存模型,默认情况下,在共享区域的大部分数据是被共享的
    • 并行区域中的所有线程可以同时访问这个共享的数据
    • 如果不需要默认的共享作用域,OpenMP为程序员提供一种“显示”指定数据作用域的方法

      嵌套并行

    • API提供在其它并行区域放置并行区域
    • 实际实现也可能不支持

      动态线程

    • API为运行环境提供动态的改变用于执行并行区域的线程数
    • 实际实现也可能不支持

    简单使用

    在VS2017中就可以使用,具体的:新建一个C/C++程序,项目--属性--C/C++--语言--OpenMP支持,把OpenMP打开。然后编写带编译指令的并行程序,注意一定要加上<omp.h>头文件。

    写一个并行的Hello World

     1 #include <omp.h>
     2 #include <stdio.h>
     3 #include <stdlib.h>
     4 
     5 int main()
     6 {
     7     int nthreads, tid;
     8 
     9     /* Fork a team of threads giving them their own copies of variables */
    10     #pragma omp parallel private(nthreads, tid)
    11     {
    12 
    13         /* Obtain thread number */
    14         tid = omp_get_thread_num();
    15         printf("Hello World from thread = %d
    ", tid);
    16 
    17         /* Only master thread does this */
    18         if (tid == 0)
    19         {
    20             nthreads = omp_get_num_threads();
    21             printf("Number of threads = %d
    ", nthreads);
    22         }
    23 
    24     }  /* All threads join master thread and disband */
    25     return 0;
    26 }

    运行结果如下:

    注:我的电脑默认是4个线程,不同的电脑运行结果不同,就算是同一部电脑每次运行的结果也可能不同(4个线程并行执行,没有确定的先后顺序)

    也可以直接使用gcc加上-fopenmp编译,For example:

    1 g++ test.cpp -o test -fopenmp
    2 ./test

    (不知道我的gcc不行,只能用g++,枯了)

    补:直到原因了,gcc默认编译链接不会链接C++标准库,可以使用g++编译链接(如上),也可以在gcc链接时显示指定链接 -lstdc++

    gcc test.cpp -o test -fopenmp -lstdc++
  • 相关阅读:
    BZOJ 2588
    BZOJ 3524
    BZOJ 3932
    Bzoj1013--Jsoi2008球形空间产生器
    Codevs1743--反转卡片
    Bzoj1208--Hnoi2004宠物收养所
    Bzoj1112--Poi2008砖块Klo
    后缀自动机学习笔记
    Bzoj1588--Hnoi2002营业额统计
    Bzoj1056--Haoi2008排名系统
  • 原文地址:https://www.cnblogs.com/ybqjymy/p/13679547.html
Copyright © 2011-2022 走看看