zoukankan      html  css  js  c++  java
  • OpenMP入门教程(一)

    什么是OpenMP

    Open Multi-Processing的缩写,是一个应用程序接口(API),可用于显式指导多线程、共享内存的并行性。

    在项目程序已经完成好的情况下不需要大幅度的修改源代码,只需要加上专用的pragma来指明自己的意图,由此编译器可以自动将程序进行并行化,并在必要之处加入同步互斥以及通信。当选择忽略这些pragma,或者编译器不支持OpenMp时,程序又可退化为通常的程序(一般为串行),代码仍然可以正常运作,只是不能利用多线程来加速程序执行。OpenMP提供的这种对于并行描述的高层抽象降低了并行编程的难度和复杂度,这样程序员可以把更多的精力投入到并行算法本身,而非其具体实现细节。对基于数据分集的多线程程序设计,OpenMP是一个很好的选择。

    OpenMP支持的语言包括C/C++、Fortran;而支持OpenMP的编译器VS、gcc、clang等都行。可移植性也很好:Unix/Linux和Windows

      OpenMP编程模型

      内存共享模型:OpenMP是专为多处理器/核,共享内存机器所设计的。底层架构可以是UMA和NUMA。即(Uniform Memory AccessNon-Uniform Memory Access)

      基于线程的并行性

    • OpenMP仅通过线程来完成并行
    • 一个线程的运行是可由操作系统调用的最小处理单
    • 线程们存在于单个进程的资源中,没有了这个进程,线程也不存在了
    • 通常,线程数与机器的处理器/核数相匹配,然而,实际使用取决与应用程序

      明确的并行

    • OpenMP是一种显式(非自动)编程模型,为程序员提供对并行化的完全控制
    • 一方面,并行化可像执行串行程序和插入编译指令那样简单
    • 另一方面,像插入子程序来设置多级并行、锁、甚至嵌套锁一样复杂

      Fork-Join模型

    • OpenMP就是采用Fork-Join模型
    • 所有的OpenML程序都以一个单个进程——master thread开始,master threads按顺序执行知道遇到第一个并行区域
    • Fork:主线程创造一个并行线程组
    • Join:当线程组完成并行区域的语句时,它们同步、终止,仅留下主线程

      数据范围

    • 由于OpenMP时是共享内存模型,默认情况下,在共享区域的大部分数据是被共享的
    • 并行区域中的所有线程可以同时访问这个共享的数据
    • 如果不需要默认的共享作用域,OpenMP为程序员提供一种“显示”指定数据作用域的方法

      嵌套并行

    • API提供在其它并行区域放置并行区域
    • 实际实现也可能不支持

      动态线程

    • API为运行环境提供动态的改变用于执行并行区域的线程数
    • 实际实现也可能不支持

    简单使用

    在VS2017中就可以使用,具体的:新建一个C/C++程序,项目--属性--C/C++--语言--OpenMP支持,把OpenMP打开。然后编写带编译指令的并行程序,注意一定要加上<omp.h>头文件。

    写一个并行的Hello World

     1 #include <omp.h>
     2 #include <stdio.h>
     3 #include <stdlib.h>
     4 
     5 int main()
     6 {
     7     int nthreads, tid;
     8 
     9     /* Fork a team of threads giving them their own copies of variables */
    10     #pragma omp parallel private(nthreads, tid)
    11     {
    12 
    13         /* Obtain thread number */
    14         tid = omp_get_thread_num();
    15         printf("Hello World from thread = %d
    ", tid);
    16 
    17         /* Only master thread does this */
    18         if (tid == 0)
    19         {
    20             nthreads = omp_get_num_threads();
    21             printf("Number of threads = %d
    ", nthreads);
    22         }
    23 
    24     }  /* All threads join master thread and disband */
    25     return 0;
    26 }

    运行结果如下:

    注:我的电脑默认是4个线程,不同的电脑运行结果不同,就算是同一部电脑每次运行的结果也可能不同(4个线程并行执行,没有确定的先后顺序)

    也可以直接使用gcc加上-fopenmp编译,For example:

    1 g++ test.cpp -o test -fopenmp
    2 ./test

    (不知道我的gcc不行,只能用g++,枯了)

    补:直到原因了,gcc默认编译链接不会链接C++标准库,可以使用g++编译链接(如上),也可以在gcc链接时显示指定链接 -lstdc++

    gcc test.cpp -o test -fopenmp -lstdc++

    至于OpenMP详细的编写格式和意义可以看这篇博客。

    参考资料:

    1、https://blog.csdn.net/wyjkk/article/details/6612108

    2、https://blog.csdn.net/HW140701/article/details/73716363

    3、https://computing.llnl.gov/tutorials/openMP/#RunTimeLibrary

  • 相关阅读:
    普通的一个python脚本,hadoop进军的准备
    Python之数据类型讲解
    开始博客的理由
    【微机原理及应用】程序的分类
    【jvm】jvm学习第二篇。jvm运行机制
    【jvm】jvm学习第一篇。初识jvm
    【it公司】it公司简介-项目流程-研发小技巧
    【感悟】20岁的人生不应该停止奋斗。----------------努力努力再努力
    【书籍学习】史上最全的Java进阶书籍推荐
    【职业规划】3年工作经验的程序员应该具备的技能
  • 原文地址:https://www.cnblogs.com/lfri/p/10111315.html
Copyright © 2011-2022 走看看