zoukankan      html  css  js  c++  java
  • 【CUDA开发】Cuda C++ Thrust API与 Cuda Runtime API程序比较

    今天买了本新书《高性能CUDA应用设计与开发方法与最佳实践》,今天读了第一章有点出获,分享给大家。

    程序功能:给向量填充数据并计算各元素之和

    1. CPU串行运行的代码:

    //seqSerial.cpp:串行执行数组的填充及求和
    #include<iostream>
    #include<vector>
    using namespace std;

    int main()
    {
     const int N=50000;
     //任务1:创建数组
     vector<int> a(N);
     //任务2:填充数组
     for(int i=0;i<N;i++)a[i]=i;
     //任务3:计算数组各元素之和
     int sumA=0;
     for(int i=0;i<N;i++)sumA+=a[i];
     //任务4:计算0-N-1之和
     int sumCheck=0;
     for(int i=0;i<N;i++)sumCheck+=i;
     //任务5:检查结果是否正确
     if(sumA==sumCheck) cout<<"Test Succeeded!"<<endl;
     else {cerr<<"TestFailed!"<<endl;return(1);}
     return (0);
    }

     2.Cuda Thrust C++ API 程序

    #include<iostream>
    using namespace std;

    #include<thrust/reduce.h>
    #include<thrust/sequence.h>
    #include<thrust/host_vector.h>
    #include<thrust/device_vector.h>

    int main()
    {
     const int N=50000;
     //任务1:创建数组
     thrust::device_vector<int>a(N);
     //任务2:填充数组,并行运算
     thrust::sequence(a.begin(),a.end(),0);
     //任务3:计算数组元素之和,并行计算
     int sumA=thrust::reduce(a.begin(),a.end(),0);
     //
     int sumCheck=0;
     for(int i=0;i<N;i++)
      sumCheck+=i;
     //
     if(sumA==sumCheck)cout<<"Test Succeeded!"<<endl;
     else
     {
      cerr<<"Test Failed!"<<endl;
      return(1);
     }
     getchar();
     return (0);
    }

     

    3.仅对数据填充改为Runtime API 程序

    //使用cuda Runtime API完成向数组中填充连续整数
    #include<iostream>
    using namespace std;

    #include<thrust/reduce.h>
    #include<thrust/sequence.h>
    #include<thrust/host_vector.h>
    #include<thrust/device_vector.h>

    __global__ void fillKernel(int *a,int n)
    {
     int tid=blockIdx.x*blockDim.x+threadIdx.x;
     if(tid<n) a[tid]=tid;
    }

    void fill(int *d_a,int n)
    {
     int nThreadsPerBlock=512;
     //int nBlocks=n/nThreadsPerBlock+(n%nThreadsPerBlock)?1:0);
     int nBlocks=(n+nThreadsPerBlock)/nThreadsPerBlock;
     fillKernel<<<nBlocks,nThreadsPerBlock>>>(d_a,n);
    }

    int main()
    {
     const int N=50000;
     //任务1:创建数组
     thrust::device_vector<int>a(N);
     //任务2:填充数组,使用Runtime API 填充数组
     fill(thrust::raw_pointer_cast(&a[0]),N);
     //任务3:计算数组元素之和,并行计算
     int sumA=thrust::reduce(a.begin(),a.end(),0);
     //任务4:计算0-N-1之和
     int sumCheck=0;
     for(int i=0;i<N;i++)
      sumCheck+=i;
     //任务5:检查结果的正确性
     if(sumA==sumCheck)cout<<"Test Succeeded!"<<endl;
     else
     {
      cerr<<"Test Failed!"<<endl;
      return(1);
     }
     getchar();
     return (0);
    }

     

  • 相关阅读:
    网络编程
    网络参考模型
    面向对象中类的成员
    Forward(请求转发)和Redirect(重定向)的比较
    AOP详解
    JDK动态代理和CGLib代理对比
    内存可见性问题分析
    Java中创建对象的5种方式
    基于Spring的动态路由AbstractRoutingDataSource实现动态分库
    在java中String类为什么要设计成final?
  • 原文地址:https://www.cnblogs.com/huty/p/8517922.html
Copyright © 2011-2022 走看看