zoukankan      html  css  js  c++  java
  • CUDA C编程,GPU编程,GPU优化计算

    CUDA C编程,GPU编程,GPU优化计算

    CUDA编程套路格式

    根据《GPU编程与优化》的学习有:

    1.获取配置GPU设备

    1 cudaSetDevice(0); //获取GPU设备,如果只有一个默认为0,这个时候可以缺省,其他情况这不行。

    2.分配GPU显存大小

    1 cudaMalloc((void**) &d_a, sizeof(float) *n); //分配显存

    3.Host2Device数据传输

    1 cudaMemcpy(d_a,a,sizeof(float) *n,cudaMemcpyHostToDevice); //数据传输,主机到设备

    4.调用kernel function

    1 gpu_kernel<<<blocks,threads>>>(***);  //kernel function调用

    5.Device2Host数据传输

    1 cudaMemcpy(a,d_a,sizeof(float) *n, cudaMemcpyDeviceToHost);
    2 //D2H数据传输,GPU结果返回CPU

    6.释放显存

    1 cudaFree(d_a) //释放显存空间,每个变量是一个显存空间,所以每个变量都要释放

    7.释放设备

    1 cudaDeviceReset(); //重置设备,可以省略
  • 相关阅读:
    hdoj 1872 稳定排序
    nyoj 60 谁获得了最高奖学金
    hdoj 2066 一个人的旅行
    nyoj 8 一种排序
    bzoj1798 1
    bzoj4031
    SPOJ-HIGH
    学习笔记::矩阵树定理
    学习笔记::树上莫队
    Strip
  • 原文地址:https://www.cnblogs.com/nanmi/p/12617524.html
Copyright © 2011-2022 走看看