zoukankan      html  css  js  c++  java
  • CUDA随机数生成库curand——deviceAPI

    原创作品,如要转载请注明出处:http://www.cnblogs.com/shrimp-can/p/6590152.html

    最近要在device函数中使用curand库生成随机数,查找了下资料,除了NVIDIA官网的介绍外,其他介绍deviceAPI的我没有找到,倒是介绍hostAPI的一大堆,因此简单整理下自己所理解的deviceAPI的使用。

    一、简介

    curand由两部分组成:host端的库和device端的头文件。

    host端的库就像其他的CPU库一样curand.h,随机数可以在设备端生成或者CPU端生成。在设备端生成的时候,对库的调用发生在host端,但是随机数的生成实际上发生在device端,随机数存储在global memory中,用户可以调用kernel直接使用这个随机数,也可以将此随机数拷贝回kernel。

    device端的库头文件curand_kernel.h,这个头文件里面定义了设置随机数生成器的状态以及生成一系列随机数的设备函数,使得kernel可以调用函数生成随机数,而不需要从global memory处读写。

    二、device API

    包含头文件curand_kernel.h,工程需要链接到库curand。

    cuda Nsignt链接到库curand的做法:右击工程名-属性-c/c++ General-Paths and Symbols,在Library Paths中添加上curand.lib所在的目录

    我安装cuda时是默认目录,在目录:/usr/local/cuda-7.5/lib64中

    使用curand的deviceAPI生成随机数主要需要三个步骤

    a.创建一个随机算法状态的对象,如curandState state

    b.对状态进行初始化,使用curand_init()函数

    c.生成随机数,使用curand等

    deviceAPI的作用也是这些,下面进行更详细的介绍

    1.创建随机算法状态对象

    在deviceAPI中,有4中为随机算法,4种真随机算法

    伪随机算法     对应的状态

    Mtgp32                       curandStateMtgp32_t

    MRG32k3a                 curandStateMRG32k3a_t

    Philox4_32_10           curandStatePhilox4_32_10_t

    XORWOW                  curandStateWORWOW_t

    真随机算法     对应的状态

    scrambled Sobol64     curandStateScrambledSobol64_t

    Sobol64                    curandStateSobol64_t

    scrambled Sobol32     curandStateScrambledSobol32_t

    Sobol32                    curandStateSobol32_t

    如要创建算法XORWOW状态对象:curandStateWORWOW_t   state

    2.对算法状态进行初始化

    curand_init()函数,不同的算法,函数的参数不相同,具体算法所需要的参数可以看NVIDIA官网curand_initAPI:http://docs.nvidia.com/cuda/curand/group__DEVICE.html#group__DEVICE

    对于除了MTGP32的伪随机算法,初始化参数都是:种子、序列、偏移、要初始化的随机算法状态对象

    注意:算法MTGP32的初始化是通过两个hostAPI,curandMakeMTGP32Constants和cirandMakeMTGP32KernelState

    如要初始化算法XORWOW状态对象:curand_init ( unsigned long long seed, unsigned long long subsequence, unsigned long long offset, curandStateXORWOW_t* state )

    3.生成随机数

    生成随机数除了可以使用不同的算法(由参数决定)以外,还能生成不同分布、不同浮点类型的随机数,这根据调用的生成随机数的API决定。

    主要有以下几种API:

    curand                                                  生成unsigned int型整数,没有特殊分布

    curand_uniform                                    生成服从均匀分布的float

    curand_uniform4                                  生成4个服从均匀分布的float

    curand_uniform_double                     生成服从均匀分布的double

    curand_uniform2_double                     生成2个服从均匀分布的double

    curand_poisson                                 生成服从泊松分布的int

    curand_poisson4                               生成4个服从泊松分布的int

    curand_normal                                  生成服从正态分布的float

    curand_normal2                                生成2个服从正态分布的float

    curand_normal4                                生成4个服从正态分布的float

    curand_normal_double                     生成服从正态分布的double

    curand_normal2_double                   生成2个服从正态分布的double

    curand_log_normal                           生成服从对数正态分布的float

    curand_log_normal2                           生成2个服从对数正态分布的float

    curand_log_normal4                           生成4个服从对数正态分布的float

    curand_log_normal_double                生成服从对数正态分布的double

    curand_log_normal2_double              生成2个服从对数正态分布的double

    curand_mtgp32_single                    生成mtgp32算法中服从均匀分布的float

    curand_mtgp32_single_specific         生成mtgp32算法中服从特殊泊松分布的float

    curand_mtgp32_specific                    生成mtgp32算法中的32bits的int

    如要生成一个int型的随机数,采用XORWOW算法:curand(curandStateXORWOW_t* state)

    以上是个人理解,如有错误的地方,忘批评指正

  • 相关阅读:
    Python基础入门教程
    【前端学习笔记】2015-09-11~~~~ js中ajax请求返回案例
    【前端学习笔记】2015-09-10~~~~ css层叠样式表~~格式
    【前端学习笔记】2015-09-09~~~~nodejs中的require()和module.exports
    【前端学习笔记】2015-09-08~~~~ 关于切图的简单方法
    【前端学习笔记】2015-09-06 ~~~~ setAttribute()、slice()
    【前端学习笔记】2015-09-02 附~~~~~ajax简单请求和获得响应结果
    【前端学习笔记】2015-09-02~~~~ 关于filter()匹配的使用
    【前端学习笔记】2015-09-01 附二 关于jq选择器的简单运用
    【前端学习笔记】2015-09-01 附 split()方法、readyState
  • 原文地址:https://www.cnblogs.com/shrimp-can/p/6590152.html
Copyright © 2011-2022 走看看