zoukankan      html  css  js  c++  java
  • 傅立叶变换—FFT(cuda实现)

    背景:

    无意间看到cuda解决FFT有一个cufft函数库,大体查看了有关cufft有关知识,写了一个解决一维情况的cuda代码,据调查知道cufft在解决1D,2D,3D的情况时间复杂度都为O(nlogn),附上解决一维情况的代码,准备后面找一些详细的资料去学习一下cuda的函数库。

    #include "stdio.h"
    #include "cuda_runtime.h"
    #include "cufft.h"
    #include "device_launch_parameters.h"
    
    
    #define LENGTH 4
    int main()
    {
    
    float Data[LENGTH] = {1,2,3,4}; cufftComplex *CompData=(cufftComplex*)malloc(LENGTH*sizeof(cufftComplex)); int i; for(i=0;i<LENGTH;i++) { CompData[i].x=Data[i]; CompData[i].y=0; } cufftComplex *d_fftData; cudaMalloc((void**)&d_fftData,LENGTH*sizeof(cufftComplex)); cudaMemcpy(d_fftData,CompData,LENGTH*sizeof(cufftComplex),cudaMemcpyHostToDevice); cufftHandle plan; cufftPlan1d(&plan,LENGTH,CUFFT_C2C,1); cufftExecC2C(plan,(cufftComplex*)d_fftData,(cufftComplex*)d_fftData,CUFFT_FORWARD); cudaDeviceSynchronize(); cudaMemcpy(CompData,d_fftData,LENGTH*sizeof(cufftComplex),cudaMemcpyDeviceToHost); for(i=0;i<LENGTH;i++) { if(CompData[i].x != 0) { printf("%3.1f",CompData[i].x); } if(CompData[i].y != 0 ) { printf("+%3.1fi",CompData[i].y); } printf(" "); } cufftDestroy(plan); free(CompData); cudaFree(d_fftData); }

    在Linux下运行的这段代码:

    编译命令:nvcc -o fftcu FFT.cu -I /usr/local/cuda/include  -L /usr/local/cuda/lib64 -lcufft

    运行命令:./fftcu

    注:/usr/local/cuda/include中有cufft.h头文件,/usr/local/cuda/lib64中有libcufft.so库文件

  • 相关阅读:
    .net core EF 入门笔记Code First
    Windows环境下安装MongodDB
    Ueditor1.4.3.3 富文本编辑器在图片不显示问题
    .net IIS网站部署Host文件简单应用
    .Net初学Less的安装与部署
    EF+MVC动态Lamda表达式拼接(学习笔记二)
    EF+MVC动态Lamda表达式拼接(学习笔记)
    区块链从入门到放弃
    Unity3D的update和FixedUpdate
    忽雷太极拳十三式
  • 原文地址:https://www.cnblogs.com/zhangjxblog/p/5016986.html
Copyright © 2011-2022 走看看