OpenCVPython系列之傅里叶变换

zoukankan html css js c++ java

OpenCVPython系列之傅里叶变换
傅里叶变换
我们生活在时间的世界中，早上7:00起来吃早饭，8:00去挤地铁，9:00开始上班。。。以时间为参照就是时域分析。
但是在频域中一切都是静止的！可能有些人无法理解，我建议大家看看这个文章，写的真是相当好，推荐！
https://zhuanlan.zhihu.com/p/19763358
傅里叶变换经常被用来分析不同滤波器的频率特性。我们可以使用 2D 离散傅里叶变换 (DFT) 分析图像的频域特性。实现 DFT 的一个快速算法被称为快速傅里叶变换（FFT）。
对于一个正弦信号，如果它的幅度变化非常快，即f数值比较大，我们可以说他是高频信号，如果变化非常慢，即f数值比较小，我们称之为低频信号。你可以把这种想法应用到图像中，那么我们如何看待图像的变化幅度大小呢？那就是看边界点和噪声，一般边界和噪声是图像中的高频分量（注意这里的高频是指变化非常快，而非出现的次数多）。如果没有如此大的幅度变化我们称之为低频分量。
那么用傅里叶变换进行滤波的优点在哪儿呢，它可以把图像由时域转换成频域，由于频域中的信息更为简单，所以滤波起来更为方便，滤波之后再转换到时域，那么就相当于一个滤波了。
傅里叶变换的作用
· 高频：变化剧烈的灰度分量，例如边界
· 低频：变化缓慢的灰度分量，例如一片大海
所以一般情况下，由于图像中的高频分量与低频分量都存在，我们可以用傅里叶变换进行滤波。
滤波
· 低通滤波器：只保留低频，会使得图像模糊
· 高通滤波器：只保留高频，会使得图像细节增强
我们来看傅里叶变换的函数原型：
dst=cv2.dft(src, dst=None, flags=None, nonzeroRows=None)
第一个参数src为输入图像
dst是输出图像，包括输出图像的大小和尺寸
flags有五种，为转换标志:
1、DFT _INVERSE：执行的是反向的一维或者二维的转换。
2、DFT _SCALE:矩阵的元素数量除以它，产生缩放效果。
3、DFT _COMPLEX_OUTPUT：执行正向转换。
4、DFT _REAL_OUTPUT：执行一维或二维复数阵列的逆变换，结果通常是相同大小的复数数组，但如果输入数组具有共轭复数对称性，则输出为真实数组。
5、DFT _ROWS:执行正向或者反向变换输入矩阵的每个单独的行，该标志可以同时转换多个矢量，并可用于减少开销以执行3D和更高维度的转换等。
nonzeroRows:表示当参数不为零时，函数假定只有nonzeroRows输入数组的第一行（未设置）或者只有输出数组的第一个（设置）包含非零，因此函数可以处理其余的行更有效率，并节省一些时间；这种技术对计算阵列互相关或使用DFT卷积非常有用。
继续来分析傅里叶逆变换函数：
dst = cv2.idft(src[, dst[, flags[, nonzeroRows]]])
src: 表示输入图像，包括实数或复数。
dst: 表示输出图像。
flags: 表示转换标记。
nonzeroRows: 表示要处理的dst行数，其余行的内容未定义。
得到的结果中频率为零的部分会在左上角，通常要转换到中心位置，可以通过np.fft.fftshift()和np.fft.ifftshift()变换来实现，前者是傅里叶变换，后者是傅里叶逆变换。
cv2.dft()返回的结果是双通道（实部、虚部），通常需要转换成图像格式才能展示(0,255)，让我们看一下代码：
```
def dft():
    img = cv2.imread('min.jpg', 0)  # 将图像转换成灰度图
    dft = cv2.dft(np.float32(img), flags=cv2.DFT_COMPLEX_OUTPUT)  # 进行傅里叶变换
    dft_shift = np.fft.fftshift(dft)  # 将频率为零的部分转移到中心位置

    magnitude_spectrum = 20 * np.log(cv2.magnitude(dft_shift[:, :, 0], dft_shift[:, :, 1]))  # 公式

    plt.subplot(121), plt.imshow(img, cmap='gray')
    plt.title('Input Image'), plt.xticks([]), plt.yticks([])
    plt.subplot(122), plt.imshow(magnitude_spectrum, cmap='gray')
    plt.title('Magnitude Spectrum'), plt.xticks([]), plt.yticks([])
    plt.show()
```
可以看到，中心部分比较亮，越靠近中间位置低频信息越多，而高频信息则都在边界部分。
接下来要想对其进行滤波，应该怎么办呢？
显而易见，既然我们要去除低频分量，那就定一个范围，比如30*30的正方形范围，以图像中心为正方形中心点，将这个范围以内的高亮度的像素点去掉，就完成了滤波，然后我们再使用傅里叶逆变换将图像还原就可以看到。
代码：
```
def filter():
    img = cv2.imread('min.jpg', 0)
    img_float32 = np.float32(img)
    dft = cv2.dft(img_float32, flags=cv2.DFT_COMPLEX_OUTPUT)
    dft_shift = np.fft.fftshift(dft)
    rows, cols = img.shape
    crow, ccol = int(rows / 2), int(cols / 2)  # 中心位置
    # 低通滤波
    mask = np.zeros((rows, cols, 2), np.uint8)
    mask[crow - 30:crow + 30, ccol - 30:ccol + 30] = 1
    # 高通滤波器
    # mask = np.ones((rows, cols, 2), np.uint8)
    # mask[crow-30:crow+30, ccol-30:ccol+30] = 0
    # IDFT
    fshift = dft_shift * mask
    f_ishift = np.fft.ifftshift(fshift)
    img_back = cv2.idft(f_ishift)
    img_back = cv2.magnitude(img_back[:, :, 0], img_back[:, :, 1])

    plt.subplot(121), plt.imshow(img, cmap='gray')
    plt.title('Input Image'), plt.xticks([]), plt.yticks([])
    plt.subplot(122), plt.imshow(img_back, cmap='gray')
    plt.title('Result'), plt.xticks([]), plt.yticks([])

    plt.show()
```
低通结果：
也可以设计高通滤波器将低频部分去除，代码在上面也有，只需修改掩模即可，构建一个掩模，与低频区域对应的地方设置为 0, 与高频区域对应的地方设置为 1。下图为效果图，高通结果：
可以看到，高通滤波相当于保留了图像的边缘部分，因为边缘部分属于高频信息。
天道酬勤循序渐进技压群雄
查看全文

相关阅读:
MySQL优化
 SLAM01
图像处理04
Be accepted for inclusion in the IEEE INFOCOM 2018 technical program
CS229 Lecture 02
图像处理03
Codeforces 900D Unusual Sequences：记忆化搜索
 Codeforces 914C Travelling Salesman and Special Numbers：数位dp
BZOJ 4199 [Noi2015]品酒大会：后缀数组 + 并查集
 BZOJ 4650 [Noi2016]优秀的拆分：后缀数组

原文地址：https://www.cnblogs.com/wuyuan2011woaini/p/15659844.html