zoukankan      html  css  js  c++  java
  • OpenCVPython系列之傅里叶变换

    傅里叶变换

    我们生活在时间的世界中,早上7:00起来吃早饭,8:00去挤地铁,9:00开始上班。。。以时间为参照就是时域分析。

    但是在频域中一切都是静止的!可能有些人无法理解,我建议大家看看这个文章,写的真是相当好,推荐!

    https://zhuanlan.zhihu.com/p/19763358

    傅里叶变换经常被用来分析不同滤波器的频率特性。我们可以使用 2D 离散傅里叶变换 (DFT) 分析图像的频域特性。实现 DFT 的一个快速算法被称为快速傅里叶变换(FFT)。

    对于一个正弦信号,如果它的幅度变化非常快,即f数值比较大,我们可以说他是高频信号,如果变化非常慢,即f数值比较小,我们称之为低频信号。你可以把这种想法应用到图像中,那么我们如何看待图像的变化幅度大小呢?那就是看边界点和噪声,一般边界和噪声是图像中的高频分量(注意这里的高频是指变化非常快,而非出现的次数多)。如果没有如此大的幅度变化我们称之为低频分量。

    那么用傅里叶变换进行滤波的优点在哪儿呢,它可以把图像由时域转换成频域,由于频域中的信息更为简单,所以滤波起来更为方便,滤波之后再转换到时域,那么就相当于一个滤波了。

    傅里叶变换的作用

    · 高频:变化剧烈的灰度分量,例如边界

    · 低频:变化缓慢的灰度分量,例如一片大海

    所以一般情况下,由于图像中的高频分量与低频分量都存在,我们可以用傅里叶变换进行滤波。

    滤波

    · 低通滤波器:只保留低频,会使得图像模糊

    · 高通滤波器:只保留高频,会使得图像细节增强

    我们来看傅里叶变换的函数原型:

    dst=cv2.dft(src, dst=None, flags=None, nonzeroRows=None)

    第一个参数src为输入图像

    dst是输出图像,包括输出图像的大小和尺寸

    flags有五种,为转换标志:

    1、DFT _INVERSE:执行的是反向的一维或者二维的转换。

    2、DFT _SCALE:矩阵的元素数量除以它,产生缩放效果。

    3、DFT _COMPLEX_OUTPUT:执行正向转换。

    4、DFT _REAL_OUTPUT:执行一维或二维复数阵列的逆变换,结果通常是相同大小的复数数组,但如果输入数组具有共轭复数对称性,则输出为真实数组。

    5、DFT _ROWS:执行正向或者反向变换输入矩阵的每个单独的行,该标志可以同时转换多个矢量,并可用于减少开销以执行3D和更高维度的转换等。

    nonzeroRows:表示当参数不为零时,函数假定只有nonzeroRows输入数组的第一行(未设置)或者只有输出数组的第一个(设置)包含非零,因此函数可以处理其余的行更有效率,并节省一些时间;这种技术对计算阵列互相关或使用DFT卷积非常有用。

    继续来分析傅里叶逆变换函数:

    dst = cv2.idft(src[, dst[, flags[, nonzeroRows]]])

    src: 表示输入图像,包括实数或复数。

    dst: 表示输出图像。

    flags: 表示转换标记。

    nonzeroRows: 表示要处理的dst行数,其余行的内容未定义。

    得到的结果中频率为零的部分会在左上角,通常要转换到中心位置,可以通过np.fft.fftshift()和np.fft.ifftshift()变换来实现,前者是傅里叶变换,后者是傅里叶逆变换。

    cv2.dft()返回的结果是双通道(实部、虚部),通常需要转换成图像格式才能展示(0,255),让我们看一下代码:


    def dft():
        img = cv2.imread('min.jpg', 0)  # 将图像转换成灰度图
        dft = cv2.dft(np.float32(img), flags=cv2.DFT_COMPLEX_OUTPUT)  # 进行傅里叶变换
        dft_shift = np.fft.fftshift(dft)  # 将频率为零的部分转移到中心位置
    
        magnitude_spectrum = 20 * np.log(cv2.magnitude(dft_shift[:, :, 0], dft_shift[:, :, 1]))  # 公式
    
        plt.subplot(121), plt.imshow(img, cmap='gray')
        plt.title('Input Image'), plt.xticks([]), plt.yticks([])
        plt.subplot(122), plt.imshow(magnitude_spectrum, cmap='gray')
        plt.title('Magnitude Spectrum'), plt.xticks([]), plt.yticks([])
        plt.show()

    image.png

    可以看到,中心部分比较亮,越靠近中间位置低频信息越多,而高频信息则都在边界部分。

    接下来要想对其进行滤波,应该怎么办呢?

    显而易见,既然我们要去除低频分量,那就定一个范围,比如30*30的正方形范围,以图像中心为正方形中心点,将这个范围以内的高亮度的像素点去掉,就完成了滤波,然后我们再使用傅里叶逆变换将图像还原就可以看到。

    代码:

    def filter():
        img = cv2.imread('min.jpg', 0)
        img_float32 = np.float32(img)
        dft = cv2.dft(img_float32, flags=cv2.DFT_COMPLEX_OUTPUT)
        dft_shift = np.fft.fftshift(dft)
        rows, cols = img.shape
        crow, ccol = int(rows / 2), int(cols / 2)  # 中心位置
        # 低通滤波
        mask = np.zeros((rows, cols, 2), np.uint8)
        mask[crow - 30:crow + 30, ccol - 30:ccol + 30] = 1
        # 高通滤波器
        # mask = np.ones((rows, cols, 2), np.uint8)
        # mask[crow-30:crow+30, ccol-30:ccol+30] = 0
        # IDFT
        fshift = dft_shift * mask
        f_ishift = np.fft.ifftshift(fshift)
        img_back = cv2.idft(f_ishift)
        img_back = cv2.magnitude(img_back[:, :, 0], img_back[:, :, 1])
    
        plt.subplot(121), plt.imshow(img, cmap='gray')
        plt.title('Input Image'), plt.xticks([]), plt.yticks([])
        plt.subplot(122), plt.imshow(img_back, cmap='gray')
        plt.title('Result'), plt.xticks([]), plt.yticks([])
    
        plt.show()

    低通结果:

    image.png

    也可以设计高通滤波器将低频部分去除,代码在上面也有,只需修改掩模即可,构建一个掩模,与低频区域对应的地方设置为 0, 与高频区域对应的地方设置为 1。下图为效果图,高通结果:

    image.png

    可以看到,高通滤波相当于保留了图像的边缘部分,因为边缘部分属于高频信息。

  • 相关阅读:
    Unity4.5版本DLL库名字问题
    Unity路径规划
    Unity 父物体与子物体位置
    Moving in Unity
    C# Xml文件操作,解释见注释
    发个招聘信息
    Unity 视频播放杂谈
    unity中Debug输出控制
    编写可读代码艺术之表面层析
    匈牙利命名法,骆驼命名法(camel),帕斯卡(Pascal)命名法(转)
  • 原文地址:https://www.cnblogs.com/wuyuan2011woaini/p/15659844.html
Copyright © 2011-2022 走看看