zoukankan      html  css  js  c++  java
  • OpenCV离散傅里叶变换

    离散傅里叶变换

    • 作用:得到图像中几何结构信息
    • 结论:傅里叶变换后的白色部分(即幅度较大的低频部分),表示的是图像中慢变化的特性,或者说是灰度变化缓慢的特性(低频部分)。
      傅里叶变换后的黑色部分(即幅度低的高频部分),表示图像中快变化的特性,或者说是灰度变化快的特性(高频部分)。

    dft()函数

    函数原型

    void dft(InputArray src, OutputArray dst, int flage=0, int nonzeroRow=0)
    
    • InputArray 类型的src。输入矩阵,可以为实数或者虚数。
    • OutputArray 类型的dst。函数调用后的运算结果存在这里,其尺寸取决于标识符,也就是第三个参数。
    • int 类型的falgs。转换的标识符,有默认值0,取值可以为表中的结合。

    标识符名称 | 意义
    -|
    DFT_INVERSE | 用一维或二维逆变换代替默认的正向变换。
    DFT_SCALE | 缩放比例标识符,输出的结果都会以1/N进行放缩,通常擦很难过会结合DFT_INVERSE一起使用。
    DFT_ROWS | 对输入矩阵的每行进行正向或反向的变换,此标识符可以在处理多种矢量的时候用于减小资源的开销,这些处理常常是三维或高位变换等复杂操作
    DFT_COMPLEX_OUTPUT | 进行一维或二维复数苏胡祖反变换。这样的结果通常是一个大小相同的复矩阵。如果输入的矩阵有复数的共轭对称性(比如是一个带有DEF_COMPLEX_OUTPUT标识符的正变换结果),便会输出实矩阵。

    • int 类型的nonzeroRows,有默认值0.当此参数设为非零时(最好是取值为想要处理的那一行的值,比如C。rows),函数会假设只有输入矩阵的第一个非零行包含非零元素(没有设置DFT_INVERSE标识符),或只有输出矩阵的一个非零行包含非零元素(设置了DFT_INVERSE标识符)。这样的话,函数就可对其他行进行更高效的处理,以节省时间开销。

    返回DFT最优尺寸大小:getOptimalDFTSize()函数

    函数原型

    int getOptimalDFTSize(int vecsize)
    
    • int 类型的vecsize,向量尺寸,即图片的rows、cols。

    扩充图像边界:copyMakeBorder()函数

    函数原型

    void copyMakeBorder(InputArray src, OutputArray dst, int top, int bottom, int left, int right, int borderType, const Scalar& value=Scalar())
    
    • InputArray 类型的src,输入图像,即源图像,填Mat类型的对象即可。
    • OutputArray 类型的dst,函数调用后的运算结果存在这里,即这个参数用于存放函数调用后的输出结果,需和源图片有一样的尺寸和类型,且size 应该为Size(src.cols+left+right , src.rows+top+bottom)。
    • 接下来的4个参数分别是为int 类型的top、bottom、left、right,分别表示在源图像的四个方向上填充多少像素。
    • 第七个参数,int 类型的 borderType,边界类型,常见取值为BORDER_CONSTANT,可参考borderInterpolate()得到更多细节。
    • 第八个参数,const Scalar& 类型的value,有默认值Scalar(),可以理解为默认值为0。当borderType取值为BORDER_CONSTANT时,这个参数表示边界值。

    计算二维矢量的幅值:magnitude()函数

    函数原型

    void magnitude(InputArray x, InputArray y, OutputArray magnitude)
    
    • InputArray 类型的x,表示矢量的浮点型X坐标值,也就是实部。
    • InputArray 类型的y,表示矢量的浮点型Y坐标值,也就是虚部。
    • OutputArray 类型的magnitude,输出的幅值,它和第一个参数x有着同样的尺寸和类型。

    计算自然对数:log()函数

    计算数组元素绝对值的自然对数
    函数原型

    void log(InputArray src, OutputArray dst)
    
    • 输入图像
    • 得到的对数值

    矩阵归一化:normalize()函数

    函数原型

    void normalize(InputArray src, OutputArray dst, double alpha=1, double beta=0, int norm_type=NORM_L2, int dtype=-1, InputArray mask=noArray())
    
    • InputArray 类型的src。输入图像,即源图像,填Mat类的对象即可。
    • OutputArray 类型的dst。函数调用后的运算结果。和源图片有一样的尺寸和类型。
    • double 类型的alpha。归一化后的最大值,默认值1。
    • double 类型的beta。归一化后的最小值,默认值0。
    • int类型的norm_type。归一化类型,有NORM_INF、NORM_L1、NORM_L2和NORM_MINMAX等参数可选,有默认值NORM_12。
    • int 类型的dtype,有默认值-1。当参数去负值时,输出矩阵和src有同样的类型,否则,它和src有同样的通道数,且此时图像深度为CV_MAT_DEPTH (dtype)。
    • InputArray 类型的mask,可选的操作掩膜,有默认值noArray()。

    综合示例

    #include<core.hpp>
    #include<imgproc.hpp>
    #include<highgui.hpp>
    #include<iostream>
    using namespace cv;
    using namespace std;
    
    
    int main()
    {
    	// 1.以灰度模式读取
    	Mat srcImage = imread("..//..//0.jpg",0);
    	if (!srcImage.data)
    	{
    		printf("读入错误");
    		return false;
    	}
    	imshow("原始图像", srcImage);
    
    	// 2.将输入图像延扩到最佳尺寸,边界用0补充
    	int m = getOptimalDFTSize(srcImage.rows);
    	int n = getOptimalDFTSize(srcImage.cols);
    	// 将添加的像素初始化为0。
    	Mat padded;
    	copyMakeBorder(srcImage, padded, 0, m - srcImage.rows, 0, n - srcImage.cols, BORDER_CONSTANT, Scalar::all(0));
    
    	// 3.为傅里叶变换的结果(实部和虚部)分配空间。
    	// 将planes数组组合合并成一个多通道的数组complexI
    	Mat planes[] = { Mat_<float>(padded), Mat::zeros(padded.size(),CV_32F) };
    	Mat complexI;
    	merge(planes, 2, complexI);
    
    	// 4.进行离散傅里叶变换
    	dft(complexI, complexI);
    
    	// 5.将复数转换为幅值,即 log(1+sqrt(Re(DFT(I))^2 + Im(DFT(I))^2)
    	split(complexI, planes);	//将多通道数组complexI分离成几个单通道数组,[0]=Re,[1]=Im
    	magnitude(planes[0], planes[1], planes[0]);	//planes[0] = magnitude
    	Mat magnitudeImage = planes[0];
    
    	// 6.进行对数尺度(logarithmic scale)缩放
    	magnitudeImage += Scalar::all(1);
    	log(magnitudeImage, magnitudeImage);	//求自然对数
    
    	// 7.剪切和重分布幅度图象限
    	//若有奇数行或奇数列,进行频谱裁剪
    	magnitudeImage = magnitudeImage(Rect(0, 0, magnitudeImage.cols & -2, magnitudeImage.rows & -2));
    
    	// 重新排列傅里叶图像中的象限,使得原点位于图像中心
    	int cx = magnitudeImage.cols / 2;
    	int cy = magnitudeImage.rows / 2;
    	Mat q0(magnitudeImage, Rect(0, 0, cx, cy));		//ROI区域的左上
    	Mat q1(magnitudeImage, Rect(cx, 0, cx, cy));	//ROI区域的右上
    	Mat q2(magnitudeImage, Rect(0, cy, cx, cy));	//ROI区域的左下
    	Mat q3(magnitudeImage, Rect(cx, cy, cx, cy));	//ROI区域的右下
    	//交换象限(左上与右下进行交换)
    	Mat tmp;
    	q0.copyTo(tmp);
    	q3.copyTo(q0);
    	tmp.copyTo(q3);
    	//交换象限(右上与左下进行交换)
    	q1.copyTo(tmp);
    	q2.copyTo(q1);
    	tmp.copyTo(q2);
    
    	// 8.归一化,用0到1之间的浮点值将矩阵变换为可视化的图像格式
    	normalize(magnitudeImage, magnitudeImage, 0, 1, NORM_MINMAX);
    
    	// 9.显示效果图
    	imshow("频谱幅值", magnitudeImage);
    	waitKey();
    
    return 0;
    }
    
    
  • 相关阅读:
    缺失的第一个正数
    tuple用法
    整数转罗马数字
    三种时间格式的转换
    不同包的调用
    正则表达式
    lgb模板
    线性回归
    时间序列的特征
    3D聚类
  • 原文地址:https://www.cnblogs.com/ishero/p/11136317.html
Copyright © 2011-2022 走看看