原文:http://blog.csdn.net/shanchuan2012/article/details/74010561
作者:贪玩的大川
1.本文目的
结合实例和一些演示来理解霍夫变换中的精髓:空间转换。
我想我把我对空间转换的理解写完了,这篇文章也就结束了,所以文章的内容不会那么完整,不会完整的讲霍夫变换(比如一般形状的检测,说实话我是初学也不会),也不会讲在opencv中的实现(我只能抄代码,自己也写不出来)。
为什么要写这篇文章?我是自学+初学图像处理,没有人可以问,只能上网搜索,网上的教程总有地方我看不明白,有时候我会怀疑是不是自己理解力不行?其实更多时候我觉得不是,问题其实在于两点,一是教程讲的不好,不能引领新手逐步深入,二是没有找到合适的教程,不同阶段看的东西是不一样的。所以我把自己的理解写出来,希望可以帮助跟我有同样困惑的人,也希望自己不要误导了别人,让人产生更多的困惑。
2.简介
这篇文章不是教程,不讲基本概念,要了解霍夫变换可以先参考以下文章:
【OpenCV入门教程之十四】OpenCV霍夫变换:霍夫线变换,霍夫圆变换合辑-毛星云
以一般化视角串联霍夫变换(hough transform),从直线到圆再到广义霍夫变换
看了以上资料我有很多地方是想不明白的,特别是看到检测圆的时候,更别说一般形状了。
刚看到霍夫变换的时候感觉挺神奇的,它来源于图像处理中的几何形状检测问题,用什么办法能够检测直线、圆或者别的形状呢?最简单的是直线,如果让我来解决,要用什么办法才能把直线检测出来呢?一时也想不到什么办法(最小二乘可以做拟合,但是一张图上有多条直线怎么办?)。看到霍夫变换的时候想到了傅里叶变换,在这个空间不好解决的问题或者不明显的特征,给他来个变换,在另外一个空间上看问题,说不定就清楚了。
3.霍夫变换检测直线
3.1笛卡尔坐标下的例子
假如我们有如下几个点:
它们完全在一条直线上,可以先告诉你们直线的方程是:
直线的一般表示是:
以点
由此得到:
所以在
可以看到它们相交于一个点了,这个点是
但是实际上用极坐标,为什么要用极坐标而不用笛卡尔坐标?上面给了回答,这里不解释。
3.2极坐标下的例子
如何用一个角度和一段距离来表示过一个点的直线呢?方法是从原点作该直线的垂线,原点到该直线的距离用
还是在笛卡尔坐标下,
还是一样的思想,对于图像空间上的一个点,过这个点的直线有无数条,所以
将图像空间上所有对应的点在参数空间上的直线都画出来就是这样:
它们也相交于一点,把交点找到(我这里没有计算交点,就当它是
整理后就是:
4.霍夫变换检测圆
都说检测圆和检测直线大体上是类似的,确实,从空间转换的角度来说是一样的,椭圆、任意形状的检测都是一样的,只要找到合适的转换方法。
圆的一般方程是这样的:
图上面有一系列的点,它们是在同一个圆上,这里已经把圆的轮廓给出来了,这里只画了圆的一半,但已经足够说明问题了。要检测这个图像中的圆应该怎么办?还是用同样的思考方式,来个空间转换。将上面圆的方程重新写一下:
这时有三个参数,圆心
过一点的圆有多少个?无数个。以上图的第1个点
这里
它代表了什么意思呢?它代表了一个经过点
上面的图是图像空间中一个点对应在参数空间的曲线,将所有点对应在参数空间的曲线都画出来就是这样的(同样为了看的清楚,只取了3个半径,分别为1,3,5):
其实我们的目的就是在参数空间找聚集点,思想和检测直线是一样的,找参数空间中曲线交点最多的位置,可以看到在
我想这时候对霍夫变换检测直线和圆的原理应该说清楚了,从直线到圆,参数从2个变成了3个,对应的参数空间从2维变成了3维。如果是别的形状,那么它的参数可能更多,对应的参数空间维数就越多,这时就很难画图了。不过通过上面的理解,相信我们已经不需要再借助图像来理解更高维的变换了,这时我们应该可以进行归纳了,不管多高维,我们都是去找在参数空间中曲线相交最多的位置。
5.数据不是那么完美的情况
上面给出来的直线和圆都完全在同一条直线和同一个圆上,但实际上可能没有那精确像下面这样:
那么参数空间中对应的相交点也不是完全在一个点上
圆的情况也是类似的,就不再给出。所以一般的做法是将参数空间分成很多个小格子,落在同一个格子里面的就算同一个交点。
6.小结
我对霍夫变换的理解依然很肤浅,觉得奇妙的地方就是空间转换。
这里再来看以一般化视角串联霍夫变换(hough transform),从直线到圆再到广义霍夫变换对作者简练的总结更能体会吧。
当然在实际的算法实现中,远比上面的图示来的复杂,不然后效率是个问题。
7.作图代码
这里附上作图用的matlab代码:
% 霍夫变换理解 圆 2维
close('all');
% 给出一个圆,圆心(1,1),半径3
r = 3;
x = -2 : 0.5 : 4; % x定义域
y = sqrt(r.^2 - (x-1).^2) + 1 + 0*(rand(1,length(x)) - 0.5); % 半个圆
% 图像空间上的圆
figure;
plot(x,y,'*'); % 实际点
hold on;
x0 = -2 : 0.01 : 4;
y0 = sqrt(r.^2 - (x0-1).^2) + 1;
plot(x0,y0); % 圆曲线
hold off;
axis equal; % 各个轴比例相同
xlabel('x');
ylabel('y');
% 参数空间
figure;
% set(gcf,'position',[100,100,500,500]);
theta = 0 : 0.01 : 2*pi;
for ir = 1 : 5
for i = 1 : 1%length(x)
a = x(i) - ir*cos(theta); % 极坐标
b = y(i) - ir*sin(theta);
plot(a,b); % 画圆
hold on;
plot(x(i),y(i), '*'); % 画圆心
end
end
hold off;
grid on;
set(gca, 'xtick', -6:1:8);
axis equal;
xlabel('a');
ylabel('b');
print(gcf, '-djpeg', 'c2_2.jpg', '-r72');
% 霍夫变换(Hough Transform)
% 直线
clc;clear;close('all');
% 测试点
x = [0,1,2,3,4];
y = x + 4 + 1*(rand(1,length(x))-0.5);
plot(x,y,'*');
hold on;
y1 = x + 4;
plot(x,y1);
xlabel('x');
ylabel('y');
print(gcf, '-djpeg', 'line1.jpg', '-r72');
% 笛卡尔坐标
figure;
legd = {};
k = 0:3;
for i = 1 : length(x)
b = -x(i)*k + y(i);
plot(k,b)
hold on;
legd = [legd, num2str(i)];
end
hold off;
% legend(legd);
grid on;
xlabel('k');
ylabel('b');
print(gcf, '-djpeg', 'line2.jpg', '-r72');
% 极坐标
figure;
theta = 0/180*pi : 0.1 : 180/180*pi;
for i = 1 : length(x)
ruo = x(i)*cos(theta) + y(i)*sin(theta);
plot(theta, ruo);
hold on;
end
hold off;
grid on;
xlabel(' heta');
ylabel('
ho');
print(gcf, '-djpeg', 'line3.jpg', '-r72');
% 霍夫变换理解 圆 3维
close('all');
% 给出一个圆,圆心(1,1),半径3
r = 3;
x = -2 : 0.5 : 4; % x定义域
y = sqrt(r.^2 - (x-1).^2) + 1 + 0*(rand(1,length(x)) - 0.5); % 半个圆
% 图像空间上的圆
figure;
plot(x,y,'*'); % 实际点
hold on;
x0 = -2 : 0.01 : 4;
y0 = sqrt(r.^2 - (x0-1).^2) + 1;
plot(x0,y0); % 圆曲线
hold off;
axis equal; % 各个轴比例相同
xlabel('x');
ylabel('y');
print(gcf, '-djpeg', 'c1.jpg', '-r72');
% 参数空间
% 3维图画的很慢,可能有地方弄错了
figure;
% set(gcf,'position',[100,100,500,500]);
theta = 0 : 0.01 : 2*pi;
for ir = 1 : 2 : 5
for i = 1 : 1%length(x)
a = x(i) - ir*cos(theta); % 极坐标
b = y(i) - ir*sin(theta);
r = ir*ones(1,length(a));
plot3(r,a,b,'b'); % 画圆
hold on;
plot3(r,x(i),y(i), 'r*'); % 画圆心
end
end
hold off;
grid on;
set(gca, 'xtick', -6:1:8);
% axis equal;
xlabel('r');
ylabel('a');
zlabel('b');
print(gcf, '-djpeg', 'c2.jpg', '-r72');