1 投影空间
欧氏空间,主要描述角度和形状,针对的是理想几何物体。例如,两条 ∥ 线永不相交,或交于无穷远点 (虚拟的点)。中学时代的 “平面与立体几何”,便属于欧式空间。
投影空间,指实际的物体,被相机拍摄后,成像所在的空间,常用于计算机视觉中。在投影空间里,两条直线必然会相交于一点,只不过当这两条线平行时,交点为无穷远。
如图所示,现实中的两条铁轨,成像在投影空间时,相交于某一点,也即无穷远点;但在欧氏空间中,无穷远点是理想点,并没有实际意义。
这样,就需要一种新的表示方法 -- 齐次坐标,将欧氏空间的无穷远点,与投影空间中有实际意义的点,建立起映射关系。
2 齐次坐标
在平面几何里,采用笛卡尔坐标,则一个点可表示为 $(x, y)^{T}$。如果增加一个坐标值,表示为 $(x, y, 1)^{T}$,且约定 ($x, y, 1)^{T}$ 和 $(kx, ky, k)^{T}$ 表示的是同一个点 (其中 k ≠ 0),
则这种用一个 N+1 维的向量,来表示 N 维向量的方法,称为齐次坐标法。
这样,由齐次坐标 $(x, y, w)$,可推导出笛卡尔坐标 $ (dfrac{x}{w}, dfrac{y}{w})$
2.1 无穷远点
欧式空间中,两条平行线方程组,如下:
$egin{cases} AX + BY + C = 0 \ AX + BY + D = 0 end{cases} $ ,其中 C ≠ D
齐次坐标点$(x, y, w)^{T}$ 与 欧氏空间点 $(X, Y)^{T}$ 的对应关系为: $ X = dfrac{x}{w}, Y = dfrac{y}{w}$,代入上面方程组得:
$egin{cases} Adfrac{x}{w} + Bdfrac{y}{w} + C = 0 \ Adfrac{x}{w} + Bdfrac{y}{w} + D = 0 end{cases} $ => $egin{cases} Ax+ By + Cw = 0 \ Ax+ By + Dw = 0 end{cases} $ => $w = 0$
既然 w = 0,则齐次坐标为 $(x, y, 0)^{T}$,对应笛卡尔坐标 $(dfrac{x}{0}, dfrac{y}{0})^{T}$,表示的是无穷远点 $(∞, ∞)^{T}$
2.2 合并加法
点 $(x, y, z)^{T}$,经过伸缩和平移后,成为点 $ (x', y', z')^{T} = (r_{1}x+t_{1}, r_{2}y+t_{2}, r_{3}z+t_{3})^{T}$,该变换过程可用如下公式表示:
$egin{bmatrix} x' \ y' \ z' end{bmatrix} = egin{bmatrix} r_{1} \ r_{2} \ r_{3} end{bmatrix} egin{bmatrix} x \ y \ z end{bmatrix} + egin{bmatrix} t_{1} \ t_{2} \ t_{3} end{bmatrix} $
如果使用齐次坐标,则可将平移变换,转化为矩阵乘法,消除了上式中的矩阵加法
$egin{bmatrix} x' \ y' \ z' \1 end{bmatrix} = egin{bmatrix} r_{1} & 0 & 0 & t_{1} \ 0 & r_{2} & 0 & t_{2} \ 0 & 0 & r_{3} & t_{3} \ 0 & 0 & 0 & 1 end{bmatrix} egin{bmatrix} x \ y \ z \ 1end{bmatrix} $
2.3 向量和点
齐次坐标还可以区分向量和点,具体如何区分的,尚待研究 ... ...
3 刚体变换
3.1 刚体定义
欧氏空间中,当物体被视为刚体时,不管是该物体的位置或朝向发生变化,还是更换观察的坐标系,其大小和形状都保持不变。
形象点说,猪八戒的九齿钉耙,由冰铁铸造而成,便是一种刚体;而镇元子大仙的七星鞭,由于是龙皮做的,故为非刚体。
3.2 位置和朝向
所谓刚体变换,就是一个可被看做刚体的物体,从一个状态 (位置和朝向),转换为另一个状态的过程。
如上所示,从世界坐标系到相机坐标系的转换,朝向由旋转矩阵 $R$ 表示,位置则由平移矩阵 $T$ 来表示: $ P_{c} = R cdot P_{w} + T$
其中,旋转矩阵 $ R = egin{bmatrix} r_{11} & r_{12} & r_{13} \ r_{21} & r_{22} & r_{23} \ r_{31} & r_{32} & r_{33} end{bmatrix} $,平移矩阵 $ T = egin{bmatrix} t_{1} \ t_{2} \ t_{3} end{bmatrix} $
旋转矩阵 R 为正交矩阵 (也即,RR' = E,E 为单位矩阵),则满足以下 6 个约束条件
(1) 大小约束 $egin{cases} r_{11}^2 + r_{12}^2 + r_{13}^2 = 1 \ r_{21}^2 + r_{22}^2 + r_{23}^2 = 1 \ r_{31}^2 + r_{32}^2 + r_{33}^2 = 1end{cases} $ (2) 方向约束 $egin{cases} r_{11}*r_{21} + r_{12}*r_{22} + r_{13}*r_{23} = 0 \ r_{21}*r_{31} + r_{22}*r_{32} + r_{23}*r_{33} = 0 \ r_{31}*r_{11} + r_{32}*r_{12} + r_{33}*r_{13} = 0end{cases} $
可用一个最简单的正交矩阵 E,来理解上面的约束条件
$egin{bmatrix} 1 & 0 & 0 \ 0 & 1 & 0 \ 0 & 0 & 1 end{bmatrix}$
3.3 转换关系
若已知 $R$ 和 $T$,则可将世界坐标系内的空间点,与相机坐标系内的空间点,建立起一一对应的关系
$ egin{bmatrix} X_{c} \ Y_{c} \ Z_{c} end{bmatrix} = egin{bmatrix} R & T end{bmatrix} egin{bmatrix} X_{w} \ Y_{w} \ Z_{w} end{bmatrix}$
3.3.1 约束分析
$R$ 和 $T$ 共有 12 个未知量,减去正交约束的 6 个方程,则还剩 6 个未知量。
表面上看,似乎只需 2 组共轭点,就可得到 6 个约束方程,对应求出剩余的 6 个未知量。实际上,这 6 个方程是有冗余信息的 (两组共轭点,在各自的坐标系下,两点之间的距离相等)
因此,第 2 组共轭点,只是提供了 2 个约束方程,加上第 1 组共轭点的 3 个约束,共有 5 个独立的约束方程。
显然,还需要第 3 组共轭点,提供 1 个独立的方程,才能求得 $R$ 和 $T$
3.3.2 几何解释
如下图所示,考虑两个刚体,它们之间存在着相互 旋转 和 平移
首先,在每个刚体上,各选一个点 L1 和 R1,移动其中一个刚体,使得这两个点重合。此时,一个刚体可相对于另一个刚体转动 (以三种不同的方式)。
然后,在每个刚体上,再分别取一个点 L2 和 R2,并且 | L2 - L1 | = | R2 - R1 |,移动一个刚体,使得这两对点,分别重合。此时,一个刚体可以相对另一个转动 (以一种方式)。
最后,在每个刚体上,分别取第三个点 L3 和 R3,满足 | L3 - L1 | = | R3 - R1 | 且 | L3 - L2 | = | R3 - R2 |,然后将这三个点对齐。此时,两个刚体便牢牢的连在了一起。
参考资料
<视觉测量> 张广军,第2章
<Robot Vision> Chapter 13
<An Invitation to 3D Vision> Chapter 2