每张图像都是现实世界的反映,而现实世界都是三维的。为什么我们看到一张图片时会觉得有远近的概念?是由于我们有先验知识。我们知道物理世界是三维的,而我们看到的是二维的,在我们的脑海里会很自然地将物体的大小与距离远近进行联系在一起,从而在大脑里脑补它们在现实世界中的排列情况。虽然有些时候我们也会判断错误,因为有些图片单靠一张是容易出现错觉的。
比如下面一张图片:
我们人可以感知到,这是一条小径,小径周围是石头和假山,山上爬满爬山虎。而由一张图像如何恢复三维数据呢?在摄影中有一种概念叫景深,就算近处的物体比较清晰,远处的物体比较模糊。而且还有一个概念叫透视,在绘画领域人们都知道用透视法绘图。由这张实景拍摄的照片也可以看出,近处的路比较宽,远处的路比较窄。如何才能恢复这些不规则形状的石头呢?
单相片建模方法研究