转自:http://www.gageet.com/2014/09182.php
本文部分参考了:http://www.zhihu.com/question/23437871
卷积层是对图像的一个邻域进行卷积得到图像的邻域特征,亚采样层就是使用pooling技术将小邻域内的特征点整合得到新的特征。
pooling的结果是使得特征减少,参数减少,但pooling的目的并不仅在于此。pooling目的是为了保持某种不变性(旋转、平移、伸缩等),常用的有mean-pooling,max-pooling和Stochastic-pooling三种。
mean-pooling,即对邻域内特征点只求平均;
max-pooling,即对邻域内特征点取最大;
Stochastic-pooling,介于两者之间,通过对像素点按照数值大小赋予概率,再按照概率进行亚采样;
根据相关理论,特征提取的误差主要来自两个方面:(1)邻域大小受限造成的估计值方差增大;(2)卷积层参数误差造成估计均值的偏移。一般来说,mean-pooling能减小第一种误差,更多的保留图像的背景信息,max-pooling能减小第二种误差,更多的保留纹理信息。在平均意义上,与mean-pooling近似,在局部意义上,则服从max-pooling的准则。
PS.
在读lecun的文章,会持续更新。
从lecun的文章分析以及实验对比结果可以看到,基本上max pooling的效果胜出average pooling一筹。大概是average pooling更多保留的是背景信息的原因。不知道有没有背景建模里用到CNN,会不会这个地方用average pooling更好些?