池化操作的一个重要目的就是队卷积后得到的特征进行进一步处理(主要是降维),池化层可以起到对数据进一步浓缩的效果,从而缓解计算时内存的压力,池化会选取一定大小区域,将该区域内的像素值使用一个代表元素表示。如果使用平均值代替,则称为平均值池化,如果使用最大值代替,则称为最大值池化。在pytorch中提供了多种池化的类,分别是最大值池化、最大值池化的逆过程、平均值池化、自适应池化(AdaptiveMaxPool、AdaptiveAvgPool)等。并提供了一维、二维、三维的池化操作。
下面以torch.nn.MaxPool2d()为例介绍相关参数
torch.nn.MaxPool2d(kernel_size , stride=None , padding=0 , dilation=1 , return_indices=False , ceil_mode=False)
kernel_size :(整数或者数组)最大值池化窗口的大小
stride:(整数或者数组,正数)最大值池化窗口移动的步长,默认是kernel_size
padding:(整数或者数组,正数)输入的每一条边补充0的层数
dilation:(整数或者数组,正数)一个控制窗口中元素步幅的参数
return_indices:如果为True,则会返回输出最大值的索引,这样会更加便于之后的操作torch.nn.MaxPool2d
ceil_mode:如果等于True,计算输出信号的时候会使用向上取整,默认是向下取整
更多池化相关知识点击这里(非书本上介绍的)