定义:感受野是指输出特征图中的1个像素点映射到原始输入图片区域的大小
所以两层3*3的卷积核和1层5*5的卷积核的特征提取能力是一样的,该如何选择?设输入特征宽高为x,步长为
考虑两个方面:
1)带训练参数量
两层3*3卷积核:9+9=18
一层5*5卷积核:25
2)计算量
两层3*3卷积核:第一层时 :(3*3)*(x-2)^2 # 后面部分表示卷积核滑动的次数
第二层时:(3*3)*(x-2-2)^2 # 此时当前层的输入特征已经是(x-2)了
总体 = 18x2-108x+180
1层5*5的卷积核:(5*5)*(x-4)^2
因此当x大于10时两层3*3卷积核的比1层5*5卷积核性能较好