卷积神经网络CNN
作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/
卷积神经网络(Convolutional Neural Network,CNN 或ConvNet)是一种具有局部连接、权重共享等特性的深层前馈神经网络。卷积神经网络最早主要是用来处理图像信息。在用全连接前馈网络来处理图像时,会存在以下两个问题:(1)参数太多,(2)局部不变性特征。
卷积神经网络是受生物学上感受野机制的启发而提出的。感受野(Receptive Field)机制主要是指听觉、视觉等神经系统中一些神经元的特性,即神经元只接受其所支配的刺激区域内的信号。在视觉神经系统中,视觉皮层中的神经细胞的输出依赖于视网膜上的光感受器。视网膜上的光感受器受刺激兴奋时,将神经冲动信号传到视觉皮层,但不是所有视觉皮层中的神经元都会接受这些信号。一个神经元的感受野是指视网膜上的特定区域,只有这个区域内的刺激才能够激活该神经元。
目前的卷积神经网络一般是由卷积层、汇聚层和全连接层交叉堆叠而成的前馈神经网络。卷积神经网络有三个结构上的特性:局部连接、权重共享以及汇聚。这些特性使得卷积神经网络具有一定程度上的平移、缩放和旋转不变性。和前馈神经网络相比,卷积神经网络的参数更少。
本博文主要考古了卷积神经网络,重点考古了卷积与互相关的区别与联系,池化操作,以及几种典型的卷积神经网络:LeNet-5(详细介绍每层参数由来),AlexNet与VGG。
1. 全连接前馈神经网络存在的问题以及卷积神经网络的引入
2. 卷积、互相关与池化
3. LeNet-5
4. AlexNet
5. VGG
6. 参考文献
[1] 邱锡鹏,神经网络与深度学习,机械工业出版社,https://nndl.github.io/, 2020.
[2] https://courses.cs.duke.edu//spring21/compsci527/notes/n_01_convolution.pdf
[3] https://www.ocean.washington.edu/courses/ess522/lectures/08_xcorr.pdf
[4] https://deeplearning.cs.cmu.edu/S20/document/slides/lec9.CNN.pdf
[5] Zhang, Aston and Lipton, Zachary C. and Li, Mu and Smola, Alexander J., Dive into Deep Learning, arXiv preprint arXiv:2106.11342, 2021.