第五讲_图像识别之图像检测Image Detection
-
目录
-
物体检测
-
ILSVRC竞赛200类(每个图片多个标签):输出类别+Bounding Box(x,y,w,h)
-
PASCAL VOC 2012只有20类
-
模型进化
区域卷积神经网络R-CNN-2014
- 模型结构
- selective search+CNN特征+svm+Bounding box regression
- Regiom proposals
- 训练流程
- 测试阶段
- RCNN性能大幅提升
SPPNet网络-2014
- R-CNN速度慢的重要原因:卷积特征重复计算量太大
- spp技术实现了共享计算,适应不同输入尺寸
- SPP层具体实现
- sppNet问题
Fast-R-CNN-2015
- 改进;更高mAP(类似AUC曲线下的面积)
- 网络结构
- 训练阶段
Faster-R-CNN-2015
- 概况,引导CNN关注区域
- Region Proposal Network
- 训练过程
区域全卷积神经网络R-FCN
- 回顾
- F-RCN的设计过程
- 分类问题对尺寸,方向等变换不敏感,网络越深,分类效果很好;但是检测对变换敏感
- 结构图:三部分
- 理解K2(C+1)个通道,映射到每类K2个score map
人脸检测/行人检测
- 主流数据库
- WIDER FACE
- IJB-A
- Caltech