最近在自己跑模型。总结了下一些比较杂的一些小计算问题。
评价指标
目标检测:
准确率与召回率。实际就是机器学习中查准率和查全率。 根据IOU计算准确率。不同IOU下计算求平均,即为平均准确率 mAP. 可通过FP曲线来看
速度:每秒识别出图像的帧数。FPS
评价数据集:COCO Cityscapes Pascal VOC等数据集
https://zhuanlan.zhihu.com/p/34179420
人脸检测:
人脸检测和目标检测评价指标差不多。再加一个误检率。
语义分割:
https://zhuanlan.zhihu.com/p/37618829
像素精度:每一类像素正确分类的个数/每一类像素的个数
均像素精度:所有类像素精度平均值
平均交并比:每一类IOU取平均值。其实和目标检测差不多,不过换成像素级别了
权频交并比: 平均交并比的带权重形式
看过少数几篇论文,感觉衡量指标主要还是平均交并比IOU,损失函数也主要按这个计算的
卷积及池化过程中坐标变换(感受野计算)
https://zhuanlan.zhihu.com/p/44106492
https://zhuanlan.zhihu.com/p/26663577
https://zhuanlan.zhihu.com/p/40267131
这四个公式很重要,基本涵盖了有关
1. 为卷积后特征图大小。nin为输入特征图大小,P为 padding数,K为卷积核大小,s为步长。例 17*17特征图经 3*3卷积,paading 1,步长2.则卷积后输出特征图大小为 9*9
2. 步长积
3. 此公式用来计算感受野大小。rin为输入上一层感受野,例如,第一层,经过k=3*3,s=2的两次卷积后,感受野大小 1+(3-1)*1=3 3+(3-1)*2=7.此处要注意Jin和Jout区别。 注意此时有空洞卷积的哈,后面还需*dialation
4. 此公式用来计算特征感受野中心坐标。
给一张其他人博客的例子:
此处还要引入一个坐标对齐的概念。 例如R-CNN中直接S/2取整,而空洞卷积坐标映射是采用双线性差值方式。简单介绍下空洞卷积概念
空洞卷积
https://zhuanlan.zhihu.com/p/50369448
https://zhuanlan.zhihu.com/p/50937830
优点:
1.下采样在扩大感受野的同时会降低图片分辨率。空洞卷积引入,可扩大感受野,同时很少损失分辨率。
2. 可引入更多的上下文信息,有利于增加识别率
缺点:
空洞卷积可能导致部分局部信息丢失。未解决此种方案引入了不同空洞率的卷积核,之后进行融合。参考Deeplab系列。
空洞卷积感受野计算方式和普通卷积一样,就是把空洞+卷积核看成一个大卷积
卷积网络复杂度计算
https://zhuanlan.zhihu.com/p/31575074
时间复杂度Time~O(M2*K2*Cl-1Cl) M为输出特征图大小,K为卷积核大小,C为通道数
Inception网络使用多个小卷积代替大卷积,感受野相同,且细节提取的更好。同时又大大减小了参数量。
例: 两个3*3 代替 一个5*5 参数量变化:before M25*5*K1*K2 after M23*3*K1*K2*2 即变为原来的18/25 多次之后参数减小量很可观
另外此处可分析下1*1 卷积。3*3 卷积前面增加 1*1卷积,之后计算量也可减小。。 引入小卷积作用可从降低复杂度方向来分析。
https://zhuanlan.zhihu.com/p/34204282
此链接为复杂度计算的深入分析,这里不再引入了。。这个复杂度计算还是很有用的。 之前我是做硬件的,复杂度计算是AI芯片面试很大可能性会问到的一个角度。。