作业内容:
1:文字回答:辨析TP、FN、FP、TN分别对应的含义(参考第一课时PPT14页中的图)
TP: 真实为1,预测为1
FP:真实为0,预测为0
FN:真实为1,预测为0
TN:真实为0,预测为0
2:代码实现:根据需要自行搜索第一课时所提及损失函数的代码定义
交叉熵
加权交叉熵
Focal loss
Dice系数
Jaccard系数
Tversky系数
Lovasz-Softmax loss
3:文字回答:为什么分类器不能只用准确率这一个指标进行评判
不看精确率,召回率无法得到模型的全部性能
4:文字回答:简述实时语义分割模型的加速方法
1)通过裁剪或resize来限定输入的图片大小,以降低计算复杂度。尽管这种方法简单有效,但空间细节的损失,尤其是边界部分,会导致算法精度下降
2)通过减少网络通道数量加快处理速度,尤其是在骨干模型的早期阶段,但会弱化空间信息
3)为追求极其紧凑的框架而丢掉模型最后阶段(比如ENet),该方法的缺点也很明显,由于ENet抛弃了最后阶段的下采样,模型的感受野不足以涵盖大物体,导致判别能力较差。
4)为弥补空间细节的丢失,很多人采用U型结构,但U型结构在高分辨率特征图上引入额外的计算,会降低模型速度;丢失掉的空间信息无法通过引入浅层修复,因此性价比不高。
5:代码实现:用BiSeNet实现对CityScapes数据集的分割