一、问题说明
最近在训练mask rcnn时发现输入的mask格式不对,后面发现通过labelme
标注并转换得到的Mask
是单通道彩色图,Mask
图像的像素值代表了像素点所属的类别标签。对于单个类别的数据集来说, Mask
像素值应该是[0,1], 其中0表示背景区域;对于多个类别的数据集, Mask
像素值应该是[0,1,2,…],显示为彩色以区分不同目标。如下图所示,虽然看上去是彩色图像,但是打开属性看其位深却是8。
二、解决办法
最开始采用OpenCV
读取,但里面自动转换成了3通道图(24位),类似于这篇博客在深度学习中遇到的opencv坑,后面采用Pillow
库,查看其官网说明,支持8位的调色板格式图片,如下图所示。
通过PIL读取后再依次处理即可正常训练
参考链接
numpy转PIL.Image: 处理Mask图像为单通道的彩色/灰度图colormap.png
在深度学习中遇到的opencv坑