paper:Deep CNN-Based Blind Image Quality Predictor
authors:Jongyoo Kim etc...
date:2018
code
1.Introduction
CNN广泛应用于计算机视觉任务,将CNN用到IQA的一个问题是:IQA数据集较小,标注困难。作者提出第一阶段使用objective error map(失真图片和原始图片做差)作为代理训练目标,训练CNN网络,pixelwise相当于扩大了数据集;第二阶段再利用第一阶段的CNN模型fituning图片到质量分数的模型。
当图片严重失真时,失真图片缺少高频细节信息,error map就会有很多高频成分,很难从失真图片预测error map,作者提出了reliability map,认为模糊区域有低的reliability。
2.DIQA
A.Image Normalization
图片预处理,(I_r)和(I_d)表示参考图片和失真图片,normalized后的用(hat{I_r})和(hat{I_d})表示。
(I^{low})经下面按下面处理获得:
(1)灰度化,高斯模糊
(2)Downscale 1/4
(3)Upscale到原来的尺度
B.Model Architecture
C.Reliability Map Prediction
训练预测error map的网络时,模型无法预测同质化区域(homogeneous regions),为此提出了reliabilit function,作者假设模糊的区域有低的reliability。
上面的定义可能影响最终预测分数,用平均reliability map替代
D.Objective Error Map
在训练的第一阶段,用objective error map作为训练的代理目标。loss函数如下:
其中(f)和(g)见上图定义,( heta)表示网络参数,(e_{gt})定义如下:
论文设定(p=0.2)。
如上图,第一阶段的网络输出变为原尺度的1/4,所以这里计算loss时也需要对(e_{gt})和(hat{r}) downscale为原尺度的1/4
E.Learning Subjective Opinion
第二阶段训练预测图片质量分数。如上图网络结构,卷积层提取的特征送入后面连接两个fc层。在这里添加了两个额外的手工设计特征:reliability map (r)的均值(mu_r)和低频失真图像(I_d^{low})的标准差(sigma_{I_d}^{low})。loss函数如下:
其中S是标准的主观评分,v是池化后的特征向量:
GAP是上面结构图里的global average pooling。