神经网络和无参考图片质量评价:Deep CNN-Based Blind Image Quality Predictor

zoukankan html css js c++ java

神经网络和无参考图片质量评价:Deep CNN-Based Blind Image Quality Predictor

paper:Deep CNN-Based Blind Image Quality Predictor
authors:Jongyoo Kim etc...
date:2018
code

1.Introduction

CNN广泛应用于计算机视觉任务，将CNN用到IQA的一个问题是:IQA数据集较小，标注困难。作者提出第一阶段使用objective error map(失真图片和原始图片做差)作为代理训练目标，训练CNN网络,pixelwise相当于扩大了数据集；第二阶段再利用第一阶段的CNN模型fituning图片到质量分数的模型。
当图片严重失真时，失真图片缺少高频细节信息，error map就会有很多高频成分，很难从失真图片预测error map,作者提出了reliability map,认为模糊区域有低的reliability。

2.DIQA

A.Image Normalization

图片预处理，(I_r)和(I_d)表示参考图片和失真图片，normalized后的用(hat{I_r})和(hat{I_d})表示。

[hat{I}=I-I^{low} ]
(I^{low})经下面按下面处理获得:
(1)灰度化，高斯模糊　　
(2)Downscale　1/4　　
(3)Upscale到原来的尺度　　

B.Model Architecture

C.Reliability Map Prediction

训练预测error map的网络时，模型无法预测同质化区域(homogeneous regions)，为此提出了reliabilit function,作者假设模糊的区域有低的reliability。

[r=frac{2}{1+exp(-alpha|hat{I_d}|)}-1 ]
上面的定义可能影响最终预测分数，用平均reliability map替代

[hat{r}=frac{1}{frac{1}{H_rW_r}sum_{i,j}r(i,j)}r ]
D.Objective Error Map

在训练的第一阶段，用objective error map作为训练的代理目标。loss函数如下:

[L(hat{I_d}; heta_f, heta_g)=||g(f(hat{I_d; heta_f})-e_{gt}; heta_g)odothat{r}||_2^2 ]
其中(f)和(g)见上图定义，( heta)表示网络参数，(e_{gt})定义如下:

[e_{gt}=|hat{I_r}-hat{I_d}|^p ]
论文设定(p=0.2)。
如上图，第一阶段的网络输出变为原尺度的1/4,所以这里计算loss时也需要对(e_{gt})和(hat{r}) downscale为原尺度的1/4

E.Learning Subjective Opinion

第二阶段训练预测图片质量分数。如上图网络结构，卷积层提取的特征送入后面连接两个fc层。在这里添加了两个额外的手工设计特征:reliability map (r)的均值(mu_r)和低频失真图像(I_d^{low})的标准差(sigma_{I_d}^{low})。loss函数如下:

[L_2(I_d; heta_f, heta_h)=||h(v,mu_r,sigma_{I_d}^{low}; heta_h)-S||_2^2 ]
其中S是标准的主观评分,v是池化后的特征向量:

[v=GAP(f(hat{I_d}; heta_f)) ]
GAP是上面结构图里的global average pooling。

3.Experiments

A.ablation studies

1.Pretraining with objective error map

2.Reliability Map

3.Image Normalization

4.Handcrafted Features

5.Proxy Training Targets

B.performance

查看全文

相关阅读:
click事件——背景高亮
 color——RGB转16进制
 导航栏高亮设置
 layui table 渲染完成后，怎样拿到表个里的所有数据
 解决 AttributeError: 'dict' object has no attribute 'has_key' 错误的方法
 2019年总结：醒悟还为时不晚
 Worker Services读取配置后，发布Windows出现的问题及解决
 C# 读取配置（详细操作，让我们一起共同成长）
程序不包含适合于入口点的静态“Main”方法
 .NET Core3.0-Worker Services

原文地址：https://www.cnblogs.com/buyizhiyou/p/12566520.html

神经网络和无参考图片质量评价:Deep CNN-Based Blind Image Quality Predictor

1.Introduction

2.DIQA

A.Image Normalization

B.Model Architecture

C.Reliability Map Prediction

D.Objective Error Map

E.Learning Subjective Opinion

3.Experiments

A.ablation studies

1.Pretraining with objective error map

2.Reliability Map

3.Image Normalization

4.Handcrafted Features

5.Proxy Training Targets

B.performance