zoukankan      html  css  js  c++  java
  • 论文阅读笔记Adversarial Learning with Mask Reconstruction for TextGuidedImage Inpainting

    ALMR对抗式学习框架

    一、contribution

    (1)我们提出了一个基于mask reconstruction(ALMR)的对抗式学习框架,用于文本引导的图像修复,该框架充分利用图像中的对象语义和文本描述。

    (2)我们设计了一个双重注意力模块(DAM),将单词级和句子级的文本特征注入图像恢复网络,使模型专注于文本描述中对象的特征词。

    (3)我们设计了一个掩码重建模块(MRM),用于惩罚在不污染背景的情况下恢复与文本描述相对应的损坏图像中感兴趣的对象。

    (4)我们扩展了CUB-200-2011,Oxford-102和CelebA HQ使用掩码标签,并在扩展数据集上进行定量和定性实验,表明ALMR的有效性。

    二、method

    双重注意模块(DAM)将文本语义注入生成器的两个阶段,掩码重建模块(MRM)从两个阶段生成的背景真相和图像中提取对象,以进行重建惩罚。

     

     

    三、evaluation metric

     在客观指标方面,FID和KID更倾向于关注与人类感知相对应的自然性。与此相反,PNSR和SSIM测量生成图像和真实图像之间的像素级差异,在文本引导图像修复的上下文中不考虑文本描述的影响。对于定性评估,我们采用Amazon Mechanical Turk(AMT)

  • 相关阅读:
    排序算法研究
    SqlParameters参数
    winfrom项目
    方法参数中有out和in关键字是什么意思?
    在C#中使用存储过程
    11Book系列多表群操作
    7drf过滤排序分页异常处理
    12RBAC基于角色的访问控制
    5drf路由组件
    8drf自动生成接口文档
  • 原文地址:https://www.cnblogs.com/h694879357/p/15511667.html
Copyright © 2011-2022 走看看