zoukankan      html  css  js  c++  java
  • 论文阅读笔记Adversarial Learning with Mask Reconstruction for TextGuidedImage Inpainting

    ALMR对抗式学习框架

    一、contribution

    (1)我们提出了一个基于mask reconstruction(ALMR)的对抗式学习框架,用于文本引导的图像修复,该框架充分利用图像中的对象语义和文本描述。

    (2)我们设计了一个双重注意力模块(DAM),将单词级和句子级的文本特征注入图像恢复网络,使模型专注于文本描述中对象的特征词。

    (3)我们设计了一个掩码重建模块(MRM),用于惩罚在不污染背景的情况下恢复与文本描述相对应的损坏图像中感兴趣的对象。

    (4)我们扩展了CUB-200-2011,Oxford-102和CelebA HQ使用掩码标签,并在扩展数据集上进行定量和定性实验,表明ALMR的有效性。

    二、method

    双重注意模块(DAM)将文本语义注入生成器的两个阶段,掩码重建模块(MRM)从两个阶段生成的背景真相和图像中提取对象,以进行重建惩罚。

     

     

    三、evaluation metric

     在客观指标方面,FID和KID更倾向于关注与人类感知相对应的自然性。与此相反,PNSR和SSIM测量生成图像和真实图像之间的像素级差异,在文本引导图像修复的上下文中不考虑文本描述的影响。对于定性评估,我们采用Amazon Mechanical Turk(AMT)

  • 相关阅读:
    RAC环境下ORACLE序列缓存导致序列混乱
    zzu edu
    windows下的神器
    关于VO、PO的理解——JAVA的(PO,VO,TO,BO,DAO,POJO)解释
    enum学习
    maven 引入本地 jar
    eclipse F6和F8的问题
    记一个搜索网盘资源的网站
    多表查询, 聚集查询和分组查询
    winserver2008安装tomcat+mysql+httpd+redis环境
  • 原文地址:https://www.cnblogs.com/h694879357/p/15511667.html
Copyright © 2011-2022 走看看