zoukankan      html  css  js  c++  java
  • 文献阅读004【精读】

    2017 Data-driven vs. model-driven Fast face sketch synthesis

    相关文献:Heterogeneous image transformation
    相关知识:KNN, SFS, SVR, high-frequency information

    0.摘要

    画像合成的旧方法——data-driven。

    本论文提出画像合成的新方法——model-driven。

    1.介绍

    data-driven:如文献阅读001,002,都是基于该方法。

    算法:

    1.输入一张新图像 IP
    2.从训练集T中的图像P拟合出新图像IP,记学得模型为:I=M(TP)
    3.将训练集T中的画像S合成出伪画像IS,IS=M(TS)
    4.输出一张合成画像 IS
    
    

    一般,在第2步中,并不是把训练集中所有图像都利用起来,而是选取最合适的部分来拟合。有用KNN方法的,即从训练集中找出前K个与新图像最像的图像,这里的“像”,可以用几何距离来表示。

    特点:计算复杂度与训练集的规模线性相关。

    model-driven

    与data-driven不同,该方法不用遍历整个训练集的图像。

    为什么不用?model-driven是直接学的一个模型,将 photo—>sketch。如下图:

    2.Model-driven face sketch synthesis

    如图Fig.2,如何求 fi ?用 ridge regression,目标函数:

    [egin{align} &Theta_{(m×p)} 为系数(参数)矩阵,即我们要学习的模型,\ &X_{(d×n)} 为 photo patches,\ &Y_{(d×n)} 为 sketch patches,\ &lambda 为正则化参数(防止过拟合)。\ &p is the size of patch,d = p^2,\ &n is the number of photo-sketch patch pairs\ &what is m mean? and how dot([m×p]·[p^2×n])?\ &把训练集图像划分成C个culsters,每个cluster有n个patches,一个X为一个cluster end{align} ]

    sketch patch synthesis:

    其他正则化技术:Laplacian regularization and p -Laplacian regularization

    本论文用 python 的 scikit-learn package 来实现,λ取10^6。

    Heterogeneous image transformation 一文中,说明了如果直接用上式来合成sketch,会出现过于光滑模糊的现象,因为一些信息(hight-frequency information, detail information)会被过滤掉。

    Zhang等作者在 Face sketch-photo synthesis based on support vector regression一文中提出用SVR的方法,他们用与合成 initial estimation(初步模型)不同的方法对high-frequency information进行合成,再补偿initial estimation缺失的信息,如下图。

    其中,Heterogeneous image transformation 2012是在Face sketch-photo synthesis based on support vector regression 2011的基础上改进,同一个作者。

    而本论文采用相同的方法,即对initial estimation, high-frequency information合成的方法都一样

    什么是 hight-frequency information?

    在对图像分块的时候,之间会有部分重叠,但是使用KNN方法或者SFS方法加权后会丢失部分high-frequency information。

    如何获得hight-frequency information?

    给定一张手稿图,每个patch的high-frequency information等于每个像素点的灰度值减去该patch的平均值,差值大的就是high-frequency information。

    输入:x,photo每个像素点减去一定范围内的平均值。

    输出:y,sketch每个像素点减去一定范围内的平均值,该图片即high-frequency information。

    训练得到的模型:f(x)

    对于test photo,可以用训练得到的模型f(x)来得到其high-frequecncy information,最后将其fuse to a whole one image

    【参考】

    Heterogeneous image transformation

    这篇文章分为两步:

    1. 用SFS进行初步的特征提取(改进了KNN的缺陷:K值固定使得有些并不邻近的点也被“强行”算作邻近点,这会使图像特征模糊)。
    2. 用SVR求出photo到sketch提取high-frequency information的模型,如下图。

    Face sketch-photo synthesis based on support vector regression

    就是介绍SVR的方法,在Heterogeneous image transformation均有介绍。

    3.知识点收获

    SVR,high-frequency information,SFS

  • 相关阅读:
    洛谷 P2915 [USACO08NOV]奶牛混合起来Mixed Up Cows 题解
    洛谷 P2687 [USACO4.3]逢低吸纳Buy Low, Buy Lower/ACWing 314 低买 题解
    7、Python异常
    必须要调整心态,积极起来,不能再偷懒
    5、Python函数
    10、Python数据库支持
    8、Python方法、属性、迭代器
    9、Python模块和标准库
    6、Python抽象的类
    UDP Linux编程(客户端&服务器端)
  • 原文地址:https://www.cnblogs.com/zzzack/p/9778458.html
Copyright © 2011-2022 走看看