zoukankan      html  css  js  c++  java
  • Variational Image Compression With a Scale Hyperprior(ICLR 2018)

    对变分推理做了点拓展(待精读)

    (hat{y})间存在明显的空间相关性(spatial dependencies)。它们的尺度在空间上是耦合的。对一组目标变量之间的依赖关系进行建模的标准方法是引入假定目标变量独立的潜在变量,因此本文引入了一组额外的随机变量( ilde{z})来捕捉空间相关性

    将每个元素( ilde{y}_i)建模为均值为0,标准差为(sigma_i)的高斯分布。其中标准偏差通过用参数转换(h_s)( ilde{z})进行预测

    [egin{aligned} p_{ ilde{oldsymbol{y}} mid ilde{oldsymbol{z}}}left( ilde{oldsymbol{y}} mid ilde{oldsymbol{z}}, oldsymbol{ heta}_{h} ight)=& prod_{i}left(mathcal{N}left(0, ilde{sigma}_{i}^{2} ight) * mathcal{U}left(-frac{1}{2}, frac{1}{2} ight) ight)left( ilde{y}_{i} ight) \ & ext { with } ilde{oldsymbol{sigma}}=h_{s}left( ilde{oldsymbol{z}} ; oldsymbol{ heta}_{h} ight) end{aligned}]

    也就是在(y)的顶部简单的叠加另一个参数变换(h_a)来扩展推理模型

    [egin{aligned} qleft( ilde{oldsymbol{y}}, ilde{oldsymbol{z}} mid oldsymbol{x}, oldsymbol{phi}_{g}, oldsymbol{phi}_{oldsymbol{h}} ight)=& prod_{i} mathcal{U}left( ilde{y}_{i} mid y_{i}-frac{1}{2}, y_{i}+frac{1}{2} ight) cdot prod_{j} mathcal{U}left( ilde{z}_{j} mid z_{j}-frac{1}{2}, z_{j}+frac{1}{2} ight) \ & ext { with } oldsymbol{y}=g_{a}left(oldsymbol{x} ; oldsymbol{phi}_{g} ight), oldsymbol{z}=h_{a}left(oldsymbol{y} ; oldsymbol{phi}_{h} ight) end{aligned}]

    由于对超先验没有先验知识,因此我们现在使用先前用于( ilde{y})的非参数、全因子密度模型(non-parametric, fully factorized density model)对( ilde{z})进行建模

    [p_{ ilde{oldsymbol{z}} mid oldsymbol{psi}}( ilde{oldsymbol{z}} mid oldsymbol{psi})=prod_i left(p_{z_{i} mid oldsymbol{psi}^{(i)}}left(oldsymbol{psi}^{(i)} ight) * mathcal{U}left(-frac{1}{2}, frac{1}{2} ight) ight)left( ilde{z}_{i} ight) ]

    其中向量(psi^{(i)})封装了每个单变量分布(p_{z_i|psi^{(i)}})(统称为(psi))的参数。

    该模型的损失函数为:

    [egin{aligned} {mathbb{E}_{oldsymbol{x} sim p_{oldsymbol{x}}} D_{mathrm{KL}}left[q | p_{ ilde{oldsymbol{y}}, ilde{oldsymbol{z}} mid oldsymbol{x}} ight]=mathbb{E}_{oldsymbol{x} sim p_{oldsymbol{x}}} mathbb{E}_{ ilde{oldsymbol{y}}, ilde{oldsymbol{z}} sim q}left[log q( ilde{oldsymbol{y}}, ilde{oldsymbol{z}} mid oldsymbol{x})-log p_{oldsymbol{x} mid ilde{oldsymbol{y}}}(oldsymbol{x} mid ilde{oldsymbol{y}}) ight.}{left.-log p_{ ilde{oldsymbol{y}} mid ilde{oldsymbol{z}}}( ilde{oldsymbol{y}} mid ilde{oldsymbol{z}})-log p_{ ilde{oldsymbol{z}}}( ilde{oldsymbol{z}}) ight]+ ext { const. }} end{aligned}]

    同样,第一项是零,因为(q)是单位宽度均匀密度的乘积。第二项(似然)包含了失真。第三项和第四项分别表示编码( ilde{y})( ilde{z})的交叉熵。与传统的变换编码类似,第四项可以看作是表示边缘信息。

  • 相关阅读:
    企业如何选择数据分析架构?——谈谈3种架构的利弊
    jquery 拼接页面
    【感恩,回馈,展望】2018 ACOUG 年会盛大来袭!
    MySQL 数据库“十宗罪”(十大经典错误案例)
    break退出当前循环
    jquery 生成页面
    Python爬虫入门教程 35-100 知乎网全站用户爬虫 scrapy
    TypeError: Cannot read property '0' of undefined
    再砸4.35亿美元,LG疯狂扩建太阳能电池生产线
    再砸4.35亿美元,LG疯狂扩建太阳能电池生产线
  • 原文地址:https://www.cnblogs.com/hhhhhxh/p/13245762.html
Copyright © 2011-2022 走看看