zoukankan      html  css  js  c++  java
  • 常见的GAN网络的相关原理及推导

    常见的GAN网络的相关原理及推导

    在上一篇中我们给大家介绍了GAN的相关原理和推导,GAN是VAE的后一半,再加上一个鉴别网络。这样而导致了完全不同的训练方式。

     GAN,生成对抗网络,主要有两部分构成:生成器,判别器。

    生成器网络的主要工作是负责生成样本数据,输入的是高斯白噪声z,输出的是样本数据向量x:

    判别器网络的主要工作是负责检测样本的数据增加,输入真实或者生成的样本数据,输出样本的标签:

    由于生成器和判别器都是需要经过网络进行训练的,所以两者都要能够微分。

    生成对抗网络的工作方式是让第一代的G产生一些图片,然后把这些图片和一些真实的图片丢到第一代的D里面去学习,让第一代的D能够分别生成的图像和真实的图片。在训练第二代的G,第二代的G产生的图片,能够骗过第一代的D,在训练第二代的D,依次迭代。

     那么,问题就来了,如何训练新一代的G来骗过上一代的D呢?

    我们可以把新一代的G和上一代的D连起来形成一个新的NN,我们训练最终的输出接近1,然后我们那中间的结果当做我们新的图片的输出。

    优化函数

    生成器G固定之后,使用来评价Pdata和Pz之间的差异。优化方式,对于生成器优化而言,我们要最小化价值函数,对于判别器而言,我们要优化最大价值函数,不断的交替进行之后,能够达到有个平衡点,称之为纳什均衡点。

    生成器最小化目标即为判别器将生成数据识别为假的概率的log值,对于上述提到的均衡点,它是判别代价函数的鞍点。

    对于GAN的训练算法,步骤如下:

    a、执行D-step的minibatch优化k次:

      1.从先验分布p(z)随机生成m个随机噪声向量z

      2.从数据集分布p(x)里随机获取m个样本x

      3.使用随机梯度上升优化判别器的代价函数

     b.执行G-step的minibatch优化1次:

      1.从先验分布p(z)随机生成m个随机噪声向量z

      2.使用梯度下降优化生成器的代价函数

     我们可以通过下面的曲线进一步理解训练过程:

     其中,绿线为生成器的数据分布,黑线为真实数据的分布,蓝线为判别器的结果分布。

    GAN的问题:

    GAN的训练比较困难,主要存在收敛难,很难达到纳什均衡点,并且无法有效监控收敛状态,另一方面,模型容易崩溃,判别器快速达到最优,能力明显强于生成器,生成器将数据集中生成在判别器最认可的空间上,即输出多样性低,不使用于离散输出(不可微分)。

  • 相关阅读:
    Extjs杂记录
    Extjs获得组件值的方式
    Extjs选中多行Grid提交
    Extjs定时操作
    Maven自动部署Tomcat错误排除
    Eclipse下maven部署web项目到tomcat7(兼容tomcat8)
    MyEclipse 2013安装后要做的几件事
    从零开始学习SSH框架笔记之四 几个关键配置文件备忘(模板)
    虚机,操作系统启动以后,卡住不动了,按F2,出现缺失文件的内容
    chroot命令
  • 原文地址:https://www.cnblogs.com/baby-lily/p/12884505.html
Copyright © 2011-2022 走看看