https://search.bilibili.com/all?keyword=WGAN
https://space.bilibili.com/447303411
该视频包括WGAN以及Lipschitz的各种实现方式的介绍。先导知识列表:神经网络、深度学习、GANs、Lipschitz
在训练的初始阶段,两个分布之间基本上是完全不重叠的
WGAN随着 P_g 变化,和P_r 的距离能平滑过渡
WGAN原文: weight clipping
优化空间/capacity 大幅缩小,完全不能铺满 Lipschiz 空间。。。
--> TRPO 是不是也可以采取类似的策略?
都把梯度拉到1去
理论上不对,实际效果倒是还不错。。。