Kuo Ming Lin 分享了 Learning By Hacking 的动图
最近討論最火熱的project之一,來自NVIDIA開源的pix2pixHD,將Image-to-Image Translation帶到了另一個境界,如影片中所示,
只要提供High Resolution的Semantic Annotation,就能夠生成細節豐富且逼真的高清真實圖片(2048x1024),還能自由變換物體以
及場景的型態(例如調整每一台車子的顏色或是變換街道),Andrej Karpathy也在Twitter盛讚說這像是photoshop 2.0!其中用到
新的GAN相關的訓練技巧有:Coarse-to-fine Generator、Multi-Scale Discriminators、Multi-Layer Feature Matching Loss。 有興
趣可以參考以下資源:
"High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs"
by Ting-Chun Wang, Ming-Yu Liu, Jun-Yan
Zhu, Andrew Tao, Jan Kautz, Bryan Catanzaro
Paper: https://arxiv.org/pdf/1711.11585.pdf
Project Page: https://tcwang0509.github.io/pix2pixHD/
Code: https://github.com/NVIDIA/pix2pixHD
中文導讀: https://zhuanlan.zhihu.com/p/31627466