使用梯度流改进生成的样品[ICLR2021]

生成对抗网络(GAN) 01/09/2021

三个要点
✔️ 提高深度生成模型（DG$f$low）所产生的样本质量的方法建议(DG$f$low)
✔️ DG$f$low扩展到VAEs和归一化流量，这是明确处理可能性的生成模型。
✔️ 提高图像和文本数据集上生成样本的质量

Refining Deep Generative Models via Discriminator Gradient Flow
written by Abdul Fatir Ansari, Ming Liang Ang, Harold Soh
(Submitted on 1 Dec 2020 (v1), last revised 5 Jun 2021 (this version, v4))
Comments: Accepted by ICLR2021
Subjects: Machine Learning (cs.LG); Artificial Intelligence (cs.AI); Machine Learning (stat.ML)

code：

本文所使用的图片要么来自该文件，要么是参照该文件制作的。

简介

深度生成模型是机器学习的一个最新发展领域。深度生成模型的目的是人为地生成与现实世界中存在的数据非常相似的数据。

深度学习模型之一是生成对抗网络（GAN），它由两类神经网络组成：判别器（Discriminator）用于判别真实数据和生成数据，生成器（Generator）用于生成样本。GANs通过使用最小优化来最小化真实和生成的数据分布之间的 "距离 "来学习。

由于GAN的目的是生成与真实数据非常相似的新数据，通常的做法是在训练完成后丢弃判别器，只使用生成器生成样本。

在这篇文章中，我们介绍了一个框架（DG$f$low），通过使用经过训练的Discriminator留下的真实数据分布的信息来改善劣质的生成样本。

什么是梯度流？

在我们讨论DG$F$low的具体内容之前，我们先来谈谈梯度流。梯度流是标量函数$F（x）$最小化过程中的 "最短路径"。

这里的 "最短路径 "是指在每个时间段的运动都是在减少$F$最多的方向。因此，梯度流$mathbf{x}(t)$满足以下方程

equation 1

使用梯度流改进生成的样本（DG$f$low）

传统的深度生成模型的问题之一是，生成的数据质量会因潜伏空间的样本不同而有很大差异。为了提高生成模型的性能，重要的是要知道如何减少质量差的数据量。在DG$f$low中，我们提出了一种方法来提高生成模型的性能，而不需要丢弃质量差的样本，传统的做法是用Metropolis-Hastings方法来拒绝质量差的样本。

构建梯度流

我们考虑我们要最小化的$F$，作为构建梯度流的第一步。这与传统的GANs中的损失函数没有太大区别，后者是代表生成的数据分布与真实数据分布之间 "距离 "的$f$-分歧。然而，在模拟离散时间步长的梯度流时，加入了一个负熵项以确保多样性。函数$F$定义如下其中$mu$是真实数据的概率测量，$rho$是生成数据的概率测量。

equation 5