论文笔记:Seeing What a GAN Cannot Generate

Seeing What a GAN Cannot Generate

尽管生成对抗网络(GAN)在合成图像上非常成功,但在GAN训练期间,mode-collapse仍然是一个严重的问题。迄今为止,很少有工作集中在理解和量化模型丢弃的模式上。这项工作在分发级别和实例级别都可视化了mode-collapse。首先,我们部署一个语义分割网络,将生成图像中的分割对象的分布与训练集中的目标分布进行比较。统计上的差异揭示了GAN忽略的对象类。其次,鉴于已识别的遗漏对象类别,我们直接可视化GAN的遗漏。特别是,我们通过GAN比较了各个照片及其近似反演之间的特定差异。为此,我们放松了反演问题,并解决了将GAN层而非整个生成器反演的棘手问题。最后,我们使用此框架来分析在多个数据集上训练的GAN,并确定它们的典型失败案例。

原文链接:arxiv
PPT:Slide
Demo:Demo

1. Abstract

GAN合成的图片足够以假乱真,但是我们对GAN能够产生哪些图像和不能产生的图像却不够了解。我们要怎么知道生成图像的过程中GAN丢弃了哪些细节或者模式,于是这篇文章提出了一个问题并进行解答:What a GAN cannot generate? 模型是难以学到图像中所有的复杂部分还是忽略了一部分特殊的语义。

如下图所示,原始的图片中的人物和教堂中的围墙都在生成的时候忽略了。

2. Method

为了解决上述问题,文中一共分成了以下两个部分,在统计意义和单个实例中显示GAN可以产生哪些和不能产生的模式:

  • 统计分析图像中的语义分割在原始图像和生成图像中的差异。(distribution-level)
  • 可视化在图像进行重建的过程中生成器忽略哪些object。(instance-level)如果我们能够使得模型最大化的接近原始图像,那么原始图像与生成图像之间的差异就是模型的缺陷,这部分细节在GAN训练和生成的过程中被忽略掉了。

2.1 Quantifying distribution-level mode collapse

要如何观察到模型中有哪些漏掉的mode,最简单的方法就是统计图像中的类别信息差异。比如在卧室中,可以统计原始图像中和生成图像中的存在了多少窗帘,并且通过这种差异就可以看到GAN在窗帘上是否存在漏洞。

为了分割图像,文中使用了Unified Perceptual Segmentation Parsing network,该网络可以为图像中每一个pixel标注信息,最多可以标注336个不同的类别。通过计算每一个类别在图像中的面积就可以得到GAN的统计差异(平均值),如下图。

mean area表中蓝色表示原始图像中的统计面积,红色是生成图像中的统计面积。Relative delta表示原始图像与生成图像的差异,可以看到chest等物体很少会在生成图像中出现。

同时文中使用了一个Frechet Segmentation Distance(FSD)量化这种差异,类比于Frechet Inception Distan(FID),如下:\text{FSD} \equiv \| \mu_{g} - \mu_{t} \| ^{2} + \text{Tr}(\sum_{g}+\sum_{t}-2(\sum_{g}\sum_{t})^{\frac{1}{2}})

2.2 Quantifying instance-level mode collapse

首先定义(x,x')为原始图像与生成图像pair,那么问题就是分析这个pair的差异,x为原始图像。通过层级反演可以得到图像的最近似输入,但是全部网络的反演及其困难,于是文中仅反演最后几层。

  • Step 1: 训练一个编码器。
  • Step 2: 通过编码器对原始图像进行编码获得z0。
  • Step 3: 对生成器的第R层进行优化,使得结果尽可能的接近原始图像。

优化目标,找到合适的中间层输入,使得生成图像尽可能的与原始图像相似。

\begin{aligned} x' &= G_{f}(r^{\ast}) \\ \text{where} \, r^{\ast} &= \text{arg min}_{r} \, l(G_{f}(R),x) \end{aligned}

3. Result

在三个GAN模型中进行测试:WGAN-GP,StyleGAN,Progressive GAN,并通过#2.1中的评价标准得到结果如下,styleGAN最能还原出原始图像。

在Progressive GAN测试的结果。

4. Discussion

这篇论文通过逐层反演GAN来发现模型中的缺陷以及忽略掉的信息,并通过统计和可视化实例对GAN模型进行解释。文章已经告诉我们模型确实不能产生哪些模式,那么我们需要问为什么,模型为什么会忽略掉这些模型,这些忽略的信息是因为训练集不够还是模型本身不足够拟合这么多复杂的信息。

同样可以思考要怎么帮助模型理解训练集中我们关注的最主要的概念,比如如果模型确实不足够拟合这么多信息,那么我们有没有办法让模型在合成的过程中忽略我们不想要的东西。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,980评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,178评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,868评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,498评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,492评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,521评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,910评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,569评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,793评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,559评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,639评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,342评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,931评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,904评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,144评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,833评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,350评论 2 342

推荐阅读更多精彩内容