Learning Deep Features for Discriminative Localization 阅读笔记

该文章收录于CVPR2016

这是2016年CVPR上的一篇文章。对后来的弱监督学习的研究有很大的启发。这篇文章非常简单，主要是通过一系列的实验，证明了两个结论：1）CNN提取的feature含有位置信息，尽管我们在训练的时候并没有标记位置信息；2）这些位置信息，可以转移到其他的认知任务当中。

首先，我想给大家先科普一下global average pooling(GAP)

我们都知道，一个卷积神经网络中都有很多卷积层，一般情况下都是 “卷积(可以多个)--池化” 这种的组合，而卷积层有通道(channel)，卷积核(kernel)的宽、高这些参数，故而每个卷积层都将有个数为 channel 多个的输出，这些输出都有一个宽和高，我们将这个输出叫做(feature map)，现在我们只需将池化的核大小设为这些输出的宽和高即可，那么得到的就是一个个的数对吧，共有该卷积层的number of channel 这么多个。

就是说我们看到下图GAP的左右，左边的蓝红绿那个feature map是在其左边那个最小的卷积层做了上采样得到的输出(feature map)，一共有N个(N = number of channel)，我们对其做全局平均池化(global average pooling)，就是将蓝色的那个feature map做一下均值得到一个结果，当然你也可以做GMP，就是将最大值作为输出，这个结果就是箭头右边的蓝色圆圈

好了言归正传，我们知道，在用神经网络来做分类的时候，一个模型往往都是多个 “卷积(可以多个)--池化” 后接全连接，那么现在，我们用同样的方式，最后面来一个全连接吧，神经元个数就是你要分类的类别数量，好了，这就可以训练了，完了就会得到你想要的结果。

这时候啊，该论文作者就想了，GAP不仅仅是一个regularizer啊，你想想看，貌似它还可以将卷积层的定位能力一直延伸到最后一层，那我们是不是可以以此将feature map上那些比较惹人注意的地方区分出来呢，答案是可以的，就比如上图，我问你那人手里是狗还是猫时，你看的哪儿呢？显然，你会更加注意狗，我们说这一块具有区分性(discriminative)的区域激活值就比较大，

现在，作者开始了，构建了一个上述的结构，在全连接前加了一个GAP层，其他和普通网络一样，假设你分类出了某个输入是一个类别，比如是狗吧，最后的第二个神经元得出的结果最大，那么我们就取出GAP和它连起来的weight，然后用此weight我们去和GAP之前颜色为蓝绿红那个feature map做一下加权平均，最终就得到了我们所说的类激活映射图(Class Activation Map)，但是这儿我们拿到的Class Activation Map是这条狗的啊，但是有些花痴觉得那个男孩儿长的挺不错的，那她们肯定注意更多的反而是这个男孩儿对吧，怎么办呢？一样的嘛，你把分类男孩儿那个神经元的weight抓出来加权平均不就完了，像这样：

你看看吧，对于palace，我们更多的就是去看的建筑本身的轮廓和城墙上的结构，比如窗户啊啥的，但是对于church，那我们就关注那个尖尖的建筑了。

总结一下吧，其实神经网络中每个神经元看到的东西都是不一样的，它们分工明确，有的检测的是比如边缘、角点这种低级的视觉特征，有的则负责检测物体、场景这种比较高端的，最终它们把这些综合一下就得到了分类结果。我们可以把最后一个卷积层看成是一个词典。每一张feature map对应检测输入中的一个单词，如果有，就在对应位置有高的激活值。后面的全连接层其实就是利用这个词典进行分类。比如对于自行车分类器，他对于车轮，车把，车座这三个单词会赋予高的权值，对其他的单词权值很低，那么当他检测到输入图片的词向量在车轮，车把，车座这三个单词的置信度很高的时候，就会把这张图判断成自行车。
但就这个文章而言，其弊端还是比较明显的，比如我有下面这个图

你注意到的是花还是鸟呢？
如果我们并未对花进行分类，那你将取哪个神经元的weight作为你CMP加权平均的weight呢？

参考：https://zhuanlan.zhihu.com/p/27587399
http://blog.csdn.net/yaoqi_isee/article/details/62214648

最后编辑于：2017.12.28 15:19:48

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,456评论 5赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,370评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,337评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,583评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,596评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,572评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,936评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,595评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,850评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,601评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,685评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,371评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,951评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,934评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,167评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,636评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,411评论 2赞 342

Learning Deep Features for Discriminative Localization 阅读笔记

推荐阅读更多精彩内容