SPP-Net:Spatial Pyramid Pooling in Deep Convolution Networks for Visual Recognition

??什么叫特征的尺度不变性:
即图像的尺度发生变换后(缩放),仍能得到相同的特征信息。

??使用多尺度的bin的原因

网络结构对比
spp结构

SPP-Net的提出是基于对R-CNN中在提取特征时需要相同输入尺度及多次进行卷积层处理的改进。

Step1:原始图片预处理阶段

对图片,利用selective search的方法选出2000个候选区

Step2:利用模型对整幅图像提取特征(与R-CNN对每个候选区单独提取特征不同)

首先得到一个在其他数据集(如ImageNet数据集)上训练好的CNN模型,将其最后的softmax层换成自身任务所需的类别数(注意加上一个背景类)。将得到的候选区根据IoU(0.5)分类为背景类及所属类别。将原始图像resize使得min(w,h)属于{480,576,688,864,1200}多个尺度,这样便可得到经过卷积层conv5后输出不同尺度的feature map层,然后对每一个region proposal选择一个尺度使得region的大小接近与224*224(????这样在进行spp时仍对其在相同尺度下进行池化),并且设置SPP中bin大小分别为(1*1,2*2,3*3,6*6),对同一feature map提取出不同尺度的特征,再将其串接成一个特征向量(见上面的SPP网络)作为后续fc6全连接层的输入,用以进行后续网络的训练,对网络进行精调时,调整的是全连接层(因为此时提取到的特征时直接从feature map上得来的多尺度特征,故利用反向传播BP不太方便对前面卷积层的参数进行更新)。方法:采用250k个mini-batchs进行梯度计算,学习率固定为e-4,之后用50k个mini-batches,将学习率调整为e-5.

Step3:对分类器进行训练

对fc7全连接层得到的特征进行分类训练,此时对正负样本的划分与Step2中IoU(0.5)不同,此时选择IoU(0.3)来划分背景样本及所属类别样本。



Step4:测试阶段


对于一张待检测图片,首先利用selective search选出2000个候选区域,然后将整张图片输入SPP-NET网络,由conv5得到整张图片的feature maps(这些特征不仅反映物体的某一部分的语义信息,同时也反应了这些特征在图像中的具体位置,如下图),再利用spp结构对每个候选区提取得到相同长度的特征向量,再进行分类,得出该候选区所属类别。对于同一类别的候选区采用非极大值抑制的方法进行筛选,最后以实现目标检测。

Ending:相比于R-CNN结构,SPP-NET主要

a:将简单的pool5池化层替换成了多结构层次的金字塔池化,以此可以实现对输入图片的尺寸没有约束(因经过SPP池化后均会产生相同尺度的特征向量),正是因其支持不同尺寸的图像输入,使得其提取到的图像特征有更好的尺度不变性。同时,这也更符合人眼看世界的逻辑,在观察一幅图像时,并不会将目标resize到同一大小再进行识别。

b:因对一幅图像只需进行一次前向卷积操作,而不需对每个候选区region proposals均进行一次卷积操作,此方式提升了效率,快了进24-64倍。

********************************************************************************************************************************

spp中在池化时,对于不同大小的输入需取不同的滑动窗口以实现输出相同数目的bins,作者在训练后面的区连接层网络时分别进行了单尺度和多尺度的训练,如下图

??是对整张图做spp操作还是对每个region做spp操作??


***********************************************************************************************************************************

*spp的结构很灵活可以应用到很多CNN网络中已解决固定尺度输入问题

不足:网络中的卷积部分,全连接部分,分类器部分需单独训练,不是end-to-end的结构,比较麻烦;且区域提取selective search是事先单独进行的,不在整个网络中。且准确率仍需进一步提高。

Adding:

多模型融合:
在文中,作者提到通过利用同样的ImageNet数据集训练的到两个不同的网络结构,仅对两个结构选用不同的初始化方法,然后对于一幅图像分别用这两个网络进行检测,对这两个网络检测出的region区域进行非极大值抑制,合并得到最终的检测结果,得到了更高的检测精度。(原因是两个网络结构可以学习得到互补的卷积特征)。故有时为了提高检测精度,可以使用多模型融合的方式。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,607评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,047评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,496评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,405评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,400评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,479评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,883评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,535评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,743评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,544评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,612评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,309评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,881评论 3 306
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,891评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,136评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,783评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,316评论 2 342

推荐阅读更多精彩内容