In this work, we introduce a Region Proposal Network(RPN) that shares full-image convolutional features with the detection network, thus enabling nearly cost-free region proposals.
文章是将RPN和 R-CNN做一个共享和融合,从而达到加速的目的。
整个文章最大的亮点就是RPN 与 R-CNN的统一化。
Region Proposal Networks
以图片为输入,输出一系列方框及对应的分数,本文通过全卷积网络实现
滑动窗口对应出一个更低维度的vector,分别给两个网络做输入:box-regression layer( reg) 和 Box-Classification layer(cls)
Translation-Invariant Anchors
cls : 产生分数 是/不是 两个分数
reg: 产生box的位置 每个框四个数值
A loss Function for Learning Region Proposals
提出了训练中的loss函数,个别参数的意义
Optimization
bp算法+SGD(随机梯度下降)+ mini-batch
阐述了初始化策略(大家都没差)
learning rate 等各种超参数
Sharing convolutional features for region proposal and object detection
两个网络的卷积网络部分分别做一定的修改(两个网络的训练是独立进行的),使得两个网络可以共享卷积层部分
Implementation Details
列举出了各个部分具体的细节和参数