文章来源:ICCV 2015
下载链接:Download paper、Code download
解决的问题:
(1) 基于整个图像的训练和预测,不再只通过局部特征进行边缘提取;
(2) 使用多尺度和多层次的特征进行学习。
该算法通过深度学习模型,完成了从图像到图像的预测,并通过学习到的丰富分级特征,完成边缘检测中的细节问题。
文章内容:
(1) 本篇论文提出了一种新的网络结构进行边缘检测,文中称该网络结构为Holistically-nested network(HED)。HED能够实现图像到图像的训练,输入一幅图像,输出对应图像的边缘检测图。该算法建立在完全卷积神经网络和深度监督网络的思想基础上。
(2) 图1是论文提出的HED网络体系结构,它的主要思想是每一个卷积层后面增加了一个side output layer,每个side output layer输出一个edge map,然后通过一个fusion layer将各个side output层输出的edge map进行融合,得到最后的边缘检测结果。
(3) HED结构是通过对16层的VGG-Net进行修改得到的,先是为每个阶段的最后一个卷积层增加一个side output layer,然后去除了VGG的全链接层和第五个池化层,并增加了一个混合层,这样就得到一个类似FCN又带有side output的网络结构,最后通过权值融合层将各个side output层的输出结果进行融合。
文章特点:
(1) 该算法大幅度提高了边缘检测的精度,在BSDS500数据集上,将边缘检测的精度从f-measure<0.76提高到了0.78,人眼的性能为0.80。
(2) 该算法提高了边缘检测的计算速度,它可以取得4帧每秒的速度,比之前的gpb几分钟一张图快了很多。
存在的不足:
由于相邻像素标签的约束不是在HED中直接实现,该算法的图像到图像训练和预测策略仍然没有明确地接触上下文信息。
相关参考:深度学习边缘提取HED C++接口实现、HED 论文笔记、HED
内容说明:
上述内容仅个人的点滴粗见,如有不当之处,请同行批评指正。