Graph Neural Networks
Graph Neural Networks: A Review of Methods and Applications
下载链接:https://arxiv.org/pdf/1812.08434.pdf
Application
语义分割语义分割是图像理解的关键步骤。这里的任务是为图像中的每个像素分配唯一的标签(或类别),这可以被视为密集的分类问题。然而,图像中的区域通常不是网格状的并且需要非本地信息,这导致传统CNN的失败。一些作品利用图形结构数据来处理它。
[49](Semantic object parsing with graph lstm, ECCV 2016)提出Graph-LSTM通过建立基于距离的超像素图形式的图形并应用LSTM在全球范围内传播邻域信息来模拟长期依赖性和空间连接。后续工作从编码分层信息的角度对其进行了改进[104](Interpretable structure-evolving lstm, in CVPR 2017)。
此外,3D语义分割(RGBD语义分割)和点云分类利用更多的几何信息,因此难以通过2D CNN进行建模。 [107](3d graph neural networks for rgbd semantic segmentation, in CVPR 2017)构造K个最近邻(KNN)图并使用3D GNN作为传播模型。在展开几个步骤之后,预测模型将每个节点的隐藏状态作为输入并预测其语义标签。
由于总是有太多的点,[105](Large-scale point cloud semantic segmentation with superpoint graphs, 2017)通过构建超点图并为它们生成嵌入来解决大规模3D点云分割。为了对超节点进行分类,[105]利用GGNN和图卷积。
[106]( Dynamic graph cnn for learning on point clouds, 2018)建议通过边缘模拟点相互作用。它们通过馈送其终端节点的坐标来计算边缘表示向量。然后通过边缘聚合更新节点嵌入。
3D GNN论文解读博客(附代码链接):