论文阅读“Deep Semantic Clustering by Partition Confidence Maximisation”

Huang J, Gong S, Zhu X. Deep semantic clustering by partition confidence maximization [C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 8849-8858.

摘要翻译

通过同时学习视觉特征和数据分组,深度聚类对高维视觉数据的结构分析显示出了较好的处理能力。// 现有的深度聚类方法通常依赖于(基于样本间关系和/或自估计伪标签的)局部学习约束。 这很容易受到分布在附近的不可避免的错误的影响,并在训练过程中错误传播。// 在这项工作中,提出通过从所有可能的分离中学习最具有置信度的聚类解决方案解决该问题,基于将来自相同语义类别的样本分配到不同的聚类中会降低聚类内部的紧凑性和簇间的多样性,即更低的分区置信度。具体地说,引入了一种新的深度聚类方法,称为分区置信最大化(PICA)。它是建立在学习语义上最可信的数据分离思想之上的,通过最大化聚类的“全局”分区置信度,所有集群都可以一对一地映射到真实的类簇中。这是通过引入可微划分不确定性指标及其随机近似和原则目标损失函数来实现的,因此传统的深度网络和基于小批量的模型训练能够直接采用。

相关工作记录

第一段:首先给出视觉领域无监督聚类问题的概念,并得到了广泛的关注。然后提出视觉数据存在的高维度问题由此引出deep clustering。虽然使用可学习表示进行聚类分析有可能对未标记数据的聚类受益,但如何提高这些集群的语义合理性仍然是一个开放问题。
第二段:给出当前deep clustering的相关工作分类。并说明这些方法存在的问题。在总结中给出:"如果没有全局解决方案级的指导来从所有可能的分离中进行选择,所得到的集群通常在语义上就不那么可信了"。由此引出自己的工作。
第三段:自己的工作提出。

论文动机
两种不同类型的约束比较

上图为深度聚类中的学习局部约束和全局约束。真实的类别区分由彩色背景描述,决策边界和边缘分别由灰色实线和灰色阴影区域表示。箭头意味着学习监督。在局部学习约束下,一个模型更有可能在邻域内传播错误,因为在解决方案层面上缺乏全局结构指导,如(b)。

虽然一组数据可以根据不同的标准以多种方式分离,但将来自相同语义类别的样本分配到不同的类簇将会减少内部的紧凑性和簇间的多样性,并导致较低的分区置信度。PICA是专门设计用来鼓励模型从所有可能的解决方案中学习置信度最高的类簇,以便找到语义上最可信的类簇间分离。
具体来说,论文提出了(1)一个划分不确定性指数,它量化了当同时执行特征表示学习和聚类分配时,深度模型如何有意义的分离一组目标图像。为了拟合标准的小批量模型学习,(2)引入了划分不确定性指标的随机逼近。进一步提出了(3)一种新的基于随机划分不确定性指标的目标损失函数,使现有网络能够进行深度聚类。

模型浅析
问题定义

给定来自K个语义类簇Y = \left\{Y_1,Y_2,...,Y_K\right\}N个图片样本I = \left\{I_1,I_2,...,I_N\right\}。目标是学习这些N个样本的聚类分配。通常有两个组件进行端到端联合学习:(1)特征抽取器:用于将样本转换为向量表示:x = f_\theta(I);(2)分类器:用于对每个样本的向量表示x学习分配分布:p = g_{\phi}(x)=\left\{p_1,...,p_K\right\}。因此,在聚类中,样本图像I最后所属的类簇即为l = {arg max}_k(p_{k} ), k \in \left\{1,2,..,K\right\}.论文的目标是直接从原始数据样本中发现底层的语义类决策边界。

方法概述

一般来说,图像聚类并不是一个定义良好的问题,因为多个不同的解决方案都可以使得输入数据有意义。由于完全缺乏高级的指导知识,这使得深度聚类极具有挑战性。考虑到这一点,作者假设置信度最高的数据分区是正在寻找的最有前途和语义上可信的解决方案。

PICA是基于分区不确定性指数(PUI)的,使用该指数测量了深度CNN解释和分区目标图像数据的能力。整体框架如下图:
Framework
(1) Partition Uncertainty Index

对于给定样本I_i,假设由抽取器给出的类簇分配可以记为:

p_i
表示当前当本分配到每个类簇的概率值。由此,所有数据的概率分配矩阵可以写成:
P
P中的第j
q_j
则收集了所有数据样本分配到第j个类簇的概率,它总结了该类簇对整个目标数据的分配统计数据。论文称之为“类簇级的分配统计向量”(ASV)。
理想情况下,每个图像只被分配给一个类簇,即每个p_i都是一个one-hot向量。这也正是PICA想要去实现的目的。为此,作者设计了partition uncertainty index作为学习目标。在上述理想情况下,可见任意两个簇的q_{j1}q_{j2}的ASV量都是彼此正交的,所以二者ASV的余弦相似度值为0。而最坏的情况是,每个样本分配到各个类簇的概率都是等同的,即无法区分,此时二者ASV的余弦相似度值为1
一个分区不确定性指数(PUI)表示为所有簇对的ASV余弦相似度集:
M_PUI
可以得出,该相似度集为K*K的方阵。通过这样做,PICA的学习目标是最小化所有PUI(对角线元素除外),如此可以提供置信度较高的聚类解决方案。

PUI的随机近似值

在原始的PUI的定义中,考虑的是数据集中所有样本到指定类簇的概率值。这使得它不适合用于基于随机小批处理的深度学习。因此,提出了一种PUI的随机近似方法。具体地说,在每次训练迭代中使用数据集的随机子集I^{t}(在概率论和统计学中,是对整个目标数据空间的离散均匀分布的采样)。在实践中,这很容易适应标准深度学习的小批量训练,即每次将I^t设置为一个mini-batch。形式上,在第t次训练迭代中,我们有一个mini-batch BN_b个样本来训练模型并设置I^t=BI^t的最新模型表示的集群预测矩阵为:

S P^t

可得:
M_SPUI

(2) Learning Objective Function

给定随机PUI--M_SPUI,如前面所讨论的,PICA以最小化M_SPUI(除对角元素)为目标进行学习训练。一个典型的目标损失函数,通常需要一个标量度量。
因此引入自注意力机制对K*K的矩阵进行转换。计算任意两个类簇间的ASV余弦相似度,实际上是通过将每个集群作为一个数据样本并抑制所有样本间的关注来增强自我注意。因此,对每个集群j应用softmax操作作为自注意,并获得一个概率度量如下:

m_j_j'
优化目标被转化为最大化\left\{m_{j,j'}\right\}_{j=1}^K。引入交叉熵,这部分的损失形式化为:
L_ce

有一些与算法无关的简单聚类方法,它们将大多数样本分配到少数集群中。为了避免这种情况,目标函数中还引入了一个额外的约束,以最小化类簇大小分布的负熵:

L_ne

之前看到的时候一直在想为什么优化目标中有常数log(K),以为可以看做L0正则的一种,其实人家只是为了确保损失值非负。
综上,PICA的训练目标为最小化:
Total loss

(3)PICA训练过程
Training

PICA的整个创新点就是将看问题的角度,由样本转换到了类簇,我们所关注的分布不再是单个样本到每个类簇。而是所有样本的类簇级分布,并由此形成了所要优化的类簇对表示。按作者的设计,将局部的指导信息升级到了全局指导信息,想法新颖。后续可以考虑将这两种指导信息进行结合用于聚类。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,607评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,047评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,496评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,405评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,400评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,479评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,883评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,535评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,743评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,544评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,612评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,309评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,881评论 3 306
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,891评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,136评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,783评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,316评论 2 342

推荐阅读更多精彩内容