论文阅读“Deep Semantic Clustering by Partition Confidence Maximisation”

Huang J, Gong S, Zhu X. Deep semantic clustering by partition confidence maximization [C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 8849-8858.

摘要翻译

通过同时学习视觉特征和数据分组，深度聚类对高维视觉数据的结构分析显示出了较好的处理能力。// 现有的深度聚类方法通常依赖于（基于样本间关系和/或自估计伪标签的）局部学习约束。这很容易受到分布在附近的不可避免的错误的影响，并在训练过程中错误传播。// 在这项工作中，提出通过从所有可能的分离中学习最具有置信度的聚类解决方案解决该问题，基于将来自相同语义类别的样本分配到不同的聚类中会降低聚类内部的紧凑性和簇间的多样性，即更低的分区置信度。具体地说，引入了一种新的深度聚类方法，称为分区置信最大化(PICA)。它是建立在学习语义上最可信的数据分离思想之上的，通过最大化聚类的“全局”分区置信度，所有集群都可以一对一地映射到真实的类簇中。这是通过引入可微划分不确定性指标及其随机近似和原则目标损失函数来实现的，因此传统的深度网络和基于小批量的模型训练能够直接采用。

论文动机

两种不同类型的约束比较

上图为深度聚类中的学习局部约束和全局约束。真实的类别区分由彩色背景描述，决策边界和边缘分别由灰色实线和灰色阴影区域表示。箭头意味着学习监督。在局部学习约束下，一个模型更有可能在邻域内传播错误，因为在解决方案层面上缺乏全局结构指导，如(b)。

虽然一组数据可以根据不同的标准以多种方式分离，但将来自相同语义类别的样本分配到不同的类簇将会减少内部的紧凑性和簇间的多样性，并导致较低的分区置信度。PICA是专门设计用来鼓励模型从所有可能的解决方案中学习置信度最高的类簇，以便找到语义上最可信的类簇间分离。
具体来说，论文提出了（1）一个划分不确定性指数，它量化了当同时执行特征表示学习和聚类分配时，深度模型如何有意义的分离一组目标图像。为了拟合标准的小批量模型学习，（2）引入了划分不确定性指标的随机逼近。进一步提出了（3）一种新的基于随机划分不确定性指标的目标损失函数，使现有网络能够进行深度聚类。

模型浅析

问题定义

给定来自 $K$ 个语义类簇 $Y = \left\{Y_1,Y_2,...,Y_K\right\}$ 的 $N$ 个图片样本 $I = \left\{I_1,I_2,...,I_N\right\}$ 。目标是学习这些 $N$ 个样本的聚类分配。通常有两个组件进行端到端联合学习：（1）特征抽取器：用于将样本转换为向量表示： $x = f_\theta(I)$ ；（2）分类器：用于对每个样本的向量表示 $x$ 学习分配分布： $p = g_{\phi}(x)=\left\{p_1,...,p_K\right\}$ 。因此，在聚类中，样本图像 $I$ 最后所属的类簇即为 $l = {arg max}_k(p_{k} ), k \in \left\{1,2,..,K\right\}.$ 论文的目标是直接从原始数据样本中发现底层的语义类决策边界。

方法概述

一般来说，图像聚类并不是一个定义良好的问题，因为多个不同的解决方案都可以使得输入数据有意义。由于完全缺乏高级的指导知识，这使得深度聚类极具有挑战性。考虑到这一点，作者假设置信度最高的数据分区是正在寻找的最有前途和语义上可信的解决方案。

PICA是基于分区不确定性指数(PUI)的，使用该指数测量了深度CNN解释和分区目标图像数据的能力。整体框架如下图：

Framework

(1) Partition Uncertainty Index

对于给定样本 $I_i$ ，假设由抽取器给出的类簇分配可以记为：

p_i

表示当前当本分配到每个类簇的概率值。由此，所有数据的概率分配矩阵可以写成：

P中的第

j

行

q_j

则收集了所有数据样本分配到第

j

个类簇的概率，它总结了该类簇对整个目标数据的分配统计数据。论文称之为“类簇级的分配统计向量”（ASV）。
理想情况下，每个图像只被分配给一个类簇，即每个

p_i

都是一个one-hot向量。这也正是PICA想要去实现的目的。为此，作者设计了partition uncertainty index作为学习目标。在上述理想情况下，可见任意两个簇的

q_{j1}

和

q_{j2}

的ASV量都是彼此正交的，所以二者ASV的余弦相似度值为

0

。而最坏的情况是，每个样本分配到各个类簇的概率都是等同的，即无法区分，此时二者ASV的余弦相似度值为

1

。
一个分区不确定性指数(PUI)表示为所有簇对的ASV余弦相似度集：

M_PUI

可以得出，该相似度集为

K*K

的方阵。通过这样做，PICA的学习目标是最小化所有PUI（对角线元素除外），如此可以提供置信度较高的聚类解决方案。

PUI的随机近似值

在原始的PUI的定义中，考虑的是数据集中所有样本到指定类簇的概率值。这使得它不适合用于基于随机小批处理的深度学习。因此，提出了一种PUI的随机近似方法。具体地说，在每次训练迭代中使用数据集的随机子集 $I^{t}$ (在概率论和统计学中，是对整个目标数据空间的离散均匀分布的采样)。在实践中，这很容易适应标准深度学习的小批量训练，即每次将 $I^t$ 设置为一个mini-batch。形式上，在第t次训练迭代中，我们有一个mini-batch $B$ 的 $N_b$ 个样本来训练模型并设置 $I^t=B$ 。 $I^t$ 的最新模型表示的集群预测矩阵为：

S P^t

可得：

M_SPUI

(2) Learning Objective Function

给定随机PUI--M_SPUI，如前面所讨论的，PICA以最小化M_SPUI（除对角元素）为目标进行学习训练。一个典型的目标损失函数，通常需要一个标量度量。
因此引入自注意力机制对 $K*K$ 的矩阵进行转换。计算任意两个类簇间的ASV余弦相似度，实际上是通过将每个集群作为一个数据样本并抑制所有样本间的关注来增强自我注意。因此，对每个集群 $j$ 应用softmax操作作为自注意，并获得一个概率度量如下：

m_j_j'

优化目标被转化为最大化

\left\{m_{j,j'}\right\}_{j=1}^K

。引入交叉熵，这部分的损失形式化为：

L_ce

有一些与算法无关的简单聚类方法，它们将大多数样本分配到少数集群中。为了避免这种情况，目标函数中还引入了一个额外的约束，以最小化类簇大小分布的负熵：

L_ne

之前看到的时候一直在想为什么优化目标中有常数log(K)，以为可以看做L0正则的一种，其实人家只是为了确保损失值非负。

综上，PICA的训练目标为最小化：

Total loss

(3)PICA训练过程

Training

PICA的整个创新点就是将看问题的角度，由样本转换到了类簇，我们所关注的分布不再是单个样本到每个类簇。而是所有样本的类簇级分布，并由此形成了所要优化的类簇对表示。按作者的设计，将局部的指导信息升级到了全局指导信息，想法新颖。后续可以考虑将这两种指导信息进行结合用于聚类。

最后编辑于：2021.06.22 20:39:55

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,607评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,047评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,496评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,405评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,400评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,479评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,883评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,535评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,743评论 1赞 295
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,544评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,612评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,309评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,881评论 3赞 306
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,891评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,136评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,783评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,316评论 2赞 342

论文阅读“Deep Semantic Clustering by Partition Confidence Maximisation”

论文阅读“Deep Semantic Clustering by Partition Confidence Maximisation”

摘要翻译

相关工作记录

论文动机

模型浅析

问题定义

方法概述

(1) Partition Uncertainty Index

PUI的随机近似值

(2) Learning Objective Function

(3)PICA训练过程

推荐阅读更多精彩内容