论文阅读"Multi-kernel fuzzy clustering based on auto-encoder for fMRI functional network"

Lu H, Liu S, Wei H, et al. Multi-kernel fuzzy clustering based on auto-encoder for fMRI functional network[J]. Expert Systems with Applications, 2020, 159: 113513.

摘要翻译

现有的基于自编码器的聚类算法只使用了一层信息。本文提出了一种新的子空间聚类算法,该方法利用从堆叠自编码器中学习到的多个隐层的信息构建不同的核。提出的基于自动编码器的模糊多核聚类方法,通过核的隶属矩阵和系数,实现目标函数的值迭代到最小误差。同时,该方法结合了自编码器,实现了输入数据的降维效果。为了验证该算法的有效性,作者首先在脑网络数据集上进行了实验。与MKFC、RMKKM等算法相比,该方法显著地提高了准确性。在构建的高维网络数据集上的实验结果优于目前的几种聚类算法。结果表明,子空间信息经过降维后更有利于聚类。

因为该论文是针对特定领域的特定数据集,因此笔者只关注所提出的模型结构。(:笔者尽力对模型进行理解,因涉及到领域专业知识,如有偏差请指正!

预备知识
  • fuzzy clustering
    模糊聚类(FCM)是机器学习领域的经典聚类算法K-means算法上的扩展,它使用L2范数来度量重构误差。此外,FCM是一种软聚类方法,对球形聚类更有效。选择模糊聚类的原因是隶属度描述了属于聚类中心的数据点的不确定性,因此它比清晰聚类包含更多的信息。(1)式中的d为L2范数:
    通过优化目标函数(2),样本点属于每个类簇c的可能性可以被计算出来。即,通过每个数据点x_i到集群中心v_c的距离,可以得到每个数据x_i的隶属度u_{ic}
  • kernel fuzzy clustering

    如果聚类算法的度量只局限于欧式距离,那么类簇中的复杂特征很难被分开。Girolami等人(2002)提出了Mercer核方法来分离具有复杂特征的非线性簇。在引入核函数后,将目标函数推广到等式 (3):
    也就是说,核模糊聚类(KFCM)是先使用核函数将数据映射到特征空间,然后使用FCM算法聚类。

    由(3)式可以得出(4)式的优化目标:

其中,K表示为:


v_c表示为:

  • multiple kernel fuzzy clustering
    KFC算法中使用的是单个核函数。当面对多种不同类型的特征样本,且每个样本都有多个非线性聚类时,单核函数不能满足核样本的要求。也就是说对于核方法而言,最重要的是使用的核适合于所有的样本点数据。因此,对于MKFC中每个样本都有多个核函数,期望从中可以得到一个合适的映射。
    假设,有h个核\{K_r \}_{r=1}^h,为了找到一个合适的核,从而为每个核都建立了对应的核权重。
模型简述


图中提出的AE-MKFC将一个堆栈编码器的多个隐藏层与多个核结合起来,最终得到了可以聚类的最佳核矩阵。编码器部分不仅可以减少维度,而且可以高度地表示样本特征。在图中,为了便于表示堆叠的SAE,没有给出解码器过程的细节。在实验中,SAE通过训练y_1,\cdots,y_l隐藏层实现降维。具体实现步骤如下:

通过l层的降维操作,每个样本被转化成l层的隐含数据表示。
核矩阵(半正定矩阵):

以及对应的核权重:

该算法的最终目标是获得一个全面的最优核空间来聚类,从而求解的核可以由权重获得:

作者也给出了最好的核函数:

前序有文献指出,欧式距离可以转化为如下的内积形式且正交关系可以防止映射中的交叉项:

对了找到每个样本点到对应簇中心的最短距离,AE-MKFC的最终的目标函数可以综合为如下:


emmm 论文中有些符号没太看懂。。。先放着吧

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,607评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,047评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,496评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,405评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,400评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,479评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,883评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,535评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,743评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,544评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,612评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,309评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,881评论 3 306
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,891评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,136评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,783评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,316评论 2 342

推荐阅读更多精彩内容