空间聚类算法简述

空间数据聚类算法主要包括四大类:(1)给予划分的聚类;(2)基于层次的聚类;(3)基于密度的聚类;(4)基于网格的聚类。时空数据聚类算法是空间数据聚类算法的验身,它将时许维度纳入聚类计算中。

1.1基于划分的空间聚类算法

k-means算法:用户定义k个簇的质心位置——将每个数据点聚合到与之最近的质心所在的簇——重新为每个簇计算质心所在位置——重复步骤二和三直到质心收敛。其计算复杂度为O(kTN),T为步骤四中迭代次数,他对于用户给定的簇中心点的初始位置和噪声点非常敏感。同时,在处理海量数据的时候运行时间较长。

1.2基于层次的空间聚类算法

层次聚的目的是将数据对象分配到一个层次结构中,它遵循两种剧本策略:向上凝聚和向下分裂。向上凝聚方法将每一个对象看做独立的簇,然后从整个层次结构的底层开始对具有相似特征的簇聚合,逐层递归至顶层。相反,向下分裂方法把所有的数据对象看做同一个簇,然后从整个层次结构的顶层开始,对具有不同特征的簇进行分裂,逐层递归至底层。其计算的事件复杂度是0(N^3 )

1.3基于密度的空间聚类算法

基于密度的聚类算法在发现任意形状和数据造成方面具有独特的优势,且不要求对簇的数量进行初始设置。其算法包括:DBSCAN算法,OPTICS算法,DENCLUE算法,CURD算法,Incremental DBSCAN算法,SDBDC算法,ST-DBSCAN算法等。DBSCAN是第一个被提出的基于密度的聚类算法。而密度主要通过两个基本参数进行定义:空间半径\varepsilon 和密度阈值MinPts.

DBSCAN基本概念:

算法的主要缺点是它的运算时间复O(N^2 ),因此对海量空间数据的聚类过程需要经过一个无法忍受的耗时。它的另一个缺陷是无法支持多密度聚类、增量聚类和并行计算。许多工作针对这些问题进行了研究他们可以被概括为两大类工作:⑴算法改进;(2)算法并行化。传统的改进方法采用空间索引技术来快速锁定数据对象。GirDBSCAN被称为最先进的DBSCAN算法它基于网格划分策略极大的减低了算法的时间复杂度,且没有计算精度损失。得益于网格的超规则空间结构,任意两个格子之间的最短空间距离可以很容易被获取。对于任意点p_{a} ,其关于\varepsilon 的近邻点只存在于一个固定的格子集合范围内;换言之,那些格子集合范围外的点一定不是其的近邻点,因此这些点与点p_{a} 之间的距离计算可以被省略,从而提高DBSCAN算法的计算效率。基于这个想法,Gunawan将整个网格划分为以\varepsilon /\sqrt{2} 为边长的正方形格子,用于2维空间数据的基于密度聚类计算,使得每个正方格子内的最大空间距离为因此一旦格子内的点的数量达到或超过MinPts,则该格子里的所有点都是核心点,且属于同一个簇。因此一个簇可以通过密度相连格子和密度可达格子的最大集合进行计算,从而省略了许多点与点之间的距离计算。同时采用了Voronoi图技术,进一步改进了DBSCAN算法的运算效率。但是,构建一个Voronoi图本身需要消耗大量的时间。基于这个想法,Gan和Tao提出了一种关于p近似DBSCAN算法来获得近似精度的计算结果,但只需要关于N的线性计算时间,用于取代传统的DBSCAN算法。

1.4基于网格的聚类

基于网格聚类算法将数据空间划分为规则的互不相交的格子,再将所有的数据对象映射带网格中基于格子进行聚类。总结一下就是:将对象空间量化为有限数目的单元,形成一个网状结构,所有聚类都在这个网状结构上进行。

我们将学习一下STING算法以及CLIQUE算法。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 200,783评论 5 472
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,396评论 2 377
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 147,834评论 0 333
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,036评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,035评论 5 362
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,242评论 1 278
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,727评论 3 393
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,376评论 0 255
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,508评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,415评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,463评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,140评论 3 316
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,734评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,809评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,028评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,521评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,119评论 2 341

推荐阅读更多精彩内容