IP属地:山东
背景 有时候数据集中会包含一个或多个数值异常大或异常小的值,这样的极端值称为异常值 对于异常值,我们该怎么办呢? 需要采用一定的技术手段从大量数...
外部指标 (要求数据集有标签) 调整兰德系数 Adjusted Rand Index描述分类与真实标签的相似度1) RI取值范围为[0,1],R...
背景 协方差与相关系数协方差描述两变量变化的相似度,相关系数除去了变量变化幅度的影响 高斯混合模型多个高斯分布混合得到的结果 高斯混合分析步骤 ...
DBSCAN DBSCAN: 具有噪声的基于密度的空间聚类 DBSCAN理解 Epsilon聚点搜索范围,如果范围内无数据或者数据太少,则认为是...
层次凝聚聚类法 HAC 也称为全连接聚类,与单连接聚类不同的是,两个类之间的距离不是最近点距离,而是最远点距离 层次聚类 优点 能够帮助进行数据...
算法介绍 对于同一个数据集,相同的聚簇中心,每次计算结果也可能会不一样 该算法除了要事先确定簇数K和对初始聚类中心敏感外,经常以局部最优结束,同...