聚类分析思路分享,如何完成用户细分?


聚类分析广泛用于市场研究、管理研究中,用于对个体细分,或对比聚类后不同样本差异。本文给大家简单梳理下聚类分析的分析思路。



聚类分析,通俗地讲即是分类,根据样本的一些特征,最终将样本分为几类。

在总体类别划分不清楚的情况下,可以用聚类的方法来分类。


01 常用的聚类方法


Spssau提供两种常见聚类方法:


如果是按样本聚类,使用SPSSAU的进阶方法>“聚类分析”功能,可以分析定量或定类数据

如果是按变量(标题)聚类,可用分层聚类,此时数据只能是定量数据

需要结合数据类型及具体情况进行选择。


02 聚类前的准备


(1)聚类指标的选择

聚类分析前需要解决几个问题,首先要选择使用哪些变量分析,主要依据研究目标决定。

比如,研究目标是针对不同价值的客户进行分类。

那么研究的核心在于确定哪些指标可以代表客户价值的指标,如消费次数、购买量、顾客满意度、忠诚度等指标,然后以此进行客户分类。其他重要性较低的指标,则不应纳入分析(比如个人信息)。

如果题项较多,可先做因子分析,得到每个维度(因子)的数据,再进行聚类。


(2)聚类个数选择

聚类个数设置为几类没有固定的要求,用户可自行设置聚类数量,如果不进行设置,SPSSAU也会提供默认建议;通常情况下,建议设置聚类数量介于3~6个之间。


03 聚类分析


(1)Spssau操作

案例:旅游消费市场细分

分析前已经进行因子分析,提取出5个主因子,分别命名为分享、关注、便捷性、从众效应、负面口碑,接下来使用这5个指标,对样本进行聚类分析。


选择5个分析项,点击拖拽到右侧,进行分析。


(2)聚类结果分析


聚类分析往往是一个主观判断的过程,需要根据分析结果及个人专业知识判断,应该聚为几类更合适。

这里结合SPSSAU输出结果,提供几个判断聚类效果的方法:



数据分布均匀

 

一般来说,每个类别的样本比例应分布均匀,如果出现某一类占比过大或过小,可以考虑重新设置聚类类别个数。


SPSSAU聚类分析结果


SPSSAU智能分析


结合频数表格与智能分析结果可知,整体分布较均匀,说明聚类个数设置为3类比较合适。


各类别特征的差异性明显


聚类类别与聚类分析项进行交叉分析,如果呈现出显著性(p<0.05),意味着聚类得到的不同类别样本,在相同指标上有明显的差异。


SPSSAU-聚类差异对比结果


同时可查看每个指标聚类时的重要性对比,如果某个指标重要性较低,考虑移出该指标。



从上述结果看,所有研究项均呈现出显著性,说明不同类别之间的特征有明显的区别,聚类的效果较好。

 

聚类类别有实际意义

 

聚类结果最终要得到几个有实际意义的类别。通过对比每类样本的特征,可以明显的区分出三类样本特征,并且根据样本特征进行命名。



通过上图可知,第一类人群在每个指标上的得分都比较高,可以命名为旅游爱好者。

第二类人群在各类指标的得分都比较低,可命名为旅游冷淡者。

第三类人群对便捷性、从众效应、负面口碑上有较高得分,相反关注旅游信息、和分享意愿都较低,命名为旅游从众者。


04聚类后的差异分析


得到聚类类别之后,接着需要对比不同类别群体的差异性;包括如在“特征”、“行为”或者“态度”上的差异性。

最常见与个人信息情况做交叉分析,可以得到不同类型的人群分布情况。

或者与"态度题"、"行为题"的差异分析,能够更有针对性的了解不同类型人群的态度及需求,便于结合不同群体提出针对性的建议措施。


其他说明


聚类分析并非统计检验分析方法,而是一种数据描述性方法,没有严格的判断标准,因而可以比较多次聚类结果,综合选择更适合的方案。

如果有定类数据,或使用分层聚类方法分析,分析思路也是如此。


登录SPSSAU官网了解更多内容。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,902评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,037评论 2 377
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,978评论 0 332
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,867评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,763评论 5 360
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,104评论 1 277
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,565评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,236评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,379评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,313评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,363评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,034评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,637评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,719评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,952评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,371评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,948评论 2 341

推荐阅读更多精彩内容

  • 聚类,顾名思义,就是将原本无规律的数据,通过比较数据之间的相似性,找出它们的联系,将差别小的数据分为一类,保证不同...
    spssau阅读 2,610评论 0 1
  • (一)什么是聚类 聚类,将相似的事物聚集在一起,将不相似的事物划分到不同的类别的过程。是将复杂数据简化为少数类别的...
    11的雾阅读 21,049评论 0 8
  • 机器学习术语表 本术语表中列出了一般的机器学习术语和 TensorFlow 专用术语的定义。 A A/B 测试 (...
    yalesaleng阅读 1,955评论 0 11
  • | 导语在产品的增长分析当中,想关注符合某些条件的一部分用户,不仅想知道这些人的整体行为(访问次数,访问时长等),...
    馒头白鱼阅读 5,935评论 0 29
  • 1.string strstr(string $haystack, mixed $needle [, bool $...
    雨y飘零久阅读 196评论 0 0