我们有时需要对一波总体样本进行分群,从而更好地了解群体之间的差异,通过聚类分析可以帮助我们解决这个问题。聚类分析在市场细分、人群细分等方面可以给我们很多启发。
聚类分析在SPSS中分为系统聚类、K聚类及两步聚类。
从区别上看,系统聚类、K聚类主要针对的是计量资料,而两步具备可同时对计量资料、计数资料进行处理。
尽管在日常工作涉及的问卷中,计数资料涉及得较少,但从结果解读方面,仍然是两步聚类的解读更为直观。
以两步聚类为例,我们来看一个案例:
例如:我们想针对一波美妆用户群体进行人群细分。通过两步聚类,我们能够从一波样本中划分不同的细分人群。
经过本篇文章学习,您能够对问卷数据做以下分析:
①对总样本进行聚类
②筛选满足不同条件的个案进行进一步分析(选择个案)
两步聚类
TIPS:在两步聚类前,一定要先清洗数据,因跳转题而出现的-3值,要全部清除掉之后再进行聚类操作
1.分析-分类-两步聚类
2.将可能影响到人群细分结果的变量选入分类变量中
连续变量在本次问卷题目中未涉及,因此不选
这一步的变量选择在不确定的情况下,可能需要多次聚类验证,一定要选择聚类效果最佳的那几个变量
这里已经根据最佳效果选择好了相关变量
3.选项-操作默认
若涉及到连续变量,在【要标准化的变量】中,将出现连续变量
这里未涉及连续变量,因此这里未显示任何变量
4.输出
勾选上方的图表和表格、创建聚类成员变量
5.确定
6.结果解读
首先会出现一个简单的图,先来看一下这个图
显示我们输入了8个相关变量,聚类为5类
我们本次预测质量处在【良好】区间(这一步可多试几个变量,选择预测质量最好的那次即可)
双击这张图,会出现2个视图框
左侧还是刚刚的图,右侧则出现了本次5种聚类在总样本的占比情况
请注意,现在左侧视图默认在【模型概要】
我们现在选择【聚类】,会根据预测变量重要性出现一张渐变颜色的表格
逐一选择5个聚类所在的列,右侧选择【单元分布】,会显示聚类比较的结果
回到数据视图中,原表格中最后一新增了一列TSC,显示的数值则是根据本次聚类,每个人对应在哪个分类的结果。
7.想要详细了解各个细分人群在其他变量上的特征,我们根据【选择个案】进行具体分析
数据-选择个案
如果条件满足(先以第1类举例)
TSC列中的数据为1,我们会将第1类人群全部筛选出来,可以针对这个人群做更为具体的分析
点击继续,点击确定
分析具体的人群特点,可以通过描述【描述统计】得到
将这个过程重复5遍,我们就可以知道每个人群的人群特点分别是怎么样的,再对这些细分人群进行命名,就实现了对一波样本进行人群细分的操作。