前提:变量间存在大量的重复信息,直接分析会因为变量间的多重共线性而导致许多问题
应用目的:信息浓缩——如何通过少数的几个主分量,使它们尽可能多地保留原始变量的信息,且彼此间互不相关
注意:更多的是研究目的的中间步骤,而非最终的结果
一:案例选用(economy.sav)
(1)分析步骤
@1:对原来的p个指标进行标准化,以消除变量在数量级或量纲上的影响。
@2:根据标准化后的数据矩阵求出协方差或相关矩阵
@3:求出协方差矩阵的特征值和特征向量
@4:确定主成分,在可能的情况下结合专业知识为各主成分赋予适当的专业解释
spss中没有把主成分分析作为一种独立的分析方法,而是和因子分析共用一个过程,因此会输出许多因子分析中的结果,但不影响分析结果.
(2) 操作步骤
分析—》降维—》因子—》选择—》确定(其它选项可自行尝试,这里不做讨论)
(3)结果展示
成分矩阵中:系数的绝对值越大表示变量的越大的部分被包含在其中,表示新的成分包含此变量的越大部分信息,可以依据此为新的主成分赋予新的专业解释。
不妨试试用散点图看看究竟哪些变量合在一起,成为一个主成分的。