15.1 直线相关分析
相关分析
相关分析:对相关关系的有无和关系大小进行统计分析的方法
直线相关分析:对线性关系的有无及大小进行统计分析的方法
相关分析的步骤
根据相关分析的对数据的要求、统计分析的内容,相关分析必须要结合一下步骤进行,缺一不可:
第一步,绘制散点图,看线性趋势。若线性趋势不成立,弃用直线相关分析。
散点图对两个变量之间有无相关关系进行大致描述,但不能准确反映关系密切程度
第二步,定量变量的正态性判断。一般可以通过绘制直方图结合正态性检验完成。
第三步,计算相关系数r。正态:Pearson相关系数,偏态:Spearman相关
•总体相关系数ρ:若ρ≠0, 称变量存在着相关;若ρ=0, 则简称两变量不相关。
•样本相关系数r :往往用来代替总体相关系数
第四步,开展假设检验,判断总体相关性的有无。
•常用t检验
•H0: ρ=0,两个变量之间无直线关系
•H1: ρ≠0,两个变量之间有直线关系
α=0.05
r 的特点
•r取值范围为|r|≤1,绝对值大小表示两变量之间直线联系的密切程度。
•当r为负值时,称为负相关;当r为正值时,称为正相关
•所以相关系数r是表示两个随机变量之间呈直线相关的强度和方向的统计量。
举例
例1:现有15例糖尿病患者,测得每位患者的胰岛素和血糖水平。问题:糖尿病患者胰岛素和血糖水平有无关系?
第一步,绘制散点图
SPSS路径: graphs→legacy dialogs→ scatter/Dots
第二步,正态检验
SPSS路径: analyze→descriptive statistics→explore (plots,Normality plots with tests)
第三步,相关分析
SPSS路径: analyze→correlation→Bivariate Correlation
r =-0.878,P<0.001
直线相关分析注意事项
•进行相关分析前应先绘出 散点图
•线性相关分析要求两个变量是服从双变量正态分布或者近似正态的随机变量
•出现异常值时慎用相关
•相关关系不一定是因果关系
•注意P值和r值的区别,两者无正比或反比关系