相关分析,是表明因素之间相关程度的绝佳方法,比如被人津津乐道的 超市里啤酒和尿不湿的相关分析。
超市工作人员发现: 啤酒的销量和尿不湿的销量 成正比,也就是正相关关系。所以 就把两类商品放在一起买,销量嗷嗷嗷地放上升。
细细琢磨下,可以探求一二。买尿不湿的多是在家带婴儿的男士,而啤酒是他们打发无聊时间的最佳伴侣。
相关分析,通常我们可以用散点图直接观察。多组数据在二维平面内打点,寻找相关关系。
难道在于,在多维变量中刚刚好找到两者呈线性关系很困难。需要两两作图,那就老多了,做好后也就蒙圈了。
相关分析第二方法——特征值法。
也成相关矩阵法,有相关系数组成。这点就是课上学的 介于-1~1之间的相关系数了。
其背后的道理,虽然不深,但也足令人望而止步。
一般的命令为:
corr(X)——相关系数
cov(X)——相关矩阵
X就是你的数据矩阵了。