【Excel系列】Excel数据分析:相关与回归分析

相关系数

15.1 相关系数的概念

著名统计学家卡尔·皮尔逊设计了统计指标——相关系数(Correlation coefficient)。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。

依据相关现象之间的不同特征,其统计指标的名称有所不同。如将反映两变量间线性相关关系的统计指标称为相关系数(相关系数的平方称为判定系数);将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数;将反映多元线性相关关系的统计指标称为复相关系数、复判定系数等。相关系数的计算公式为:

复相关系数(multiple correlation coefficient):反映一个因变量与一组自变量(两个或两个以上)之间相关程度的指标。它是包含所有变量在内的相关系数。它可利用单相关系数和偏相关系数求得。其计算公式为:

当只有两个变量时,复相关系数就等于单相关系数。Excel中的相关系数工具是单相关系数。

15.2 相关系数工具的使用

CORREL 和 PEARSON 工作表函数均可计算两个测量值变量之间的相关系数,条件是每种变量的测量值都是对 N 个对象进行观测所得到的。(丢失任何对象的任何观测值都会导致在分析中忽略该对象。)相关系数分析工具特别适合于当 N 个对象中的每个对象都有两个以上的测量值变量的情况。它提供一张输出表(相关矩阵),其中显示了应用于每个可能的测量值变量对的 CORREL(或 PEARSON)值。

与协方差一样,相关系数是描述两个测量值变量之间的离散程度的指标。与协方差的不同之处在于,相关系数是成比例的,因此它的值与这两个测量值变量的表示单位无关。(例如,如果两个测量值变量为重量和高度,当重量单位从磅换算成千克时,相关系数的值并不改变。)任何相关系数的值都必须介于 -1 和 +1 之间(包括 -1 和 +1)。

可以使用相关系数分析工具来检验每对测量值变量,以便确定两个测量值变量是否趋向于同时变动,即,一个变量的较大值是否趋向于与另一个变量的较大值相关联(正相关);或者一个变量的较小值是否趋向于与另一个变量的较大值相关联(负相关);或者两个变量的值趋向于互不关联(相关系数近似于零)。

【例】9个小麦品种(分别用A1,A2,...,A9表示)的6个性状资料见表,作相关系数计算。

表 15-1 试验数据

(1)建立一张工作表,输入数据:

图 15-1 EXCEL数据输入

(2)从“数据”选项卡选择“数据分析”,从“数据分析”列表框中选择“相关系数”,单击“确定”弹出相关系数对话框。

图 15-2 相关系数对话框

数据区域可包括变量名称,但不包括样本编号。每个变量的样本按行排列的选择“逐行”按列排列的选择“逐列”。若包括变量名称,则选择“标志位于第一列”

(3)单击“确定”得偏相关系数如下表。

图 15-3 结果输出

Excel分析工具中的“相关系数”仅计算出相关系数的值,并未进行相关性检验。相关系数检验可由相关系数临界值来判断。

相关系数为可决系数的平方根,可决系数为回归平方和与总误差平方和之比,而F统计量为回归均方和与总均方和之比,由于可借助F临界值求得相关系数临界值。即:

本例中n=9,在G9单元格输入=SQRT(FINV(0.05,1,7)/(FINV(0.05,1,7)+7)),在B12输入=IF(ABS(B4)>$G$9,"相关性显著","不显著")并复制,得:

图 15-4 由函数判断显著性

协方差

16.1 协方差的概念

在概率论和统计学中,协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。两个实数随机变量X与Y之间的协方差定义为:  COV(X,Y)=E[(X-E(X))(Y-E(Y))]其中,E是期望值。

16.2 协方差工具的使用

当您对一组个体进行观测而获得了 N 个不同的测量值变量时,“相关”和“协方差”工具可在相同设置下使用。“相关”和“协方差”工具都会提供一张输出表(矩阵),其中分别显示每对测量值变量之间的相关系数或协方差。不同之处在于协方差的取值在 -1 和 +1 之间,而协方差没有限定的取值范围。相关系数和协方差都是描述两个变量离散程度的指标。

“协方差”工具为每对测量值变量计算工作表函数 COVAR 的值。(当只有两个测量值变量,即 N=2 时,可直接使用 COVAR,而不要使用“协方差”工具。)在“协方差”工具的输出表中的第 i 行、第 i 列的对角线上的输入值是第 i 个测量值变量与其自身的协方差;这正好是用工作表函数 VARP 计算得出的变量的总体方差。

可以使用“协方差”工具来检验每对测量值变量,以便确定两个测量值变量是否趋向于同时变动,即,一个变量的较大值是否趋向于与另一个变量的较大值相关联(正相关);或者一个变量的较小值是否趋向于与另一个变量的较大值相关联(负相关);或者两个变量中的值趋向于互不关联(协方差近似于零)。

【例】9个小麦品种(分别用A1,A2,...,A9表示)的5个性状资料见表,作协方差计算。

(1)建立一张工作表,输入数据:

图 16-1 输入数据

(2)从“数据”选项卡选择“数据分析”,从“数据分析”列表框中选择“协方差”,单击“确定”弹出协方差对话框。

图 16-2 协方差工具对话框

数据区域可包括变量名称,但不包括样本编号。每个变量的样本按行排列的选择“逐行”按列排列的选择“逐列”。若包括变量名称,则选择“标志位于第一列”

(3)单击“确定”得协方差如下表。

图 16-3 结果输出

回归

17.1 回归基本公式

对于多元回归,仍可用最小二乘法。

决定系数与调整的决定系数:


17.2 回归工具的使用

“回归”分析工具通过对一组观察值使用“最小二乘法”直线拟合来执行线性回归分析。本工具可用来分析单个因变量是如何受一个或几个自变量的值影响的。

例:某企业成本与销售额如下表(单元:万元),试进行多元线性回归。

表 17-1 数据资料

(1)打开一张EXCEL表格,输入数据如下。

图 17-1 在EXCEL输入数据

(2)数据|分析|数据分析|回归,弹出回归对话框并设置如下:

图 17-2 回归对话框设置

(3)单击“确定”得如下输出结果。

摘要表:

表中Multiple R为复相关系数;R Square为决定系数;Adjusted R Square调整的决定系数。

表 17-2 输出结果(摘要) SUMMARY OUTPUT

表 17-3 输入结果(方差分析表)

参数值、参数检验与置信区间。

表 17-4 输出结果(回归系数、t检验及置信区间

表 17-5 输出结果(残差)RESIDUAL OUTPUT

表中的标准残差=(残差-残差的均值)/残差的标准差即

图 17-3 结果输出残差图

表 17-6 输入结果(百分比排位)PROBABILITY OUTPUT


图 17-4 正态分布图


大数据订阅号(ID:BigData07)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,098评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,213评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,960评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,519评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,512评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,533评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,914评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,574评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,804评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,563评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,644评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,350评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,933评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,908评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,146评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,847评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,361评论 2 342

推荐阅读更多精彩内容