和多重共线性一次偶遇

在结构方程模型中，调节效应是很常见的形式。它描绘的是自变量（X）对因变量（Y）的作用强度受到调节变量（M）的影响。
比如，大家都知道吃夜宵吃多容易变胖，但夜宵在家吃和出去吃可能效果不一样。出去吃烧烤火锅，热量就比在家水煮白菜更容易胖。那么“吃夜宵的量（自变量X）”对“体重增加（因变量Y）”的影响，受到“吃饭地点（调节变量M）”的调节。作用关系如下图：

Moderation Effect.png

（图片引自Hayes, 2013. Model Templates for PROCESS for SPSS and SAS）

验证的步骤通常是：先确认自变量X和因变量Y之间的关系，然后检验交互变量X*M与因变量Y之间的关系。
通常来讲，调节变量（M）是独立于自变量（X）和因变量（Y）的，最好不要和它们有直接关系，否则会很难解释。比如上面的例子，还存在一种可能：因为烧烤火锅经常是和别人一起去吃，而且味道比水煮白菜好，所以吃的更多。那么吃饭地点（M）和吃夜宵的量（X）有了联系，解释起来就很麻烦了。

很不幸，我今天就遇到了。今天中午在重新整理数据的时候，把调节变量放进了相关分析的矩阵里。发现调节变量（M）和自变量（X）相关达到了显著性。
第一反应是：糟糕，我不会遇到多重共线性了吧？！
（注：多重共线性是指多个自变量（X1，X2，X3...）预测一个因变量（Y）时，自变量与自变量之间存在相关的情况，会导致预测结果出现偏差）

第二反应是：这是本质多重共线性，还是非本质多重共线性？
之前在方杰等（2015）的论文里看到，调节效应检验最好将自变量（X）和调节变量（M）做中心化处理，有助于调节效应正负的解释，以及减少“非本质”多重共线性。所以，如果我这边遇到的是“非本质”多重共线性的话，我后续做中心化处理既有理有据，同时还能把偏差消除掉。美滋滋。
但是打开这篇论文之后傻了，非本质共线性指的是自变量X和交互变量XM，或者调节变量M和交互变量XM之间的相关。而我遇到的自变量X和调节变量M的相关恰恰就是本质多重共线性。

既然事情已经发生，那就只能想想该怎么解决了。百度了一下多重共线性的解决办法，大致有以下几种：
1）增加样本量（加不了，实验已经做完了）；
2）移除共线性变量（就俩，移了就没了）；
3）逐步回归（就俩变量X和M，怎么逐步啊）；
4）岭回归或主成分回归（感觉要学新东西，先不学）。

当可选的解决办法都被否定之后，我出现了侥幸心理：仅仅只是X和M相关，能判定是多重共线性吗？是否还有其他判定标准？
还真有，就是——方差膨胀系数（variance inflation factor，VIF）。网上说VIF值一般在1左右，5到10之间可以接受，大于10则是严重的多重共线性。
计算VIF的R代码如下：

library(car)
#一般的回归方程
formula <- lm(y~x1+x2)
vif(formula)
#调节效应方程
formula2 <- lm(y~x1+x2+x1*x2)
vif(formula2)

当我把自己的数据代入之后，发现同样的数据，放在一般的回归里VIF值很低，一旦加上交互变量，就会忽然变得很高（多次尝试不同的数据仍然是类似的结果）。我猜测，交互项是由x1与x2相乘得来，它与x1和x2相关度都很高，所以导致了VIF值很高。
~~看来这条路又走不通了。~~
刚才吃饭的时候又想了一下，把交互变量丢到方程里面的做法着实是自己找抽。明明想观察的是自变量和调节变量之间是否共线，结果自己把导致共线的变量丢进去了。
重新计算之后，结果还是令人满意的，只有1出头，所以称不上是多重共线性。

Data <- data.frame(y,x1,x2)
formula <- lm(y~x1+x2)
vif(formula)
   x1    x2 
1.159 1.159 
formula2 <- lm(y~x1+x2+x1*x2)
vif(formula2)
    x1     x2  x1:x2 
22.150 16.888 51.179 

###我是吃完饭之后的分割线###
#x和m是相关的两组数据，看来仅仅是相关，离共线性还差的远
formula4 <- lm(y~x+m)
> vif(formula4)
     x      m 
1.0791 1.0791

松了口气之后，才重新想起下午看到VIF值的公式。当VIF=10的时候，x1预测x2的R平方要高达0.9了，是一个非常高的值。想想也是，我这点数据怎么可能这么高呢，哈哈哈哈哈哈。
算是虚惊一场吧，回头再找点参考文献说明一下就好了。
忙活了一中午和下午，充实是挺充实，但好像又什么都没干。

VIF公式及其解释.png

参考：
方杰, 温忠麟, 梁东梅, & 李霓霓. (2015). 基于多元回归的调节效应分析. 心理科学, 38(03), 715-720
温忠麟, 侯杰泰, & 张雷. (2005). 调节效应与中介效应的比较和应用. 心理学报, 37(2), 268-274

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 201,468评论 5赞 473
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 84,620评论 2赞 377
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 148,427评论 0赞 334
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,160评论 1赞 272
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,197评论 5赞 363
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,334评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,775评论 3赞 393
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,444评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,628评论 1赞 295
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,459评论 2赞 317
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,508评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,210评论 3赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,767评论 3赞 303
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,850评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,076评论 1赞 258
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,627评论 2赞 348
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,196评论 2赞 341

和多重共线性一次偶遇

推荐阅读更多精彩内容