毒药也可以成为药品,抑制疾病,拯救生命。
抑制变量
有时变量之间表面上看似没关,其实是因为第三因素掩盖了他们之间的关系,这类使原有关系被弱化或掩盖真实关系的变量也称为抑制变量。在回归分析实践中,常常会发现原来某些不显著的变量,在纳入一些控制变量后,显著性发生较大变化(由不显著变为显著)或系数出现较大变化(系数由小变大),原因即是如此。抑制变量的存在,使我们难以有效检验原假说的真伪,具有很大的迷惑性。下面看两个例子:
例1:现实中我们发现中国的综合国力增长,但仍无法轻易动用武力解决台湾问题,实质上是因为受到抑制因素——美国的影响所致,如果美国不支持台湾(抑制作用下降),那么台湾问题的解决速度将大大加快。
例2:假设我们想研究不同种族的人群内部的亲疏程度,例如:假设我们有一个量表可以度量“亲疏度”,针对黑人和白人两类人群,看看他们各自内部是否互相亲热还是疏远。我们初步发现亲疏度的值在黑人和白人间一开始是无显著差异的,但当我们引入教育水平作为控制变量后,发现不同教育水平下,白人之间明显比黑人之间更亲热。为什么?事实上,黑人往往教育水平更低,而教育水平更低的人群,他们之间可能更倾向于相互疏远(在中国是否成立待定)。
外生变量与抑制变量的比较:
从例2可以看出,抑制变量与外生变量(或称“混杂因素”)非常像,二者都同时与解释变量和因变量相关,所以外生变量和抑制变量都是需要在实证研究中需要被“控制”的变量,它们都可以称为“控制变量”。但抑制变量有两点和外生变量不一样:
(1)二者实质性内容不一样,控制外生变量是检验解释变量和被解释变量已经显现的关系(发现“伪相关”),控制抑制变量的目的是为了发掘出“潜在的”关系(发现“伪不相关”)。
(2)二者逻辑顺序不一样。外生变量常常是解释变量、被解释变量同时变动的“共因”,但抑制变量则不然,它不需要是二者的“共因”。比如例2中,教育水平显然不决定一个人的种族。
抑制变量由于在文献中很少提及,以及实践中很难发现,因此长期被忽视。很多研究人员发现两个变量无关后,就常常终止了后续的分析。事实上,找到抑制变量也是学术创新,因为在控制了更多的抑制变量后,如果解释变量和被解释变量仍然无关,那么我们就找到了证伪某个假说的强有力证据。
调节变量
调节变量不同于之前提到的所有类型的变量,它的存在是为了探究某规律在不同子样本中是否具有差异,即调节变量更多地反映了所研究对象中由于存在子群体的异质性,限制了某种规律的适用范围。调节作用多出现在实验研究中,用于评估某种新药对不同处理组的交互效应,在社会科学研究中也经常应用。
例3:学生的学习效果和指导方案的关系往往受到学生个性的影响。一种指导方案对某类学生很有效,对另一类学生却没有效,从而学生个性是调节变量。
样本加权问题
例4:著名的辛普森悖论(simpson–paradox)(简化版):
一所美国高校的两个学院,分别是法学院和商学院,新学期招生。人们怀疑这两个学院有性别歧视。现作如下统计:
上面三个表格显露出几个重要信息:如果看总录取率,那么男生比女生高。如果分学院看,各个学院女生录取率比男生要高。为什么?因为男生绝大多数去了商学院(209个男生,201个去了商学院),虽然男生在法学院录取比例较低,但被商学院更高的录取比例(80.1%)拉上来了(哪个子样本人数越多,其在总体中的权重越大)。
上例说明了一个深刻的道理,在上例的不同学院中,男女比例并不均衡,在样本层面出现了自选择现象,因此只能通过样本加权的方法来最终判别总体上的性别录取差异是否存在。
结语
行文至此,我们已经讨论了变量的几乎所有类型,他们中有的被当作“控制变量”来检验假说的稳健性(外生变量、抑制变量),有些则作为理论发展的工具而被单独讨论(先行变量、中介变量、调节变量)。由此可见,回归方程中,纳入什么变量,不纳入什么变量有非常深厚的方法论基础,纳入一个变量后,所关注的核心解释变量的符号、显著性的变化也意味着所纳入变量的角色的差别。
但是,还有一类变量,它严重影响我们的研究效度,而我们却无法通过将他们纳入回归方程,因为他们很可能是未知的、已知但无法度量的。这类未知或无法度量的因素,对我们的研究有致命的影响,他们多数不能通过传统的统计控制的方式解决。这个问题在经济学中常被提及,那就是“内生性”问题。内生性问题是计量经济学、统计学中因果推断领域的核心问题,对这个问题的思考,我将在未来结合数据采集结构的内容进行进一步讨论。