DID是用来做政策评价常用的模型,did估计本质上是面板固定效应估计。
使用前提
- 政策不能是“一刀切”类型,即存在受政策影响的实验组和不受政策影响的对照组
- 至少两年的面板数据,如果是截面数据一般也别考虑了
du 表明了一刀切政策无法适用DID;dt表明了截面数据无法使用。
很多时候,大家在看使用DID的文献时,会发现别人的基准模型和模型(1)并不完全一致,别人的模型如下:
别人的模型里只有交互项du·dt,而缺失了du和dt,是哪里出问题了么?并没有,模型(1)和(2)本质还是一样的,且模型(2)在多年面板数据集里更为常见。模型(2)中,
为个体固定效应,更为精确地反映了个体特征,替代了原来粗糙的分组变量du;
为时间固定效应,更为精确地反映了时间特征,替代了原来粗糙的政策实施变量dt。因而,du和dt并未真正从模型中消失,只是换了个马甲。模型(2)事实上就是一个双向固定效应模型,这也是为什么DID方法一定程度上可以减轻遗漏变量偏误的原因(主要是消除那些不可观测的非时变因素,为了使估计结果尽可能准确,模型中还是要加入控制变量)。
- 两期did,数据只有两年,分别为政策实施前后;两年数据是没有办法进行平行趋势检验的。
- 多期did,数据有多于2年,实施前有n年,实施后有x年
政策效果不随时间而变的 Standard DID 的模拟
政策效果随时间而变的 Standard DID 的模拟
异时DID
在传统与经典DID的模型设定中,一个隐含假设是,处理组的所有个体开始受到政策冲击的时间均完全相同。但有时也会遇到每位个体的处理期不完全一致的情形(heterogeneous timing);比如,某项试点政策在不同城市分批推出。此时,可使用“异时DID”(heterogeneous timing DID)。
异时DID的关键在于,既然每位个体的处理期不完全一致,则处理期虚拟变量也因个体而异,故应写为(既依赖于个体 i,也依赖于时间 t)。具体而言,异时DID的模型设定为
。这意味着,第1位个体从第3期开始受到政策处理,第2个体从第4期开始受到政策冲击,而第3位个体从未受到政策冲击(属于控制组);以此类推。
- 广义did
以上各种DID方法均假设存在处理组与控制组的区别,但有时某项政策在全国统一铺开,此时只有处理组,并没有控制组,是否还能使用DID呢?答案是“能”,可以尝试“广义DID”(generalized DID)。
稳健性检验:
即便处理组和对照组在政策实施之前的趋势相同,仍要担心是否同时发生了其他可能影响趋势变化的政策,也就是说,政策干预时点之后处理组和对照组趋势的变化,可能并不真正是由该政策导致的,而是同时期其他的政策导致的。这一问题可以概括为处理变量对产出变量作用机制的排他性,对此,可以进行如下的检验:
A. 安慰剂检验,即通过虚构处理组进行回归,具体可以:a)选取政策实施之前的年份进行处理,比如原来的政策发生在2008年,研究区间为2007-2009年,这时可以将研究区间前移至2005-2007年,并假定政策实施年份为2006年,然后进行回归;b)选取已知的并不受政策实施影响的群组作为处理组进行回归。如果不同虚构方式下的DID估计量的回归结果依然显著,说明原来的估计结果很有可能出现了偏误。
B. 可以利用不同的对照组进行回归,看研究结论是否依然一致。
C. 可以选取一个完全不受政策干预影响的因素作为被解释变量进行回归,如果DID估计量的回归结果依然显著,说明原来的估计结果很有可能出现了偏误。等等。
尽管DID的基本原理很简单,但其实际运用十分灵活,并不是上面一点内容可以介绍完的,大家应当多去看相关的文献,然后多做总结。关于DID的一些扩展内容,比如DDD、PSM-DID等,以后再跟大家细说。
代做DID分析, 联系 扣 29997442