什么是双重差分模型?

如题所述

举例:

现在要修一条铁路,铁路是条线,所以必然会有穿过的城市和没有被穿过的城市。记Di=1 如果城市i被穿过,Di=0 如果城市i没有被穿过。
现在我们比较好奇铁路修好以后,被铁路穿过的城市是不是经济增长更快了?我们该怎么做呢?
一开始的想法是,我们把Di=1的城市的GDP加总,减去Di=0的城市的GDP加总,然后两者一减,即E(Yi|Di=1)-E(Yi|Di=0),这样我们就算出了两类城市的GDP的平均之差。
这样做不用说肯定有问题。万一被铁路穿过的城市在建铁路之前GDP就高呢?为了解决这个问题,我们需要观察到至少两期,第一期是建铁路之前,第二期是建铁路之后。我们先把两类城市的GDP做两期之差,即:

这是第一次差分,经过这一步,我们实际上算出了每个城市GDP的增长(率,如果取log之后),也就是GDP的趋势。
完了之后,计算:

这是第二次差分。这一步就把两类城市在修建铁路之前和之后的GDP增长率的差异给算出来了,这就是我们要的处理效应,即修建铁路之后对城市经济的促进作用。
这个东西你还可以换一个写法。记T=1 如果时间为建铁路之后,T=0如果时间为建铁路之前,那么我们可以得到一个表:


Treated代表在某一期,某一类城市是不是建了铁路。第零期肯定没有建铁路,第一期只有Di=1的城市建了铁路。所以Treated=Di*T。因此我们把方程写成:

对时间差分,得到:

再次差分,取期望:

可见,gamma就是我们想要估计的处理效应。
所以实际做的时候,可以直接跑

这个式子的回归,得到的交叉项的系数就是所要估计的处理效应。
用一个图表示就是:

所以看清楚了,这里DID最关键的假设是common trend,也就是两个组别在不处理的情况下,y的趋势是一样的。
那么你会说了,铁路穿过的城市可能本身GDP也高,而GDP高的城市按照理论GDP增长率可能更高可能更低,所以common trend的假设可能是不对的,那怎么办?
如果这个问题存在,我们可以进一步假设在控制了某些外生变量之后,common trend是对的,比如上个问题,我们可以控制城市在t=0期的GDP level。当我们控制其他变量之后,自然不能直接减两次了,我们需要用上面说的回归式子,即run the following OLS:

1、双重差分模型(difference-in-difference,DID)近年来多用于计量经济学中对于公共政策或项目实施效果 的定量评估。

2、通常大范围的公共政策有别于普通科研性研究,难以保证对于政策实施组和对照组在样本分配上的完全随机。

3、非随机分配政策实施组和对照组的试验称为自然试验(naturaltrial),此类试验存在较显著的特点,即不同组间样本在政策实施前可能存在事前差异,仅通过单一前后对比或横向对比的分析方法会忽略这种差异,继而导致对政策实施效果的有偏估计。

4、DID模型正是基于自然试验得到的数据,通过建模来有效控制研究对象间的事前差异,将政策影响的真正结果有效分离出来。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2023-10-16

双重差分(Differences-in-Differences,DID),其常用于政策评估效应研究,比如研究‘鼓励上市政策’,‘开通沪港通’,‘开通高铁’,‘引入新教育模式’等效应时,分析效应带来的影响情况。

比如:两类地区A和B,在2020年A类地区没有开通高铁,B类地区开通高铁。那么开通高铁对于GDP的影响情况如何呢?涉及两个关键数据,分别是Treated和Time,此处Treated为地区(A和B两个地区),以及时间项Time(高铁开通前和开通后)。同时研究‘开通高铁’参于gdp的影响,那么被解释变量Y即为gdp,与此同时还涉及可选的控制变量(控制变量为可选项,多数情况下并不需要),比如教育投入,人口或对外投资情况等,如下表说明。

    特别提示

    Treated只能为数字0或1,且一定包括此2个数字。其用于标识研究‘效应’对应的组别,数字0标识‘控制组’,数字1标识‘实验组’,一定需要这样处理。

    Time只能为数字0或1,且一定包括此2个数字。其用于标识研究‘时间’对应的组别,数字0标识‘before’(实验前),数字1标识‘after(实验后),一定需要这样处理。

理论上,双重差分研究可在很大程度上避免数据内生性问题。‘政策效应’通常为外生项,因而不存在双向因果关系,比如开通高铁影响gdp,gdp同时影响开通开通。与此同时,双重差分也有着一定的前提性要求,通常其希望满足‘平行趋势假设’(Parallel Trend Assumption),即time项为0时,即比如开通高铁前,A类和B类两类地区的gdp数据需要无明显的差异性。

至于‘平行趋势假设’(共同趋势)的检验,其有多种检验方式。包括t 检验法,‘交叉项’显著性检验法,F 统计量检验法,图示法。具体说明如下:

针对‘交互项显著性检验法’或‘F 统计量检验法’,时间项可能仅为2期(实验前和实验后),也可能为多期m期(m>2),那么哑变量设置后,放入分析的交互项为‘实验前时的交互项’,如下表说明:

如果是使用t 检验法,SPSSAU在进行DID分析时默认有提供,如果是使用‘交互项显著性检验法’或者‘F 统计量检验法’,可先将时间项作哑变量处理后,与treated项作交互项,然后进行线性回归(SPSSAU通用方法里面的线性回归或计量研究里面的OLS回归均可)。如果是使用‘图示法’,则使用SPSSAU可视化->簇状图完成。

关于使用SPSSAU簇状图查看平行趋势,其适用于多期数据(即有多年的数据),类似操作如下图所示:

簇状图结果如下图:比如2016年是政策点,2016年以前实验组和控制组的“数据走势情况”大体一致则说明满足平行性趋势,图示法比较直观但有一定主观性,通常情况下只要政策点之前的数据走势大致一致即可。

双重差分的理论请参考:

    双重差分法DID,其通常用于政策效应类研究。共涉及两项,分别是实验组别treated(数字0表示控制组,数字1表示实验组),和时间项time(数字0表示实验前,数字1表示实验后)。一般希望在实验前即time为0时,实验组别数据基本保持一致性,即满足‘平行趋势假设’。‘平行趋势假设’检验有多种方式,建议查看本页面中相关说明。

    比如本案例可使用SPSSAU的簇状图进行‘平行趋势假设’查看,如下图可以看到,实验前时两个组别的‘从业人数’即效应水平基本完全一致,说明满足‘平行趋势假设’,因而可以继续分析,当然也可使用实验前时,控制组和实验组效应值的差异情况进行检验,SPSSAU默认有提供。

本案例操作截图如下,案例中带3个控制变量,如果没有控制变量可直接不放入即可,如下:

相似回答