课程小结|尤炜: 双重差分法的基本原理及其应用

时间:2022-10-12 点击数:

以下文章来源于香樟经济学术圈 ,作者艾丽娅

本次讲座内容涵盖了DID的模型设定原理、常规检验及实践应用。

首先,尤老师向同学们介绍了自然实验的相关概念。自然实验是一种可以用来识别结构参数的外生冲击。尤老师指出,对双重差分模型而言,能否达到因果识别的效果至关重要,因此必须合理选择外生冲击。在选择外生冲击时,“影响越大、发生越突然、影响更随机(具备一定异质性)”的外生冲击,可以起到越好的效果。尤老师向同学们介绍了一些可以选做自然实验的例子,如移民冲击、(短时期大规模开展的)基础设施建设、新技术的涌现、自然灾害、战争、全球价格冲击等,其中一部分例子在后续的讲座中与知识点结合,被进一步展开讲解。

随后,尤老师以Card(1990)的论文(The Impact of the Mariel Boatlift on the Miami Labor Market)为例,介绍了DID及DDD的基本原理。根据Card,1980年马里尔升船事件使当年迈阿密的劳动力增加7%。若选取马里尔升船事件为一次准自然实验,以迈阿密为处理组,其他未受难民影响城市为对控制组,可以构建双重差分模型。估计结果显示,难民潮对迈阿密白人失业率的影响为-1.1%。

进一步地,考虑到黑人中从事低技能工种的人占比更大,而大部分难民几乎没有接受职业技能的培训,难民潮对黑人的影响与对白人的影响可能存在差异,因此可以在双重差分(DID)的基础上构造三重差分(DDD)模型。三重差分模型的估计结果表明难民潮对低技能工种人群失业率的影响为0.1%。

在此之后,尤老师结合大量经典文献,从政策变化的外生性、处理组和控制组的选择、平行趋势检验、安慰剂检验、连续型和标准误差等六个方面,对双重差分法做了深入拓展。尤老师指出,在对处理组和控制组进行选择时,一个基本的原则是二者必须尽可能可比,必要时可以尝试不同的控制组定义,观察结果是否稳健;一些匹配方法,如倾向得分匹配法、回归匹配的方法和合成控制法,尽管可以削弱偏差的影响,但也可能影响模型的可信度,令人感觉政策冲击“不够外生”。以Jia, Ma, Qin, and Wang (2020 EER)的文章(Place-based policies, state-led industrialisation, and regional development: Evidence from China's Great Western Development Programme)为例,该文章探讨了西部大开发省市对西部地区的影响。若将西部大开发战略中全部省市纳入研究范围,得到的结果将有偏,更好的选择方式是取西部大开发战略边界线东西两侧的城市。另一篇来自QJE的文章(Local Economic Development, Agglomeration Economies, and the Big Push: 100 Years of Evidence from the Tennessee Valley Authority)以田纳西河谷管理局(TVA)的大型基础设施建设为准自然实验,研究大型地区发展项目的长期影响。在该案例中,TVA项目的选择是非随机的,因此控制组有三:受提议但最终未入选的县、南部的其他地区、国内的其他地区。

因果识别是进行DID的重要目的,处理组和控制组的结果变量需具有相同的潜在趋势则是识别的重要假设,因此使用DID前应当进行平行趋势检验和安慰剂检验。平行趋势检验的要点在于,应当选择尽可能多的前置时期,选择的时间段过短可能影响模型的可信度。安慰剂检验,又称假设在某个时间点发生了某事件或政策变化,而实际上并没有发生,然后对DID模型进行估计,检验系数是否显著。进行安慰剂试验至少需要政策前两期的数据。为讲解“理想的”平行趋势检验的例子,尤老师以Michela Giorcelli(2019)的论文(The Long-Term Effects of Management and Technology Transfers)为例。该文章的背景是1952至1958年马歇尔计划美国战后对意大利开展援助,处理组的中小制造企业企业可以申请该项目,并可以决定是否派遣他们的经理到美国(管理转移),购买美国的机器(技术转让),或者同时做(管理和技术转让相结合),以5到15年为区间,可以看出接受了管理培训和技术转移的企业具有更高的存活率。“生产力计划”选择的处理组省分和试点地区具有随机性,假设没有该计划,当年进行申请的处理组省份和控制组省份将会有相同的趋势。

对“非理想”的平行趋势检验,尤老师通过讲解An, Lei , Yu Qin, Jing Wu, Wei You(2020)的文章,提出了几种应对方法,如稳健性检验减少控制变量、考察非政策断点等。

为讲解连续型DID,尤老师介绍了Richard Hornbeck (2010)的论文。在铁丝网出现前,养牛人和种庄稼的农民间存在产权界定和保护的问题,铁丝网的出现降低了耕地保护的成本。而1880年至1900年刺铁丝网的引入和普及,根据林地覆盖率的不同,对不同地区产生了不同的影响。森林覆盖率高的地区更容易制取木栅栏,因而受铁丝网影响小。在这个案例中,不同地区受政策的影响不同,发生的变化也是连续的。研究发现,森林覆盖率低的地区,耕地的状况得到了改善。

此外,尤老师说明当数据具有“分组”结构(使得误差项在组内相关)时,使用标准OLS会导致标准误差下偏。一种常见的解决方法是对标准误进行聚类,在DID情况中,通常在组(it中的i)层面上进行集群。

讲座的最后,尤老师对本次内容做了总结性发言,并回答了同学们关于科研和学习的问题。尤老师建议同学们在日常学习生活中,要保持对对新闻和历史事件的敏感度,找到事件和相应的数据,在此基础上开展进一步研究。老师精彩的讲解得到了与会同学的热烈好评,同学们表示期待有机会与尤老师进行进一步的交流与合作。

来源:香樟经济学术圈