[关闭]
@liuyuxi 2021-05-05T14:27:48.000000Z 字数 3802 阅读 62

合成控制法笔记(二)

计量经济学


一、以往文献与可用参考资料

以往文献

1.刘甲炎,范子英.中国房产税试点的效果评估:基于合成控制法的研究[J].世界经济,2013,36(11):117-135.
2.

可用参考资料

1.合成控制法(SMC)案例及代码示例(含安慰剂检验)
2.用stata做合成控制法

二、安慰剂检验的目标与意义

  安慰剂检验最初的意义在于排除心理因素对实验结果的影响,而在微观计量经济学中主要是为了避免我们看到的处理效应并非政策干预的结果,而是由一些其他偶然因素造成的后果。
  而为了排除偶然因素,前提是要求对控制组的合成控制效果至少不能太差,否则安慰剂检验会无意义,因此需要排除掉拟合效果不好的控制组。
  双重差分安慰剂检验与合成控制安慰剂检验二者的实质其实均属于一种随机置换检验(permutation test),其实都是Fisher的精确P检验方法在几种因果推断方法下的应用。3

三、安慰剂检验的四种操作

作法一: 排序检验(Permutation Test)法 所有组的处理效应对比

1刘乃全,吴友.长三角扩容能促进区域经济共同增长吗[J].中国工业经济,2017(06):79-97.
2刘友金,曾小明.房产税对产业转移的影响:来自重庆和上海的经验证据[J].中国工业经济,2018(11):98-116.
  此法旨在确保得到如同处理组一致的结果是小概率事件,从而排除其他偶然因素的干扰。比如在刘友金,曾小明(2018)剔除了处理前RMSPE过高的组之后,发现处理组表现与控制组迥异,可知获得类似处理组表现的概率为1/30(此时处理组、控制组共30组),此概率的作用类似于显著性水平(犯“第一类错误(弃真错误)”的概率),或者说P值(原假设被拒绝所需要的最小显著性水平),给定显著性水平为5%,则此时1/30的概率显然已经落入“拒绝域”(在3.33%的较小的显著性水平恰可被拒绝,则在5%的较大的显著性水平下更应该拒绝),即此时可以拒绝原假设“处理组的表现是其他偶然因素导致的”。
此处输入图片的描述

  房产税的政策效应评估绝对是合成控制法的一个极佳的例子,之前也给大家推荐过两篇有关房产税政策效应评估的论文,一篇是刘甲炎和范子英(2013)的《中国房产税试点的效果评估:基于合成控制法的研究》,另一篇是稍晚点的,刘友金和曾小明(2018)的《房产税对产业转移的影响:来自重庆和上海的经验证据》。两篇论文都使用的是合成控制法来评估房产税政策,尽管各自的结果变量y有所不同,但是其思想内核都是一致的,因为用合成控制法来评估房产税政策是再合适不过了。但是,大家可能就会发现刘甲炎和范子英(2013)只用合成控制法评估了重庆的房产税政策,而没有评估上海的房产税政策,刘友金和曾小明(2018)倒是尝试评估了上海的房产税对产业转移的影响,但是效果较为糟糕。
..........
  我们先要追根溯源至合成控制法控制组的权重问题上来。与双重差分法不同,合成控制法的控制组是数据驱动的,用房产税来举例说明就是,我们是根据数据自身来选择哪些城市可以成为上海和重庆的控制组,同时根据相近程度赋予相应权重。最为重要的是,合成控制法要求权重必须在0-1之间(权重和为1),因而,如果处理组特征远远大于或小于控制组个体特征(极端样本比Y_max还大,或比Y_min还小),我们将无法无法找到合适的权重对控制组进行加权平均拟合。
  因此,该方法就不能用于上海房产税政策效应的评估,因为上海的房价在中国房价中基本处于第一位置,其他经济特征也比较特殊,无论是评估房产税对抑制房价上涨的作用还是评估房产税对产业转移的影响,我们都很难从其他城市中找到与上海经济特征相似的样本,因此就无法选择控制组和相应的权重,进而无法构造出上海的合成控制对象,就算构造出来了也会导致政策实施前的拟合效果非常差。如果合成控制对象没能拟合好房产税政策实施前的预测变量值,最后得到的“处理效应”就不是真实的处理效应,而仅仅是由拟合效果不好所导致的, 与房产税政策无关。
引自江河:《为什么合成控制法不适用于上海房产税政策效应评估?》

作法二:安慰剂法(Placebo Test) 所有组MSPE大小对比

刘乃全,吴友.长三角扩容能促进区域经济共同增长吗[J].中国工业经济,2017(06):79-97.第7页详细说明了此法与前法的区别与细节:

  两种方法主要区别在于控制分析单元的选取,前者选择与目标分析单元最相似的控制分析单元,后者则随机选择控制分析单元
........
  以整体城市为例,在186个控制组城市中,其合成权重不为0的控制组城市为182个,因此,其权重均值为0.0055(1/182),整体城市选择权重大于0.0055的14个城市来进行安慰剂检验(因为权重越大则代表与处理组越接近,此方法只选择与处理组较接近的组)。.......类此分析,原位城市采用权重大于0.0071(1/141)的11个城市、新进城市采用权重大于 0.0054(1/184)的21个城市分别进行安慰剂检验。

此法只论权重,而不管MSPE,确属另一种思路。
安慰剂法—目标分析单元与相似控制单元的RMPSE对比
图片来源:中国知网,可惜原文并未提供此图相应code。

作法三:使用synth_runner命令1 2

作法三与作法一在原理上更为接近。
此方法中p值的计算是将控制组中安慰剂处理效应大于处理组处理效应的个数,除以控制组的个体数。1

synth_runner命令中的几个选项:
(1) trends选项:可以使synth命令根据结果变量(outcome variable)的时间顺序来进行匹配,具体是通过处理前最后一期(last pretreatment period)的结果变量值为1,并相应等比例缩放每个结果变量值的方式来实现。
(2)training_propr(real)选项:此选项可以自动生成处理前选定期数结果的预测变量,并将这些变量纳入到synth命令中去。在(real)中输入位于[0,1]之间的任何数,则synth_runner命令会将选定的几期作为训练期,具体是从最早一期开始向后算起,直到所有包括的期数占处理前各期的比例等于(real)中设定的实数为止,将这几期设定为“训练期”(training period),并将处理前各期的剩余部分作为“检验期”(validation period)。如将(real)设定为1,则会将处理前所有期结果的全部预测变量均纳入synth命令中,此时可能会造成原有的控制变量/预测变量失去意义。
(3)gen vars选项可以生成一系列新变量,诸如lead depvar_synth effect pre_rmspe post_rmspe等。
(4)lead表示试点后的动态时间,lead=1即试点后第一期。
(5)pre_limit_mult(real)的作用是在进行安慰剂检验时,删除均方误差过高的控制组对象,使用此选项需要指明相应的倍数(real),可以通过指定控制组的pretreatment RMSPE(Root Mean Square Prediction Error)不超过处理组的real倍(也即MSPE不超过real2 倍)来实现。
普通合成控制相应Do文档2:
(附注:结合连享会synth_runner文章,个人感觉leadtrends应该都是在处理时间不一致的时候需要指定,才会充分发挥作用。)

  1. sysuse smoking
  2. xtset state year
  3. synth_runner cigsale beer(1984(1)1988) ///
  4. lnincome(1972(1)1988) retprice age15to24 ///
  5. cigsale(1988) cigsale(1980) cigsale(1975), /// *cigsale(1975) cigsale(1980) cigsale(1988) 分别表示人均香烟消费在1975、1980与1988年的取值。
  6. trunit(3) trperiod(1989) gen_vars
  7. single_treatment_graphs, trlinediff(-1) effects_ylabels(-30(10)30) /// *查看合成效果
  8. effects_ymax(35) effects_ymin(-35)
  9. effect_graphs, trlinediff(-1 // 绘制加州与合成加州人均香烟消费之差(即处理效应)
  10. pval_graphs //统计推断图,原始P值与标准化P值的结果。

多个处理组,且不同处理时间的合成控制2

  1. sysuse smoking
  2. xtset state year
  3. gen byte D = (state==3 & year>=1989) | (state==7 & year>=1988)
  4. synth_runner cigsale retprice age15to24, d(D) pred_prog(my_pred) trends training_propr(`=13/18') drop_units_prog(my_drop_units) xperiod_prog(my_xperiod) mspeperiod_prog(my_mspeperiod)
  5. effect_graphs
  6. pval_graphs

作法四:连玉君(2020)方法

参考文献

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注