计量与stata四天班control method_第1页
计量与stata四天班control method_第2页
计量与stata四天班control method_第3页
计量与stata四天班control method_第4页
计量与stata四天班control method_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、tt高级计量经济学及应用第十一讲控山东大学经济学院q/:econometrics-sa腾讯课堂:https:/2017/4/241控评估某政策实施于某地区的效应The counterfactual framework:假想该地区如果未受政策干预将会怎样,二者之差即为“处理效应”(treatment effect)寻找控制组(control group),在各方面与受政策地区相似却未受干预的其他地区,作为处理组(treated group)的反事实替身2017/4/242选择控制组的与随意性通常很难找到最理想的一个控制地区(control region),在方面近于处理地区(treated re

2、gion)。:、广州、?如何选择控制组存在一定的随意性与(ambiguity);、广州、的相似度也不尽相同。2017/4/243SCM的Abadie and Gardeazabal (2003)提出“合”(synthetic control method)。成控虽无法找到的最佳控制地区,但可对中国的若干大城市进行适当的线性组合,构造一个更为优秀的“控制地区”(synthetic control region),并将“真实北京”与“成控”进行对比,故名“合”。2017/4/244源于活动的计量方法AG (2003)以SCM研究1975年之后,西班地区(Basue countr牙)活动的经济成本使

3、用西班牙其他地区的线性组合来构造合成的控制地区,并使控制地区的经济特征与活动爆发前地区尽可”的人 ”进行对比。能相似,然后把此后“均GDP演化与“真实2017/4/245一个处理地区假设共有 (1+J ) 个地区,其中第 1 个地区为受到活动冲击地区。其余 J 个西班牙地区未受冲击(在此 J = 16潜在的控制组,称为“donor),pool” 。潜在假定:活动仅影响地区2017/4/246记控制地区的权重向量wJ 1 w w2其中wj非负,表示第 j 个地区在重之和为 1克地区所占的权重;且所w 的不同取值即不同的控制地区控制”(synthetic control),简称“2017/4/24

4、7结果变量 ( y ) 与变量2017/4/248活动之前的经济特征在地区爆发活动之前,记其各为向量 x1(K1维列向测变量的平均量,下标 1 表示“treated region”),即上表第(1)列的数值(除了人均GDP)。将西班牙其他地区相应变量的平均值记为矩阵 X0(KJ 维矩阵,下标 0 表示“control region”),其中第 j 列为第 j 个地区的相应取值。2017/4/249如何选择权重选择权重 w ,使得 X0w尽可能地接近于 x1,即经过之后,控制地区的经济特征应尽量接近处理地区。 X0w)(x1 X0w)为度量此距离,可使用二次型 (x1但x1中每个变量对于 y 的

5、能力有大小之别,应享有不同的权重。2017/4/2410最优权重 w*考虑有约束的最小化问题:min (x1 X0 w)V(x1 X0 w)wJ 1 wj j 2wj 0, j 2, J 1; 1s.t.V 为(KK)维对角矩阵,对角线元素皆非变量对于人均GDP的负,反映相应的w*(V)。相对重要性。数值求解2017/4/2411如何选择 V选择最优的V ,使得在活动全面爆发地区的人均GDP与真实之前,地区尽量接近记 z1为 (101) 维列向量,包含地区在1960-1969年(共10年)的人均GDP;而记 Z0为 (10J) 维矩阵,其中每列为相应控制地区在1960-1969年的人均GDP。

6、2017/4/2412最小化均方误差以 Z0 w*(V)z1 ,并考虑最小化“均方误差”(Mean Squared PredictionError,简记MSPE):1 zZ w (V)z Z w (V)*minV101010记最优解 w*(V*) ,即的最优权重。地区2017/4/2413最优权重的估计结果AG (2003)发现,只有两个地区的权重为正(Catalonia,权重0.8508,加)与马德里(Madrid,权重0.1492),其他地区的权重均为0。直观上,Catalonia与Madrid的经济特征与地区最为相似。2017/4/2414比较真实与地区地区在样本期间(假设为T期)的记人

7、均GDP为向量y1(T1维列向量)。记其他地区在样本期间的人均GDP为矩阵 Y0(TJ 维矩阵),其中每列为相应地区的人均GDP。地区的人均GDP序列 Y w*y*102017/4/24152016解读在1975年大规模(实线)与活动爆发之前,真实(虚线)的人均GDP十分接近。二者在1975年后即开始分岔,在1980与1990年代,真实低约10%。的人均GDP比2017/4/2417SCM的理论Abadie et al. (2010)研究SCM的理论基础依然假设共有 (1+J ) 个地区。其中,第1个地区受到政策干预(多个地区受干预,可合并为一个大地区;或分别估计)其余 J 个地区未受冲击(d

8、onor pool)2017/4/2418因子模型记 yit为地区 i 在第 t 期实际观测的结果变量Nity为地区 i 在第 t 期如果未受政策干预的记结果变量(上标 N 表示未受干预),由以下因子模型(factor m)决定: zu y Nttitiitit(1)(2)(3)(4)2017/4/2419因子模型(续)t为不可观测的共同因子(commonfactor),也称为“时间固定效应”zi 为可观测向量(不受政策干预影响,不随时间而变,例如干预之前的变量之平均值),t, 表明 z为未知参数向量(随时间而变)Ny对于的作用随时间而变iit2017/4/2420因子模型(续2)为不可观测的

9、共同因子(commontfactors),可理为不同地区面的同冲击(common shocks),比如它的两个分量分别表示技术冲击(technologicalshocks)与金融(finanl crises)各地区对于共同冲击 的反应不相同,以向t ui量 ui 表示。称为“交互固定效应”e()2017/4/2421SCM的基本性质控制 w,使得它能够完美如果能找到地政策干预前处理地区的经济特征与结果变量,则随着干预前的期数增大,SCM是渐近无偏的。反之,如果控制无法很好地干预前处理地区的经济特征与结果变量,则不建议使用SCM。2017/4/2422的Sa命令控(安装)sscinstallsy

10、nth,replacesynthyx1x2x3,trunit(#)trperiod(#)counit(numlist)xperiod(numlist)mspeperiod()figureresultsperiod()nestedalloptkeep(filename)y为结果变量,x1x2 x3为变量。必选项“trunit(#)”指定处理地区(trunit表示treated unit),必选项“trperiod(#)”指定政策干预开始的时期(trperiod表示treated period)。2017/4/2423命令Synth“counit(numlist)”指定潜在的控制地区(counit

11、表示controits),默认为处理地区以外的所有地区。“xperiod(numlist)”指定将变量进行平均的期间,默认为政策干预开始之前的所有时期。误差(MSPE)“mspeperiod()”指定最小化均方的时期,默认为政策干预开始之前的所有时期。“figure”将处理地区与控制的结果变量画时间趋势图。“resultsperiod()”指定此图的时间范围(默认为整个样本期间)。2017/4/2424命令Synth(续)“nested”使用嵌套的数值方法寻找最优的控制(使用此选项),比默认方法更费时间,但可能更精确使用选择项“nested”时,如果再加上选择项“allopt”(即“neste

12、dallopt”),则比单独使用“nested”还要费时间,但精确度可能更高。“keep(filename)”将估计结果(比如,控制的权重、结果变量)存为另一Sa数据集(filename.dta),以便进行后续计算。2017/4/2425加州控烟法的案例Abadie et al. (2010)将SCM应用于研究加州1988年第99号控烟法(Proition 99)的效果该法将加州的香烟消费税(cigarette excise tax)提高了每包25美分,将所得收入专项用于控烟的教育与宣传,并了一系列关于室内清洁空气的地方1970-2000年的州际面板数据2017/4/2426选择控制地区由于M

13、assachusetts, Arizona, Oregon与Florida的在1989-2000期间也引入了正式的控烟立州法,故将此四州从donor pool中去掉。还去掉了在1989-2000期间将香烟消费税提高了每包50美分及以上的州(Alaska, Hawaii, Maryland, Michigan, New Jersey, New York,Washington),以及特区。剩下38个州作为潜在的控制地区(即使加上去掉的州,结果也依然稳健)。2017/4/2427主要变量结果变量为cigsale(人均香烟消费量,包/年)变量包括retprice(平均香烟零售价格)、e(人均收入对数)

14、、age15to24(15-24岁所占总,年轻人为吸烟主力)、beer(人均啤酒消费量,烟酒不分家)。均为1980-1988年的州平均值。使用1975、1980与1988年的人均香烟消费量作为三个额外的2017/4/24变量。28SCM估计(打开数据集)(设为面板数据)sysusesmokingxtsetseyearsynthcigsaleretpriceeage15to24beercigsale(1975)cigsale(1980)cigsale(1988),trunit(3)trperiod(1989)keep(smoking_synth)2017/4/2429命令解读“cigsale(1

15、975)cigsale(1980)cigsale(1988)”分别表示人均香烟消费在1975、1980与1988年的取值;“trunit(3)”表示第3个州即加州为处理地区;“trperiod(1989)”表示控烟法在开始实施变量在1980-“xperiod(1980(1)1988)”表示将1988年期间进行平均,其中“1980(1)1988”表示始于1980年,以1年为间隔,而止于1988年“keep(smoking_synth)”将估计结果存为Sa数据集smoking_synth.dta(放在Sa的当前工作路径)2017/4/2430Unit Weights:Co_NoUnit_Weigh

16、tAlabamaArkansas Colorado00.161ConnecticutDelaware.06800GeiaI0Illinoisna Iowa Kansas0000Kentucky LouisianaMaineMinnesota0000Mississippi Missouri Montana Nebraska NevadaNew HshireNew Mexico North Carolina00.2010.235000000North DakoOhi2017/4/2431Oklahoma最优权重 w*上表显示,大多数州的权重为0,而只有以下五个州的权重为正,即Colorado0.1

17、61,Connecticut (0.068),Montana (0.201),Nevada (0.235)与Utah (0.335)此结果与Abadie et al. (2010)汇报的结果非常接近(细微差别或由于计算误差)。2017/4/2432比较加州与加州的变量PredictorBalance:2017/4/2433Treated Syntheticretpricee age15to24beer cigsale(1975) cigsale(1980) cigsale(1988)89.4222289.4146410.076569.858694.1735324.173544424.2824.

18、21326127.1127.0633120.2120.454590.191.6356比较加州与加州的结果变量1970198019902000year2017/4/2434cigsale 804060100120Californiasynthetic California计算处理效应打开另一Sa程序,调用已存数据集smoking_synth.dta,计算加州与加州人均香烟消费之差(即处理效应)usesmoking_synth.dta,clear(如果不打开另一S数据集smoking.dta)a程序,则此数据集将覆盖原有的geneffect=_Y_treated-_Y_synthetic(“_Y_

19、treated”与“_Y_synthetic”分别表示处理地区与控制的结果变量)2017/4/2435画图labelvariable_time“year”labelvariableeffectgapinper-capitacigarettesales(inpacks)(为画图更漂亮,加上时间变量与处理效应的,可使用变量管理器来方便地加)lineeffect_time,xline(1989,lp(dash)yline(0,lp(dash)(画处理效应的时间趋势图,并在横轴分别画虚线)处与纵轴0处2017/4/2436处理效应在1989-2000,加州的人均年香烟消费减少20多包,大约下降25%,

20、经济效应显著(economically significant)19701980199020002017/4/2437yeargap in per-capita cigarette sales (in packs)-30-20-10010稳健性检验Abadie et al. (2010)加入的变量,比如失业率、收入不、贫困率、福利转移、率、相关的逮捕率、香烟税、密度等;发现结果依然稳健。地区之间无互相影响(noerference betn units)的假定可能不满足,比如加州的反烟运动可能波及其他州,烟草行业可能将其他州的香烟投入到加州,乃至从其他便宜香烟到加州。Abadie et al.

21、(2010)根据史实对此进行了探讨,并认为其效应均不大,至少不可能导致上图中如此大的处理效应。2017/4/2438统计推断Abadie et al. (2010)认为,在比较案例研究中,由于潜在的控制地区数目通常并不多,故不适合使用大样本理论进行统计推断。使用“安慰剂检验”(placebo test)来进行统计检验,类似于统计学中的“排列检验”(permu用于任何样本容量。ion test),适医学随机实验:让控制组服用安慰剂(比如,糖丸),不让参与者知道服用的究竟是真药还是安慰剂,避免心理作用影响实验效果,称为“安慰剂效应”(placebo effect)2017/4/2439安慰剂检验控所估计的控烟效应,是否由偶然所驱动?如果从donor pool随机抽取一个州(而不是加州)进行合成控制估计,能否得到类似规模的效应?进行一系列的安慰剂检验,依次将donor pool中的每个州作为假想的处理地区(假设也在1988年通过控烟法),而将加州作为控制地区对待,然后使用法的效应,也称为“安慰剂效应”。控估计控烟得到安慰剂

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论