倾向值匹配模型 (PSM模型)PPT课件

上传人：海*** IP属地：广东上传时间：2022-02-28 格式：PPT 页数：46 大小：842KB 积分：12 举报 版权申诉

已阅读5页，还剩41页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、2021/3/91倾向值匹配法（PSM）2021/3/92Q：为什么要使用PSM？ A：解决样本选择偏误带来的内生性问题例：上北大有助于提高收入吗？样本选择偏误：考上北大的孩子本身就很出色（聪明、有毅力、能力强）解决方法：样本配对2021/3/93配对方法同行业（一维配对）同行业、规模相当（二维配对）同行业、规模相当、股权结构相当、（多维配对）？ PSM：把多个维度的信息浓缩成一个（降维：多维到一维）2021/3/94配对过程中的两个核心问题（1） Q1：哪个样本更好一些？A1:Sample2较好：比较容易满足共同支撑假设（common support assumption）202

2、1/3/95配对过程中的两个核心问题（2） Q2：stu c1,c2,c3三人中，谁是stu PK的最佳配对对象？ A2：stu c3是最佳配对对象，比较容易满足平行假设（balancing assumption）2021/3/96ATT（Average Treatment Effect on the Treated）平均处理效应的衡量运用得分进行样本匹配并比较，估计出ATT值。 ATT=EY(1)-Y(0) |T=1Y(1):Stu PK 上北大后的年薪Y(0): Stu PK 假如不上北大的年薪可观测数据可观测数据不可观测数据，不可观测数据，采用配对者的采用配对者的收入来代替收入来代替A

3、TT=12W-9W=3W2021/3/97实例介绍2021/3/98实例介绍研究问题：培训对工资的效应基本思想：分析接受培训行为与不接受培训行为在工资表现上的差异。但是，现实可以观测到的可以观测到的是处理组接受培训的事实，而如果处理组没有接受培训会怎么样是不可观测的不可观测的，这种状态称为反事实。匹配法就是为了解决这种不可观测的事实的方法。2021/3/99实例介绍分组：在倾向值匹配法中，根据处理指示变量将样本分为两个组。处理组处理组，在本例中就是在NSW（国家支持工作示范项目）实施后接受培训的组；控制组控制组，在本例中就是在NSW实施后不接受培训的组。研究目的：通过对处理组和对照组的

4、匹配，在其他条件完全相同的情况下，通过接受培训的组（处理组）与不接受培训的组（控制组）在工资表现上的差异来判断接受培训的行为与工资之间的因果关系。2021/3/910变量定义变量变量定义定义treat接受培训（处理组）表示接受培训（处理组）表示1，没有接受培训（控制组）表示，没有接受培训（控制组）表示0age年龄年龄educ受教育年数受教育年数black种族虚拟变量，黑人时，种族虚拟变量，黑人时，black=1hsip民族虚拟变量，西班牙人时，民族虚拟变量，西班牙人时，hsip=1marr婚姻状况虚拟变量，已婚，婚姻状况虚拟变量，已婚，marr=1re741974年实际工资年实际工资re751

5、975年实际工资年实际工资2021/3/911变量定义re781978年实际工资年实际工资u74当在当在1974年失业，年失业，u74=1agesqage*ageeducsqeduc*educre74sqre74*re74re75sqre75*re75u74blcaku74*blcak2021/3/912倾向打分2021/3/913OLS回归结果工资的变化到底是来自个体的异质性工资的变化到底是来自个体的异质性性还是培训？性还是培训？2021/3/914倾向打分 1.设定宏变量(1)设定宏变量breps表示重复抽样200次命令：global breps 200(2)设定宏变量x，表示age ag

6、esq educ educsq married black hisp re74 re75 re74sq re75sq u74black命令：global x age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black2021/3/915倾向打分 2.通过logit模型进行倾向打分命令：pscore treat $x,pscore(mypscore) blockid(myblock) comsup numblo(5) level(0.05) logit注:$表示引用宏变量2021/3/916pscore结果2

7、021/3/917倾向值分布2021/3/918倾向值分布2021/3/919block中样本的分布2021/3/920block中的描述性统计2021/3/921运用得分进行样本匹配并比较2021/3/922方法一：最邻近方法方法一：最邻近方法（nearest neighbor matchingnearest neighbor matching）含义：最邻近匹配法是最常用的一种匹配方法，它把控制组中找到的与处理组个体倾向得分差异最小的个体，作为自己的比较对象。优点：按处理个体找控制个体，所有处理个体都会配对成功，处理组的信息得以充分使用。缺点：由于不舍弃任何一个处理组，很可能有些配对

8、组的倾向得分差距很大，也将其配对，导致配对质量不高，而处理效应ATT的结果中也会包含这一差距，使得ATT精确度下降。 2021/3/923方法一：最邻近方法方法一：最邻近方法（nearest neighbor matchingnearest neighbor matching）命令 set seed 10101（产生随机数种子） attnd re78 treat $x,comsup boot reps($breps) dots logit2021/3/924方法一：最邻近方法方法一：最邻近方法（nearest neighbor matchingnearest neighbor matchin

9、g）2021/3/925方法二：半径匹配法方法二：半径匹配法（radius matchingradius matching）半径匹配法是事先设定半径，找到所有设定半径范围内的单位圆中的控制样本，半径取值为正。随着半径的降低，匹配的要求越来越严。2021/3/926方法二：半径匹配法方法二：半径匹配法（radius matchingradius matching）命令 set seed 10101 attr re78 treat $x,comsup boot reps($breps) dots logit radius(0.001)2021/3/927方法二：半径匹配法方法二：半径匹配法（r

10、adius matchingradius matching）2021/3/928方法三：分层匹配法方法三：分层匹配法（stratification matchingstratification matching）内容：分层匹配法是根据估计的倾向得分将全部样本分块，使得每块的平均倾向得分在处理组和控制组中相等。优点：Cochrane ,Chambers（1965）指出五个区就可以消除95%的与协变量相关的偏差。这个方法考虑到了样本的分层问题或聚类问题。就是假定：每一层内的个体样本具有相关性，而各层之间的样本不具有相关性。缺点：如果在每个区内找不到对照个体，那么这类个体的信息，会丢弃不用。总

11、体配对的数量减少。2021/3/929方法三：分层匹配法方法三：分层匹配法（stratification matchingstratification matching）命令 set seed 10101 atts re78 treat,pscore(mypscore) blockid(myblock) comsup boot reps($breps) dots2021/3/930方法三：分层匹配法方法三：分层匹配法（stratification matchingstratification matching）2021/3/931方法四：核匹配法方法四：核匹配法（kernel matchin

12、gkernel matching）核匹配是构造一个虚拟对象来匹配处理组，构造的原则是对现有的控制变量做权重平均，权重的取值与处理组、控制组PS值差距呈反向相关关系。2021/3/932方法四：核匹配法方法四：核匹配法（kernel matchingkernel matching）命令 set seed 10101 attk re78 treat $x,comsup boot reps($breps) dots logit2021/3/933方法四：核匹配法方法四：核匹配法（kernel matchingkernel matching）2021/3/934psmatch22021/3/935

13、匹配变量的筛选 1.设定宏变量设定宏变量x，表示age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black命令：global x age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black2021/3/936匹配变量的筛选 2.初步设定 logit treat $x2021/3/937匹配变量的筛选 3.逐步回归 stepwise,pr(0.1):logit treat $x2021/3/938ps值的计算 psmatc

14、h2 treat $x,out(re78) 倾向得分的含义是，在给定X的情况下，样本处理的概率值。利用logit模型估计样本处理的概率值。概率表示如下： P(x)=PrD=1|X=ED|X2021/3/939匹配处理组最近邻匹配命令：psmatch2 treat $x（if soe=1）,out(re78) neighbor(2) ate 半径匹配命令：psmatch2 treat $x,out(re78) ate radius caliper(0.01) 核匹配命令：psmatch2 treat $x,out(re78) ate kernel2021/3/940匹配处理组满足两个假

15、设：A共同支撑假设B平行假设2021/3/941ATT（平均处理效应的衡量）以半径匹配为例：psmatch2 treat $x,out(re78) ate radius caliper(0.01)1、处理组平均效应（、处理组平均效应（ATT）2、控制组平均效应（、控制组平均效应（ATU）3、总体平均效应（、总体平均效应（ATE）2021/3/942ATT（平均处理效应的衡量）匹配前后变量的差异对比命令：pstest re78 $x（pstest re78 $x,both graph）2021/3/943匹配前后密度函数图twoway (kdensity _ps if _treat=1, legend(label(1 Treat) (kdensity _ps if (_wei!=1&_wei!=.), legend(label(2 Control), xtitle(Pscore) title(After Matching)twoway (kdensity _ps if _treat=1, legend(label(1 Treat) (kdensity _ps if _treat=0, legend(label(2 Control),xtitle(Pscore) title(Before Matching)2021/3/944运用bootstrap获得

人人文库> 全部分类> 专业文献 > 通信电子

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

倾向值匹配模型 (PSM模型)PPT课件

文档简介

温馨提示

最新文档

评论

倾向值匹配模型 (PSM模型)PPT课件

文档简介

温馨提示

最新文档

评论

相关文档