倾向匹配分析深度(Propsensitymatchinganalysis)_第1页
倾向匹配分析深度(Propsensitymatchinganalysis)_第2页
倾向匹配分析深度(Propsensitymatchinganalysis)_第3页
倾向匹配分析深度(Propsensitymatchinganalysis)_第4页
倾向匹配分析深度(Propsensitymatchinganalysis)_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、倾向匹配分析深度( Propsensity matching analysis )有很多现象和关联似乎显而易见, 然而证明这些 “简单”的现象和关联的过程,可能极其消耗人力和物力。在20 世纪 30 年代之前,匹配法(也称控制法)在因果研究中占据了压倒性的地位,科学家认为只有将实验组和对照组的所有情况都尽可能接近,才能两组间的差异是否归于处理因素。但是,在要让实验组和对照组之前的特征(混杂)尽可能匹配,不仅难以操作,而且会消耗大量资源,尤其在很多情况下,很多因素是试验者难以去控制的。随机化概念的起源在伊利诺伊大学的莫柔地块( University of Illinois , MorrowPlo

2、ts ) , Fisher 通过“分割地块实验” ( ( Split-PlotExperiment ) ,成功证明了一个在今天看来可能极其简单,但却耗费了几代科学家上百年努力的结论:土壤的质量是农业生产率最关键的决定因素( Soil quality is a vital componentof agricultural productivity ) 。 并开拓了如今广为人知的方差分析(ANOV A),将随机实验法纳入了因果分析的殿堂,成为因果分析的金标准。为什么要做倾向值分析 在卫生领域, 随机临床试验( RCT ) 是应用随机实验法最典型的例子。为了证明某种处理(或因素)的作用,将研究对象随

3、机分组并进行前瞻性的研究,可以最大程度上确保已知和未知的混杂因素对各组的影响均衡,阐明处理因素的真实效应。但RCT 对研究对象严格的纳入和排除标准, 无疑会影响研究结果的外推,同时费用和组织困难问题很多时候都是让人难以承受的。此外,很多研究问题无法做到随机,甚至有些情况下的随机是违反伦理道德的。 而非随机对照研究(如观察性研究和非随机干预研究)能够较好地耐受 RCT中存在的问题,在实际应用中更为广泛。如何利用非随机化研究的资料探究因果,一直是流行病学和统计学研究中非常关注的问题。传统的控制混杂的方法如分层、匹配等控制的混杂因素有限,多因素分析的方法在概念上“控制了其他因素,探究某一因素的影响”

4、 ,依然无法控制混杂因素所导致的偏性。在这种情况下,倾向值分析( Propensity scoreanalysis)的理论和实践不断丰富,并在流行病学、经济学、社会科学等领域得到广泛应用。 举一个简单的例子。我们常认为重点学校的对于学生学习能力的提升是优于一般学校的。如果把学校类型视为处理因素,而结局指标为入学后成绩的改变量。那么不同学校间学生成绩改变量的差异,究竟是因为学校不同(处理因素,简单理解为师资、设施等条件的综合) ,还是因为考入重点学校的学生,本身就比一般学校的学生更聪明, 更勤奋, 家长的受教育水平更高,对教育的投资更大(混杂因素)?如果控制这些混杂因素以后,学校对成绩的影响,是

5、否就会发生很大变化?学生进入何种学校学习(接受不同处理)的概率是不同的,受到了很多因素的影响,而这些因素同时可能也会影响结局,导致分 析处理效应时的偏性。 倾向值就是研究的个体在一定可观测到的协变量(混杂)存在的情况下,接受某种干预的可能性。而倾向评分析,就是利用倾向值从对照组中为处理组中的每个个体寻找一个或多个背景特征相同或相似的个体作为对照,使两组的混杂因素的分布也趋于均衡,实现类似于随机化设计中的随机分配干预的目的。倾向值分析的步骤经典的倾向值分析主要包括以下 3 步(上图来自推荐书目 1, P85) 1. 寻找最佳的协变量,构建估计倾向值的模型。模型的因变量为是否接受处理,自变量通常是

6、同时影响处理因素和结局的变量(混杂) ,或是在干预组和对照组之间分布不均衡的变量。倾向值的模型以 logistic 回归模型最为常见,构建理想的倾向值模型和以是否接受处理为因变量,找到最恰当的自变量组合的 logistic 回归其实在原理上几乎是完全一致的。模型系数的假设检验、拟合度、逐步法筛选变量等,此外,一种较新的自动选择的算法一般加速建模( GBM ) 法也可用于选择变量和构建模型。 通过构建的模型,可以计算出每个研究对象的倾向值评分,它代表了研究对象接受处理的可能性。因此,具有相同倾向值的研究对象,在模型中的协变量是均衡可比的(而并非取值上完全一致) 。 2. 匹配根据倾向值的结果,从

7、对照组中选择 1: M 个倾向值接近的个体与处理组匹配。如果处理组和对照组在协变量的分布上差别较大,则倾向值的分布也会 差别较大,所以有了共同支持域( common support )的概念(下图,推荐书目 1, P97) 。共同支持域可以理解为处理组和对照组倾向值得分相同的范围,在共同支持域内的进行匹配,可能两组间协变量的分布更均衡(涉及到算法的选择和设置等问题)。匹配的算法有有 Nearest Neighbor Matching (最邻近匹配) 、 Full matching (完全匹配) 、精确匹配( ExactMatch ) 、 Optimal matching (最优匹配)等。其中

8、NearestNeighbor Matching 和 Optimal matching 较为常用。 不同算法各有优劣,实际应用中一般选择可以使匹配后的处理组和对照组协变量均衡, 且研究对象丢失不多的算法。 3. 匹配后分析包括分层分析和多元分析等,不同研究采用的方法差别较大,可参照和自己方向类似的文献。倾向得分匹配的命令研究某项治疗、政策、或者其他事件的影响因素上很常见。对于经济、金融学领域来说,比如需要研究某个劳动者接受某种高等教育对其收入的影响,或者比如研究某个企业运用了某项管理层激励措施以后对企业业绩的影响。如果我们简单地将是否执行了某项时间作为虚拟变量,而对总体进行回归的话,参数估计就

9、会产生偏误,因为在这样的情况下,我们只观察到了某一个对象他因为发生了某一事件后产生的表现,并且拿这种表现去和另一些没有发生这件事情的其他对象去做比较。这样的比较显然是不科学的,因为比较的基 础并不同。通俗地说,我们真正要做的是考虑,如果拿小明来说,小明读了研究生和小明没有读研究生,他的收入会差多少?可是小明已经读了研究生,我怎么才能估计出他要是不读研究生,他的收入会是多少呢?于是,我们引入“倾向得分匹配”这样一种研究方法。英文叫 Propensity Score Matching 。 这种方法能让我们从一大堆没有参加培训的人群中(也就是我们的总体样本的一个子集) ,对每个人读研究生的概率进行估

10、计,然后选出和小明具有非常相似的去读研究生的概率,可是没有去读的同学小刚作为小明的对照,然后再来看他们的区别。当样本中的每个研究生”小明“都找到了匹配的非研究生”小刚“,我们便能对这两组样本进行比较研究了。1. 所以第一步,我们要对总体样本执行probit 或者 logit 模型,然后估计出每一个观测对象读研究生的概率是多少。以probit 模型为例, 在 stata 中, 执行以下命令: probit dependentvar independent var其中,dependent var是一个0或1的二进制变量,1代表该对象读了研究生,否则是0。 2. 对每一个观测值,我们根据估计出来的

11、probit 模型, 算出他读研究生的概率是多少。 Stata中,执行如下命令: predict pscore, p其中, pscore 是定义的记录每个观测对象概率的变量名称。3. 使用 psmatch2 命令,让 Stata 帮你对于每个读了研究生的观测对象,找出一个与之具有最接近的概率值的,可是没有读研究生的观测对象: psmatch2 dependent var, pscore(pscore)noreplacement其中,(pscore)是在第二步中生成的那个记录对象概率的变量, noreplacement 是一个选项,使得任何读了研究生的观察对象的对照对象都具有唯一性,换言之,只能

12、 1对1匹配。4. Stata会在你的数据中自动添加几个变量,其中_id 是自动生成的每一个观测对象唯一的 ID ; _treated 表示某个对象是否读了研究生, 如果读了, _n 表示的是他被匹配到的对照对象的 _id ; _pdif 表示一组匹配了的观察对象他们概率值的差。做好了这些,你就完成了一个最简单的 1 对 1 的倾向得分匹配。 psmatch2 还提供多种匹配方法,比如在一定的半径范围内的临近匹配、在一定概率阀值内的全部匹配等等。具体的可以在Stata中输入help psmatch2查看所有可用的选项。倾向得分匹配的理论倾向得分匹配的理论框架是“反事实推断模型” 。 “反事实推

13、断模型”假定任何因果分析的研究对象都有两种条件下的结果:观测到的和未被观测到的结果。如果我们说“ A 是导致 B 的原因” ,用的就是一种“事实陈述法” 。而“反事实”的推断法则是:如果没有A , 那么 B 的结果将怎样(此时,其实 A 已经发生了)?因此,对于处在干预状态(treatment condition) 的成员而言,反事实就是处在控制状态(condition of control) 下的潜在结果(potential outcome) ;相反,对于处在控制状态的成员而言,反事实就是处在干预状态下的潜在结果。显然,这些潜在结果是我们无法观测到的,也就是说,它们是缺失的。PSM 介绍倾向

14、得分匹配的理论框架是“反事实推断模型” 。“反事实推断模型”假定任何因果分析的研究对象都有两种条件下的结果:观测到的和未被观测到的结果。如果我们说“ A 是导致 B 的原因” , 用的就是一种 “事实陈述法” 。 而“反 事实” 的推断法则是: 如果没有 A , 那么 B 的结果将怎样 (此时, 其实 A 已经发生了) ?因此, 对于处在干预状态(treatmentcondition) 的成员而言, 反事实就是处在控制状态(condition ofcontrol)下的潜在结果(potential outcome);相反,对于处在控 制状态的成员而言,反事实就是处在干预状态下的潜在结果。显然,这

15、些潜在结果是我们无法观测到的,也就是说,它们是缺失的。 我们假定有N 个个体, 每一个处在干预中的个体 i (i=1,2, ,N )都将有两种潜在结果( ),分别对应着未被干预状态和干预状态中的潜在结果。那么对一个个体进行干预的效应标记为 ,表示干预状态的潜在结果与未干预状态的潜在结果之间的差,即: 令 表示接受干预, 表示未接受干预,同时 表示所测试的结果变量。那么反事实框架可以表示为以下模型: 该模型也可以表示为: 这个模型表 明,两种结果中的哪一种将在现实中被观测到,取决于干预状态,即 D 的状态。用 ATT(Average treatmenteffect for thetreated)

16、来测度个体在干预状态下的平均干预效应,即表示个体 i 在干预状态下的观测结果与其反事实的差,称为平均干预效应的标准估计量, 很明显, 反事实 是我们观测不到的,所以我们只有使用个体i 在未干预状态下的观测结果作为替代来估计个体在干预状态下的潜在结果反事实。所以,给公式可以进一步表示为: 显然,这里需要到数据的随机性了。在实验数据中,个体是随机分配(randomassignment)的,所以个体的所有特征在干预组和控制组之间是相等,也就无需考虑用 作为替代对反事实 进行估计时存在的偏差了,这里称为选择偏倚,换句话说,实验数据能够确保数据的选择偏倚为 0,所以实验设计中,随机性能保证干预组和控制组

17、之间的数据平衡。而对于观测数据,往往由于缺乏随机性,而导致干预组和控制组不仅仅在干预统计量上存在不同,还在第三方变量X (这个变量是可观测的)上存在区别。这时,我们必须要考虑到这些区别以防止出现潜在偏倚。这时就要采用匹配的方式进行干预效应分析。匹配的目的在于确保干预效应估计是建立在可比个体之间的不同结果的基础上。最简单的匹配方式是将干预组和控制组中第三方变量 X 的值相同的两个个体进行配对分析。 但是, 如果 X 并不 是某一个变量,而是一组变量时,最终简单的匹配方式也就 不再适用,而是采用倾向得分匹配方式进行匹配。最简单匹配方法的几个假设:条件独立假设(conditionalindepend

18、ence assumption or CIA) :给定 X 后干预状态的潜在结果是独立的,换句话说,控制住 X 之后,干预分配就相当于随机分配。共同支撑条件(common supportcondition) : 对于 X 的每一个值, 存在于干预组或控制组的可能性均为正,即。同时,第二个要求称为覆盖条件,即匹配组变量 X 需要在干预组和控制组上有足够的覆盖, 即处理组每一个个体在控制组中都能找到与之匹配的 X 。 若 X 只有一个变量,则对于给定的 X=x , ATT(x) 的表达式为: 显然, X只有一个变量时, 干预组和控制组针对X 的匹配标准是清晰的: 对于干预组个体和控制组个体, 他们

19、的 X 变量的值越近,这两个个体的特征也就越相似。但, 如果 X 不再只是一个变量, 而是一组变量时, 所谓 “近”的判断标准也就变得模糊起来。针对这个问题, Rosenbaumand Rubin (1983)解决了维度问题, 并证明了如果基于 X 相关变量的匹配是有效的, 那么基于 X 变量组的倾向得分的匹配也将同样有效,从而奠定了 PSM 的理论基础。这里,倾向得分是通过logist 回归获得的,从而将X 由多维降到了一维的水平。 所以倾向得分中包含了 X 中所有变量的信息,综合反映了每个个体X 变量组的水平。显然,倾向得分匹配的优势很明显降维,它由单个变量(倾向得分)对个体进行匹配来代替

20、了 X 所有变量为基础对个体进行匹 配。同样的, PSM 的主要定理总结为以下几点:定理一,倾向得分 p(X) 是一个平衡得分。 有着相同倾向得分的两组个体之间的特征显然是平衡的。定理二,如果条件独立假设依旧成立,那么潜在结果在倾向得分的条件下也将独立于干预状态。也就是说,只要向量X包含满足 CIA 的所有相关信息, 那么倾向得分的条件作用也就等价于向量X 中所有变量的条件作用。所以, PSM 的 ATT(x) 的表达式为: 为了估计 ATT , 需对 p(X)在干预上的条件作用的分布取平均: PSM 的步骤计算倾向值(采用logistic 回归)进行得分匹配得分匹配的几种方法:( 1 )最邻

21、近匹配( Nearest neighbor matching, NNM ) (是否使用卡尺with or without caliper) 以倾向得分为依据,在控制组样本中向前或向后寻找最接近干预组样本得分的对象,并形成配对。 ( 2)半径匹配(Radius matching )设定一个常数r (可理解为区间或范围,一般设定为小于倾向得分标准差的四分之一) ,将实验组中得分值与控制组得分值的差异在 r内的进行配对。( 3)核匹配(Kernel Matching )将干预组样本与由控制组所有样本计算出的一个估计效果进行配对,其中估计效果由实验组个体得分值与控制组所有样本得分值加权平均获得,而权数则由核函数计算得出。评定匹配后的平衡性计算平均干预效果( ATT )进行敏感性分析推荐书籍与文献倾向值分析方法相对较新,近年来很多方法也发展迅速,本文只对起源和主要步骤进行介绍。在模型和算法选择,匹配后处理等方面有诸多细节

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论