




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
RD方法(regression discontinuity design)l 什么是regression discontinuity design?下面将用一篇文章来介绍:如何理解由于使用燃煤取暖,中国 5 亿北方居民预期寿命将缩短 5.5 年?7月8日发表在美国国家科学院院刊(PNAS)的一篇论文,向已经逐渐意识到空气污染危害的中国民众再次展现了残酷的现实:以淮河为界,烧煤供暖的中国北方地区空气污染水平高于中国南方,北方5亿居民因严重的空气污染,平均每人失去5年寿命。这篇文章由清华大学的李宏彬、北京大学的陈玉宇和另外两位作者共同完成。前两位完成了这篇论文的主要部分。这个回答首先介绍他们的研究方法,再谈一谈研究者和媒体对这篇文章的引申。l 科学家如何得出使用燃煤取暖中国5亿北方居民预期寿命将缩短5.5年这个结论的?首先要说的是这篇文章使用的RD方法(regression discontinuity design),即断点回归方法。断点回归方法是最近的政策评估中非常重要的一个方法,他可以在没有随机性的情况下识别出政策的效果。在早期的研究中,要识别一个处理(Treatment)的效果,我们必须拥有随机性,比如两组随机分开的小白鼠,一组加上某种处理,一组没有处理,最后观察两者的区别。为什么我们那么需要随机性呢?因为研究的基础需要几组十分类似的群体,他们的任何特征都服从一个相同的分布,无论是性别、年龄、教育、健康程度这样,我们才能确定几组对象之间出现的差别是来自于实验处理的差异,而非某些个人特征。从一个大样本中严格随机抽取的样本,正好满足这样的同分布假设。但对于政策研究来说,我们不可能找到这样随机分开的两组人,而且也无法用实验的方法来获得结果你能将随机分开的100人放在干净空气中,将另外100人放在肮脏空气中并观察一段时间吗?一些研究者面对这种缺乏随机性的情况,采用了增加控制变量的方式。比如,把性别年龄教育健康程度全部放进回归式中,然后声称,两组人之间由于性别年龄教育健康的不同而造成的差别都已经去掉了,剩下的就是这个政策的效果了。可是,这很容易遭到批评,而且是没完没了的批评。为什么不控制工资高低?婚姻状况?从事行业?只要没有随机分开,任何特征变量的差异造成的结果,都可能混淆在政策结果中,你不控制这个变量,政策的效果就仍然没有识别干净。遭到批评的研究者只能继续加变量,没完没了的加变量。更关键的是,前面说的还是可以量化的东西,努力程度?性格特征?甚至,智商?这些不可观测的变量可能影响更大。举一个例子,科学家想知道上了“一本”大学对学生未来的工资有什么影响。上了一本和没上一本的大学生,显然不是随机分开的两个群体。当然也没法用控制变量的方法来消除“一本”之外的影响,因为肯定有一些不可观测的变量是你控制不了的。控制变量法至此完败。但科学家并没有束手无策,他们找到了RD方法。所谓RD方法,就是观察那些在一本线上下2分的学生,看“上一本”和“没上一本”的学生的未来工资差异。这个想法的天才之处在于,高考的上下5分,实在是一件随机性非常大的事情。让这批学生重新考一次,不少学生的情况可能就要逆转。对于这5分区间内的学生来说,一条一本线,就像一个天然的分割线,将两组人随机分开了。退一步说,即使我们将高考视为一项没有随机性的考试,RD方法还有另外一个假设连续性假设。那些刚好上了一本的学生,比起差几分没上一本的学生,可能要聪明一点;也可能家庭环境好一点,请了好一点的家庭教师;也可能更努力一些,多做了几道习题。但注意,如果我们将智商、努力程度、家庭环境等等变量都视为连续的变量,那么上了一本的学生,比起没上一本的,也只是多了那么“一点点”。于是,我们可以开始观察这批学生的工资了。RD方法的所有目光,都聚焦在了那个“间断点”上。首先看一本线下1分的学生,和线下2分的学生,线上2分的学生和线上1分的学生,是否有工资差别?直观上想,可能没有,可能前者比后者高10块,这说明在没有其他显著差别时,各种连续变量产出的工资,也应该是一个连续变量。但我们再看线上0分的学生,和线下1分的学生时,显著的工资差异出现了,乖乖,差1000块。线上0分的学生,和线下1分的学生,各种特征都应该是差不多的,即便有差别,在连续性假设下也应该是很小很小的差别,那么产生这样显著的工资差异,只能由前者上了一本,而后者没上一本来解释了,因为这是两者间唯一的区别。于是,科学家们说,“上一本”这个事情,可以增加大学生大约1000元工资。我们回到这篇论文上,作者正是观察到了这样一条天然的分割线:淮河以北地区,政府提供了暖气,用烧煤的方式进行,而淮河以南则没有。那么,淮河两岸十分接近的两个地区,理论上来说也应该服从这样的“连续性”假设,也就是各种变量都差不多,唯一的区别就是有没有烧煤。于是作者发现,由于烧煤,淮河以北的空气总悬浮物比淮河以南多了而空气污染造成的结果,淮河两岸的人均寿命差异则是惊人的5年。同时,不考虑空气污染,用其他变量预测出来的人均寿命则几乎没有差别。这说明了连续性假设是成立的,淮河两岸的两个十分接近的地区几乎拥有相同的特征。作者还发现,淮河以北的超额死亡率,正是由和空气污染相关的心肺疾病相关,并进而与空气总悬浮物相关,而与谋杀、自杀等因素无关。至此,作者终于给出结论:烧煤将使空气总悬浮物大幅度上升,并使中国北方地区的居民人均寿命降低5年。l Regression Discontinuity Design的局限性由于使用燃煤取暖,中国5亿北方居民预期寿命将缩短5.5年这个结论有什么问题?如果看完上面那段,你感到心服口服,感叹科学家真聪明,RD方法真奇妙,进而相信了这个结论,那你可能不是从事学术工作的。这项研究主要存在以下三个问题。第一个问题:连续性假设是否对所有变量都成立?淮河分界线两边的城市,真的在所有变量上都是连续的吗?作者在Figure4中控制了许多变量,并验证他们都是连续的,但那些没有控制的变量呢?我们可能可以说说高考差5分的学生没有什么显著差别,但一条河流两旁的城市,我们就很难说他没有显著差别。由于河流两侧的流速不同,地势不同,我们常常能发现一条河两侧的气候特征相差较大,甚至作物种植不同,这些都会导致死亡率的差异,也有可能造成空气总悬浮物的不同,而且他们都没有被控制在作者的图中。也就是说,淮河这个间断点,在识别烧煤取暖对空气污染以及死亡率的作用上,还不够干净。第二个问题:无法消除的自选择性还是从“一本和工资”的故事开始讲。科学家们虽然能研究一本线上的学生和线下1分学生的工资差异,可却忘记了一个问题:可能有好些刚好越过一本线的学生,并不是因为他考上了一本,而是他老爹有一些手腕,买通了官员,将他儿子的分数改了。而且,又不好太张扬,于是,就改一个躺在一本线上的分数。所以,他们的工资差异,还有一部分来自那些躺在一本线上学生的“有手腕的老爹”。对于这一项研究来说,所谓的自选择,就是迁移。一些在淮河以北的居民可能发现,淮河以北空气太差,他还是搬到淮河以南吧。而另一些淮河以南的居民感到没有暖气太冷,于是他选择搬到淮河以北。于是,搬到淮河以南的人,更注重自身健康;搬到淮河以北的人,由于体弱而怕冷。如此,两岸居民的分布就出现了差异,其寿命差异,有一部分就来自这些不可观测的自选择效应。第三个问题:小范围的有效性回到上一本和工资的那个例子上。“科学家们说,“上一本”这个事情,可以增加大学生大约1000元工资。”这句话,就有问题。你最多只能说:一本线上2分的学生,能因为上一本这个事情,增加约1000元的工资。举一个极端的例子,一个因为家庭情况不允许复读,而且本来可以超过一本线100多分,甚至可以上清华北大的学生,却因为试卷丢失而少了一门成绩,从而没上成一本。对他来说,“上一本”这个事情,可能就不止1000元工资的差异了。这个例子的意思是,RD方法得出的结论,仅仅在他所研究的那个小范围内有效。超出这个范围太多,就没有那么有效了。同样的,我们可以说“淮河以北,且紧邻淮河的地区,因为烧煤取暖导致的空气总悬浮物增加,损失了5.5年的寿命”。但将结论推到北方所有地区,就有问题。比如,也许从淮河向北,人们拥有一个随纬度升高而逐渐上升的“空气总悬浮物耐受能力”,但科学家却无法观察到这点,“5.5年寿命差异”的外推便失效了。鉴于以上三个缺点,烧煤取暖到5.5年寿命差异这个逻辑链条,我们都不能够完全相信。更别说将这个寿命差异推广到整个北方地区了。当然,我们也不能矫枉过正,全盘否定这项研究的意义。l 这一项研究的重要意义在于:1,消除了无休止的口水仗,识别了空气污染和健康之间的因果关系。要知道在使用RD方法之前,“空气污染有害论”者还在不停地增加控制变量,“空气污染无害论”者还在argue不可观测的健康特征呢。2,虽然有上述提到的几个问题,但他们的数据选取让我相信这几个问题都不是特别严重,我们大致可以下定论,淮河以北十分接近的几个城市,由空气污染所导致的寿命减少大致是5年左右。这是一个十分醒目的结果,会引起一批
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 阿里地区2024-2025学年八年级上学期语文期中测试试卷
- 2025 年小升初成都市初一新生分班考试英语试卷(带答案解析)-(人教版)
- 江苏省徐州市2026届高三第一次质量检测数学试卷
- 社区网格长消防知识培训课件
- 内蒙古自治区包头市统编版2024-2025学年四年级下册期末考试语文试卷(含答案)
- 通信施工合同范本
- 工厂职工聘用合同范本
- 焊工应聘合同范本模板
- 酒吧酒水供货合同范本
- 香蕉购销合同范本简单
- 2025至2030年中国应急产业市场供需现状及投资战略研究报告
- 中医院临床路径培训课件
- 2025年甘肃普通高中学业水平选择性考试化学真题及答案
- 湖南省岳阳市岳阳楼区2024-2025学年八年级下学期期末考试英语试题(含笔试答案无听力音频及原文)
- 基于SERVQUAL模型的物业公司服务质量提升研究
- 2025年N1叉车司机模拟考试1000题及答案
- 精索静脉曲张治疗-洞察及研究
- 2025年秋期部编人教版六年级上册语文全册核心素养教案(教学反思无内容+二次备课版)
- 养老护理员培训班课件
- 肾挫裂伤护理
- 不买社保的劳动协议书
评论
0/150
提交评论