内生性产生的原因及解决方案ppt课件.ppt_第1页
内生性产生的原因及解决方案ppt课件.ppt_第2页
内生性产生的原因及解决方案ppt课件.ppt_第3页
内生性产生的原因及解决方案ppt课件.ppt_第4页
内生性产生的原因及解决方案ppt课件.ppt_第5页
已阅读5页,还剩109页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五讲内生性 1 OLS经典假设所有的解释变量Xi与随机误差项彼此之间不相关 若解释变量Xi和ui相关 则OLS估计量是非一致的 也就是即使当样本容量很大时 OLS估计量也不会接近回归系数的真值 当解释变量和随机误差项相关时 模型存在着内生性问题 2 在计量经济学中 把所有与扰动项相关的解释变量都称为 内生变量 这与一般经济学理论中的定义有所不同 1 与误差项相关的变量称为内生变量 endogenousvariable 2 与误差项不相关的变量称为外生变量 exogenousvariable 3 造成误差项与回归变量相关 内生性 的原因很多 但我们主要考虑如下几个方面 遗漏变量偏差变量有测量误差双向因果关系 4 遗漏变量偏差 5 6 变量有测量误差测量数据正确时 假设方程为 当存在测量误差时 方程为 所以我们有 7 可知 误差项中包含 所以可以得到 如果 则回归结果有偏 非一致 我们假设 则有 8 结论 1 由于 2 回归的性质决定于w的标准差 9 双向因果关系之前我们假定因果关系是从回归变量到因变量的 X导致了Y 但如果因果关系同时也是从因变量到一个或多个回归变量 Y导致了X 的呢 如果是这样的话 因果关系是向前的也是 向后 的 即存在双向因果关系 如果存在双向因果关系 则OLS回归中同时包含了这两个效应 因此OLS估计量是有偏的 非一致的 10 可以推导出 11 检验方法 豪斯曼检验检验 豪斯曼检验 Hausmanspecificationtest H0 所有解释变量均为外生变量 H1 至少有一个解释变量为内生变量 quietlyreglw80s80expr80tenure80iqeststoreolsquietlyivregress2slslw80expr80tenure80 s80iq medkwwmrtage eststoreivhausmanivols 若Hausman检验失效 检验统计量为负值 则使用dmexogxt 否则仍Hausman检验为主 12 使用Davidson MacKinnon检验 xtivreg后使用dmexogxt Davidson MacKinnon 1993 检验 H0 OLS和xtivreg都是一致的 即内生性问题对OLS的估计结果影响不大xtivregtlsizendtstang npr tobinL1 npr fedmexogxtDavidson MacKinnon检验得到F统计量的P值小于0 05 代表有内生性 13 遗漏变量偏差可采用在多元回归中加入遗漏变量的方法加以解决 但前提是只有当你有遗漏变量数据时上述方法才可行 双向因果关系偏差是指如果有时因果关系是从X到Y又从Y到X时 此时仅用多元回归无法消除这一偏差 同样 变量有测量误差也无法用我们前面学过的方法解决 因此我们就必须寻找一种新的方法 14 二 内生性的解决方案 事实上 仅仅为了解决内生性问题 并不需要我们对内生性问题的缘起有很深入的理解 对于应用型的实证研究而言 我们只需要掌握解决内生性问题的具体方案即可 内生性问题的解决方案一共四种 理论上来讲 这四种方案应对内生性问题都很有效 但于我个人而言 我对四种方法的评价是有高低的 由高到低分别介绍如下 15 1 自然实验法 所谓自然实验 就是发生了某些外部突发事件 使得研究对象仿佛被随机分成了实验组或控制组 这是我最喜欢的方法 只是自然实验需要寻找一个事件 并且这个事件只影响解释变量而不影响被解释变量 遇着这种事件是一种缘分 还要能识别出来 这对学者的眼光也是一种挑战 有很多文章声称使用了自然实验 但严格来讲 并没有做到对研究对象进行了随机分组 虽然如此 我对此类文章仍然很是喜欢 16 自然实验包括的要素有 一个政策措施 treatment 一个观察到的结果 outeome 一个对照组 contorlgoruP 在评估 政策措施 对 结果 是否发挥作用时 对照组充当一个参照系 而一个 准自然实验 和自然实验的区别在于处理组和对照组的选取是否随机 这里的 结果 是以受政策影响的县和没有受政策影响的县之间在增长速度上的差异来衡量 简单连接改革措施和被直管县绩效的做法并不恰当 这样的做法无法排除其他政策或是整体经济的影响 因而是无法衡量改革真实效果的 17 2 双重差分法 Difference in Difference DID 一般称为双重差分法 或倍差法 倘若出现了一次外部冲击 这次冲击影响了一部分样本 对另一部分样本则无影响 而我们想看一下这次外部冲击到底有何影响 双重差分法就是用来研究这次冲击的净效应的 其基本思想是 将受冲击的样本视作实验组 再按照一定标准在未受冲击的样本中寻求与实验组匹配的对照组 而后做差 做差剩下来的便是这次冲击的净效应 双重差分法实际上是固定效应的一个变种 差分的过程实际上是排除固定效应的过程 ZERA在 计量论文写作和发表的黑客教程 有一个非常简明风趣的举例 我转述于此 以飨读者 18 Differenceindifferencemodels MaybethemostpopularidentificationstrategyinappliedworktodayAttemptstomimicrandomassignmentwithtreatmentand comparison sampleApplicationoftwo wayfixedeffectsmodel 19 Problemsetup Cross sectionalandtimeseriesdataOnegroupis treated withinterventionHavepre postdataforgroupreceivinginterventionCanexaminetime serieschangesbut unsurehowmuchofthechangeisduetosecularchanges 20 Differenceindifferencemodels Basictwo wayfixedeffectsmodelCrosssectionandtimefixedeffectsUsetimeseriesofuntreatedgrouptoestablishwhatwouldhaveoccurredintheabsenceoftheinterventionKeyconcept cancontrolforthefactthattheinterventionismorelikelyinsometypesofstates 21 Threedifferentpresentations TabularGraphicalRegressionequation 22 DifferenceinDifference 23 time Y t1 t2 Yt1 Yt2 treatment control Yc1 Yc2 Treatmenteffect Yt2 Yt1 Yc2 Yc1 24 KeyAssumption ControlgroupidentifiesthetimepathofoutcomesthatwouldhavehappenedintheabsenceofthetreatmentInthisexample YfallsbyYc2 Yc1evenwithouttheinterventionNotethatunderlying levels ofoutcomesarenotimportant returntothisintheregressionequation 25 BasicEconometricModel Datavariesbystate i time t OutcomeisYitOnlytwoperiodsInterventionwilloccurinagroupofobservations e g states firms etc 26 ThreekeyvariablesTit 1ifobsibelongsinthestatethatwilleventuallybetreatedAit 1intheperiodswhentreatmentoccursTitAit interactionterm treatmentstatesaftertheinterventionYit 0 1Tit 2Ait 3TitAit it 27 Yit 0 1Tit 2Ait 3TitAit it 28 Moregeneralmodel Datavariesbystate i time t OutcomeisYitManyperiodsInterventionwilloccurinagroupofstatesbutatavarietyoftimes 29 uiisastateeffectvtisacompletesetofyear time effectsAnalysisofcovariancemodelYit 0 3TitAit ui t it 30 GroupeffectsCapturedifferencesacrossgroupsthatareconstantovertimeYeareffectsCapturedifferencesovertimethatarecommontoallgroups 31 其中 d就是双重差分估计量 Y为研究的结局变量 右侧脚标中treatment和control分布代表干预组和对照组 t0和t1分别代表干预前和干预后 构造了差分估计量之后 就要根据不同的数据类型和不同的结局变量Y 分别选用相应的参数检验方法来进行建模 32 1 适用于独立混合横截面数据 独立混合横截面数据是在不同时点从同一个的大总体内部分别进行随机抽样 将所得的数据混合起来的一种数据集 该类数据的特点为每一条数据都是独立的观测值 通过将不同时点的多个观测值结合起来 从而可以加大样本量以获得更精密的估计量和更具功效的检验统计量 也可加入新的变量 时间 即干预前后 以便判断干预前后的差别 对于总体一致 范围较大 涉及不同时间点的调查研究 多收集此类数据 33 34 35 36 2 适用于综列数据面板数据的DID模型 面板数据要求在不同时点调查相同的研究对象 它与独立混合横截面数据最大的不同在于 不同时点的观测值并不是独立分布的 这类数据的特点在于 由于研究的个体相同 一些不随时间改变的不可观测的因素 如个人特质等 对不同时点的观测值会产生影响 可以通过控制这些影响从而得到较为真实的结果 37 38 39 由于一般大规模的人群调查存在较大的变异性问题 仅在模型中纳入虚拟变量 分组 A 时间 T 是远远不够的 为了提高解释系数R2 需要加入其他可能影响被解释变量的因素 即控制除分组 时间变量以外的其他变量 40 sscinstalldiffhelpdiffdiffy t treated p t robust如果有控制变量 可以利用cov 添加 41 工具变量 instrumentalvariable IV 回归是当回归变量X与误差项u相关时获得总体回归方程未知系数一致估计量的一般方法 我们经常称其为IV估计 其基本思想是 假设方程是 我们假设ui与Xi相关 则OLS估计量一定是有偏的和非一致的 工具变量估计是利用另一个 工具 变量Z将Xi分离成与ui相关和不相关的两部分 3 工具变量法 42 我们的工作就是要寻找相应的工具变量将解释变量分解成内生变量和外生变量 然后利用两阶段最小二乘法 TSLS 进行估计 43 工具变量的选取 一个有效的工具变量必须满足称为工具变量相关性和工具变量外生性两个条件 即 1 工具变量相关性 工具变量与所替代的随机解释变量高度相关 2 工具变量外生性 工具变量与随机误差项不相关 44 一个合适的工具变量应该同时满足两个条件 第一要能很好地解释内生变量 也就是说工具变量和内生变量之间要足够相关 第二 工具变量要来自系统之外 即工具变量具备外生性 如果内生性表现为联立性问题 第二个标准尤其必要 虽然统计证据可以告诉我们工具变量和内生变量是否相关 但是其背后的因果链条和工具变量是否具备外生性的证明一样 必须依赖令人置信的逻辑推导 工具变量的外生性在回归中表现为和方程的残差项正交 即工具变量不会对方程被解释变量产生影响 如果产生影响则只能通过内生变量起作用 45 两阶段最小二乘估计量 若工具变量Z满足工具变量相关性和外生性的条件 则可用称为两阶段最小二乘 TSLS 的IV估计量估计系数 1 两阶段最小二乘估计量分两阶段计算 第一阶段把X分解成两部分 即与回归误差项相关的一部分以及与误差项无关的一部分 第二阶段是利用与误差项无关的那部分进行估计 46 一般IV回归模型 因变量Yi 外生解释变量W1i W2i Wri 内生解释变量X1i X2i Xki 我们引入工具变量Z1i Z2i Zmi 47 第一阶段回归 利用OLS建立每个内生变量 X1i X2i Xki 关于工具变量 Z1i Z2i Zmi 和外生变量 W1i W2i Wri 的回归 并得到所有回归结果的拟合值Xi hat 第二阶段回归 用Xi hat取代原有的Xi 与原有的外生变量Wi一起进行第二次回归 得到TSLS统计量 TSLS 注意 工具变量出现在第一阶段回归 但不出现在第二阶段回归 48 引入工具变量的个数 假设我们有n个内生解释变量 引入了m个工具变量 n和m的关系是什么 n m恰好识别nm不可识别只有恰好识别和过度识别才能用IV方法估计 49 两阶段最小二乘法的stata命令 ivregress2slsdepvar varlist1 varlist2 instlist r first其中 depvar 为被解释变量 varlist1为外生解释变量 varlist2为所有的内生解释变量集合 instlist为工具变量集合 选择项r表示使用异方差稳健的标准误 选择项 first 表示显示第一阶段的回归 50 工具变量有效性的检验 工具变量相关性工具变量相关性越强 也就是工具变量能解释越多的X变动 则IV回归中能用的信息就越多 因此利用相关性更强的工具变量得到的估计量也更精确 弱工具变量 如果虽然但是弱工具变量几乎不能解释X的变动 51 弱工具变量检验准则 1 偏R2 Shea spartialR2 含义 在第一阶段回归中 在控制外生变量影响的前提下 看其它变量对某内生变量的解释力 或者说 在第一阶段回归中 剔除掉外生变量的影响 2 最小特征值统计量F 经验上F应该大于10 Stata命令 estatfirststage allforcenonrobust 52 3 Cragg DonaldWaldF统计量4 Kleibergen PaapWaldrkF统计量 当假定残差项不满足独立同分布时 就看这个来判断是否弱工具 原假设是弱工具 所以拒绝原假设就可以 F检验临界值表CHIDISTF 12 自变量数据m 600 自由度df n 样本数 m 1 87 06Stata命令 ivreg2 53 如果存在弱工具变量该怎么办 1 如果有很多工具变量 有部分强工具变量和部分弱工具变量 可以舍弃较弱的工具变量而选用相关性较强的工具变量子集 在stata中 可以使用ivreg2命令进行 冗余检验 以决定选择舍弃哪个工具变量 直观上 冗余工具变量是那些第一阶段回归中不显著的变量 2 如果系数是恰好识别的 则你不能略去弱工具变量 在这种情况下 有两个选择 第一个选择是寻找其他较强的工具变量 难度较大 54 第二个选择是利用弱工具变量继续进行实证分析 但采用的方法不再是TSLS 而是对弱工具变量不太敏感的有限信息极大似然法 LIML 在大样本下 LIML与2SLS是渐近等价的 但在存在弱工具变量的情况下 LIML的小样本性质可能优于2SLS LIML的Stata命令为ivregresslimldepvar varlist1 varlist2 instlist 55 工具变量外生性的检验 刚才我们提到 只有恰好识别和过度识别才能用IV方法估计 一个很重要的命题是 只有过度识别情况下才能检验工具变量的外生性 而恰好识别情况下无法检验 56 过度识别约束检验 基本思想 假设有一个内生回归变量 两个工具变量且没有包含的外生变量 则你可以计算两个不同的TSLS估计量 其中一个利用第一个工具变量 而另一个利用第二个工具变量 由于抽样变异性 这两个估计量不会相同 但如果两个工具变量都是外生的 则这两个估计量往往比较接近 如果由这两个工具变量得到估计非常不同 则你可以得出其中一个或两个工具变量都有内生性问题的结论 57 识别标准 Sargan统计量 ivregress2sls过程中 实际的工具变量 组 是x 与z Sagan检验即检验这些工具变量是否外生 是否与扰动项相关 原假设是这些变量都与扰动项不相关 利用残差对这些工具变量回归 sargen检验的P值应该越大越好 一般超过0 1既可以说明不能拒绝工具变量有效的零假设 不宜接近于1 一般大于0 4就是危险信号 工具变量过多 导致检验结果不可信 Sargan统计量服从自由度为L k的卡方分布 查表 在excel中输入CHIDIST x iv v 其中x是sargan统计量的值 iv是工具变量的秩 v是估计参数个数 回车 58 HansenJ统计量C统计量 说明采用工具变量的合理性过度识别检验的Stata命令 estatoverid 59 xtabond2alsoreportstestsofover identifyingrestrictions ofwhethertheinstruments asagroup appearexogenous Forone step non robustestimation itreportstheSarganstatistic whichistheminimizedvalueoftheone stepGMMcriterionfunction TheSarganstatisticisnotrobusttoheteroskedasticityorautocorellation Soforone step robustestimation 稳健估计andforalltwo stepestimation xtabond2alsoreportstheHansenJstatistic whichistheminimizedvalueofthetwo stepGMMcriterionfunction andisrobust xtabond2stillreportstheSarganstatisticinthesecasesbecausetheJtesthasitsownproblem itcanbegreatlyweakenedbyinstrumentproliferation 60 究竟该用OLS还是工具变量法 豪斯曼检验原假设为 H0 所有解释变量均为外生变量regyx1x2eststoreolsivregress2slsyx1 x2 z1z2 eststoreivhausmanivols sigmamore 61 上述检验的缺点是 它假设在H0成立的情况下 OLS最有效率 但如果存在异方差 OLS并不最有效率 不是BLUE 故传统的豪斯曼检验不适用于异方差的情形 此时可以使用杜宾 吴 豪斯曼检验 DWH 该检验在异方差的情况下也适用 更为稳健 stata命令 estatendogenous为负值不存在内生性 62 例一 Mincer 1958 最早研究了工资与受教育年限的正相关关系 但遗漏了 能力 这个变量 导致遗漏变量偏差 针对美国面板调查数据中的年轻男子组群 YoungMen sCohortoftheNationalLongitudinalSurvey 简记NLS Y Griliches 1976 采用工具变量法对遗漏变量问题进行了校正 BlackburnandNeumark 1992 更新了Griliches 1976 的数据 即这个例子中将要使用的数据集grilic dta 63 该数据集中包括以下变量 lw 工资对数 s 受教育年限 age 年龄 expr 工龄 tenure 在现单位的工作年数 iq 智商 med 母亲的受教育年限 kww 在 knowledgeoftheWorldofWork 测试中的成绩 mrt 婚姻虚拟变量 已婚 1 rns 美国南方虚拟变量 住在南方 1 smsa 大城市虚拟变量 住在大城市 1 year 有数据的最早年份 1966 1973年中的某一年 64 这是一个两期面板数据 初始期为当以上变量有数据的最早年份 结束期为1980年 不带80字样的变量名为初始期 带80字样的变量名为1980年数据 比如 iq指的是初始期的智商 而lw80指的是1980年的工资对数 65 1 先看一下数据的统计特征 usegrilic dta clearsum 2 考察智商与受教育年限的相关关系 pwcorriqs sig 3 建立如下方程 reglw80s80expr80tenure80 66 继续对方程进行分析 我们发现了如下问题 1 遗漏变量问题 认为方程遗漏了 能力 这个变量 加入iq 智商 作为 能力 的代理变量 reglw80s80iqexpr80tenure80 67 2 测量误差问题 iq 智商 对 能力 的测量存在误差 3 变量内生性问题 s80可能与扰动项中除 能力 以外的其他因素相关 因此是内生变量 解决方法 引入四个变量med kww mrt age 作为内生解释变量iq与s80的工具变量 然后使用TSLS方法进行回归 ivregress2slslw80expr80tenure80 s80iq medkwwmrtage first 68 也可以使用GMM估计方法使用两步GMM ivregressgmmlw80expr80tenure80 s80iq medkwwmrtage 使用迭代GMM ivregressgmmlw80expr80tenure80 s80iq medkwwmrtage igmm 69 几点注意事项 1 first选项的目的是显示TSLS第一阶段的结果 如果省略 则仅显示第二阶段的结果 2 命令的用法比较严格 将被解释变量和所有外生解释变量放到括号外面 内生解释变量放到括号里面 等号后面为所有工具变量 3 2SLS只能通过stata完成 利用定义手动计算的结果是错误的 因为残差序列是错误的 70 4 不可能单独为每个内生变量指定一组特定的工具变量 而是给所有内生变量指定一系列工具变量 5 所有外生变变量都作为自己的工具变量 6 为了检验工具变量的外生性 本题为过度识别 7 在大样本下 IV估计是一致的 但在小样本下 IV估计并非无偏估计量 有些情况下偏误可能很严重 71 弱工具变量检验 检验方法 1 初步判断可以用偏R2 partialR2 剔除掉模型中原有外生变量的影响 2 Minimumeigenvaluestatistic 最小特征值统计量 经验上此数应该大于10 这个方法类似于与书上的 第一阶段F统计量 72 工具变量外生性检验 我们一般称为过度识别约束J检验 检验工具变量是否与干扰项相关 即工具变量是否为外生变量 TSLS根据Sargan统计量进行过度识别检验 命令为 estatoverid检验工具变量的外生性 H0 所有工具变量都是外生的 H1 至少有一个工具变量不是外生的 与扰动项相关 73 ivregress2slslw80expr80tenure80 s80iq medkwwmrtage firstestatfirststage allforcenonrobustestatfirststageestatoverid 74 究竟该用OLS还是IV 解释变量是否真的存在内生性 假设能够找到方程外的工具变量 1 如果所有解释变量都是外生变量 则OLS比IV更有效 在这种情况下使用IV 虽然估计量仍然是一致的 会增大估计量的方差 2 如果存在内生解释变量 则OLS是不一致的 而IV是一致的 75 4 动态面板回归法 基本思想是将解释变量和被解释变量的滞后项作为工具变量 IV 其实 我是不认可这种处理方法 除非万不得已 我不推荐这种方法 我也不太相信这种方法能真正缓解内生性问题 76 广义矩估计法 GMM 基本思想 求解如下一般化目标函数 使之最小化J b GMM n g b GMM W g b GMM 其中 W为权重矩阵在球型扰动项的假定下 2SLS是最有效的 但如果扰动项存在异方差或自相关 则广义矩估计方法效果更好 GMM方法又分为两步GMM法和迭代GMM方法 77 异方差性是相对于同方差而言的 所谓同方差 是为了保证回归参数估计量具有良好的统计性质 经典线性回归模型的一个重要假定 总体回归函数中的随机误差项满足同方差性 即它们都有相同的方差 如果这一假定不满足 即 随机误差项具有不同的方差 则称线性回归模型存在异方差性 对于模型如果随机误差项的各期望值之间存在着相关关系 即这时 称随机误差项之间存在自相关性 autocorrelation 或序列相关 78 有关GMM的Stata命令为ivregressgmmyx1 x2 z1z2 两步GMM ivregressgmmyx1 x2 z1z2 igmm 迭代GMM estatoverid 过度识别检验 79 例二 reglwsexprtenurernssmsa r引入智商 iq 作为 能力 的代理变量 再进行OLS回归 reglwsiqexprtenurernssmsa r 80 2 由于用iq来度量能力存在 测量误差 故iq是内生变量 考虑使用变量 med kww mrt age 作为iq的工具变量 进行2SLS回归 并使用稳健标准误 ivregress2slslwsexprtenurernssmsa iq medkwwmrtage rfirst 3 进行过度识别检验 考察是否所有工具变量均外生 即与扰动项不相关 estatoverid 81 4 我们怀疑 mrt age 不满足外生性 故使用C统计量检验这两个工具变量的外生性 finditivreg2ivreg2lwsexprtenurernssmsa iq medkwwmrtage rorthog mrtage 5 考虑仅使用变量 med kww 作为iq的工具变量 再次进行2SLS回归 ivregress2slslwsexprtenurernssmsa iq medkww rfirst 82 再次进行过度识别检验 estatoverid 6 弱工具变量检验estatfirststage allforcenonrobust 7 为了稳健起见 下面使用对弱工具变量更不敏感的有限信息最大似然法 LIML ivregresslimllwsexprtenurernssmsa iq medkww r 83 8 进一步考察弱工具变量问题 对工具变量kww进行冗余检验ivreg2lwsexprtenurernssmsa iq medkww rredundant kww 9 利用豪斯曼检验判断是否存在内生解释变量 quireglwiqsexprtenurernssmsaeststoreols1quiivregress2slslwsexprtenurernssmsa iq medkww estimatesstoreiv1hausmaniv1ols1 sigmamore 84 10 由于传统的豪斯曼检验在异方差的情形下不成立 下面进行异方差稳健的DWH检验 estatendogenous异方差下也可以利用ivreg2命令进行文件的内生性检验 ivreg2lwsexprtenurernssmsa iq medkww rendog iq 85 11 如果存在异方差 则GMM比2SLS更有效率 为此 进行如下最优GMM估计 ivregressgmmlwsexprtenurernssmsa iq medkww 进行过度识别检验 estatoverid考虑迭代GMM ivregressgmmlwsexprtenurernssmsa iq medkww igmm 86 12 结果的完整展现 quireglwsexprtenurernssmsa reststoreols no iqquireglwiqsexprtenurernssmsa reststoreols with iqquiivregress2slslwsexprtenurernssmsa iq medkww reststoretslsquiivregresslimllwsexprtenurernssmsa iq medkww reststorelimlquiivregressgmmlwsexprtenurernssmsa iq medkww eststoregmmquiivregressgmmlwsexprtenurernssmsa iq medkww igmmeststoreigmmoutreg2 ols no iqols with iqtslslimlgmmigmm usingoutput doc replaceseeout 87 遇到内生性问题如何处理 1 使用内生解释变量的滞后变量作为工具变量 2 寻找有创意的工具变量 88 内生性的其它解决办法 1 代理变量 某变量无法直接观测 而用其它变量替代 2 前定变量 用变量的前一期或前几期数据 3 面板数据模型 到底如何对待内生性问题 1 需要重点考虑的问题之一 2 最好的收集数据之前就加以考虑 尤其是准备获取一手数据的情况下 如果考虑 应用经济理论 89 本实例使用数据集 grilic dta 考察智商与受教育年限的相关关系 上表显示 智商 在一定程度上可以视为能力的代理变量 与受教育年限具有强烈的正相关关系 相关系数为0 51 作为一个参考系 先进行OLS回归 并使用稳健标准差 90 91 其中expr tenure rns smsa均为控制变量 而我们主要感兴趣的是变量受教育年限 s 回归的结果显示 教育投资的年回报率为10 26 这个似乎太高了 可能的原因是 由于遗漏变量 能力 与受教育正相关 故 能力 对工资的贡献也被纳入教育的贡献 因此高估了教育的回报率 引入智商iq作为能力的代理变量 再进行OLS回归 92 93 虽然教育的投资回报率有所下降 但是依然很高 由于用iq作为能力的代理变量有测量误差 故iq是内生变量 考虑使用变量 med 母亲的受教育年限 kww 在 knowledgeoftheWorldofWork 中的成绩 mrt 婚姻虚拟变量 已婚 1 age 年龄 作为iq的工具变量 进行2SLS回归 并使用稳健的标准差 94 95 在此2SLS回归中 教育回报率反而上升到13 73 而iq对工资的贡献居然为负值 使用工具变量的前提是工具变量的有效性 为此 进行过度识别检验 考察是否所有的工具变量均外生 即与扰动项不相关 结果强烈拒绝所有工具变量均外生的原假设 考虑仅使用变量 med kww 作为iq的工具变量 再次进行2SLS回归 同时显示第一阶段的回归结果 96 97 上表显示 教育的回报率为6 08 较为合理 再次进行过度识别检验 接受原假设 认为 med kww 外生 与扰动项不相关 进一步考察有效工具变量的第二个条件 即工具变量与内生变量的相关性 从第一阶段的回归结果可以看出 工具变量对内生变量具有较好的解释力 更正式的检验如下 98 99 从以上结果可看出 虽然Shea spartialR 2不到0 04 但是F统计量为13 40 10 我们知道 虽然2SLS是一致的 但却是有偏的 故使用2SLS会带来 显著性水平扭曲 sizedistortion 而且这种扭曲随着弱工具变量而增大 上表的最后部分显示 如果在结构方程中对内生解释变量的显著性进行 名义显著性水平 nominalsize 为5 的沃尔德检验 加入可以接受的 真实显著性水平 truesize 不超过15 则可以拒绝 弱工具变量 的原假设 因为最小特征值统计量为14 91 大于临界值11 59 总之我们有理由认为不存在弱工具变量 但为了稳健起见 下面使用对弱工具变量更不敏感的有限信息最大似然法 LIML 100 101 结果发现 LIML的系数估计值与2SLS非常接近 这也从侧面印证了 不存在弱工具变量 使用工具变量法的前提是存在内生解释变量 为此须进行豪斯曼检验 其原假设是 所有的解释变量均为外生 102 103 上表显示 可以在5 的显著性水平下拒绝 所有解释变量均外生的原假设 即认为存在内生解释变量iq 由于传统的豪斯曼检验建立在同方差的前提下 故在上述回归中均没

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论