




已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2012 2013 学年高级计量经济学分组名单学年高级计量经济学分组名单 第一组 潘琳 王超 倪远栋 叶寅 李畅 吴 超 卿剑 李珊 刘春梅 王巍 马哲光 俞力群 田纪华 题目 二阶段最小二乘法 2SLS 内容 适用的情况 或条件 估计原理 步骤 实例 二阶段最小二乘计量方法讲义整理二阶段最小二乘计量方法讲义整理 1 1 引例 引出问题和方法 引例 引出问题和方法 例一 有关工资收入和教育水平 个人能力之间的关系问题例一 有关工资收入和教育水平 个人能力之间的关系问题 考虑成年劳动者的工资方程中存在未观测到的能力的问题 一个简单的模型为 1 log 210 eabileducwage 其中e是误差项 在某些假定下 如何用诸如IQ的代理变量代替能力 从而通过以 下回归可得到一致性估计量 对 进行回归 log wageIQeduc 然而 假定不能得到适当的代理变量 或它不具备足以获取一致性估计量所需的性质 这样一来 我们将abil放入误差项中 留下来的就是简单的回归模型 2 log 10 ueducwage 其中u包含了abil 当然 可以用OLS估计此方程 但是 如果educ 与 abil 即 educ 与随机误差项 u 相关 即educ为内生解释变量 则用 OLS 估计得到的结 果将是的有偏 非一致性估计量 1 我们把简单回归模型写成 3 10 uxy 其中我们认为x与u相关 0 Cov ux 此时 假如我们能找到一个变量 z 满足两个条件 一是与变量 x 存在高度相关关系 即 二是与随机扰动项 u 不存在相关关系 即 从遗漏变量 0 Cov xz 0 Cov uz 的角度看 这意味着z应当对y无偏效应 也不应当与其它影响y的因素相关 此时变量 z 就称作为变量 x 的工具变量 IV 则我们就利用工具变量 z 可以根据上述方程 3 来进 行估计 得到参数的无偏的一致估计 如劳动经济学家已在工资方程中使用的家庭背景变 量作为教育的IV 例如 母亲的教育 motheduc 与孩子的教育是正相关的 这一点通 过收集劳动者数据样本并做educ对motheduc的简单回归便可以看出来 因此 motheduc满足相关性条件 但是 母亲的教育也可能与孩子的能力相关 通过母亲的能 力和可能通过孩子幼年所受的教养的质量 另外 educ的另一个 IV 选择是成长过程中兄弟姊妹的数目 sibs 一般地说 较多 的兄弟姊妹与较低的平均教育水平相联系 而与个人能力的高低不存在直接关系 这样 它就可以充当educ的工具变量 进而进行工具变量发进行估计 得到参数的无偏 一致 估计 我们利用方程 3 z与y之间的协方差为 Cov Cov Cov 1 uzxzyz 现在 在与的假定下 我们可以解出为 0 Cov uz0 Cov xz 1 Cov Cov 1 xz yz 给定一个随机样本 我们用对应样本量来估计总体的量 在分子和分母中约去样本容 量后 我们得到的工具变量 工具变量 IV 估计量 估计量 instrumental variables IV estimator 1 1 1 1 n i ii n i ii xxzz yyzz 例二 逃课对考试成绩的因果影响问题例二 逃课对考试成绩的因果影响问题 考虑逃课对期末考试平均成绩的因果影响的问题 在一个简单的回归框架中 我们有 4 10 uskippedscore 其中 score 是期末考试平均成绩 skipped 是该学期逃课的总数目 此时 在用 OLS 估计方程时 我们担心 skipped 可能与 u 中其它因素相关 比如 成绩较好 无法观测的 能力变量 的学生可能逃课较少等情况 因而 score 对 skipped 的简单回归可能不会给我们 一个对逃课的因果影响的好的估计 因此 我们需要找到一个好的工具变量进行估计 什么可能是 skipped 的好的 IV 我们所需要的是对 score 无直接效应 且与学生能力 不相关的 IV 同时 该 IV 必须与 skipped 相关 一个选择是利用住宿区与教室之间的距离 distance 这也许会增加逃课的可能性 由于恶劣的天气 睡过头等等 因而 skipped 可 能与 distance 正相关 这一点可通过 skipped 对 distance 的回归并作一个 t 检验得以验证 distance 是否与 u 不相关 在简单回归模型 4 中 假如 u 中的一些因素不与 distance 相关 那么 distance 也许是 skipped 的一个好的 IV 进而能良好估计模型 4 如果学生能力有一个好的代理 例如以往学期的累积 GPA IV 法可能根本就不需要 问题总结 问题总结 例子存在的共同问题 例子存在的共同问题 1 在简单回归模型中存在遗漏重要变量问题 运用 OLS 估计导致其得到估计结果不一致 2 遗漏变量没有良好的代理变量情况下 会导致解释变量与扰动项的存在相关关系 即 出现内生解释变量情况 导致估计结果有偏 解决的可行方法 解决的可行方法 1 在没有良好代理变量情况下 通过寻找外生变量作为工具变量进行估计 解决了内生解 释变量导致的有偏估计情况 得参数的到无偏 一致估计 2 二阶段最小二乘简单介绍 工具变量相关概念 使用的情况 解 二阶段最小二乘简单介绍 工具变量相关概念 使用的情况 解 决的问题 主要的估计思想等 决的问题 主要的估计思想等 工具变量法 工具变量法 1 由以上引例可以看出在解决内生解释变量问题时 通过需找一个满足一定条件的外生 变量 即工具变量来获取无偏的一致估计 故为工具变量法 2 何为工具变量 IV 在简单回归方程中 一个有效的工具变量 10 uxy 应满足以下两个条件 A 相关性 工具变量与内生解释变量相关 即 0 Cov xz B 外生性 工具变量与扰动项不相关 即 0 Cov uz 现在我们来证明可得到的工具变量能够用于进行方程一致性参数估计 特别地 为了 根据总体协方差写出 我们对方程两边求与z的协方差 得到 1 Cov Cov Cov 1 uzxzyz 现在 在与的假定下 我们可以解出为 0 Cov uz0 Cov xz 1 Cov Cov 1 xz yz 注意到如果z与x不相关 即 该简单代数式不成立 上式表明是0 Cov xz 1 z y之间的总体协方差除以z x之间的总体协方差的商 这说明了被识别 给定一个 1 随机样本 我们用对应样本量来估计总体的量 在分子和分母中约去样本容量后 我们得 到的工具变量 工具变量 IV 估计量 估计量 instrumental variables IV estimator 1 1 1 1 n i ii n i ii xxzz yyzz 给定x y和z的样本数据 很容易获得 IV 估计量 的 IV 估计量就为 0 除了其中的斜率估计量现在为 IV 估计量 它看起来就像 OLS 中的截xy 10 1 距估计量 传统的工具变量法一般都通过 二阶段最小二乘法 2SLS 或 TSLS 来实现 顾名思义 就是通过做两个回归来完成估计过程 第一阶段 用内生解释变量对工具变量回归 即 得到拟合值 OLS xz x 第二阶段 用被解释变量对第一阶段回归的拟合值进行回归 即 OLS yx 二阶段最小二乘法 二阶段最小二乘法 在前一节中 我们假定有单一的内生解释变量 和的一个工具变量 可往往 2 y 2 y 我们有不只一个的外生变量 它们被排斥在结构模型之外 且可能与相关 这意味着它 2 y 们是的有效的 IV 在本节中 我们讨论如何运用复工具变量 2 y 工具变量法作为矩估计方法 必须满足矩法估计的阶条件 一般的说 当我们在回归 模型中有不只一个的内生解释变量时 在若干复杂的情况下仍可能不能识别 但是 我们 可以容易地表述识别的一个必要条件 叫做阶条件阶条件 order condition 根据是否满足阶条件分为三种情况 A 不可识别 工具变量的个数小于内生解释变量的个数 B 恰好识别 工具变量的个数等于内生解释变量的个数 C 过度识别 工具变量的个数大于内生解释变量的个数 以上介绍的工具变量法仅适用于 恰好识别的情形 但在实际中存在多个内生解释变量 和工具变量的情况 就会出现 过度识别 的情况 解决方法之一就是扔掉 多余 的工具变 量 但这种方法不是有效的 因为丢掉的工具变量包含着有用的信息 导致估计的结果不 充分 此时运用二阶段最小二乘为有效估计 显然 多个工具变量的线性组合仍然是工具变量 仍满足工具变量的两条件 如果能生 成工具变量的线性组合数等于内生解释变量个数 则又回到了恰好识别的情形 在球型扰 动项的假定下 由二阶段最小二乘法所提供的工具变量线性组合是所有线性组合中最渐进 有效的 所以能良好解决过度识别问题 使工具变量法最终得到有效地一致估计 3 3 二阶段最小二乘法估计的基本原理和主要步骤 重点思想和推到 二阶段最小二乘法估计的基本原理和主要步骤 重点思想和推到 步骤 步骤 1 估计的基本步骤 估计的基本步骤 第一阶段 第一阶段 将每个解释变量分别对所有 L 个工具变量作 OLS 回归 得到拟合 1 k xx 1 2 L z zz 值为 1122 kk xPx xPxxPx 其中 为的投影矩阵 写成矩阵形式 可以定义 1 PZ Z ZZ Z 1 1212 kk Xx xxP x xxPXZ Z ZZ X 第二阶段 第二阶段 由于是的线性组合 参见第一阶段回归 故恰好包含 K 个工具变量 X 1 2 L z zz X 使用为工具变量对原模型进行工具变量法估计 XyX 1 IV X XX y 因此 可以看出 可以将视为把对进行 OLS 回归而得到的 故名为 二阶段最 IV y X 小二乘 需要注意的是 第二阶段回归得到的残差为 而原方程残差确 22 SLS eyX 是 因此在进行 2SLS 最好不要自己去进行两次手工回归 而是直接使用 2 SLS eyX 软件 如 STATA 进行回归分析 将代入方程 可得到 2SLS 的最终表达式 1 XZ Z ZZ X 1 IV X XX y 1 1 1 1 2 SLS X PXX PyX Z Z ZZ XX Z Z ZZ y 2 二阶段最小二乘相关检验 二阶段最小二乘相关检验 在使用工具变量法估计的时候 必须对工具变量的有效性进行检验 否则 导致估计结 果不一致或估计量的方差过大 A 检验工具变量与解释变量的相关性检验工具变量与解释变量的相关性 前面在使用工具变量进行估计的时候 工具变脸必须与内生解释变量完全不相关 否则 就无法使用工具变量法估计 如果仅仅微弱的相关 成为 若工具变量 其后果类似于样 本容量较小 导致估计量性质变得很差 统计推断失效 判断弱工具变量的方法之一为 在第一阶段回归中 检验原假设 21122 xxze 一个经验规则 如果次检验的 F 统计量大于 10 则可拒绝 存在弱工具变量 02 0H 的原假设 不必担心弱工具变量问题 在多个内生解释变量的情况下 将有多个第一阶段 回归 固有多个 F 统计量 此时运用 最小特征值统计量 STATA 提供了最小特征值统计 量的临界值 B 检验工具变量的外生性检验工具变量的外生性 举例说明 假定我们有单一的被怀疑的内生变量 123122101 uzzyy 其中和是外生的 我们有另外两个外生变量 和 它们不出现在方程中 1 z 2 z 3 z 4 z 我们在介绍简单的工具变量估计量时 我们强调 IV 必须满足两个必需条件 它必须 与误差不相关 与内生解释变量相关 我们在相当复杂的模型中已看到 如何判断在诱导 型回归中是否能用一个t或F检验来检验第二个必需条件 我们声称第一个必需条件不能 被检验 因为它涉及到 IV 与未观测到的误差之间的相关 然而 如果我们有不只一个的 工具变量 我们就能有效地检验它们中的一部分是否与结构误差不相关 作为一个例子 在有另外两个工具变量和的条件下 重新考虑方程 我们知道仅 3 z 4 z 用作为的 IV 就能估计 给定 IV 估计值 我们就能计算残差 3 z 2 y 因为在估计中根本没用到 我们可以验证与 231221011 zzyyu 4 z 4 z 在样本中是否相关 如果它们相关 不是的有效 IV 当然 这并没有告诉我们 1 u 4 z 2 y 与是否相关 实际上 因为它是个有用的检验 我们必须假定假定与不相关 然而 3 z 1 u 3 z 1 u 如果和是用相同的逻辑来选择的 例如母亲的教育和父亲的教育 发现与 3 z 4 z 4 z 相关将使人对用作为 IV 产生怀疑 1 u 3 z 因为和的角色可以交换 若是假定与不相关 我们也可以检验与是否 3 z 4 z 4 z 1 u 3 z 1 u 相关 我们该用哪个检验呢 结果是 我们对检验的选择是无关紧要的 我们必须假定至 少有一个 IV 是外生的 然后 我们可以对 2SLS 中所用的过度识别约束过度识别约束 overidentifying restrictions 进行检验 根据我们的用意 过度识别约束的数目简单地就是额外的工具变量 的数目 假定我们只有一个内生解释变量 如果我们只有的单一个 IV 而没有没有过度识 2 y 别约束 也就没什么可检验的 如果我们有的两个 IV 如同前面的例子中那样 则我 2 y 们有一个过度识别约束 如果我们有三个 IV 则有两个过度识别约束 等等 检验过度识别约束是相当简单的 我们必须获得 2SLS 残差 然后做一个辅助回归 检验 任意多个 过度识别约束检验 任意多个 过度识别约束 i 用 2SLS 估计结构方程 获得 2SLS 残差 1 u ii 将对所有外生变量回归 获得 即 1 u 2 R 2 1 R iii 在所有 IV 都与不相关的虚拟假设下 其中q是模型之外的工具 1 u 22 1 q a nR 变量的数目减去内生解释变量的总数目 如果超过了分布中的 例如 5 临界值 2 1 nR 2 q 我们拒绝 所有工具变量都是外生的 所有工具变量都是外生的 并推断出至少部分的 IV 不是外生的 0 H C 究竟该用究竟该用 OLS 还是工具变量法 对解释变量内生性的检验还是工具变量法 对解释变量内生性的检验 当解释变量是外生的时 2SLS 估计量不如 OLS 有效 正如我们已看到的 2SLS 估计 值会有非常大的标准误 因此 检验一个解释变量的内生性是有用的 它说明了 2SLS 甚 至是否必要 获取这样的检验相当简单 举例说明 假定我们有单一的被怀疑的内生变量 1 123122101 uzzyy 其中和是外生的 我们有另外两个外生变量 和 它们不出现在方程 1 中 1 z 2 z 3 z 4 z 如果与不相关 我们该用 OLS 估计 对此我们如何检验呢 Hausman 1978 建议 2 y 1 u 直接比较 OLS 和 2SLS 估计值 判断其差异是否在统计上显著 毕竟 如果所有变量外生 OLS 和 2SLS 都是一致性的 如果 2SLS 与 OLS 的差异显著 我们断定必定是内生的 2 y 保持外生性 计算 OLS 和 2SLS 看估计值是否实际上有差异 这是个好主意 为了 j z 判断差异是否在统计上显著 用回归来检验更容易 这是以估计的诱导型为基础的 此 2 y 时诱导型为 2 24433221102 vzzzzy 现在 因为各个与不相关 所以与不相关当且仅当与不相关 这是我们希 j z 1 u 2 y 1 u 2 v 1 u 望检验的 写成 其中与不相关 且有零均值 那么 与不相关 1211 evu 1 e 2 v 1 u 2 v 当且仅当 检验这一点最容易的方法是将作为添加的回归元包括在 1 中 做0 1 2 v t检验 这么做唯一的问题是 不能被观测到 因为它是 2 中的误差项 可是因为我 2 v 们能用 OLS 估计的诱导型 我们可以获取诱导型残差 因此 我们用 OLS 估计 2 y 2 v 3 errorvzzyy 2123122101 并用t统计量检验 如果我们以一个小的显著水平拒绝 我们因与相0 H 10 0 H 2 v 1 u 关推断出是内生的 进而运用 2SLS 估计比 OLS 估计更有效 2 y 附 广义距估计 附 广义距估计 GMMGMM 在扰动项存在异方差或自相关情况下 广义距估计 在扰动项存在异方差或自相关情况下 广义距估计 GMMGMM 比 比 二阶段最小二乘 二阶段最小二乘 2SLS2SLS 更有效率 即 更有效率
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025广东依顿电子科技股份有限公司招聘HRBP岗模拟试卷及答案详解1套
- 2025年甘肃省平凉市灵台县第二批城镇公益性岗位人员招聘114人模拟试卷及一套答案详解
- 2025年临沂平邑县部分事业单位公开招聘教师(17名)考前自测高频考点模拟试题附答案详解(模拟题)
- 2025年烟台市公费医学生考试选聘(139人)考前自测高频考点模拟试题完整答案详解
- 2025年威海技师学院公开招聘工作人员(29名)考前自测高频考点模拟试题及答案详解(易错题)
- 2025年甘肃省兰州新区市政投资管理集团有限公司急需紧缺技术岗位人员招聘32人考前自测高频考点模拟试题及1套参考答案详解
- 云南企业战略咨询方案
- 2025年日照科技职业学院公开招聘教师41人模拟试卷完整参考答案详解
- 2025年温州永嘉县人民医院医共体分院招聘劳务派遣人员2人模拟试卷及一套参考答案详解
- 2025年福建省泉州市洛江区公办学校招聘编制内9人模拟试卷及参考答案详解一套
- Hytera海能达HM780 说明书
- 2025年衢州编外考试试题及答案
- 2025-2026学年苏少版(2024)小学美术一年级上册教学计划及进度表
- 水务局面试真题及答案解析:水利行业招聘面试实战
- 邮政储蓄网点一点一策实施方案
- 2025年飞行服务站无人机培训行业现状分析报告
- 2025年中医理疗师考试题库及答案
- 强迫性障碍护理查房
- 物业对中介管理办法
- 骨科病人饮食护理课件
- 2025年财政知识竞赛考试题库及答案(共50题)
评论
0/150
提交评论