




已阅读5页,还剩47页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 第九章设定误差与测量误差 SpecificationErrorandMeasurementError 2 在前面的章节中 我们考虑回归模型时 我们隐含地假定了所选择的模型 是对现实的真实反映 即它正确地反映了所研究的系统的运行机制 用专业术语讲 就是假定所选模型中不存在设定误差 但完全正确的模型设定只有理论意义 在实践中也许永远达不到 我们只是希望找到一个能够合理反映现实的模型 即一个好的模型 3 传统建模方法的过程 1 根据有关经济理论的阐释或社会经济实践的惯常经验 选择模型应当包含的变量及模型具体的函数形式 构建理论模型 2 收集相关变量的样板观测数据 采用一定的计量经济学方法 对模型参数进行估计 求出理论模型的样本估计式 3 对模型样本估计式进行理论检验 统计检验及计量经济学检验 如果检验结果能满足先验假设的要求 模型估计式便被接受 4 实际经济问题范围广泛 类型多样 经济理论难易对所有对象都给出具体的阐释 实践经验也不总是能够提供可以借鉴的参照 在这种情况下 理论模型的构建就将因缺乏依据而不能令人信服 即使所研究的问题有相关理论的说明或实际经验的参考 但对于某个具体的经济现象 有其特殊性 是否一定符合理论与经验的常规 还是一个有待证明的问题 有时虽然能根据经济理论和实际经验构建出一个好的理论模型 但由于数据资料不满足要求 参数估计困难等原因 使其不具有实用性 计量经济模型的传统建模方法的缺陷 5 好的 模型具有的特性 一 简单性模型永远无法完全把握现实 并非越复杂的模型越能反映现实 在建模过程中一定程度的抽象或简化反而是更易操作和抓住关键 二 可识别性对于给定的一组数据 每个参数只有一个估计值 6 三 拟合优度回归分析的基本思想是用模型中所包含的变量来尽可能地解释被解释变量的变化 因此 拟合优度越高 则认为模型就越好 四 理论一致性无论拟合优度多高 一旦模型中的一个或多个参数的符号有误 该模型就不是一个好的模型 五 预测功效Friedman 对模型的真实性的唯一重要的检验是预测值与经验值的比较 即 模型预测越准确 模型越好 7 如果模型不是 好 模型 那就要考虑模型的设定是否正确 具体来说 是否遗漏了重要的变量 是否包含了多余的变量 模型的函数形式是否正确 随机扰动项的设定是否合理 数据收集是否有误差 8 模型设定误差 变量的设定误差模型函数的设定误差随机扰动项的设定误差变量数据的测量误差 本章主要讨论 变量的设定误差变量数据的测量误差 9 一 变量设定误差的后果 第一节设定误差 变量设定误差主要有两类 相关变量的遗漏 欠拟合 无关变量的误选 过拟合 10 1 遗漏相关变量 欠拟合 的后果把采用遗漏了重要解释变量的模型进行估计而带来的偏误 称为遗漏相关变量误差 假定真实模型为 Yi 1 2X2i 3X3i ui但因某种原因遗漏了解释变量X3 而将模型设为 Yi 1 2X2i vi 11 1 如果遗漏的解释变量X3和含有的X2相关 则 1和 2的OLS估计值是有偏的 且非一致的 且偏离程度随着相关程度的增加而增大 2 如果遗漏的解释变量X3和含有的X1不相关 2的估计值是无偏误的 但截距项 1的估计值依然是有偏误的 12 2 引入无关变量 过拟合 的后果把采用误选了无关解释变量的模型进行估计而带来的偏误 称为引入无关变量误差 假定真实模型为 Yi 1 2X2i ui而加入了无关解释变量X3 模型被设定为 Yi 1 2X2i 3X3i vi 这时 参数的OLS估计量是无偏的和一致的 但不是有效估计量 13 1 遗漏相关变量 则系数既有偏误且非一致 随机误差的估计不正确 假设检验无效 2 包含无关变量 依然给出真实模型中的系数的无偏且一致估计量 随机误差的估计正确 假设检验有效 唯一代价是 系数的方差估计变大了 总结 虽然误选无关变量不如遗漏相关变量的后果严重 但我们也不能下结论 与其略掉相关变量 不如包含无关变量 因为增加无关变量将导致估计量的方差增大 引起参数估计精度下降 并且将引发多重共线性的问题 还将导致自由度的损失 14 第二节设定误差的检验 引入无关变量的检验模型误选了无关解释变量的检验 比较简单 只要针对变量系数为零的假设 用t检验或F检验 对变量系数作显著性检验即可判断哪些变量是无关变量 15 遗漏相关变量的检验模型遗漏重要解释变量的检验要相对复杂 方法主要有 1 DW检验 2 拉格朗日乘数检验 3 一般性检验除此之外 还有似然比检验 沃尔德检验 豪斯曼检验等 16 一 DW检验 基本思想 遗漏的相关变量应包含在随机扰动项中 那么回归所得的残差序列就会呈现自相关性 以 为例 因此可从自相关性的角度检验相关变量的遗漏 17 DW检验步骤如下 1 对设定的回归模型运用OLS估计得残差序列ei 2 假设H0 未遗漏相关变量 H1 遗漏相关变量 3 计算DW统计量 4 查DW表 得临界值dL和dU 进行判断 如果DW值显著 则拒绝原假设 表明遗漏了重要的解释变量 否则 表明没有遗漏 18 二 拉格朗日乘数检验 基本思想 遗漏的相关变量应包含在随机扰动中 因此回归所得的残差序列应与遗漏的相关变量呈现出某种依存关系 所以对残差序列与相关变量进行回归 若相关变量具有统计显著性 则认为存在遗漏相关变量形成的设定误差 19 拉格朗日乘数检验步骤如下 1 对设定的回归模型运用OLS估计得残差序列ei 2 用ei对全部的解释变量 包括遗漏变量 进行回归 得可决系数R2 3 假设H0 未遗漏相关变量 H1 遗漏相关变量 4 构造检验统计量nR2 在大样本情况下 nR2 x2 m m为受约束变量的个数5 进行判断 若nR2 x2a m 则拒绝原假设 表明遗漏了重要的解释变量 否则 表明没有遗漏 20 三 一般性检验 一般性检验 RESET regressionspecificationerrortest 是拉姆齐 Ramsey 于1969年提出的一种检验方法基本思想 在事先不知道遗漏哪个变量的情况下 可寻找一个替代变量Z来检验 若模型回归所得的残差包含着遗漏的相关变量 那么这个残差可用被解释变量拟合值的某个函数近似表示 因此替代变量Z通常选用所设定模型被解释变量拟合值的若干次幂的线性组合 若这个线性组合是显著的 则认为存在遗漏相关变量 21 一般性检验步骤如下 1 对设定的回归模型 2 以的线性组合作为替代变量 工具变量 通常选择的平方 立方和四次方的线性组合 对下列模型进行估计 运用OLS估计得被解释变量拟合值 1 2 实际上 认为 22 3 构造原假设H0 然后用F统计量进行检验 其中RSSR和RR2分别是对 1 式回归得到的残差平方和与拟合优度 RSSU和RU2分别是对 2 式回归得到的残差平方和与拟合优度 J为约束条件的个数 在这里J 3 4 若F统计量的值大于临界值 则拒绝H0 表明有设定误差 否则 表明无设定误差 23 对F统计量的说明 若F较小 意味着RSSR与RSSU接近 即ui与vi接近 从而都接近于零 即原假设H0成立 反之若F较大 表明原假设不成立 所以可用F统计量检验 式子中除以J和n k J 是为了分别消除约束个数和自由度的影响 所以 故 因为 24 注意到 于是 25 第三节测量误差 在计量经济模型中 由于变量使用了不准确的数据 而导致的模型误差称为测量误差 主要原因有 1 理论误差 汇总数据可能只是理论值的近似而形成理论误差 2 登记误差 由于虚报或误报而产生登记误差 3 统计误差 由于统计口径不一致或误解指标含义而产生统计误差 4 整理误差 由于汇总计算而产生的数据整理误差 26 一 测量误差的后果 1 被解释变量的测量误差设真实的模型为 其中Yi 为被解释变量的理论值 Xi为解释变量的理论值 假设由于某种原因 被解释变量的观测值Yi与理论值之间存在一个测量误差ei 即 1 27 于是上述模型相应变为 为使问题简化 假定 且ui和ei是不相关的 于是 因此 如果用OLS分别估计 1 和 2 式 得 2 28 由于 所以当被解释变量存在测量误差时 将会增大回归系数估计值的误差 并且误差幅度随着测量误差的增大而增大 对于 1 式 对于 2 式 29 2 解释变量的测量误差设真实的模型为 其中Yi Xi 分别为被解释变量和解释变量的理论值 假设解释变量的观测值Xi与理论值之间存在一个测量误差ei 即 1 则 1 式变为 30 由于 所以 2 31 这说明模型 2 中解释变量Xi与随机误差项vi是相关的 在这种情况下 如果运用OLS估计系数 则 32 由于Xi与vi的相关性 上式右边第二项不为零 所以 这表明 当模型中解释变量存在测量误差时 系数的最小二乘估计将是一个有偏估计 33 二 测量误差的检验 豪斯曼 Hausman 1978年提出了一种检验测量误差的方法 基本思想 如果存在测量误差 则测量误差应反映在残差中 将残差作为解释变量加入到模型中进行回归 其参数估计量应显著 34 检验步骤如下 1 对所研究的回归模型 无论是否存在观测误差 先采用OLS法得到参数估计量 2 对可能存在测量误差的解释变量 选择与其相关的工具变量 将该解释变量对选择的工具变量进行回归 得到残差 3 将残差加入第 1 步中的回归表达式 再次进行OLS估计 得残差的参数估计值 4 对残差的参数估计值进行检验 若显著则认为该解释变量确实存在测量误差 反之则没有 35 本章重点 1 变量设定误差和数据测量误差的后果 2 设定误差的检验 DW检验 拉格朗日乘数检验 一般性检验 3 测量误差的检验 豪斯曼检验 36 例利用表1资料 试分析影响中国进口量的主要因素 表1影响中国进口量的主要因素 37 38 39 一 模型设定 设定模型为 LSIMCGDP 用最小二乘估计 40 先用图形诊断 1 绘制et 1与et的散点图 SCATe 1 e GENRe resid 41 2 绘制et的图形 点击 View actual fitted residual residualgraph 从以上图形看出 存在自相关 可能遗漏了重要的相关变量 LSIMCGDP 42 因为n 24 k 1 取显著性水平 0 05时 查表得dL 1 273 dU 1 446 而0 0 5357 DW dL 所以 二 DW检验 1 在命令窗口键入 2 检验 存在遗漏变量现象 LSIMCGDP 43 三 校正 1 在命令窗口键入 LSIMCGDPGDP 1 ZHZH ZH ZH的系数在统计上不显著 剔除 44 2 在命令窗口键入 LSIMCGDPGDP 1 ZH ZH 因为n 23 k 3 取显著性水平 0 05时 查表得dL 1 078 dU 1 66 而2 2 048 DW 4 dL 所以 已不存在自相关 表明模型无变量设定误差 45 四 拉格朗日乘数检验 设定模型为 1 用最小二乘估计 LSIMCGDP GENRe resid 生成残差序列 2 用残差序列E对所有解释变量进行回归 LSECGDPGDP 1 ZH ZH 3 检验 因为nR2 23 0 72736 16 72928 查表得X20 025 2 7 37776 显然 16 72928 7 37776 故拒绝假设H0 未遗漏相关变量 表明有遗漏相关变量 46 47 五 一般性检验 设定模型为 1 用最小二乘估计 LSIMCGDP 生成序列 GENRY1 1607 337 0 230696 GDP 2 选择Y1的2 3 4次方的线性组合对下列模型作估计 LSIMCGDPY12Y13Y14 48 3 检验 因为n 24 k 2 J 3 取显著性水平 0 05时 查表得临界值F0 05 J n k J F0 05 3 19 3 13 由于F 650 7795 3 13 所以拒绝H0 表明有遗漏相关变量 49
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农业生态系统服务功能的动态评价模型-洞察阐释
- 食品加工服务市场潜力分析-洞察阐释
- 数字化时代新闻出版新业态-洞察阐释
- 2025至2030年中国珠宝零售行业市场运行态势及投资战略研判报告
- 基于用户行为特征的安全威胁检测模型(增强现实领域)-洞察阐释
- 苹果审核周期与审核标准的动态分析-洞察阐释
- 浙江制药有限公司年产75吨托西酸舒他西林、10吨辛伐他汀、120吨碘克沙醇技改项目环境影响报告书
- 食品加工中的功能食品开发-洞察阐释
- 开放式创新驱动农业新质生产力的机制分析
- 数据驱动的旅游营销策略-洞察阐释
- 智慧树知到《运动生理学》章节测试答案
- 中医师承跟师月记1000字
- 香格里拉酒店
- 不定型耐火材料浇注施工工艺
- 4.1被动运输课件高一上学期生物人教版必修1
- 《基于PLC智能照明控制系统设计》开题报告2000字
- 《起重机械安全技术规程(第1号修改单)》
- 食品安全追溯管理制度范文
- 某年县区首届“百姓大舞台”活动方案
- 起重设备定期检查维护制度
- 遗传与生活智慧树知到答案2024年哈尔滨师范大学
评论
0/150
提交评论