本科经济计量学第7章(第4版)_第1页
本科经济计量学第7章(第4版)_第2页
本科经济计量学第7章(第4版)_第3页
本科经济计量学第7章(第4版)_第4页
本科经济计量学第7章(第4版)_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第7章模型的选择:标准和检查,我们已经提到了模型的设定误差,但在实际应用中,必须尽量避免设定误差,所以在选择模型时要特别注意。 本章主要考虑以下问题: (1)“好”或“正确”模型具有什么性质? (2)在实践中可能会犯什么类型的设定误差? (3)设定误差的结果会怎么样? (4)如何诊断设定误差? (5)设定误差的纠正措施是什么? 缺少7.1“好”模型具有的性质7.2设定误差的类型7.3相关变量:包含了“太低适合”模型7.4相关变量。 “过高合适”模型7.5不合适的函数形式7.6测量误差7.7诊断设定误差:检查设定误差7.8总结7.1“好”模型具有的特性简约性(节约性) -模型尽可能简单的识别性-

2、各参数只有一个估计值适合度高-适合度越大,理论一致性-理论一致性而不是理论预测能力被证实了, 7.2设定误差类型1 .相关变量的缺失:“太低的适合”模型2 .包含相关变量:“太高的适合”模型3 .采用了错误的函数形式4 .测量误差,7.3相关变量的缺失:“太低的适合”模型,考虑练习问题4.14的数据,yi=b1b2x2I 如果我们采用的推定的是Yi=A1 A2X2i vi (7-2)、返回(7-6)、残差检查、不适合,请注意此时vi的性质: vi中含有B3X3i ui。 这可能会发生缺少重要说明变量的错误。 若返回(7-12 ),则由于变量X3t发生欠缺,因此当该变量是重要的变量时,会产生欠缺

3、变量的偏差,(1)在x3与X2相关的情况下,估计量a1和a2与偏差不一致;(2)在x3与X2不相关的情况下,估计量a2产生偏差推定量a2的方差有偏差的(5)置信区间和假设检定不可靠,例7.1幼儿死亡率的决定要因利用表4-7所示的数据,式(7-1)的回归结果为CMI=263.6416-0.0056 pgn PPI-2.2316 fl rise=(11.5932 ) R2=0.6981; 另一方面,错误设置公式(7-2)的回归结果是CMI=157.4244-0.0114 pgnpiser=(9. 8455 ) (0. 0032 ) (7-7) t=(15.989 ) (-3.5157 )2=303

4、228.5; R2=0.1528; 返回(7-13 )、(1)错误的设定式显示,PGNP每增加1美元,平均婴儿死亡率就下降约0.01。 实际模型显示,PGNP每增加1美元,平均婴儿死亡率约减少0.006。 错误设定方程式高估了(绝对值) PGNP对CM的影响。 注意2个回归结果中,(2)切片也有偏差,在本例中,低估了真切片值(比较式(7-6)和(7-7) ) (3)根据两模型估计的RSS也明显不同(4)切片和斜率的标准偏差也明显不同(5)两模型的判定系数也明显不同在这种情况下,可能会犯“过剩适合”和“过剩设定”模型(即,包含非必要的变量)的错误。 这可能是因为经济理论不完善,以及研究者无法确定

5、变量在模型中的作用。 如果在模型中包含非相关变量,会产生什么样的结果呢? 我们还在用简单的二变量和三变量模型进行说明。 假设: Yi=B1 B2X2i ui (7-9)是正确设定的模型,但某研究者添加了多馀的变量X3的模型: yi=a1a2x2ai3x3vi(7-10 )其中,如果设定误差过度适合模型,R2值会增加(变量系数的t其他结果是,(1)“不正确”模型(7-10 )的OLS估计量没有偏差(一致)。 (2)从回归式(7-10 )得到的2的估计量是适当的估计值。 (3)标准置信区间和假设验证仍有效。 (4)但是,回归式(7-10 )中估计的参数的方差通常比实际模型(7-9)中估计的参数的方

6、差大。 因此,假设验证是有效的,但估计的系数值不像从正确模型估计的真值那么准确。 简单地说,OLS估计量是线性无估计量,但不是最佳的线性无估计量。 另外,从上述讨论中,我们注意到相关变量的缺失比不包含相关变量的结果更为严重。 但是,通常,为了避免缺少相关变量,不推荐包含可能不相关的变量。 1 .不必要的变量的增加降低了估计量的有效性(即,更大的标准差)。 2 .可能引起多重共线性问题3 .自由度损失很大。 正确选择变量很重要。 7.5错误的函数形式现在考虑了另一个设定误差。 假设模型中包含的变量y、X2、X3在理论上是正确的变量,则yi=b1b 2x2ib 3x 3ui (7-1) lnyi=

7、a1a2lnx 2i3lnx 3vi (7-12 )方程式(7-1)和(7- 12 )方程式的变量相同,但变量不同。 注意:公式(7-12 )是对数线性模型,参数A2测量y对X2的弹性,而公式(7-1)中,B2仅测量y和X2的变化率(斜率),两者不同。 如何从这两个方程式中选择模型? 使用不适当的模型拟合数据时,会出现模型的设置误差,并且估计的系数很可能是真系数的偏差估计。 例7.3美国进口商品支出考虑表7-1所示数据: 19592006年美国进口商品支出y,个人可支配收入x数据(单位: 10亿美元)。 以下是模型(7-1)和(7-12 )的拟合结果: t=36295.32.2975 x2t-

8、18.5253 x3t=(6. 3790 ) (20.5203 ) (-6.403 ) (7- 13 ) r2=0. 9839; lnt=10.9327.4857 lnx2t-0.0085 x3t=(0.7014 ) (13.6501 ) (-1.0215 ) (7- 14 ) R2=0.9959 (7- 14 )的回归结果是,进口支出对PDI的弹性约为1.49%,进口支出为0.8 另外,两个方程式的R2值也不能比较。 这是因为在这两个模型中,要解释的变量不同。 查看Eviews文档。 7.6测量误差,我们一直假设隐式失真变量y和解释变量x没有测量误差。 即,回归时,假定这些变量的数据正确,没

9、有测定误差。 但是,在实践中,这种假设可能不被满足。 测定误差的结果取决于误差发生在失真变量中还是发生在解释变量中。 如果7.6.1应变量的测定误差仅为应变量的测定误差,则(1)OLS估计量不偏向。 (2)OLS估计量的方差也没有偏差。 (3)估计量的估计方差比没有测量误差时大。 7.6.2说明变量中的测定误差说明变量中有测定误差时,(1)OLS估计量有偏差。 (2)OLS的估计量不一致。 因此,解释变量中的测量误差是一个重大问题。 如果失真变量和解释变量都有测量误差,问题就更严重了。 纠正措施: (1)尽可能准确地处理变量x的数据,避免记录、舍入、错误,确保数据的可比性。 (2)使用工具变量

10、(或替代变量)。 这些变量与原始x变量高度相关,但与测量误差和回归误差项无关。 有时能找到这样的变量,但也有困难。7.7诊断设定误差:设定误差的检查,7.7.1诊断非相关变量的存在7.7.2缺失变量和不正确的函数形式的检查7.7.3 MWD检查7.7.4回归误差的设定检查,知道设定误差的类型和结果,但我们建立的模型中是否存在设定误差,设定误差是哪一个? 只要知道这个,就能知道我们的模型是不是正确的,如果不正确的话,会怎么改善。 如果经济理论表明某变量X1、X2、X3影响y,即使其中某变量的系数在统计上不明确,该模型当然也应包含这三个变量。 如果不能确定模型中是否还包含变量X4,则将变量X4导入

11、到模型中,当验证(t检验)的变量在统计上不明显时,删除对模型不太影响(对估计值和假设检验的结果不太影响)的变量。 如果无法确定模型是否还包含变量X4和X5,则可以通过f检验验证零假设: B4=B5=0。 7.7.1诊断非相关变量的存在,例7-4 85个国家的生命期望为评价收入和保健对生命期望的影响,收集了85个国家的数据,回归结果如下表所示。 应变量是生命的期望(单位:年)。 具体指标可以比较看到Eviews文件的输出结果。 7.7.2缺失变量和不正确函数形式的检查首先根据理论和调查和以前的工作经验,构建我认为掌握了问题本质的模型。 然后对该模型进行实证验证,慎重分析回归结果。 为了判断模型是

12、否合适,主要根据(1)与预测相比,估计系数的符号(2) R2和修正后的R2 (3)中估计的t值,残差检查残差ei也可以用于检查模型的设定误差。 例如,检查是否缺少某个重要变量,或者检查是否使用了错误的函数形式。 例如,如果模型(7-1)和(7-2)使用方程式(7-2)是正确的方程式(13-1 ),那么模型(7-2)的误差项与vt=B3X3t ut (即,残差项vt与X3t相关,并且不是白噪声,而是残差的返回到模型(7-13 ) :将进口支出回归到PDI和时间。 假设我们错误地错过了时间和趋势变量,估计了以下回归公式: y :进口商品支出; x :如果模型中应该包含个人可支配的收入,即趋势变量X

13、3,则上面模型中的误差项目如下。 残差给出了几种系统模型。 注: S1是漏掉趋势变量后模型的残差,S2是包含趋势变量模型的残差的具体结果Eviews文件。 其他检查设定误差的方法(1)麦克金农白大卫逊检查(MWD检查) (2)拉姆齐复位检查(设定误差检查) (3)华尔德检查(4)拉格朗日乘数检查(5)主机检查(6) boxcoxco (以确定回归模型的函数形式)在7.7.3线性模型和对数线性模型之间进行选择: MWD检验,H0:线性模型: y为x的线性函数H1:对数线性模型: lnY为x或lnX的线性函数估计线性模型, 得到y的推定值推定线性对数模型,得到lnY的推定值,求出y对x和Z1i的回

14、归,如果t检验Z1i的系数在统计上有意义,则拒绝H0;检验步骤如下:(6)如果命令lnY对x或lnX和Z2i的回归的Z2i的系数在统计上有意义,则拒绝H1 在假设实际进口支出函数是线性的情况下得到的结果是:下表:7.7.4回归误差设定检查: RESET,RESET检查步骤: (1)根据原设定模型推定y值,(2)残差图表示残差和y的推定值之间有某种曲线关系,则RESET检查的一个优点是不需要设定选择模型,因此能简单地执行。但是,如果检查的结论表示原来的模型设定错误,则该检查结果对选择正确的模型没有帮助。 关于进口支出的一个例子,方程式(7-23 )的实证分析结果见下表:用式(7-24 )进行f检验,由于该值大于当时的f阈值5.122,拒绝了零假设,即原来的模型被错误地设定了。 7.8总结本章讨论的要点如下。 1 .古典线性回归模型假定实证分析中使用的模型“设定正确”。 2 .模型的正确设置有几个意义(包含的变量不多、不少、函数形式正确等)。 如果模型忽略了重要变量,该模型的估计系数通常有偏差,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论