计量经济学11_第1页
计量经济学11_第2页
计量经济学11_第3页
计量经济学11_第4页
计量经济学11_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三部分第三部分 实践中的实践中的回归分析回归分析chp 11 标准与检验标准与检验11-2主要内容主要内容n优良模型的性质优良模型的性质n设定误差的类型设定误差的类型n遗漏相关变量遗漏相关变量n包括不相关变量包括不相关变量n不正确的函数形式不正确的函数形式n度量误差度量误差n设定误差的诊断设定误差的诊断n小结小结11-3一、优良模型的性质一、优良模型的性质n简约性(简约性(parsimony)n可识别性(可识别性(identifiability)n拟合优度(拟合优度(goodness of fit)n理论一致性(理论一致性(theoretical consistency)n预测能力(预测能力

2、(predictive power)11-4二、设定误差的类型二、设定误差的类型n导致模型失效的设定误差主要包括如下几导致模型失效的设定误差主要包括如下几种类型:种类型:遗漏相关变量遗漏相关变量包括不必要的变量包括不必要的变量采用了错误的函数形式采用了错误的函数形式度量误差度量误差11-5三、遗漏相关变量三、遗漏相关变量 “过低拟合过低拟合”模型模型n考虑如下模型:考虑如下模型:yi=b1+b2x2i+b3x3i+ui其中,其中,y为婴儿死亡率,为婴儿死亡率,x2为人均为人均gnp,x3为女性识为女性识字率字率n若在建模时遗漏了变量若在建模时遗漏了变量x3,则有:,则有:yi=a1+a2x2i

3、+vi12233iiiiybb xb xu 11-6n遗漏变量遗漏变量x3将导致的后果:将导致的后果:如果遗漏变量如果遗漏变量x3与模型中的变量与模型中的变量x2相关,则相关,则a1和和a2是有偏的,即:其均值或期望值与真实值是有偏的,即:其均值或期望值与真实值不一致,用符号表示如下:不一致,用符号表示如下:e(a1) b1,e(a2) b2n可以证明:可以证明:e(a2) =b2+b3b32e(a1)=b1+b3 (e(x3)-b32e(x2)11-7a1和和a2也是不一致的,即无论样本容量有多大,也是不一致的,即无论样本容量有多大,偏差也不会消失偏差也不会消失如果如果x2与与x3不相关,则

4、不相关,则b32为零。为零。根据错误模型得到的误差方差是真实误差方差根据错误模型得到的误差方差是真实误差方差的有偏估计量;的有偏估计量;a2的方差是真实估计量的方差是真实估计量b2方差的有偏估计量。方差的有偏估计量。通常的置信区间和假设检验过程不再可靠。通常的置信区间和假设检验过程不再可靠。11-8n例例11-1 :婴儿死亡率的决定因素:婴儿死亡率的决定因素正确:正确:cm=f(pgnp,flr,u)错误:错误:cm=f(pgnp,u)n启示启示:在建立模型时,要对研究现象:在建立模型时,要对研究现象所蕴含的经济理论做深入了解,从而所蕴含的经济理论做深入了解,从而把相关变量都纳入模型。把相关变

5、量都纳入模型。11-9四、包括不相关变量四、包括不相关变量“过度拟合过度拟合”模型模型n模型包括不必要变量将导致的后果模型包括不必要变量将导致的后果不不相关变量偏差相关变量偏差假定下列包含双变量的模型为正确:假定下列包含双变量的模型为正确:yi=b1+b2x2i+ui但建模时包括了不必要的变量但建模时包括了不必要的变量x3,即:,即:yi=a1+a2x2i+a3x3i+vi该模型的估计后果:该模型的估计后果:11-10n“不正确不正确”模型的模型的ols估计量是无偏的,即估计量是无偏的,即e(a1)=b1, e(a2)=b2, e(a3)=0n方差方差 2的估计量是正确的的估计量是正确的n建立

6、在建立在t检验和检验和f检验基础上的标准的置信检验基础上的标准的置信区间和假设检验仍然是有效的。区间和假设检验仍然是有效的。n错误的回归方程中估计的错误的回归方程中估计的a是无效的是无效的其其方差比从真实模型中估计的方差比从真实模型中估计的b的方差大。的方差大。11-11五、不正确的函数形式五、不正确的函数形式nyt=b1+b2x2t+b3x3t+ut(1)b2度量了度量了y对对x2的变化率的变化率nlnyt=a1+a2lnx2t+a3lnx3t+vt(2)a2度量了度量了y对对x2的弹性,的弹性,n实践中,经济理论没有明确应变量与解释实践中,经济理论没有明确应变量与解释变量之间的函数形式,假

7、定对数形式是正变量之间的函数形式,假定对数形式是正确的,但人们很可能用(确的,但人们很可能用(1)式来拟合数据,)式来拟合数据,导致模型设定误差。导致模型设定误差。11-12n例:例:11-3 美国进口货物的支出(美国进口货物的支出(p251)n=-751.47+0.576x-19.01timen t= -5.63* 8.68* -5.43*nr2=0.96,ad_r2=0.96,f=233.3nln=-22.01+3.66lnx-0.0458timen t= -4.17* 5.10* -2.32*nr2=0.96,ad_r2=0.96,f=233.311-13n例:例:11-3 美国进口货物

8、的支出(美国进口货物的支出(p251)分别用上述两种模型对数据进行拟合,其中:分别用上述两种模型对数据进行拟合,其中:n模型一的所有回归系数都显著,模型一的所有回归系数都显著,x的回归系数表明的回归系数表明在其他条件不变的情况下,个人可支配收入每增加在其他条件不变的情况下,个人可支配收入每增加1美元,平均进口支出将增加美元,平均进口支出将增加57美分,美分,n模型二的回归系数亦显著,其中,进口支出对模型二的回归系数亦显著,其中,进口支出对pdi的弹性约为的弹性约为3.66,而时间的回归系数表明,在其他,而时间的回归系数表明,在其他变量保持不变的条件下,进口支出年均以变量保持不变的条件下,进口支

9、出年均以4.58%的的速率降低,速率降低,。,。两个模型难以进行直接的比较两个模型难以进行直接的比较11-14六、度量误差六、度量误差n一般地,我们隐含地假定应变量和解释变量不存一般地,我们隐含地假定应变量和解释变量不存在度量误差,即在度量误差,即数据是准确的数据是准确的,而不是臆断的、,而不是臆断的、外推的、内插的或围绕某个系统样式。实践中,外推的、内插的或围绕某个系统样式。实践中,这种假定往往难以满足。这种假定往往难以满足。n应变量中的度量误差应变量中的度量误差导致的后果:导致的后果:ols估计量是无偏的;估计量是无偏的;ols估计量的方差也是无偏的;估计量的方差也是无偏的;估计量的估计方

10、差比没有度量误差时的大估计量的估计方差比没有度量误差时的大n应变量中的误差加入到了误差项应变量中的误差加入到了误差项ui中。中。11-15n解释变量中的度量误差解释变量中的度量误差导致的后果:导致的后果:ols估计量是有偏的;估计量是有偏的;ols估计量也是不一致的估计量也是不一致的n解决办法:解决办法:使用工具变量或替代变量使用工具变量或替代变量n实践中的建议:实践中的建议:确保变量确保变量x的数据尽可能准确,避免记录、舍的数据尽可能准确,避免记录、舍入和遗漏误差。入和遗漏误差。11-16七、诊断设定误差:检验七、诊断设定误差:检验n1. 诊断非相关变量的存在诊断非相关变量的存在t检验检验在

11、建模时,为了避免遗漏变量偏差,会纳入一在建模时,为了避免遗漏变量偏差,会纳入一些控制变量。如果统计检验表明它们不显著(些控制变量。如果统计检验表明它们不显著(t检验),则可将它们从模型中删除。检验),则可将它们从模型中删除。n例:考虑模型例:考虑模型yt=b1+b2x2t+b3x3t+b4x4t+ut11-17n例例11-4 : 85个国家的生命预期个国家的生命预期先验地预期先验地预期收入收入和和生命预期生命预期、获得保健获得保健和和生命生命预期预期之间正相关。之间正相关。n模型模型1验证这一预期;验证这一预期;n模型模型2增加了收入平方变量增加了收入平方变量目的在于验证生命预期对收入是以递增

12、的速率变化还是以目的在于验证生命预期对收入是以递增的速率变化还是以递减的速率变化;递减的速率变化;n模型模型3增加了获得保健平方变量增加了获得保健平方变量目的在于验证生命周期对获得保健是以递增的速率变化还目的在于验证生命周期对获得保健是以递增的速率变化还是以递减的速率变化。是以递减的速率变化。11-18表表11-2 生命预期模型生命预期模型解释变量解释变量model 1model 2model 3intercept收入收入获得获得收入平方收入平方获得平方获得平方r2f39.438(20.2)0.0054(4.44)0.2833(9.96)-0.774140.5340.508(20.8)0.00

13、16(3.48)0.2499(8.08)0(-2.41)-0.789101.0943.166(10.02)0.0014(2.68)0.149(1.001)0(-1.96)0.0008(0.69)0.79075.4511-19n逐步回归:最开始逐步回归:最开始y与与x2相关,因为相关,因为b2在统计是在统计是显著,接着将模型加入变量显著,接着将模型加入变量x3。如果。如果b3统计显著,统计显著,则把这个变量保留在模型中这样的过程。则把这个变量保留在模型中这样的过程。n建模中不能重复使用建模中不能重复使用t检验和检验和f检验,但从某种程检验,但从某种程度上说,某些实验过程(如数据挖掘)有助于决度上

14、说,某些实验过程(如数据挖掘)有助于决定应变量和解释变量之间的函数形式。尤其当模定应变量和解释变量之间的函数形式。尤其当模型中包含若干解释变量,而我们又无法通过作图型中包含若干解释变量,而我们又无法通过作图直观观察这些变量与应变量关系的时候。直观观察这些变量与应变量关系的时候。11-20n2. 对遗漏变量和不正确函数形式的检验对遗漏变量和不正确函数形式的检验n对于菲利普斯曲线:预期工资变化率与失对于菲利普斯曲线:预期工资变化率与失业率负相关,但它们可能的关系有:业率负相关,但它们可能的关系有:yt=b1+b2xt+ut(b20)lnyt=b1+b2lnxt+ut(b20)11-21n模型的选择

15、:实践中通常按如下步骤进行模型的选择:实践中通常按如下步骤进行判断:判断:首先根据理论或调查及先前的实践经验,建立首先根据理论或调查及先前的实践经验,建立一个自认为抓住了问题本质的模型;一个自认为抓住了问题本质的模型;然后对这个模型进行实证检验;然后对这个模型进行实证检验;得到回归结果后,根据前面讨论的得到回归结果后,根据前面讨论的“好好”的模的模型衡量标准型衡量标准进行事后分析。此时才知道所选择进行事后分析。此时才知道所选择模型是否恰当。模型是否恰当。11-22n判定模型是否恰当主要根据以下一些参数:判定模型是否恰当主要根据以下一些参数:r2和校正后的和校正后的r2估计的估计的t值值与先验预

16、期相比,估计系数的符号与先验预期相比,估计系数的符号n如果结果并不令人满意,由要考虑模型是如果结果并不令人满意,由要考虑模型是否恰当,并寻求补救措施,可能是遗漏某否恰当,并寻求补救措施,可能是遗漏某个重要变量;使用错误的函数形式等。个重要变量;使用错误的函数形式等。主主要可采用以下一些方法:要可采用以下一些方法:11-23n残差检验残差检验残差图可显示模型中的设定误差,如遗漏了某残差图可显示模型中的设定误差,如遗漏了某个重要的变量,或使用了不正确的函数形式。个重要的变量,或使用了不正确的函数形式。例:例:正确模型为正确模型为(11-13) :yt=b1+b2xt+b3timet+ut错误模型为

17、(遗漏错误模型为(遗漏x):):yt=b1+b3timet+vt则:则:vt=b2xt+utnv不仅反映出真实的随机项不仅反映出真实的随机项u,还反映变量,还反映变量x11-24n对图对图11-2的说明的说明s1:“错误错误”模型的残差;模型的残差;s2:“正确正确”模型的残差。模型的残差。n但从图中我们还可以看出,即使在进口支出函数中但从图中我们还可以看出,即使在进口支出函数中增加了趋势变量,残差也不完全是随机分布的,从增加了趋势变量,残差也不完全是随机分布的,从而说明模型而说明模型1113本身设定也不完全正确,可能是本身设定也不完全正确,可能是遗漏了与国内价格有关的进口价格指数,或是遗漏遗

18、漏了与国内价格有关的进口价格指数,或是遗漏了趋势变量的平方项。了趋势变量的平方项。n在任何情况下,对估计模型的残差图进行在任何情况下,对估计模型的残差图进行检查都是建模过程中不可或缺的重要内容检查都是建模过程中不可或缺的重要内容。11-25线性与对数线性模型之间的选择线性与对数线性模型之间的选择:mwd检验(麦克金农怀特戴维森检验)检验(麦克金农怀特戴维森检验)建立假设:建立假设:h0:线性模型:线性模型:y是是x的线性函数的线性函数h1:对数线性模型:对数线性模型:lny是是x或或lnx的线性函数的线性函数11-26nmwd检验步骤检验步骤:1. 估计线性模型,得到估计线性模型,得到y的估计

19、值的估计值 i ;2. 估计线性对数模型,得到估计线性对数模型,得到lny的估计值的估计值 ;3. 求求4. 做做y对对x和和z1i的回归;的回归;n如果根据如果根据t检验检验z1i的系数是统计显著的,则拒绝的系数是统计显著的,则拒绝h0;5. 求求6. 做做lny对对x或或lnx和和z2i的回归的回归n如果如果z2i的系数是统计显著的,则拒绝的系数是统计显著的,则拒绝h1lniy1lnlniiiyyziiiyyantiz)lnlog(211-27nmwd检验的思想:如果线性模型是正确的,检验的思想:如果线性模型是正确的,那变量那变量z1i应该是统计不显著的。应该是统计不显著的。11-28n例

20、:例:p256(原始数据见表原始数据见表11-1)表表11-3;11-411-29回归误差设定检验回归误差设定检验:reset检验(拉姆检验(拉姆齐检验)齐检验)nreset(regression specification error test)n思想:将残差对思想:将残差对y的预期值作图的预期值作图我们已经知道,我们已经知道, ei=0, eii=0。如果残差图。如果残差图显示残差随估计的显示残差随估计的y值呈现某种变动样式,则值呈现某种变动样式,则表明,如果把表明,如果把以某种形式的解释变量纳入模以某种形式的解释变量纳入模型,将提高型,将提高r2,如果增加的,如果增加的r2是统计显著的是

21、统计显著的(f检验),则表明原始模型是错误设定的。检验),则表明原始模型是错误设定的。11-30nreset检验的步骤:检验的步骤:1. 根据模型估计出根据模型估计出y值,即值,即i ; 2. 回到模型,把回到模型,把i的高次幂,平方立方等纳入的高次幂,平方立方等纳入模型以获取残差和模型以获取残差和 i 之间的系统关系;之间的系统关系;3. 令从方程得到的令从方程得到的r2为为r2new ,从方程得到的,从方程得到的r2old为,然后利用为,然后利用f检验检验差别从方程中增加的差别从方程中增加的r2是否是统计显著的;是否是统计显著的;4. 如果在所选显著水平下计算的如果在所选显著水平下计算的f值是统计显著值是统计显著的,则认为原始模型是错误设定的。的,则认为原始模型是错误设定的。222/1/newoldnewrrfrn新新回回归归量量个个数数新新模模型型中中参参数数个个数数11-31n例:进口支出一例的说明例:进口支出一例的说明原始数据见原始数据见p251,表,表11-1结果见结果见p258,表,表11-5结论:模型结论:模型11-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论