计量经济学系列课件一元线性回归模型检验_第1页
计量经济学系列课件一元线性回归模型检验_第2页
计量经济学系列课件一元线性回归模型检验_第3页
计量经济学系列课件一元线性回归模型检验_第4页
计量经济学系列课件一元线性回归模型检验_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、PAGE PAGE 432.3 一元线性回回归模型的统统计检验 回归分分析是要通过过样本所估计计的参数来代代替总体的真真实参数,或或者说是用样样本回归线代代替总体回归归线。尽管从从统计性质上上已知,如果果有足够多的的重复抽样,参参数的估计值值的期望(均均值)就等于于其总体的参参数真值,但但在一次抽样样中,估计值值不一定就等等于该真值。那那么,在一次次抽样中,参参数的估计值值与真值的差差异有多大,是是否显著,这这就需要进一一步进行统计计检验。主要要包括拟合优优度检验、变变量的显著性性检验及参数数的区间估计计。 一、拟拟合优度检验验拟合优度检验,顾顾名思义,是是检验模型对对样本观测值值的拟合程度度

2、。检验的方方法,是构造造一个可以表表征拟合程度度的指标,在在这里称为统统计量,统计计量是样本的的函数。从检检验对象中计计算出该统计计量的数值,然然后与某一标标准进行比较较,得出检验验结论。有人人也许会问,采采用普通最小小二乘估计方方法,已经保保证了模型最最好地拟合了了样本观测值值,为什么还还要检验拟合合程度?问题题在于,在一一个特定的条条件下做得最最好的并不一一定就是高质质量的。普通通最小二乘法法所保证的最最好拟合,是是同一个问题题内部的比较较,拟合优度度检验结果所所表示优劣是是不同问题之之间的比较。例例如图2.3.1和图2.3.2中的直线线方程都是由由散点表示的的样本观测值值的最小二乘乘估计

3、结果,对对于每个问题题它们都满足足残差的平方方和最小,但但是二者对样样本观测值的的拟合程度显显然是不同的的。 图2.3.1 图图2.3.2 1、总总离差平方和和的分解已知由一组样本本观测值,=1,2,n得到如下样样本回归直线线而的第个观测值值与样本均值值的离差可分分解为两部分分之和: (22.3.1)图2.3.3示示出了这种分分解,其中,是样本回归直线理论值(回归拟合值)与观测值的平均值之差,可认为是由回归直线解释的部分;是实际观测值与回归拟合值之差,是回归直线不能解释的部分。显然,如果落在样本回归线上,则的第个观测值与样本均值的离差,全部来自样本回归拟合值与样本均值的离差,即完全可由样本回归

4、线解释。表明在该点处实现完全拟合。 Y =来自残差 SRF =总离差 =来自回归 X图2.3.3对于所有样本点点,则需考虑虑这些点与样样本均值离差差的平方和。由由于 可以证明,所以以有 (2.3.2)记,称为总离差差平方和(Totall Sum of Sqquaress),反映样本本观测值总体体离差的大小小;,称为回归平平方和(Explaiined SSum off Squaares),反映由模模型中解释变变量所解释的的那部分离差差的大小;,称称为残差平方方和(Residdual SSum off Squaares),反映样本本观测值与估估计值偏离的的大小,也是是模型中解释释变量未解释释的那部

5、分离离差的大小。 (2.3.2)表表明的观测值值围绕其均值值的总离差平平方和可分解解为两部分,一一部分来自回回归线,另一一部分则来自自随机势力。因因此,可用来来自回归线的的回归平方和和占Y的总离离差的平方和和的比例来判判断样本回归归线与样本观观测值的拟合合优度。 读者也也许会问,既既然反映样本本观测值与估估计值偏离的的大小,可否否直接用它作作为拟合优度度检验的统计计量?这里提提出了一个普普遍的问题,即即作为检验统统计量的一般般应该是相对对量,而不能能用绝对量。因因为用绝对量量作为检验统统计量,无法法设置标准。在在这里,即即残差平方和和,与样本容容量关系很大大,当n比较小时,它它的值也较小小,但

6、不能因因此而判断模模型的拟合优优度就好。 2、可可决系数统计计量 根据上上述关系,可可以用 (2.3.3)检验模型的拟合合优度,称为为可决系数(ccoeffiicientt of ddetermminatiion)。显然,在在总离差平方方和中,回归归平方和所占占的比重越大大,残差平方方和所占的比比重越小,则则回归直线与与样本点拟合合得越好。如如果模型与样样本观测值完完全拟合,则则有。当然,模模型与样本观观测值完全拟拟合的情况是是不可能发生生的,不可能能等于1。但毫无疑疑问的是该统统计量越接近近于1,模型的拟拟合优度越高高。在实际计算可决决系数时,在在已经估计出出后,一个较较为简单的计计算公式为

7、: (2.3.4)这里用到了样本本回归函数的的离差形式来来计算回归平平方和: 。在例2.1.11的收入-消费支出例中中, 说明在线性回归归模型中,家家庭消费支出出总变差(vvariattion)中中,由家庭可可支配收入的的变差解释的的部分占977.66%,模模型的拟合优优度较高。 由(22.3.3)知知,可决系数数的取值范围围为,是一个个非负的统计计量。它也是是随着抽样的的不同而不同同,即是随抽抽样而变动的的统计量。为为此,对可决决系数的统计计可靠性也应应进行检验,这这将在第3章中进行。 二、变变量的显著性性检验 变量的显著性检检验,旨在对对模型中被解解释变量与解解释变量之间间的线性关系系是否

8、显著成成立作出推断断,或者说考考察所选择的的解释变量是是否对被解释释变量有显著著的线性影响响。 从上面面的拟合优度度检验中可以以看出,拟合合优度高,则则解释变量对对被解释变量量的解释程度度就高,线性性影响就强,可可以推测模型型线性关系成成立;反之,就就不成立。但但这只是一个个模糊的推测测,不能给出出一个统计上上的严格的结结论。因此,还还必须进行变变量的显著性性检验。变量量的显著性检检验所应用的的方法是数理理统计学中假假设检验。 1、假假设检验假设检验是统计计推断的一个个主要内容,它它的基本任务务是根据样本本所提供的信信息,对未知知总体分布的的某些方面的的假设作出合合理的判断。假设检验的程序序是

9、,先根据据实际问题的的要求提出一一个论断,称称为统计假设设,记为;然然后根据样本本的有关信息息,对的真伪伪进行判断,作作出拒绝或接接受的决策。假设检验的基本本思想是概率率性质的反证证法。为了检检验原假设是是否正确,先先假定这个假假设是正确的的,看由此能能推出什么结结果。如果导导致一个不合合理的结果,则则表明“假设为正确”是错误的,即即原假设不正正确,因此要要拒绝原假设设。如果没有有导致一个不不合理现象的的出现,则不不能认为原假假设不正确,因因此不能拒绝绝拒绝原假设设。概率性质的反证证法的根据是是小概率事件件原理,该原原理认为“小概率事件件在一次试验验中几乎是不不可能发生的的”。在原假设设下构造

10、一个事事件,这个事事件在“原假设是正确确”的条件下是是一个小概率率事件。随机机抽取一组容容量为n的样本观测测值进行该事事件的试验,如如果该事件发发生了,说明明“原假设是正确确”是错误的,因因为不应该出出现的小概率率事件出现了了。因而应该该拒绝原假设设。反之,如如果该小概率率事件没有出出现,就没有有理由拒绝原原假设,应该该接受原假设设。 2、变变量的显著性性检验 用以进进行变量显著著性检验的方方法主要有三三种:F检验、t检验、z检验。它们们的区别在于于构造的统计计量不同。应应用最为普遍遍的t检验,在目目前使用的计计量经济学软软件包中,都都有关于t统计量的计计算结果。我我们在此只介介绍t检验。 对

11、于一一元线性回归归方程中的,已已经知道它服服从正态分布布 进一步根据数理理统计学中的的定义,如果果真实的未知知,而用它的的无偏估计量量替代时,可可构造如下统统计量 (2.3.5)则该统计量服从从自由度为的的分布。因此此,可用该统统计量作为显显著性检验的的统计量。如果变量是显著著的,那么参参数应该显著著地不为0。于是,在在变量显著性性检验中设计计的原假设为为: 给定一一个显著性水水平,查分布表(见见附录),得得到一个临界界值。因为分布是是双尾分布,所所以按照查分布表中的的临界值。于于是 (这里的已不同同于(2.3.5) 式,其其中)为原假假设下的一个个小概率事件件。在参数估估计完成后,可可以很容

12、易计计算的数值。如如果发生了,则在(1)的置信度下下拒绝原假设设,即变量XX是显著的,通通过变量显著著性检验。如如果未发生,则在(1)置信度下接接受原假设,即即变量X是不不显著的,未未通过变量显显著性检验。对于一元线性回回归方程中的的,可构造如如下t统计量进行行显著性检验验: (2.3.6)同样地,该统计计量服从自由由度为的分布,检验验的原假设一一般仍为。在例2.1.11及例2.2.1的收入-消费支出例例中,首先计计算的估计值值于是和的标准差差的估计值分分别是:t统计量的计算算结果分别为为: 给定一个显著性性水平=0.05,查分布表表中自由度为为8(在这个个例中)、=0.005的临界值值,得到

13、2.306。可可见,说明解释释变量家庭可可支配收入在在95%的置信信度下显著,即即通过了变量量显著性检验验。但,表明在95%的置信度下下,无法拒绝绝截距项为零零的假设。三、参数的置信信区间 假设检检验可以通过过一次抽样的的结果检验总总体参数可能能的假设值的的范围(最常常用的假设为为总体参数值值为零),但但它并没有指指出在一次抽抽样中样本参参数值到底离离总体参数的的真值有多“近”。要判断样样本参数的估估计值在多大大程度上可以以“近似”地替代总体体参数的真值值,往往需要要通过构造一一个以样本参参数的估计值值为中心的“区间”,来考察它它以多大的可可能性(概率率)包含着真真实的参数值值。这种方法法就是

14、参数检检验的置信区区间估计。要判断估计的参参数值离真实实的参数值有有多“近”,可预先选选择一个概率率,并求一个个正数,使得得随机区间(random interval)包含参数的真值的概率为1-。即:如果存在这样一一个区间,称称之为置信区区间(confiidencee inteerval); 1-称为为置信系数(置信度)(confiidencee coeffficieent),称为显著性水水平(levell of ssignifficancce);置信信区间的端点点称为置信限限(confiidencee limiit)或临界值(critiical vvaluess)。在变量的显著性性检验中已经经知道: 这就是说,如果果给定置信度度,从分布表中中查得自由度度为的临界值值,那么值处在在的概率是。表表示为: 即 于是得到的置信信度下的置信信区间是 (2.3.6)在例2.1.11与2.2.11中,如果给给定,查表得得: 从假设检验中已已得到: , 于是,根据(22.3.6)计算得到、的置信区间间分别为 (00.63455,0.91195) (-433.332,2266.98)显然,参数的置置信

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论