回归分析概要(多元线性回归模型)_第1页
回归分析概要(多元线性回归模型)_第2页
回归分析概要(多元线性回归模型)_第3页
回归分析概要(多元线性回归模型)_第4页
回归分析概要(多元线性回归模型)_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章回归分析概要第五节多元线性回归分析一模型的建立与假定条件在一元线性回归模型中,我们只讨论了包含一个解释变量的一元线性回归模型,也就是假定被解释变量只受一个因素的影响。但是在现实生活中,一个被解释变量往往受到多个因素的影响。例如,商品的消费需求,不但受商品本身的价格影响,还受到消费者的偏好、收入水平、替代品价格、互补品价格、对商品价格的预测以及消费者的数量等诸多因素的影响。在分析这些问题的时候,仅利用一元线性回归模型已经不能够反映各变量间的真实关系,因此,需要借助多元线性回归模型来进行量化分析。多元线性回归模型的基本概念如果一个被解释变量(因变量)y有k个解释变量(自变量)x,jl,2,3

2、,.,k,同ttj时,y不仅是X的线性函数,而且是参数卩和卩,i1,2,3,.k(通常未知)的线性函数,ttk0i随即误差项为u,那么多元线性回归模型可以表示为:ty=Bx+Bx,.+Bx,u,(t1,2,.,n)t01t12t2ktkt这里e(y)p+Bx+Bx+.+Bx为总体多元线性回归方程,简称总体回归方t01t12t2ktk程。其中,k表示解释变量个数,P称为截距项,卩卩卩是总体回归系数。012kp,口3,k表示在其他自变量保持不变的情况下,自变量Xj变动一个单位所引起的因变量Y平均变动的数量,因而也称之为偏回归系数。当给定一个样本(y,x,x,x),t1,2,.n时,上述模型可以表示

3、为:tt1t2tkyp+px+Px+Px+uTOC o 1-5 h z0111212klk1yp+px+Px+Px+u0121222k2k2yp+px+px+px+u0131232k3k3yp+px+px+px+ut01t12t2ktkt此时,y与x已知,p与u未知。ttjit其相应的矩阵表达式为:1、y1y2=y(T1)111x.x111jx.x212jx.x313jx.x.xT1TjTk0023.0UJ(k1)T(T1)(Tk).x1k.x3k.x2k可以简化为:Y=X卩+u-总体回归模型的简化形式。2.假定条件与一元线性回归模型的基本假定相似,为保证得到最优估计量,多元线性回归模型应满足

4、以下假定条件:假定1随机误差项U满足均值为零,其方差k+1。(2)满足基本要求的样本容量一般经验认为,当n30或者至少n3(k+1)时,才能说满足模型估计的基本要求。三、多元可决系数与调整后的多元可决系数类似于一元线性回归模型的情形,我们对估计的回归方程关于样本观测值的拟合优度进行检验,而检验的统计量是可决系数。因是多元回归,样本可决系数R2就称为多元可决系数。对于多元线性回归模型的情形,一元线性回归模型的总离差平方和的分解公式依然成立,即:TSS=ESS+RSS其中,TSS的自由度为n-1,n表示样本容量,ESS的自由度为k,k表示自变量的个数,RSS的自由度为n-k-1。R2ESSTSSR

5、SSTSS我们在模型应用中发现,如果在模型中增加一个解释变量,R2往往会增大。这是因为残差平方和往往随着解释变量个数的增加而减少,至少不会增加。这就给人一个错觉:要使模型拟合得好,只要增加解释变量就可以了。但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,因此,在多元线性回归模型之间比较拟合优度,R2就不是一个合适的指标,必须加以调整。在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是将残差平方和与总离差平方和分别处以各自的自由度,以剔除变量个数对拟合优度的影响。定义调整的多元可决系数如下:(1R2)R2二1RSS心一k一DTSS/(n1)当模型中增

6、加一个自变量,如果RSS/(n-k-1)变小,因而使R2增大,便可认为这个自变量对因变量有显著影响,应该放入模型中,否则,应予抛弃。在样本容量一定的情况下,R2具有如下性质:若k1,则R2,R2;R2可能出现负值。如T=10,k=2,R2=0.1时,R2=-0.157o显然,负的拟合优度没有任何意义,在此情况下,取R2=0在实际中,R2或R2越大,模型拟合得就越好,但拟合优度不是评价模型优劣的唯一标准。因此,我们不能仅根据R2或R2的大小来选择模型。补充知识:赤池信息准则和施瓦茨信息准则为了比较所含解释变量个数不同的多元线性回归模型的拟合优度,常用的标准还有赤池信息准则(AkaikeInfor

7、mationCriterion,AIC)和施瓦茨信息准则(SchwarzCriterion,SC),其定义分别为:AIC=In(竺)2(kl)nnSC=In(竺)kIn(n)nn这两个准则均要求仅当所增加的解释变量能够减少AIC值或SC值时才能在原模型中增加该解释变量。显然,与调整的可决系数相仿,如果增加的解释变量没有解释能力,则对残差平方和e,e的减小没有多大帮助,但增加了待估参数的个数,这时可能到时AIC或SC的值增加。四、统计检验1.F检验为了从总体上检验模型中被解释变量与解释变量之间的线性关系是否显著成立,检验的原假设为:H:卩=卩=卩=0(k表示方程中回归系数的个数,也可以称为自变量

8、012k的个数)若成立,则模型中被解释变量与解释变量之间不存在显著的线性关系。备择解释为:H:卩不全为零。1j若原假设成立,则检验统计量:ESS/kRSS/(n-k-1)F(k,n一k一1)这是自由度为k,n-k-1的F分布,对于预先给定的显著水平a,可以从F分布表中查出相应的自由度。设检验水平为a,则检验规则是:若FF(k,n一k一1),接受原假设;a若FF(k,n-k-1),则接受备选假设。aF与R2的关系:R2=1-n-1n-k-1kF由公式,可以看出,F与R2成正比,R2越大,F值也越大。即总体的F检验越显著(F值越大),R2的值也越大,回归方程拟合得就越好,所以,F检验可以看作是对拟合优度的检验。回归系数的显著性检验一t检验对于多元线性回归模型,总体回归方程线性关系的显著性,并不意味着每个解释变量对被解释变量的影响都是显著的。因此,有必要通过检验把那些对被解释变量影响不显著的解释变量从模型中剔除,只保留对被解释变量影响显著的解释变量,以建立更为简单合理的多元线性回归模型。如果一个解释变量x对被解释变量的影响不显著

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论