




全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章 回归分析概要第五节 多元线性回归分析一 模型的建立与假定条件在一元线性回归模型中,我们只讨论了包含一个解释变量的一元线性回归模型,也就是假定被解释变量只受一个因素的影响。但是在现实生活中,一个被解释变量往往受到多个因素的影响。例如,商品的消费需求,不但受商品本身的价格影响,还受到消费者的偏好、收入水平、替代品价格、互补品价格、对商品价格的预测以及消费者的数量等诸多因素的影响。在分析这些问题的时候,仅利用一元线性回归模型已经不能够反映各变量间的真实关系,因此,需要借助多元线性回归模型来进行量化分析。1. 多元线性回归模型的基本概念如果一个被解释变量(因变量) 有 个解释变量(自变量) , , tyktjxk,.321同时, 不仅是 的线性函数,而且是参数 和 (通常未知)的线性tytkx0ki,.321,函数,随即误差项为 ,那么多元线性回归模型可以表示为:tu,.210 ttkttt uxxy),.(n这里 为总体多元线性回归方程,简称总体回归ttttE)(方程。其中,k 表示解释变量个数, 称为截距项, 是总体回归系数。0k.21表示在其他自变量保持不变的情况下,自变量 变动一个单位所引起的i,.321, tjX因变量 Y 平均变动的数量,因而也称之为偏回归系数。当给定一个样本 时,上述模型可以表示为:ntxyktt ,.21),.,(21ttkttt kkuxxyu .210 333 22102 11此时, 与 已知, 与 未知。ttjitu其相应的矩阵表达式为:)1(321)1(210)(1332211)1(321 . TkkTjTjkjjT uuxxyy可以简化为:-总体回归模型的简化形式。uXY2. 假定条件与一元线性回归模型的基本假定相似,为保证得到最优估计量,多元线性回归模型应满足以下假定条件:假定 1 随机误差项 满足均值为零,其方差 相同且为有限值。tu2假定 2 随机误差项之间相互独立,无自相关。假定 3 解释变量 , 之间线性无关,即解释变量的样本观测值矩阵式满秩tjxk,.321矩阵,否则称解释变量之间存在多重共线性(与课本假定 7 合并) 。假定 4 解释变量 , 是确定性变量,与误差项彼此之间相互独立。tj,.假定 5 解释变量是非随机变量,且当 ,Q 是一个有限值的非奇XT1时 ,异矩阵。假定 6 随机误差项服从正态分布。假定 7 回归模型是正确设计的。二、最小二乘法根据最小二乘法的原则,总体回归模型可以推导为样本回归模型,即: uXY其中, 是 的估计值列向量, 称为残差列向量。).(10k)(XYu因为, ,所以, 也是 Y 的线性组合。u关于多元线性回归模型中样本容量的问题:(1)最小样本容量在多元线性回归模型中,样本容量必须不少于模型中解释变量的数目(包括常数项) ,这就是最小样本容量,即: 。1kn(2)满足基本要求的样本容量一般经验认为,当 或者至少 时,才能说满足模型估计的基本要求。30)(3k三、多元可决系数与调整后的多元可决系数类似于一元线性回归模型的情形,我们对估计的回归方程关于样本观测值的拟合优度进行检验,而检验的统计量是可决系数。因是多元回归,样本可决系数 就称为多元可决2R系数。对于多元线性回归模型的情形,一元线性回归模型的总离差平方和的分解公式依然成立,即:TSS= ESS +RSS其中,TSS 的自由度为 n-1,n 表示样本容量,ESS 的自由度为 k,k 表示自变量的个数,RSS 的自由度为 n-k-1。 TSRER12我们在模型应用中发现,如果在模型中增加一个解释变量, 往往会增大。这是因为2残差平方和往往随着解释变量个数的增加而减少,至少不会增加。这就给人一个错觉:要使模型拟合得好,只要增加解释变量就可以了。但是,现实情况往往是,由增加解释变量个数引起的 的增大与拟合好坏无关,因此,在多元线性回归模型之间比较拟合优度,2R就不是一个合适的指标,必须加以调整。2在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是将残差平方和与总离差平方和分别处以各自的自由度,以剔除变量个数对拟合优度的影响 。定义调整的多元可决系数 如下: )1()1/(122 RknnTSkR当模型中增加一个自变量,如果 RSS/(n-k-1)变小,因而使 增大,便可认为这个自变量对因变量有显著影响,应该放入模型中,否则,应予抛弃。在样本容量一定的情况下, 具有如下性质:2(1) 若 ;,12Rk则(2) 可能出现负值。如 时, 。显然,负的拟合2 1.0,12RkT157.02优度没有任何意义,在此情况下,取在实际中, 或 越大,模型拟合得就越好,但拟合优度不是评价模型优劣的唯一2R标准。因此,我们不能仅根据 或 的大小来选择模型。2补充知识:赤池信息准则和施瓦茨信息准则为了比较所含解释变量个数不同的多元线性回归模型的拟合优度,常用的标准还有赤池信息准则(Akaike Information Criterion, AIC)和施瓦茨信息准则(Schwarz Criterion,SC ) ,其定义分别为:)()(12,nIkeInSCA这两个准则均要求仅当所增加的解释变量能够减少 AIC 值或 SC 值时才能在原模型中增加该解释变量。显然,与调整的可决系数相仿,如果增加的解释变量没有解释能力,则对残差平方和 e, e 的减小没有多大帮助,但增加了待估参数的个数,这时可能到时 AIC 或SC 的值增加。四、统计检验1. F 检验为了从总体上检验模型中被解释变量与解释变量之间的线性关系是否显著成立,检验的原假设为: (k 表示方程中回归系数的个数,也可以称为自变0.:210H量的个数)若成立,则模型中被解释变量与解释变量之间不存在显著的线性关系。备择解释为: 不全为零。j:1若原假设成立,则检验统计量: )1/(knRSEF)1,(knF这是自由度为 的 F 分布,对于预先给定的显著水平 a,可以从 F 分布表中,查出相应的自由度。设检验水平为 a,则检验规则是:若 ,接受原假设;)1,(knF若 ,则接受备选假设。aF 与 的关系:2R, kn112kFnR12由公式,可以看出,F 与 成正比, 越大,F 值也越大。即总体的 F 检验越显著2(F 值越大) , 的值也越大,回归方程拟合得就越好,所以,F 检验可以看作是对拟合2优度的检验。2.回归系数的显著性检验t 检验对于多元线性回归模型,总体回归方程线性关系的显著性,并不意味着每个解释变量对被解释变量的影响都是显著的。因此,有必要通过检验把那些对被解释变量影响不显著的解释变量从模型中剔除,只保留对被解释变量影响显著的解释变量,以建立更为简单合理的多元线性回归模型。如果一个解释变量 对被解释变量的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 水污染控制工程模考试题及答案(附解析)
- 护理学导论练习题(含答案解析)
- 2025年3月电力线路高级工题库+答案(附解析)
- 2024年4月儿科护理习题(附参考答案解析)
- 《塔罗牌的团体使用》课件
- 纤维原料的风险管理与应急预案考核试卷
- 藤编艺术品市场分析考核试卷
- 2025年邮政专用机械及器材合作协议书
- 罐头食品原料储藏与保鲜技术进展考核试卷
- 《农业水资源管理与利用》课件
- 医疗纠纷预防和处理条例通用课件
- 模具管理系统解决方案课件
- 全套老年人能力评估师考试题库(50题+答案)
- 中职电子商务班级建设方案
- 【校本作业】六年级下册语文校本作业与单元练习(附参考答案)
- 安全生产与质量管理体系的关系
- 学生实习自主申请表
- 痛觉及其调制
- 七年级上册语文人教版全册文言文全文详解及翻译
- 北师大小学数学小升初《简便运算》复习课件
- 园艺植物种质资源图文
评论
0/150
提交评论