第三章多元线性回归分析1_第1页
第三章多元线性回归分析1_第2页
第三章多元线性回归分析1_第3页
第三章多元线性回归分析1_第4页
第三章多元线性回归分析1_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、14计量经济学课件第三章 多元线性回归分析主要内容:n 多元线性回归模型 n 多元线性回归模型的参数估计n 多元线性回归模型的统计检验n 多元线性回归模型的预测n 案例3.1 多元线性回归模型一、多元线性回归模型 多元线性回归模型:表现在线性回归模型中的解释变量有多个。一般表现形式: i=1,2,n其中:k为解释变量的数目,称为回归参数(regression coefficient)。经济解释:也被称为偏回归系数,表示在其他解释变量保持不变的情况下,每变化1个单位时,Y的均值E(Y)的变化;或者说给出了的单位变化对Y均值的“直接”或“净”(不含其他变量)影响。样本回归函数:用来估计总体回归函数

2、 i=1,2,n其随机表示式: 称为残差或剩余项(residuals),可看成是总体回归函数中随机扰动项的近似替代。§3.2 多元线性回归模型的估计一、普通最小二乘估计对于随机抽取的n组观测值对样本回归函数: i=1,2n根据最小二乘原理,参数估计值应该是下列方程组的解 即 由于满秩,故有 随机误差项m的方差s的无偏估计 可以证明,随机误差项u的方差的无偏估计量为 二、参数估计量的性质在满足基本假设的情况下,其结构参数b的普通最小二乘估计、最大或然估计及矩估计仍具有:线性性、无偏性、有效性。1、 线性其中,C= 为一仅与固定的X有关的行向量 2、无偏性 3、有效性(最小方差性) 参数

3、估计量的方差-协方差矩阵其中利用了 和 三、多元线性回归模型的参数估计实例例题3.1Y: 某商品需求量X1:该商品价格X2:消费者平均收入下图(图3.1) = 113.83 - 8.36 X1 + 0.18 X2 (4.0) (-3.6) (0.9) R2 =0.88, F=26.4, n=10图3.1§3.3 多元线性回归模型的统计检验多元线性回归模型的基本假定 假设1,解释变量是非随机的或固定的,且各X之间互不相关(无多重共线性)。假设2,随机误差项具有零均值、同方差及不序列相关性假设3,解释变量与随机项不相关 假设4,随机项满足正态分布 一、拟合优度检验1、可决系数与调整的可决

4、系数记 总离差平方和回归平方和剩余平方和则可决系数该统计量越接近于1,模型的拟合优度越高。 问题:在应用过程中发现,如果在模型中增加一个解释变量,往往增大。这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。调整的可决系数(adjusted coefficient of determination) 在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:其中:n-k-1为残差平方和的自由度,n-1为总体平

5、方和的自由度。与之间存在如下关系:二、方程的显著性检验(F检验) 方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。1、方程显著性的F检验 即检验模型 中的参数是否总体显著不为0。可提出如下原假设与备择假设: H0: H1:不全为0F检验的思想来自于总离差平方和的分解式:TSS=ESS+RSS如果这个比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。因此,可通过该比值的大小对总体线性关系进行推断。在原假设成立的条件下,统计量 服从自由度为(k , n-k-1)的F分布。给定显著性水平a,可得到临界值 (k,

6、n-k-1),由样本求出统计量F的数值,通过F> (k,n-k-1) 或 F£ (k,n-k-1)来拒绝或接受原假设,以判定原方程总体上的线性关系是否显著成立。 2、关于拟合优度检验与方程显著性检验关系的讨论 由 与 可推出: 或 F与同向变化:当=0时间,F=0;越大,F值也越大;当=1时,F为无穷大。三、变量的显著性检验(t检验)方程的总体线性关系显著¹每个解释变量对被解释变量的影响都是显著的因此,必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。这一检验是由对变量的 t 检验完成的。1、t统计量 由于以表示矩阵主对角线上的第i个元素,于是参

7、数估计量的方差为: 其中为随机误差项的方差,在实际计算时,用它的估计量代替: 易知服从如下正态分布 因此,可构造如下t统计量 2、t检验设计原假设与备择假设: 给定显著性水平a,可得到临界值,由样本求出统计量t的数值,通过|t|> 或 |t|£来拒绝或接受原假设,从而判定对应的解释变量是否应包括在模型中。 注意:一元线性回归中,t检验与F检验一致 一方面,t检验与F检验都是对相同的原假设 进行检验; 另一方面,两个统计量之间有如下关系: 看下一页图(例题3.1)四、参数的置信区间 参数的置信区间用来考察:在一次抽样中所估计的参数值离参数的真实值有多“近”。 在变量的显著性检验中

8、已经知道:容易推出:在(1-a)的置信水平下的置信区间是 其中,为显著性水平为a 、自由度为n-k-1的临界值。如何才能缩小置信区间? 增大样本容量n,因为在同样的样本容量下,n越大,t分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小; 提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差平方和越小。 提高样本观测值的分散度,一般情况下,样本观测值越分散,(XX)-1的分母的|XX|的值越大,致使区间缩小。§3.4 多元线性回归模型的预测样本内10点与样本外1点预测小结n 多元线性回归模型 n 多元线性回归模型的参数估计n 多

9、元线性回归模型的统计检验n 多元线性回归模型的预测预测的评价指标例题3.1预测评价指标的应用建模过程中应注意的问题(1) 研究经济变量之间的关系要剔除物价变动因素。 注意:价格指数应该用定基价格指数。(2) 依照经济理论以及对具体经济问题的深入分析初步确定解释变量。 例:我国粮食产量 = f(耕地面积、农机总动力、施用化肥量、农业人口等)。 例:关于食用油消费量模型(3) 当引用现成数据时,要注意数据的定义是否与所选定的变量定义相符。 例:“农业人口”要区别是“从事农业劳动的人口”还是相对于城市人口的“农业人口”。 (4) 养成看散点图的习惯。中国移动电话用户数(亿户)序列硫酸透明度(y)与铁

10、杂质含量(x)的关系GDP与FDI(5)谨慎对待离群值(outlier)(6) 过原点回归模型与非过原点回归模型相比有如下不同点: 残差和等于零不一定成立。 可决系数有时会得负值! (7) 改变变量的测量单位可能会引起回归系数值的改变,但不会影响t值。即不会影响统计检验结果。(8) 回归模型给出估计结果后,首先应进行F检验。F检验是对模型整体回归显著性的检验。 (检验一次,H0: b1= b2 = = bk = 0; H1: bj不全为零。)若F检验结果能拒绝原假设,应进一步作t检验。t检验是对单个解释变量的回归显著性的检验。若回归系数估计值未通过t检验,则相应解释变量应从模型中剔除。剔除该解释变量后应重新回归。按经济理论选择的变量剔出时要慎重。(10) 对于多元回归模型,当解释变量的量纲不相同时,不能在估计的回归系数之间比较大小。若要在多元回归模型中比较解释变量的相对重要性,应该用标准化变量回归。 (11) 利用回归模型预测时,解释变量的值最好不要离开样本范围太远。原因是 根据预测公式离样本平均值越远,预测误差越大。 有时,样本以外变量的关系不清楚。当样本外变量的关系与样本内变量的关系完全不同时,在样本外预测就会发生错误。(12) 回归模型的估计结果应与经济理论或常识相一致。(13) 残差项应非自相关。否则说明 仍有重要解释变量被遗漏在模型之外。 选

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论