3多元线性回归模型PPT教学课件_第1页
3多元线性回归模型PPT教学课件_第2页
3多元线性回归模型PPT教学课件_第3页
3多元线性回归模型PPT教学课件_第4页
3多元线性回归模型PPT教学课件_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1引子:中国汽车的保有量会达到1.4亿辆吗 ? 中国经济的快速发展,使居民收入不断增加,数以百万计的中国人开始得以实现拥有汽车的梦想,中国也成为世界上成长最快的汽车市场。 中国交通部副部长在中国交通可持续发展论坛上做出预测 :“2020年,中国的民用汽车保有量将比2003年的数字增长倍,达到1.4亿辆左右”。 是什么因素导致中国汽车数量的增长? 影响中国汽车行业发展的因素并不是单一的,经济增长、消费趋势、市场行情、业界心态、能源价格、道路发展、内外环境,都会使中国汽车行业面临机遇和挑战。第1页/共67页2分析中国汽车行业未来的趋势,应具体分析这样一些问题:中国汽车市场发展的状况如何?中国汽车市

2、场发展的状况如何?(用销售量观测)(用销售量观测)影响中国汽车销量的主要因素是什么?影响中国汽车销量的主要因素是什么? (如收入、价格、费用、道路状况、能源、政策环境等)(如收入、价格、费用、道路状况、能源、政策环境等)各种因素对汽车销量影响的性质怎样?各种因素对汽车销量影响的性质怎样?(正、负)(正、负)各种因素影响汽车销量的具体数量关系是什么?各种因素影响汽车销量的具体数量关系是什么?所得到的数量结论是否可靠?所得到的数量结论是否可靠?中国汽车行业今后的发展前景怎样?应当如何制定汽车的中国汽车行业今后的发展前景怎样?应当如何制定汽车的产业政策?产业政策?很明显,只用一个解释变量已很难分析汽

3、车产业的发展, 还需要寻求有更多个解释变量情况的回归分析方法。 怎样分析多种因素的影响?怎样分析多种因素的影响?第2页/共67页3第三章第三章 多元线性回归模型多元线性回归模型 本章主要讨论: : 多元线性回归模型及古典假定多元线性回归模型及古典假定 多元线性回归模型的估计多元线性回归模型的估计 多元线性回归模型的检验多元线性回归模型的检验 多元线性回归模型的预测多元线性回归模型的预测第3页/共67页4 第一节第一节 多元线性回归模型及古典假定多元线性回归模型及古典假定 本节基本内容: : 一、多元线性回归模型的意义 二、多元线性回归模型的矩阵表示 三、多元线性回归中的基本假定 第4页/共67

4、页5一、多元线性回归模型的意义一、多元线性回归模型的意义例如:有两个解释变量的电力消费模型 其中: 为各地区电力消费量; 为各地区国内生产总值(GDP); 为各地区电力价格变动。模型中参数的意义是什么呢? 12233iiYXXu2X3XiY第5页/共67页6多元线性回归模型的一般形式多元线性回归模型的一般形式一般形式:对于有 个解释变量的线性回归模型 模型中参数 是偏回归系数,样本容量为偏回归系数:控制其它解释量不变的条件下,第 个解释变量的单位变动对应变量平均值的影响。k12233.iiikkiiYXXXu(1,2,., )jjkjn第6页/共67页7指对各个回归系数而言是“线性”的,对变量

5、则可是线性的,也可是非线性的例如:生产函数取自然对数lnlnlnlnlnYALKuYAL K u多元线性回归多元线性回归第7页/共67页8 的总体条件均值表示为多个解释变量的函数 总体回归函数也可表示为: : 2312233E(,.,).iiikiiikkiY XXXXXX12233.iiikkiiYXXXu Y多元总体回归函数多元总体回归函数第8页/共67页9 的样本条件均值表示为多个解释变量的函数或其中 回归剩余(残差):-iiieYY多元样本回归函数多元样本回归函数12233Y. iiikkiXXX12233. iiikkiiYXXXeYni, 2 , 1第9页/共67页10二、多元线性

6、回归模型的矩阵表示二、多元线性回归模型的矩阵表示 个解释变量的多元线性回归模型的 个观测样本,可表示为 1122133111.kkYXXXu2122233222.kkYXXXu12233.nnnkknnYXXXunk第10页/共67页11 Y1n用矩阵表示1n1kn k1211112222222111kknnknknYXXuYXXuYXXuXYu第11页/共67页12总体回归函数 或样本回归函数 或 其中: 都是有 个元素的列向量 是有 个元素的列向量 是第一列为1 1的 阶解释变量 数据矩阵 ( (截距项可视为解释变量 取值为1)1)n kknE(Y)= XY = X+ uY = XY =

7、X+eY,Y,u,eX,第12页/共67页13三、多元线性回归中的基本假定三、多元线性回归中的基本假定 假定1 1:零均值假定 或 假定2 2和假定3 3:同方差和无自相关假定 假定4 4:随机扰动项与解释变量不相关 E( )0 ( 1,2, ) iuin Cov(,)0 2,3, jiiXujkCov( ,)E(-E )(-E)E()ijiijjiju uuuuuuu20 () iji= j(E u)= 0第13页/共67页14假定5:5:无多重共线性假定 ( (多元中) ) 假定各解释变量之间不存在线性关系,或各个解释变量观测值之间线性无关。或解释变量观测值矩阵 列满秩( ( 列) )。

8、即 可逆假定6 6:正态性假定X2(0,)iuNk()RankkX()RankKX XX X第14页/共67页15 第二节第二节 多元线性回归模型的估计多元线性回归模型的估计 本节基本内容: : 普通最小二乘法(普通最小二乘法(OLSOLS) OLSOLS估计式的性质估计式的性质 OLSOLS估计的分布性质估计的分布性质 随机扰动项方差随机扰动项方差 的估计的估计 回归系数的区间估计回归系数的区间估计 2第15页/共67页16 一、普通最小二乘法一、普通最小二乘法(OLSOLS)最小二乘原则 剩余平方和最小: 求偏导, ,令其为0:0:22min( - )iiieY Y2212233min -

9、(.)iiiikkieYXXX 2()0ije第16页/共67页17 即 注意到12233-(.) iiikikiiYXXXe0ie 12233-2-(.)0 iiikikiYXXX12233-2-(.)0 kiiiikikiX YXXX212233-2-(.)0 iiiikikiX YXXX20i iX e 0ki iX e 第17页/共67页18 用矩阵表示因为样本回归函数为 两边乘 有:因为 ,则正规方程为:XXe=021222221110001in2i ik1kknnki ieeXXXeX e=.XXXeX e X eX X = X YXY = XX+ XeY=X+eXe第18页/共6

10、7页19 由正规方程 多元回归中 二元回归中 注意: 和 为 的离差-1 = (X X) X Y(),k k是满秩矩阵 其逆存在X XXX= XY12233Y - X - X23222332222323()()-()()()()-()iiiiiiiiiiiy xxy xx xxxx x22332322222323()()-()()()()-()iiiiiiiiiiiy xxy xx xxxx xxyX,Y OLS估计式第19页/共67页20二、二、OLS估计式的性质估计式的性质 OLS估计式 1.1.线性特征: : 是 的线性函数,因 是非随机 或取固定值的矩阵 2.2.无偏特性: : E()

11、kk(-1X X) X-1 = (X X) X YY第20页/共67页213. 最小方差特性 在 所有的线性无偏估计中,OLS估计 具有最小方差 结论:在古典假定下,多元线性回归的 OLS估计式是最佳线性无偏估计式(BLUE)kk第21页/共67页22三、三、OLS估计的分布性质估计的分布性质基本思想 是随机变量,必须确定其分布性质才可能进行区间估计和假设检验 是服从正态分布的随机变量, , 决定了 也是服从正态分布的随机变量 是 的线性函数,决定了 也是服从正态分布的随机变量iuiiYiiYi第22页/共67页23 的期望 ( (由无偏性) ) 的方差和标准误差: 可以证明 的方差- -协方

12、差矩阵为 这里是 矩阵 中第 行第 列的元素2-1Var-Cov( )()XXE( )SE()jjj c2Var()jjj cjjc-1()X Xjj2(,) 1,2,.,jjjj N cjk 故有:第23页/共67页24 四、随机扰动项方差四、随机扰动项方差 的估计的估计 多元回归中 的无偏估计为: 或表示为 将 作标准化变换: 2k-(0,1)SE()kkkkkjjkzN c22-ien k2-n ke e2第24页/共67页25因 是未知的,可用 代替 去估计参数 的标准误差: 当为大样本时,用估计的参数标准误差对 作标准化变换,所得Z统计量仍可视为服从正态分布当为小样本时,用估计的参数

13、标准误差对 作标准化变换,所得的t统计量服从t分布: 22- ( - )SE()kkktt n k2第25页/共67页26五、回归系数的区间估计五、回归系数的区间估计由于给定 ,查t分布表的自由度为 的临界值或: :或表示为: :*22-P-( - )( - )1-SE()jjjtn kttn k2( - )2( - )(-,)jjn kjjjn kjjt ct c22P-1-jjjjjjjt ct c22P-()()1-jjjjjtSE tSE ()SE()jjjj*jjj - - t = t n - kc2( - )tn k(1,., )jknk第26页/共67页27 第三节第三节 多元线

14、性回归模型的检验多元线性回归模型的检验本节基本内容: : 多元回归的拟合优度检验多元回归的拟合优度检验 回归方程的显著性检验(回归方程的显著性检验(F F检验)检验) 各回归系数的显著性检验(各回归系数的显著性检验(t t检验)检验)第27页/共67页28一、多元回归的拟合优度检验一、多元回归的拟合优度检验多重可决系数:在多元回归模型中,由各个解释变量联合解释了的 的变差,在 的总变差中占的比重,用 表示与简单线性回归中可决系数 的区别只是 不同,多元回归中多重可决系数也可表示为 22313iiikikY = + X+ X +.+ X22222( -)ESSTSS-RSS1-TSS(-)TSS

15、iiiiY YeRYYyiY2R2RYY第28页/共67页292ESS-nYXY 特点:多重可决系数是模型中解释变量个数的多重可决系数是模型中解释变量个数的不减函数不减函数,这给对比不同模型的多重可决系数带来缺陷,所以这给对比不同模型的多重可决系数带来缺陷,所以需要修正。需要修正。2TSSnYYY222ESS-TSS-nYRnYXYYY232322.iiiikiikix yx yx yRy可以证明:多重可决系数的矩阵表示第29页/共67页30思想可决系数只涉及变差,没有考虑自由度。如果用自由度去校正所计算的变差,可纠正解释变量个数不同引起的对比困难。自由度统计量的自由度指可自由变化的样本观测值

16、个数,它等于所用样本观测值的个数减去对观测值的约束个数。修正的可决系数第30页/共67页31可决系数的修正方法2211TSS()nniiiiYYY 总变差 自由度为 解释了的变差 自由度为 剩余平方和 自由度为 修正的可决系数为 22222( - )-11-1-( -1)-iiiien kenRynn ky22RSS(-)iiiYYe22ESS(- )iiYYy1n-1k-n-k第31页/共67页32 特点 可决系数 必定非负,但修正的可决系数 可能为负值,这时规定 修正的可决系数修正的可决系数 与可决系数与可决系数 的关系:的关系:22-11-(1-)nRRn - k2R2R2R2R20R第

17、32页/共67页33二、回归方程显著性检验(二、回归方程显著性检验(F F检验检验)基本思想在多元回归中有多个解释变量,需要说明所有解释变量联合起来对应变量影响的总显著性,或整个方程总的联合显著性。对方程总显著性检验需要在方差分析的基础上进行F检验。第33页/共67页34总变差 自由度 模型解释了的变差 自由度 剩余变差 自由度变差来源 平方和 自由度 方差归于回归模型归于剩余总变差方差分析表22TSS( - )iiY Yy2ESS(- )iY Y2RSS( - )iiY Y2ESS( - )iY Y1n-1k-n-k2TSS( - )iY Y2RSS( - )iiY YTSS/ -1nESS

18、/ -1kRSS/ n-k1n-1k-n-k第34页/共67页35 原假设 备择假设 不全为0 0 建立统计量( (可以证明):): 给定显著性水平 ,查F F分布表得临界值 并通过样本观测值计算 值F检验FESS ( -1) F( -1,)RSS ( - )kFkn-kn k( -1, - )F kn k1H :(12)j j= , ,.,k023H :0k = =.= =第35页/共67页36如果 ( (小概率事件发生了) ) 则拒绝 ,说明回归模型有显著意义,即所有解释变量联合起来对 有显著影响。如果 ( (大概率事件发生了) ) 则接受 ,说明回归模型没有显著意义,即所有解释变量联合起

19、来对 没有显著影响。( -1, - )F F kn k( -1, - )FF kn k023H :0k = =.= =YY023H :0k = =.= =第36页/共67页37可决系数与F检验由方差分析可以看出,F检验与可决系数有密切联系,二者都建立在对应变量变差分解的基础上。F统计量也可通过可决系数计算:可看出:当 时, 越大, 值也越大 当 时, 结论:对方程联合显著性检验的F检验,实际上也是对 的显著性检验。 22( -1)(1-) ( - )RkFRn k20R 2R21R F 0F =F2R第37页/共67页38三、各回归系数的显著性检验三、各回归系数的显著性检验 (t t 检验)检

20、验) 目的: 在多元回归中,分别检验当其他解释变量保持不变时,各个解释变量 对应变量 是否有显著影响。 方法: 原假设 备择假设 统计量为: *- ( - )SE()jjjjjjtt n kc0H :0=1 2jj,.,k ,1H :0j X Y第38页/共67页39t检验的方法 给定显著性水平 ,查自由度为 时t分布表的临界值为 如果 就不拒绝 而拒绝 即认为 所对应的解释变量 对应变量 的影响不显著。 *22-( - )( - )tn kttn k1H :0j 0H :0j 2( - )tn kjXjn-kY第39页/共67页40 如果 就拒绝 而不拒绝 即认为 所对应的解释变量 对应变量

21、 的影响 是显著的。 在多元回归中,可分别对每个回归系数逐个地进 行t检验。 注意:在一元回归中F检验与t检验等价,且 但在多元回归中F检验与t检验作用不同。0H*22-( - )( - )ttn kttn k或jXj2Ft1H0j:Y第40页/共67页41第四节第四节 多元线性回归模型的预测多元线性回归模型的预测 本节基本内容: : 应变量平均值预测应变量平均值预测 应变量个别值预测应变量个别值预测第41页/共67页42一、应变量平均值预测一、应变量平均值预测 1. 1. 平均值的点预测 将解释变量预测值代入估计的方程: 多元回归时: 或 注意: :预测期的 是第一个元素为1 1的行向量,

22、,不是矩阵, ,也不是列向量 FYFX22331.FFFkFkY X X XFXY第42页/共67页43 基本思想: 由于存在抽样波动,预测的平均值 不一定 等于真实平均值 ,还需要对 作区间估计。 为对 作区间预测,必须确定平均值预测值 的抽样分布。必须找出与 和 都有 关的统计量 。 2. 2. 平均值的区间预测E()FFYXFYFYE()FFYXFYE()FFYXYY第43页/共67页44 具体作法 ( (回顾一元回归) )当 未知 时,只得用 代替,这时一元中已知222( -2)ien12E()E()FFFFYYX X22(-)1SE()FFiXXYnx222(-)1Var()FFiX

23、XYnx222(-)1Var()FFiXXYnx第44页/共67页45多元回归时, ,与 和 都有关的是偏差 从正态分布, ,可证明用 代替 , ,可构造t统计量 *-E()-E() ( - )SE()FFFFFYYwwtt n kwF-1FFXX (X X) X2Var()Fw-1FFX (X X) X-E()FFFwYYFX2E()FYFX22( - )ien kE()0FwFwFYFw第45页/共67页46 则给定显著性水平 ,查t分布表,得自由度的临界值 ,则或22-E() 1FFFP YtYYt -1FF-1FFX (XX) XX (XX) X22P(-SE()E()(SE()FFF

24、FFYtYYYtY2()tnk1-n-k第46页/共67页47二、应变量个别值预测二、应变量个别值预测 基本思想: 既是对 平均值的点预测,也是对 个别值的点预测。 由于存在随机扰动 的影响, , 的平均值并不等于 的个别值 为了对 的个别值 作区间预测,需要寻找与预测值 和个别值 有关的统计量,并要明确其概率分布YiuFYFYFYFYYYYY第47页/共67页4822( - )ien k已知剩余项 是与预测值 和个别值 都有关的变量,并且已知 服从正态分布,且可证明当用 代替 时,对 标准化的变量为: FYE()0Fe2Var()1Fe-1FFX (X X) X-E()- ( - )SE()

25、1FFFFFeeYYtt n ke-1FFX (XX) X2FeFYFeFe 具体作法具体作法第48页/共67页4922(-SE()SE()1-FFFFFPYteYYte给定显著性水平 ,查 t 分布表得自由度为 的临界值 则 因此,多元回归时 的个别值的置信度 的预 测区间的上下限为:2 1FFYYt-1FFX (X X) X2( - )tn kY1-n k第49页/共67页50第五节第五节 案例分析案例分析案例:中国税收增长的分析中国税收增长的分析提出问题改革开放以来,随着经济体制改革的深化和经济的快速增长,中国的财政收支状况发生很大变化,为了研究影响中国税收收入增长的主要原因,分析中央和

26、地方税收收入的增长规律,预测中国税收未来的增长趋势,需要建立计量经济模型。第50页/共67页51理论分析影响中国税收收入增长的主要因素可能有:(1)从宏观经济看,经济整体增长是税收增长的基本源泉。(2)社会经济的发展和社会保障等都对公共财政提出要求,公共财政的需求对当年的税收收入可能会有一定的影响。(3)物价水平。中国的税制结构以流转税为主,以现行价格计算的GDP和经营者的收入水平都与物价水平有关。(4)税收政策因素。第51页/共67页52 以各项税收收入Y 作为被解释变量 以GDP表示经济整体增长水平 以财政支出表示公共财政的需求 以商品零售价格指数表示物价水平 税收政策因素较难用数量表示,

27、暂时不予考虑建立模型建立模型第52页/共67页53模型设定为:其中: 各项税收收入(亿元) 国内生产总值(亿元) 财政支出(亿元) 商品零售价格指数(%)1222334tttttY X X XuY2X3X4X第53页/共67页54数据来源:中国统计年鉴其中: 各项税收收入(亿元) 国内生产总值(亿元) 财政支出(亿元) 商品零售价格指数(%)3XY2X4X数据收集数据收集第54页/共67页55假定模型中随机项满足基本假定,可用假定模型中随机项满足基本假定,可用OLS法估计法估计其参数。其参数。具体操作:用用EViews软件,估计结果为:软件,估计结果为:参数估计参数估计第55页/共67页56模

28、型估计的结果可表示为234-2582.791 0.0220670.70210423.98541iYXXX (940.6128) (0.0056) (0.0332) (8.7363) t= (-2.7459) (3.9566) (21.1247) (2.7449) 20.9974R 20.9971R 拟合优度:拟合优度:可决系数 较高, 修正的可决系数 也较高, 表明模型拟合较好。模型检验:模型检验:20.9974R 20.9971R df =F 2717.238 21第56页/共67页57显著性检验显著性检验F检验:检验: 针对针对 ,取,取 查自由度为查自由度为 和和 的临界值的临界值 。由

29、于由于 ,应拒绝,应拒绝 ,说明回归方程显著,即说明回归方程显著,即“国内生产总值国内生产总值”、“财政财政支出支出”、“商品零售物价指数商品零售物价指数”等变量联合起来确等变量联合起来确实对实对“税收收入税收收入”有显著影响。有显著影响。 0234H :0(3,21)F0.05F(3,212717.238)3.075F-1=3k=21n-k0H第57页/共67页58t检验:给定 ,查t分布表,在自由度为 时临界值为 ,因为 的参数对应的t统计量均大于2.080, 这说明在5%的显著性水平下,斜率系数均显著不为零,表明国内生产总值、财政支出、商品零售价格指数对财政收入分别都有显著影响。 0.025(21)2.080t0.05234,XXX- n3=25-4=21第58页/共67页59本模型中本模型中所估计的参数的符号与经济理论分析一致,说明所估计的参数的符号与经济理论分析一致,说明在其他因素不变的情况下,国内生产总值每增加在其他因素不变的情况下,国内生产总值每增加1 1亿元,平均说来财政收入将增加亿元,平均说来财政收入将增加220.67220.67万元;财万元;财政支出每增加政支出每增加1 1亿元,平均说来财政收入将增加亿元,平均说来财政收入将增加7021.047021.04万元万元; ;商品零售物价指数每增加商品零售物价指数每增加1%

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论