多元线性回归模型的统计检验.ppt

上传人：x*** IP属地：四川上传时间：2019-07-28 格式：PPT 页数：33 大小：446KB 积分：15 举报 版权申诉

已阅读5页，还剩28页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

3.3 多元线性回归模型的统计检验 (Statistical Test of Multiple Linear Regression),一、拟合优度检验二、方程的显著性检验(F检验) 三、变量的显著性检验（t检验）四、参数的置信区间,一、拟合优度检验 (Testing the Simulation Level),1、可决系数与调整的可决系数,则,总离差平方和的分解,由于:,=0,所以有：,注意：一个有趣的现象,-,i,i1,ik,可决系数,该统计量越接近于1，模型的拟合优度越高。,问题：在应用过程中发现，如果在模型中增加一个解释变量， R2往往增大这就给人一个错觉：要使得模型拟合得好，只要增加解释变量即可。但是，现实情况往往是，由增加解释变量个数引起的R2的增大与拟合好坏无关，R2需调整。,调整的可决系数（adjusted coefficient of determination）,在样本容量一定的情况下，增加解释变量必定使得自由度减少，所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度，以剔除变量个数对拟合优度的影响:,其中：n-k-1为残差平方和的自由度，n-1为总体平方和的自由度。,地区城镇居民消费模型（k=2）,地区城镇居民消费模型（k=1）,与k=2比较，变化不大,0.973893,0.970433,二、方程的显著性检验(F检验) (Testing the Overall Significance),方程的显著性检验，旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。,1、方程显著性的F检验,F检验是要检验模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立，即检验模型 Yi=0+1Xi1+2Xi2+ +kXik+i i=1,2, ,n 中的参数j是否显著不为0。,按照假设的原理与程序，可提出如下原假设与备择假设：,H0： 0=1=2= =k=0 H1： j不全为0,F检验的思想来自于总离差平方和的分解式： TSS=ESS+RSS,如果这个比值较大，则X的联合体对Y的解释程度高，可认为总体存在线性关系，反之总体上可能不存在线性关系。因此,可通过该比值的大小对总体线性关系进行推断。,由于Yi服从正态分布，根据数理统计学中的定义Yi的一组样本平方和服从2分布，所以有： ESS=(Yi-Y) 2(k) RSS=(Yi-Yi) 2(n-k-1) 即回归平方和、残差平方和分别服从自由度为k和n-k-1的2分布进一步根据数理统计学中的知识，在原假设H0成立的条件下，统计量服从自由度为(k , n-k-1)的F分布。,给定显著性水平，可得到临界值F(k,n-k-1)，由样本求出统计量F的数值，通过 F F(k,n-k-1) 或 FF(k,n-k-1) 来拒绝或接受原假设H0，以判定原方程总体上的线性关系是否显著成立。,地区城镇居民消费模型,拒绝0假设，犯错误的概率为0,对于地区城镇居民消费模型的例子：二元模型：F=560.5650,给定显著性水平 =0.05，查分布表，得到临界值： F(2,28)=3.34,显然有 F F(k,n-k-1) ，即二个模型的线性关系在95%的水平下显著成立。,2、关于拟合优度检验与方程显著性检验关系的讨论,由,可推出：,与,或,对于一般的实际问题，在5%的显著性水平下， F统计量的临界值所对应的R2的水平是较低的。所以，不宜过分注重R2值，应注重模型的经济意义；在进行总体显著性检验时，显著性水平应该控制在5%以内。,在地区城镇居民消费二元模型中，,3.34,0.1354,有许多著名的模型，R2小于0.5，支持了重要的结论例如：库茨涅兹假设收入差距与经济增长水平之间的倒“U”型规律。（1）内容：随着经济的发展水平的提高，居民收入差距先扩大，然后达到顶点，再缩小，即居民的收入差距与经济发展水平是倒“U”型。（2）该规律可以从经济理论上得到很好的解释。,（3）该假设之所以被接受，是基于经验的证明。建立一个计量经济学模型，被解释变量是收入差距（用基尼系数表示），解释变量是经济发展水平（用GDP表示，包含GDP的一次项、二次项，因为倒“U”型假设是一条抛物线），从而构造一个二元模型，看看该二元模型是否显著性成立，及GDP的二次项系数是否为负因为抛物线是开口向下的。,后来做了很多检验，如用美国的历史数据、德国历史数据以及 64个国家（从经济发展水平低到经济发展水平高）同一年的数据，均符合倒“U”型规律，但方程的拟合优度大体上都在0.4左右。对我国，用中国各个省份的数据研究各省的居民收入差距，也验证了该规律即经济发展水平比较低的地区（如西部地区），居民收入差距小；经济发展水平比较高的地区（如广东、上海、北京），居民收入差距比较小；而经济发展水平处于中间的省份（如湖北、湖南、吉林、辽宁等），居民收入差距大，但模型的拟合优度为0.3、0.4、0.5，比较小，但模型成立，因为方程的显著性检验F检验在相当高的水平下成立。因此，不要片面追求拟合优度，关键是看模型的经济意义本身。,三、变量的显著性检验（t检验） (Testing the Individual Significance),对于多元线性回归模型,方程的总体线性关系显著每个解释变量对被解释变量的影响都是显著的。因此，必须对每个解释变量进行显著性检验，以决定是否作为解释变量被保留在模型中。这一检验是由对变量的 t 检验完成的。,1、t统计量,由于,以cii表示矩阵(XX)-1 主对角线上的第i个元素，于是参数估计量的方差为：,因此，可构造如下t统计量,其中2为随机误差项的方差，在实际计算时，用它的估计量代替:,=,2、t检验,设计原假设与备择假设：,H1：i0,给定显著性水平，可得到临界值t/2(n-k-1)，由样本求出统计量t的数值，通过 |t| t/2(n-k-1) 或 |t|t/2(n-k-1) 来拒绝或接受原假设H0，从而判定对应的解释变量是否应包括在模型中。,H0：i=0 （i=1,2k）,地区城镇居民消费模型,关于常数项的显著性检验,T检验同样可以进行。一般不以t检验决定常数项是否保留在模型中，而是从经济意义方面分析回归线是否应该通过原点。,注意：一元线性回归中，t检验与F检验一致,一方面，t检验与F检验都是对相同的原假设H0：1=0 进行检验; 另一方面，两个统计量之间有如下关系：,四、参数的置信区间,参数的置信区间用来考察：在一次抽样中所估计的参数值离参数的真实值有多“近”。在变量的显著性检验中已经知道：,=,容易推出：在(1-)的置信水平下i的置信区间是,其中，t/2为显著性水平为、自由度为n-k-1的临界值。,在地区城镇居民消费二元模型例中, 给定=0.05，查表得临界值：t0.025(28)=2.048,计算得参数的置信区间： 1 ： (0.4014, 0.7098 ) 2 ：(0.0174, 0.4828),从回归计算中已得到：,0.5556,0.2501,0.0753,0.1136,如何才能缩小置信区间？,增大样本容量n，因为在同样

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

多元线性回归模型的统计检验.ppt

文档简介

温馨提示

最新文档

评论

多元线性回归模型的统计检验.ppt

文档简介

温馨提示

最新文档

评论

相关文档