已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第5章 自变量选择与逐步回归思考与练习参考答案5.1 自变量选择对回归参数的估计有何影响?答: 回归自变量的选择是建立回归模型得一个极为重要的问题。如果模型中丢掉了重要的自变量, 出现模型的设定偏误,这样模型容易出现异方差或自相关性 ,影响回归的效果;如果模型中增加了不必要的自变量, 或者数据质量很差的自变量, 不仅使得建模计算量增大, 自变量之间信息有重叠,而且得到的模型稳定性较差,影响回归模型的应用。5.2自变量选择对回归预测有何影响?答:当全模型(m元)正确采用选模型(p元)时,我们舍弃了m-p个自变量,回归系数的最小二乘估计是全模型相应参数的有偏估计,使得用选模型的预测是有偏的,但由于选模型的参数估计、预测残差和预测均方误差具有较小的方差,所以全模型正确而误用选模型有利有弊。 当选模型(p元)正确采用全模型(m元)时,全模型回归系数的最小二乘估计是相应参数的有偏估计,使得用模型的预测是有偏的,并且全模型的参数估计、预测残差和预测均方误差的方差都比选模型的大,所以回归自变量的选择应少而精。5.3 如果所建模型主要用于预测,应该用哪个准则来衡量回归方程的优劣?答:如果所建模型主要用于预测,则应使用统计量达到最小的准则来衡量回归方程的优劣。5.4 试述前进法的思想方法。答:前进法的基本思想方法是:首先因变量Y对全部的自变量x1,x2,.,xm建立m个一元线性回归方程, 并计算F检验值,选择偏回归平方和显著的变量(F值最大且大于临界值)进入回归方程。每一步只引入一个变量,同时建立m1个二元线性回归方程,计算它们的F检验值,选择偏回归平方和显著的两变量变量(F值最大且大于临界值)进入回归方程。在确定引入的两个自变量以后,再引入一个变量,建立m2个三元线性回归方程,计算它们的F检验值,选择偏回归平方和显著的三个变量(F值最大)进入回归方程。不断重复这一过程,直到无法再引入新的自变量时,即所有未被引入的自变量的F检验值均小于F检验临界值F(1,n-p-1),回归过程结束。5.5 试述后退法的思想方法。答:后退法的基本思想是:首先因变量Y对全部的自变量x1,x2,.,xm建立一个m元线性回归方程, 并计算t检验值和F检验值,选择最不显著(P值最大且大于临界值)的偏回归系数的自变量剔除出回归方程。每一步只剔除一个变量,再建立m1元线性回归方程,计算t检验值和F检验值,剔除偏回归系数的t检验值最小(P值最大)的自变量,再建立新的回归方程。不断重复这一过程,直到无法剔除自变量时,即所有剩余p个自变量的F检验值均大于F检验临界值F(1,n-p-1),回归过程结束。5.6前进法、后退法各有哪些优缺点?答:前进法的优点是能够将对因变量有影响的自变量按显著性一一选入,计算量小。前进法的缺点是不能反映引进新变量后的变化,而且选入的变量就算不显著也不能删除。后退法的优点是是能够将对因变量没有显著影响的自变量按不显著性一一剔除,保留的自变量都是显著的。后退法的缺点是开始计算量大,当减少一个自变量时,它再也没机会进入了。如果碰到自变量间有相关关系时,前进法和后退法所作的回归方程均会出现不同程度的问题。5.7 试述逐步回归法的思想方法。答:逐步回归的基本思想是有进有出。具体做法是将变量一个一个的引入,当每引入一个自变量后,对已选入的变量要进行逐个检验,当原引入变量由于后面变量的应纳入而变得不再显著时,要将其剔除。引入一个变量或从回归防方程中剔除一个变量,为逐步回归的一步,每一步都要进行F检验,以确保每次引入新的变量之前回归方程中只包含显著的变量。这个过程反复进行,直到无显著变量引入回归方程,也无不显著变量从回归方程中剔除为止。这样就避免了前进法和后退法各自的缺陷,保证了最后得到的回归子集是最优回归子集。5.8 在运用逐步回归法时,进和出的赋值原则是什么?如果希望回归方程中多保留一些自变量,进应如何赋值?答:原则是要求引入自变量的显著水平进小于剔除自变量的显著性水平出,否则可能出现死循环;若想回归方程多保留自变量,可以增大进的值,使得更多自变量的P值在进的范围内,但要注意,进的值不得超过出的值。5.9 在研究国家财政收入时,我们把财政收入按收入形式分为:各项税收收入、企业收入、债务收入、国家能源交通重点建设收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等。为了建立国家财政收入回归模型,我们以财政收入y(亿元)为因变量,自变量如下:x1为农业增加值(亿元),x2为工业增加值(亿元),x3为建筑业增加值(亿元),x4为人口数(万人),x5为社会消费总额(亿元),x6为受灾面积(万公顷)。据中国统计年鉴获得19781998年共21个年份的统计数据,见表5.4(P167)。由定性分析知,所有自变量都与y有较强的相关性,分别用后退法和逐步回归法作自变量选元。解:后退法SPSS输出结果:逐步回归法二者结果相同,回归方程为:y=865.9290.601x10.361x20.639x5但是回归系数的解释不合理。5.10 表5.5的数据是19681983年期间与电话线制造有关的数据,各变量的含义如下:x1年份;x2国民生产总值(10亿美元);x3新房动工数(单位:1000);x4失业率();x5滞后6个月的最惠利率;x6用户用线增量();y年电话销量(百万尺双线)。(1)建立y对x2x6的线性回归方程。SPSS输出结果如下:回归方程为:=5922.827+4.864+2.374-817.901+14.539-846.867其中x2、 x5的系数未通过检验。(2)用后退法选择自变量。后退法剔除P值最大的剔除x5,模型的参数均通过显著性检验。(显著性水平0.05),得回归方程为:=6007.320+5.068+2.308-824.261-862.699模型表明年电话销量(y)与国民生产总值、新房动工数、失业率、用户用线增量有显著的线性关系。(3)用逐步回归法选择自变量逐步回归法引入x3,x5,x4进入回归模型,没有剔除变量,保留x3,x5,x4作为最终模型。回归方程为:y=1412.8073.440x3415.136x4348.729x5模型表明年电话销量(y)与新房动工费、失业率、滞后6个月的最惠利率 有显著的线性关系。(4)根据以上计算结果分析后退法和逐步回归法的差异答:两个方法得到的最终模型是不同的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- ICU患者谵妄识别与早期干预技巧
- 国际溺水护理前沿:指南与技术借鉴
- 教培合同终止协议书
- 救援拖车安全协议书
- 甜叶菊种植合同协议
- 朋友入股协议签合同
- 特约维修品牌协议书
- 按年收费的合同协议
- 王者荣耀端口协议书
- 生病职工互助协议书
- 2025年低压电工复审考试题库及参考答案
- 2025年超星尔雅学习通《固体废物管理与资源化利用》考试备考题库及答案解析
- 冰雪天幼儿园安全课课件
- ICU呼吸机应用操作指导
- 移动客服沟通话术
- 高中体育人教版 (2019)全一册第三章 培养体育品德第三节 体育品格教学设计
- 2025云南交投集团下属临沧管理处招聘30人笔试历年常考点试题专练附带答案详解试卷3套
- 2025年反洗钱测试题及答案
- 仓管转正述职报告
- 安邦护卫集团总部及下属单位招聘笔试题库2025
- 智能网联汽车产业园项目施工方案
评论
0/150
提交评论