




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、逐步回归分析的基本思想在实际问题中,人们总是希望从对因变量y有影响的诸多变量中选择一些变量作为自变量,应用多元回归分析的方法建立“最优”回归方程以便对因变量y进行预报或控制。所谓“最优”回归方程,主要是指希望在回归方程中包含所有对因变量y影响显著的自变量而不包含对影响不显著的自变量的回归方程。逐步回归分析正是根据这种原则提出来的 一种回归分析方法。它的主要思路是在考虑的全部自变量中按其对y的作用大小,显著程度大小或者说贡献大小,由大到小地逐个引入回归方程,而对那些对作用不显著的变量可 能始终不被引人回归方程。另外,己被引人回归方程的变量在引入新变量后也可能失去重要性,而需要从回归方程中剔除出去
2、。引人一个变量或者从回归方程中剔除一个变量都称 为逐步回归的一步,每一步都要进行F检验,以保证在引人新变量前回归方程中只含有对y影响显著的变量,而不显著的变量已被剔除。逐步回归分析的实施过程是每一步都要对已引入回归方程的变量计算其偏回归平方和(即贡献),然后选一个偏回归平方和最小的变量,在预先给定的水平下进行显著性检验,如果显著则该变量不必从回归方程中剔除,这时方程中其它的几个变量也都不需要剔除(因为其它的几个变量的偏回归平方和都大于最小的一个更不需要剔除)。相反,如果不显著,则该变量要剔除,然后按偏回归平方和由小到大地依次对方程中其它变量进行检验。将对影 响不显著的变量全部剔除,保留的都是显
3、著的。接着再对未引人回归方程中的变量分别计 算其偏回归平方和,并选其中偏回归平方和最大的一个变量,同样在给定水平下作显著性检验,如果显著则将该变量引入回归方程,这一过程一直继续下去,直到在回归方程中的变量都不能剔除而又无新变量可以引入时为止,这时逐步回归过程结束。在供选择的m个自变量中,依各自变量对因变量作用的大小,即偏回归平方和(partialregression sum of squares)的大小,由大到小把自变量依次逐个引入。每引入一个变量,就 对它进行假设检验。当P:-时,将该自变量引入回归方程。新变量引入回归方程后,对方程中原有的自变量也要进行假设检验,并把贡献最小且退化为不显著的
4、自变量逐个剔出方 程。因此 逐步回归每一步(引入一个自变量或剔除一个自变量)前后都要进行假设检验, 直至既没有自变量能够进入方程,也没有自变量从方程中剔除为止。回归结束,最后所得方程即为所求得的“最优”回归方程。逐步回归分析的特点:双向筛选,即引入有意义的变量(前进法),剔除无意义变量(后退法)多元线性回归的应用1 .影响因素分析2 .估计与预测用回归方程进行预测时,应选择具有较高R2值的方程。3 统计控制指利用回归方程进行逆估计,即通过控制自变量的值使得因变量 Y为 给定的一个确切值或者一个波动范 围。此时,要求回归方程的 R2值要 大,回归系数的标准误要小。1 .样本含量应注意样本含量n与
5、自变量个数 m的比例。通常,样本含量至少为变量数的5-10倍。2 方程“最优”问题目的是精选自变量以求得拟合效果最好的多元回归方程。最优子集回归是选择一组使回归方程拟和最好的自变量,而逐步回归则选择对因变量作用有意义的自变量,要根据研究目的选用合适的方法。逐步回归分析的主要计算步骤1)确定F检验值在进行逐步回归计算前要确定检验每个变量是否显若的!检验水平,以作为引人或剔除变量的标准。检验水平要根据具体问题的实际情况来定。 一般地,为使最终的回归方程中包含较多的变量 ,F水 平不宜取得过高,即显著水平a不宜太小。水平还与自由度有关,因为在逐步回归过程中,回归方程 中所含的变量的个数不断在变化,因
6、此方差分析中的剩余自由度也总在变化,为方便起见常按*计 算自由度。I为原始数据观测组数,:为估计可能选人回归方程的变量个数。 例如 ., 估计可能有2 3个变量选入回归方程,因此取自由度为15-3-1 = 11,查F分布表,当0= 0.1,自由度 A-1,加M时,临界值二、,并且在引入变量时,自由度取I-1,;?检验的临界值记1,在 剔除变量时自由度取.:,:- - 1, 检验的临界值记 】,并要求 n -, 实际应用中常取(2)逐步计算如果已计算步(包含0),且回归方程中已引入个变量,则第1 ;步的计算为:(:.)计算全部自变量的贡献(偏回归平方和)。()在已引入的自变量中,检查是否有需要剔
7、除的不显著变量。 这就要在已引入的变量中选取具有最小 V 值的一个并计算其 值,如果-卜二一,表示该变量不显著,应将其从回归方程中剔除,计算转至(.)。 如-卜一则不需要剔除变量,这时则考虑从未引入的变量中选岀具有最大 值的一个并计算F值,如口果F -;i,则表示该变量显著,应将其引人回归方程,计算转至(.)。如果F二片,表示已无变量可选入方程,则逐步计算阶段结束,计算转人(3)。(:)剔除或引人一个变量后,相关系数矩阵进行消去变换,第.-一步计算结束。其后重复(,)(.)再进 行下步计算。由上所述,逐步计算的每一步总是先考虑剔除变量 ,仅当无剔除时才考虑引入变量。 实际计算时,开 头几步可能
8、都是引人变量,其后的某几步也可能相继地剔除几个变量。当方程中已无变量可剔除,且又无变量可引入方程时,第二阶段逐步计算即告结束,这时转入第三阶段。(3)其他计算,主要是计算回归方程入选变量的系数、复相关系数及残差等统计量。逐步回归选取变量是逐渐增加的。选取第个变量时仅要求与前面己选的-1个变量配合起来有最小的残差平方和,因此最终选岀的一个重要变量有时可能不是使残差平方和最小的 一个,但大量实际问题 计算结果表明,这个变量常常就是所有 个变量的组合中具有最小残差平方和的那一个组合 ,特别当 不太大时更是如此,这表明逐步回归是比较有效的方法。引人回归方程的变量的个数一与各变量贡献的显著性检验中所规定的F检验的临界值卜1与的取值大小有关。如果希望多选一些变量进人回归方程,则应适当增大检验水平 a值,即减小的值,特别地,当= 0 时,则全部变量都将被选入,这时逐步回归就变为一般的多元
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 酒店建设项目可行性研究报告
- 2025年建筑装饰和装修业行业研究报告及未来行业发展趋势预测
- 2025年可穿戴医疗设备在心血管疾病预防中的应用与创新趋势报告
- 2026届湖南省邵阳市邵东县第三中学化学高一上期中联考试题含解析
- 2025新能源行业安全生产标准化建设与行业规范报告
- 2025年农业绿色发展政策扶持与农业废弃物资源化利用技术发展现状分析报告综述
- 2025年安庆经开区公办幼儿园劳务派遣教师招聘13人考试参考试题及答案解析
- 2025重庆渝北区第三实验小学招聘学科教师若干人考试参考试题及答案解析
- 2025年新能源汽车轻量化车身轻量化碰撞安全性能与电动汽车政策法规研究
- 危重患者管理护理试题及答案
- 峥嵘岁月 课件-2024-2025学年高中音乐人音版(2019) 必修 音乐鉴赏
- GB 21258-2024燃煤发电机组单位产品能源消耗限额
- DB34T 4379-2023 农村房地一体不动产确权登记技术规程
- 数字媒体艺术史全册完整教学课件
- 贵州珍酒酿酒有限公司招聘笔试题库2024
- 电力建设施工技术规范 第5部分:管道及系统-DLT 5190.5
- 《矿物岩石学教学课件》1-2 矿物学
- 《信号完整性测试》课件2
- DB6101T141-2018猕猴桃水肥一体化施肥技术规程
- 制造业绿色生产与环境可持续发展
- 中国石油天然气股份有限公司油气田站场目视化设计规定
评论
0/150
提交评论