




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章 逐步回归与自变量筛选方法,一、问题的提出 1. 多元线性回归需对系数作检验,无意义的变量需剔除,由于变量间相关性,其他变量的显著性发生改变 2.从应用和分析目的角度,精选自变量模型拟合要优、变量节俭 问题:如何选择自变量进入模型? 1. 分析目的;2.建立模型的统计准则是什么?3.结合专业和实际问题考虑,二、自变量筛选的标准与原则,1.残差平方和、残差均方准则 当残差平方和(SSE)最小时,决定系数(R2)达到最大。 n为样本含量, R2 为包含m个自变量的回归方程的决定系数。 R2是随着变量数的增加而增大,而 不受变量数的影响,,2. CP统计量 n为样本含量,p表示进入模型的自变量
2、个数,m表示所有自变量个数, 表示从全部m个自变量的回归模型中得到的残差均方。 在模型变量个数减少的过程中第一次 值接近p+1时,模型最佳。如果 自变量中没有包含对 Y有主要作用的变量,则不宜用 方法选择自变量。 3.AIC准则 由Akaike在极大似然基础上提出的,Akaike信息量准则 AIC=n(ssp)-2(p+1) ssp表示选入模型p个变量的剩余平方和。AIC越小越好。,4.预测平方和准则(press统计量,预测精度),Press=di2 di2=Yi-XI Xi 表示剔除了所要预测的第i观测值以后所剩余观测值所做估计。 5.逐步回归(统计显著性准则) 统计显著性准则:把有统计学意
3、义的变量选入模型,得到的回归模型不一定是最佳预测模型。 三. 逐步回归分析(stepwise regression) 1. 概述 简单地对回归系数作检验,比较复杂; 用前述的几个指标是在所有子集回归中选最优回归模型,而逐步回归是每一步引入或剔除一个变量(其标准是F检验),直到引不进又剔不出为止,建立一个包含所有对因变量有影响的自变量。不是最优回归,二、逐步回归法,方法:向前法(forward )、向后法(backward)、逐步法(stepwise ) 每一步只引入或剔除一个自变量准则,是基于对偏回归平方和的F检验,(1)向前法(forward),回归方程中的自变量是一个个进入的,最有统计学意
4、义的变量最先进入,依此类推。即只进不出。 Y对每一个自变量作线性回归,计算各自变量的偏回归平方和,选取偏回归平方和最大者作F检验,有意义(P小)则引入。 局限性:即后续变量的引入可能会使进入方程的自变量变得不重要。 (2)向后法(backward),先将全部自变量选入方程,然后逐步剔除无统计学意义的自变量。即只出不进。偏回归平方和最小的变量,作F检验及相应的P值,决定它是否剔除(P大) 。重复上述过程。,剔除自变量的方法是在方程中选一个偏回归平方和最小的变量,作F检验决定它是否剔除,若无统计学意义则将其剔除,然后对剩余的自变量建立新的回归方程。重复这一过程,直至方程中所有的自变量都不能剔除为止
5、。理论上最好,建议使用采用此法。 (3)逐步法(stepwise),逐步回归法是在前述两种方法的基础上,进行双向筛选的一种方法。逐步的把有统计学意义的变量选入模型,也逐步剔除原先无统计学意义的变量。即有进有出。该方法本质上是前进法。,3.计算方法与步骤 首先确定引入与剔除变量的F统计量标准,检验水准a定为0.05 0.30,值越小表示选取自变量的标准越严。 注意:引入变量的检验水准要小于或等于剔除变量的检验水准。 四.注意事项 1.选择恰当的a和F值(选择不同的a 多做几次,看哪个更合要求)。 2.当自变量之间有高度相关时,很难建立模型。 3.可以考察变量之间的交互作用。 4.有从专业上认为必
6、须引入,五. 回归系数反常分析 回归系数的反常现象 1. 回归系数的正负符号与客观实际不一致。 2. 专业认为有统计学意义,但结果无统计学意义。回归系数正常,但标准误很大,无统计学意义。 3. 稍微改变a,引入的变量差别较大,回归方程不稳定。 4. 重要变量进不了模型。 主要原因 1. 自变量的多重共线性 2. 设计时某些重要的变量没有考虑进来。 3. 样本量太小 4. 变量的测量误差大有异常值。 5. 变量取值范围太窄。,六.SAS程序,Data A; Input x1-x3 y; Cards; . Proc reg; Model y=x1-x3/selection=stepwise(forward backward) sle sls; Run;,Proc reg; Model y=x1-x3/ cp adjrsq ; Run; Proc stepwise; Model y=x1-x3/stepwise(forward
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年洛阳汝阳县面向高等院校应届毕业生招聘教师41名模拟试卷及1套参考答案详解
- 安全培训被查课件
- 2025年琼中县教育局赴海师公开招聘教师和校医49名考前自测高频考点模拟试题及完整答案详解一套
- 2025海南保亭农水投资有限公司人员(代农水投公司发布)考前自测高频考点模拟试题及答案详解(典优)
- 2025华东理工大学材料科学与工程学院高分子材料人工智能研发创新团队招聘(上海)模拟试卷及答案详解参考
- 2025福建厦门市集美区海凤实验幼儿园非在编人员招聘1人考前自测高频考点模拟试题完整参考答案详解
- 2025年甘肃省武威市事业单位已发布模拟试卷及参考答案详解一套
- 2025包头市昆都仑区发展和改革委员会竞争性比选工作人员的考前自测高频考点模拟试题及答案详解(有一套)
- 2025年福建省厦门市湖里保安集团有限公司招聘1人考前自测高频考点模拟试题及答案详解(易错题)
- 2025年阜阳民生医院招聘20人考前自测高频考点模拟试题及答案详解(夺冠系列)
- 研究生教材SPSS统计软件应用
- 2025年部编版新教材三年级上册《9.犟龟》教案
- 2024年南宁市招聘中小学教师笔试真题
- 2024-2025学年下学期高二英语外研社版期中必刷常考题之被动语态
- 老员工带新员工的培训制度
- 水浒传每回内容梗概
- 工地试验室安全培训内容
- 合同车辆质押合同
- 2024版数据中心基础设施运维与维保服务合同2篇
- 增材制造课件
- 《《宫腔粘连多学科诊疗体系和效能评估标准》》
评论
0/150
提交评论