版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、SPSS多元线性回归模型建立基于逐步回归法多元线性回归模型回归:区别相关。因变量对解释变量的依赖关系,意义在于通过已知后者的值去预测前者的均值。线性:用于研究一种特殊的关系,即用直线或多维直线描述其依赖关系。多元:解释变量大于等于两个。建立一个模型: Y = 0 + 1 X 1 + 2 X 2 + . + i X i确定一些标准,判断进入的变量,和得出对应的系数。简要回顾一些计量经济学知识vT检验,F检验。都是对于系数为0假设检验。vT检验针对的假设是某一个系数为0。分布。vF检验针对的假设是所有的回归系数均为0.总显著性检验。分布。vSig.值significance即eviews中的p值。
2、小于设置的显著性水平如0.05,则拒绝原假设,统计量显著。vR2、调整R2 指标揭示拟合程度。随着进入模型的变量个数增加, R2 不断增大,同时代价是残差自由度的减少,意味着估计和预测可靠性低 。 举例说明本例给出的是某企业职员调查的数据。共有样本量474.所给变量共有6个:当前工资、初始工资、工作种类、过去经验、受雇时间、受教育程度。准备建立一个以当前工资为因变量,其他变量为自变量的回归方程。判断哪些变量进入方程,并且给出对应系数。1、选变量v要建立一个模型首先要选择变量,解释变量和因变量之间要有一定的关系。v方法:散点图直接判断相关性和偏相关性系数。v所要判断的变量:初始工资、工作种类、过
3、去经验、受雇时间、受教育程度散点图检验线性关系v散点图可以很直观地判断是否存在线性关系。v操作:Graphs-Legacy Dialogs-Scatter/Dot-Simple Scatter结论:当前工资和初始工资存在线性关系。偏相关系数检验线性关系v各因素之间有相互作用,仅仅看每个自变量分别和因变量之间觉得相关系数不能反映出各个变量之间的真实情况。v检验偏相关系数,控制其他的变量对两个变量相关关系的影响。v由偏相关系数和对应T值可以判断,这些变量和因变量的有关,可以建立一个以它们为自变量的回归模型。偏相关系数检验线性关系v操作:Analyze-Correlate-Partial Corre
4、lationv选择分析变量:当前工资、受教育程度v选择控制变量:其他变量v结论:T值的显著性水平为0,拒绝当前工资和受教育程度不相关的假设。偏相关系数为0.161.变量和因变量是相关的。v其他分析变量操作同,初步判断得出变量均可进入模型。2、选数据v我们建立回归模型是在若干假定前提之下的, 即对数据是有要求的。因变量数据的要求。v(1是否满足“残差的方差齐性要求v 方法:散点图v操作在后面做回归模型建立时一同分析。PP图检验正态性v(2因变量数据是否满足正态性要求v方法:PP图。所有点聚集在直线上,则说明该变量的数据分布是服从于所要检测的分布的PP图检验正态性v操作:Analyze-Descr
5、iptive Statistics-vP-Pplots v检验变量:当前工资v检验分布:正态分布Normalv结论:满足正态性假设要求3、进行回归v介绍回归方法:vEnter:强行进入法。所有变量直接全部进入模型。只有一个模型。v向前回归:根据自变量对因变量的贡献率,首先选择一个贡献率最大的自变量进入,一次只加入一个进入模型。然后,再选择另一个最好的加入模型,直至选择所有符合标准者全部进入回归。 v 向后回归:将自变量一次纳入回归,然后根据标准删除一个最不显著者,再做一次回归判断其余变量的取舍,直至保留者都达到要求。逐步回归Stepwise:是向前回归法和向后回归法的结合。v首先按自变量对因变
6、量的贡献率进行排序,按照从大到小的顺序选择进入模型的变量。每将一个变量加入模型,就要对模型中的每个变量进行检验,剔除不显著的变量,然后再对留在模型中的变量进行检验。直到没有变量可以纳入,也没有变量可以剔除为止。进行回归操作v进行回归操作:Analyze-Regression-Linear选择自变量和因变量v选择回归方法: Stepwise设置操作Statistics:系统默认选项:1、Estimates输出回归系数,标准化回归系数,回归系数为0的假设T值等) 2、 Model fit要引入模型的和要从模型中剔除的变量, 每一步模型R2 调整R2 、ANOVA方差分析表。设置操作vPlots制图
7、,检查方差齐性,vY:ZRESID(标准化残差)v X:ZPRED标准化预测值)v残差的方差齐性v分析依据:假如v它的大部分都落v在( - 3, 3) 范围之v内, 就可以认为v它满足这个条件。逐步回归中不在方程中变量一、判断模型中各个要进入变量的系数显著性:1、注释中是模型已有的变量,表中是排除在回归方程外变量。2、举例分析第一步: 方程中已有的第一个进入变量是初始工资,还有4个未进入模型。在这个方程的基础上,如果4个变量中每一个单独进入这个方程,会形成一个新的二元解释变量方程,这个二元方程的统计量结果如表。通过判断Partial Correlation绝对值来确定哪个是贡献率最大的,从而这
8、个变量先进入模型。3、第3 列是针对每一个变量前面的系数为零的假设的t 检验值, 第四列给出了这个检验结果。从中可以看出,sig.值均0.05。故拒绝系数为零的假设, 即每一个变量都对因变量有贡献,所以都不剔除。4、结论:第二个进入方程的变量是0.372的职务分类。分析 ANOVA表二、判断每一步模型总显著性1、方差分析表显示了回归拟合过程中每一步的方差分析结果。2、F值的Sig.值均0.05,不影响。其他的系数的显著性水平为0. 000, 它们都0. 05, 故属于小概率事件, 即拒绝回归系数为零的假设, 即每个回归方程都有意义。y=-15038.574+1.365X1 +5859.585X2-19.553X3+154.698X4+539.642X5注释:X1 初始工资、X2工作种类、X3过去经验、X4受雇时间、X5受教育程度注意:B( 偏回归系数) , 有一个缺点就是单
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学2025积极听讲说课稿
- 某织造厂生产设备操作细则
- 某涂料厂产品研发准则
- 高中心理教育教案:2025年自我价值感提升说课稿
- 滨州阳信县教体系统招聘教师考试真题2025
- 西安建筑科技大学华清学院专职教师招聘笔试真题2025
- 九江市修水县投资集团有限公司及所属企业招聘笔试真题2025
- 2025年山东省科创集团有限公司权属企业招聘考试试卷真题
- 小学数学青岛版 (六三制)五年级下册二 校园艺术节-分数的意义和性质教案及反思
- Unit 6 Rain or Shine Section B 3a-3c教案人教版(2024)七年级英语下册
- 公路四新技术培训课件
- 跨境电商文化内涵介绍
- 2026年北京航空航天大学工科面试航空航天兴趣与工程实践含答案
- 外墙瓷砖改涂真石漆施工方案
- 心梗合并室间隔穿孔课件
- 红斑狼疮患者术前准备注意事项
- 素描基础的入门课件
- 高考语文范文《成事须有“三力”-心力、能力、外力》
- 2018马原第七章共产主义崇高理想及其最终实现
- 制造工艺设计规范
- 盆栽种植与养护劳动课件
评论
0/150
提交评论