SPSS回归分析PPT课件.ppt_第1页
SPSS回归分析PPT课件.ppt_第2页
SPSS回归分析PPT课件.ppt_第3页
SPSS回归分析PPT课件.ppt_第4页
SPSS回归分析PPT课件.ppt_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2020 3 20 在数量分析中 经常会看到变量与变量之间存在着一定的联系 要了解变量之间如何发生相互影响的 就需要利用相关分析和回归分析 本讲介绍回归分析基本概念 主要类型 一元线性 多元线性 非线性回归分析 曲线估计 时间序列的曲线估计 含虚拟自变量的回归分析以及逻辑回归分析等 第五讲回归分析 1 2020 3 20 回归分析基本概念在回归分析中 因变量y是随机变量 自变量x可以是随机变量 也可以是非随机的确定变量 而在相关分析中 变量x和变量y都是随机变量 相关分析是测定变量之间的关系密切程度 所使用的工具是相关系数 回归分析则是侧重于考察变量之间的数量变化规律 并通过一定的数学表达式来描述变量之间的关系 进而确定一个或者几个变量的变化对另一个特定变量的影响程度 2 2020 3 20 具体地说 回归分析主要解决以下几方面的问题 通过分析大量的样本数据 确定变量之间的数学关系式 对所确定的数学关系式的可信程度进行各种统计检验 并区分出对某一特定变量影响较为显著的变量和影响不显著的变量 利用所确定的数学关系式 根据一个或几个变量的值来预测或控制另一个特定变量的取值 并给出这种预测或控制的精确度 3 2020 3 20 第一节一元线性回归线性回归的统计原理 两个定距变量的回归是用函数来分析的 我们最常用的是一元线性回归方程 通过样本数据建立一个回归方程后 不能立即就用于对某个实际问题的预测 因为 应用最小二乘法求得的样本回归直线作为对总体回归直线的近似 这种近似是否合理 必须对其作各种统计检验 具体统计检验有 4 2020 3 20 1 拟合优度检验回归方程的拟合优度检验就是要检验样本数据聚集在样本回归直线周围的密集程度 从而判断回归方程对样本数据的代表程度 回归方程的拟合优度检验一般用判定系数实现 该指标是建立在对总离差平方和进行分解的基础之上 5 2020 3 20 2 回归方程的显著性检验 F检验 回归方程的显著性检验是对因变量与所有自变量之间的线性关系是否显著的一种假设检验 一般采用F检验 利用方差分析的方法进行 回归参数显著性检验的基本步骤 提出假设 计算回归方程的F统计量值 根据给定的显著水平 确定临界值 或者计算F值所对应的p值 作出判断 F对应的显著性水平小于0 05或0 1 可以判断回归方程系数不会同时为0 回归方程存在 6 2020 3 20 3 回归系数的显著性检验 t检验 回归方程的显著性检验只能检验所有回归系数是否同时与零有显著性差异 它不能保证回归方程中不包含不能较好解释说明因变量变化的自变量 因此 可以通过回归系数显著性检验对每个回归系数进行考察 回归参数显著性检验的基本步骤 提出假设 计算回归系数的t统计量值 根据给定的显著水平 确定临界值 或者计算t值所对应的p值 作出判断 t对应的显著性水平小于0 05或0 1 认为其对应的系数不会显著为0 7 2020 3 20 例一 已知10户居民家庭的月可支配收入和消费支出数据 试采用一元线性回归分析方法 根据可支配收入的变化来分析消费支出的变化情况 单位 百元 8 2020 3 20 回归 线性 9 2020 3 20 R方 0 987 说明该线性模型可以解释自变量98 7 的变差 模型拟合优度检验Anova表中的F检验的显著性小于0 05 表明一元线性回归模型显著 10 2020 3 20 显著性水平值小于0 05 该项不会显著为0 大于0 05 该项会显著为0 11 2020 3 20 第二节多元线性回归 Linear过程 主要功能和原理介绍在实际问题中 因变量常受不只一个自变量的影响 如 植物生长速度受温度 光照 水分 营养等许多因素的影响 家庭消费支出受可支配收入水平 以往消费水平 收入水平的影响 汽车的需求量受人们的收入水平 汽车价格 汽车使用费用的高低等影响 多元线性回归就是研究某一个因变量和多个自变量之间的相互关系的理论与方法 12 2020 3 20 多元线性回归方程中变量的选取1 向后剔除法 BackwardElimination 1 将所有的P个自变量全部选入回归模型 然后估计出回归系数 2 检验回归系数是否为零 3 去掉在回归系数检验中没有通过的检验 即回归系数为零 具有最小F值的变量 将剩余的P 1个自变量作回归模型 再估计出回归系数 如果没有通过检验的变量较多 将检验水平选的稍微大一点 如0 10 4 再对P 1个自变量作回归系数进行是否为零的检验 如果还有变量的回归系数没有通过检验 再去掉在回归系数检验中具有最小F值的变量 将剩余的P 2个自变量再作回归模型估计出回归参数 5 依此进行下去直到所剩变量均通过检验 13 2020 3 20 2 向前选择法 ForwardSelection 1 算出因变量和每个自变量的相关系数 选择具有最大相关系数的自变量进入回归模型 2 对回归系数进行检验 如果检验结果是回归系数为零 则放弃回归方程 否则进入下一步 3 在上一步的方程中选入的自变量作为控制变量 分别计算因变量与其他自变量的偏相关系数 将具有偏相关系数绝对值最大的自变量选入回归方程 并对相应回归系数进行检验 如果检验结果是回归系数为零 则停止进一步选择 有效方程为前一步所建的方程 否则进行下一步的选择 4 重复第三步 但增加取固定影响的变量数 减少可被选择的自变量 直到所选变量未通过检验 前一步所建的方程为最后方程 14 2020 3 20 3 逐步回归法 StepwiseRegression 是将向后剔除法和向前选择法结合起来用 基本步骤 1 采用向前选择的方式选择第一个方程贡献最大的变量 若通不过显著性检验则终止选择 2 对未引入过方程的自变量 分别考察它们对方程的贡献 3 从中找出最大的变量进行显著性检验 如果不显著计算结束 如果显著则将该自变量正式引入方程 4 除方程中刚引入的变量以外的其他变量 分别计算它们对方程的贡献 5 从中找出最小者进行显著性检验 如果显著则没有要剔除的变量 回到第一步 否则剔除该变量 再回到第2步 4 删除法强迫将所有不进入方程模型的备选变量一次剔除 15 2020 3 20 例二 已知全国各地区的粮食生产情况 给出了人均粮食占有量 公斤 粮食产量 万吨 农作物总的播种面积 千公顷 有效灌溉面积 千公顷 以及化肥施用量 万吨 试以粮食产量为因变量 其他变量为自变量进行多元线性回归分析 建立回归方程 16 2020 3 20 17 2020 3 20 18 2020 3 20 19 2020 3 20 20 2020 3 20 21 2020 3 20 该变量不能被其他变量解释的变异百分比 值越小被其他变量解释的变异百分比越大 共线性问题越严重 判定自变量对回归模型的作用 值越大 对模型的贡献越大 容差的倒数 值越大说明共线性问题越严重 大于2被认为有共线性问题 22 2020 3 20 特征值越接近0 自变量间的相关性越高 意味着数据中微小变动引起预测值的大变化 大于15表示可能存在共线性问题 大于30则表示有严重的多重共线性问题 23 2020 3 20 在特定个案从回归系数的计算中排出的情况下 所有个案残差变化幅度的测量 较大的COOK距离表明从回归统计量的计算中排除个案后 系数会发生根本变化 预测值转化为标准化形式 预测值 均值预测值 预测值标准差 度量某个点对回归拟合的影响 一般情况下值大于0 06就要引起注意 由于排除了特定个案而导致的回归系数和预测值的变化 24 2020 3 20 练习 数据data5 2是某企业1987 1998年的经济效益 科研人员 科研经费的统计数据 假定1999年该企业科研人员61名 科研经费40万元 试预测1999年该企业的经济效益 25 2020 3 20 第三节曲线回归 CurveEstimation过程 原理介绍和功能分析1 曲线回归基本介绍通过两个相关变量X与Y的实际观测数据建立曲线回归方程 以揭示X与Y间的曲线联系的方式 曲线回归分析最困难和首要的工作是确定变量X与Y之间的曲线关系的类型 通常通过两个途径来确定 1 利用有关专业知识 根据已知的理论规律和实践经验 如细菌数量的增长常具有指数函数的形式 幼畜体重的增长具有S型曲线的形状 即Logistic曲线的形式等 2 若没有已知的理论规律和经验可以利用 则可用描点法将实测点在直角坐标纸上描出 观察实测点的分布趋势与哪一类已知的函数曲线最接近 然后再选用该函数关系式来拟合实测点 26 2020 3 20 27 2020 3 20 28 2020 3 20 例三 某地1963年调查得儿童年龄 岁 X与锡克试验阴性率 Y的资料如下 试拟合对数曲线 数据见SPSS63 29 2020 3 20 分析 回归 曲线 30 2020 3 20 判断最优曲线原则 R方越大越好 当R方接近时 选择尽量简单的方程 31 2020 3 20 图形判断 观察点越多在某条曲线上 该曲线方程拟合越

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论