




已阅读5页,还剩71页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第7章回归分析 1 研究人员想进一步了解各种影响因素各自在多大程度上对男性胃癌患者在术后发生院内感染产生影响 想要了解这个问题 既要用到 回归分析 这一统计方法 2 事物是普遍联系的 并且彼此之间是有机地联系着 相互依赖着 相互制约着的 离开周围的事物和条件而孤立地存在的事物是没有的 因此 统计学在研究某一事件的时候 就不能只是研究其本身 同时还要研究其与其它事物之间的相互联系 并找出合理的方法确定它们之间的关系 7 1回归分析概述 3 事物或现象之间的相互依存关系大致可分成两种 一种是函数关系 是一种确定性的关系 即一个事物或现象的数值发生变化是 与其相关的事物或现象的数值也发生着相对应变化 还有一种是相关关系 是指事物或现象之间确实存在的一定的关系 但是这种关系又不能用固定的因果关系来描述 与此同时 虽然相关关系并不是确定的 但是从概率学的意义上来说 彩蔷哂泄媛尚缘模对于这一类的关系我们可以使用相关分析和回归分析来描述 接下来将详细介绍回归分析 4 回归分析和相关分析都是用来描述相关关系的方法 都是用来度量两个或两个以上的变量之间的关系的方法 确定变量之间是否存在关系 这是回归分析和相关分析共同的起点 因此从广义上讲 回归分析是从属于相关分析的 但是严格来将两者有存在区别 回归分析使用数学公式的方式来表示变量之间的关系 而相关分析是通过检验和度量变量之间关系的密切程度 两者相辅相成 7 1 1回归分析与相关分析的关系 5 所以根据不同的 可以从不同的角度去分析变量之间的关系 当只是要知道变量之间的关系的密切程度时 一般可以同过求变量间的相关系数得到相关信息 这个过程就叫相关分析 但是如果研究的目的是要确定变量之间数量关系的可能形式 找出变量之间的依存关系的合理的数学模型 用数学模型来表示变量之间的关系 这就叫回归分析 6 要进行回归分析 对数据是有一定的要求的 有学者提出了 在应用多元回归时 所分析的数据必须符合以下基本假定 1 正态性假定 2 因变量的各个观察值之间必须是相互独立的 3 各个自变量之间不能有多元共线性关系 也就是说各个自变量彼此之间不能有较高的相关 相关系数大于0 700 4 线性关系 5 各个残差之间相互独立假定 6 残差的等分散性假定 7 1 2回归分析的对数据的要求 7 具体地说 回归分析的一般过程分成四步 分别是 1 提出回归模型的假设 2 获取数据 3 建立回归方程 4 回归方程的检验 7 1 3回归分析的基本步骤 8 想要了解两个变量之间的因果关系 可用一元线性回归分析来得出 例如要知道雏鸭的重量对50日龄鸭的重量的影响 只要收集到相关的数据就可建立回归模型 从而由雏鸭的重量大致推断出50日龄鸭的重量 一下将对一元线性回归做详细介绍 7 2一元线性回归分析 9 当只探究一个自变量和一个因变量之间的数学关系 同时两变量之间为线性关系时 所建立的回归模型为一元线性回归模型 可用如下公式表示 Y bX a 7 2 1一元线性回归的基本概念 10 例7 1 在安徽的白鸭的生长情况研究中 得到如下一组关于雏鸭重 g 与50日龄鸭重 g 的数据 试建立50日龄鸭重 y 与雏鸭重 x 的线性回归方程 7 2 2实例分析 雏鸭体重与日龄 11 1 操作过程 1 打开数据文件 鸭重一元回归案例 2 选择 分析 回归 线性 命令 3 打开 线性回归 对话框 如下如所示 12 4 将上图中左侧变量列表框中的变量 50日龄鸭重 移入右侧的 因变量 文本框中 变量 雏鸭重 移入右侧的 自变量 文本框中 5 在 方法 文本框中共有5种方法可选 分别是 进入 逐步 删除 R 向后 向前 分别对应 强迫进入变量法 逐步回归分析法 删除法 向后法 和 向前法 本利可采用强迫进入变量法 13 6 单击 统计量 按钮 打开如下图所示的 线性回归 统计量 子对话框 该对话框中设置要输出的统计量 这里勾选 估计 模型拟合度复选框 单击 继续 按钮 回到 线性回归 主对话框中 14 7 单击 绘制 按钮 打开如下图所示的 线性回归 图 子对话框 在 线性回归 图 子对话框中的 标准化残差图 选项组中勾选 正态概率图 复选框 以便对残差的正态分布进行分析 单击 继续 按钮回到 线性回归 主对话框 15 8 单击 保存 按钮 在弹出如下图所示的 线性回归 保存 子对话框右侧的 残差 选项组中 勾选 未标准化 复选框 这样可以在数据文件中生成一个变量名为res 1的残差变量 以便对残差进行进一步分析 线性回归 保存 子对话框的功能在于将回归分析的各种结果所得到的各种预测值 残差值 以及相关统计量都以一个新变量名称增列在 SPSS数据编辑程序 窗口中 该子对话框是将一些数据收集起来以便进一步的分析 在一般的实际应用中 此子对话框应用的机会比较少 单击 继续 按钮 回到 线性回归 主对话框 16 9 在 线性回归 主对话框中单击 选项 按钮 打开如下图所示的 线性回归 选项 子对话框 此子对话框的功能在于界定采用逐步回归分析法时 选择进入回归方程式的自变量的准则 以及是否输出常数项 截距 等 在回归分析程序中 该子对话框中的选项保持程序默认的就可以 不用更改 单击 继续 按钮 回到主对话框 17 10 在 线性回归 主对话框中 单击 确定 按钮 完成SPSS操作 输出结果 18 2 结果分析 1 选入和删除的变量在本例中 只有一个自变量 雏鸭重 所以如下表所示 在选入的变量中只有 雏鸭重 没有删除的变量 使用的方法是 选入 19 2 模型摘要如下表所示为回归模型的摘要表 每个模型包括相关系数 R 相关系数的平方 R平方 调整后的相关系数 调整后的R平方 估计的标准误 由表中可知自变量 雏鸭重 和因变量 50日领鸭重 的相关系数为0 977 决定系数 为0 955 调整后的为 为0 951 回归模型的误差均方和 MSE 的标准误为60 953 20 3 方差分析如下表所示为回归模型的方差分析摘要表 其中的变异量显著性检验的F值为213 808 显著性检验的p值为0 000 小雨0 05的显著水平 表示回归模型整体解释变异量达到显著水平 也就是说回归系数不等于0 即预测变量会达到显著水平 21 4 回归系数如下表所示为回归模型的回归系数及回归系数的显著性差异 包括为标准化的回归系数 未标准化的回归系数 回归系数的显著性的t值 标准化回归系数的绝对值越大 表示该预测变量对因变量的影响越大 其解释因变量的变异量也就会越大 从表中可以得到为标准化的回归方程 50日龄鸭重 582 185 21 712 雏鸭重 22 5 残差统计量如下表所示为残差统计量 其中包括 预测值 残差 标准化预测值 和 标准化残差 的描述性统计量 最小值 最大值 平均数 标准差 和 个数 预测值 的最小值为2319 158 最大值为3187 645 平均值为2720 833 标准差为268 724 由于本例是为了方便说明回归分析的操作步骤 所以选取的样本量较少 实际研究中取样应多一些为好 这样会让回归分析方程更加稳定有效 23 自然界的万事万物都是相互联系和关联的 所以一个因变量往往同时受到很多个自变量的影响 如本章开篇时讲到的那个例子 男性胃癌患者发生术后院内感染的影响因素有很多 如年龄 手术创伤程度 营养状态 术前预防性抗菌 白细胞数以及癌肿病理分度 这时我们如果要更加精确的 有效的预测男性胃癌患者发生术后院内感染的具体情况这个因变量 就必须引入多个自变量 建立多元回归模型 7 3多元线性回归分析 24 多元回归模型是指含有两个或者两个以上的自变量的线性回归模型 用于揭示因变量与多个自变量之间的线性关系 多元回归的方程式为 Y b0 b1X1 b2X2 biXi以下呈现的是在计算多元回归模型时一般采用的几种方法以及方法的选择 1 逐步回归法 2 强迫进入法 3 阶层回归分析法 4 方法的选择 7 3 1多元线性回归的基本概念 25 接下来会举三个例子来分别说明 强迫选入法 逐步回归法 和 阶层多元回归法 是如何运用的 7 3 2各种回归分析方法的实例分析 26 例7 2 强迫选入法 某医院的一位优秀的男医生 想研究男性胃癌患者发生术后院内感染的影响因素 在研究了多名病人之后 他得到了数据资料 请通过多元线性回归统计方法找出哪些因素是对术后感染产生影响的 其中数据资料如下页所示 27 28 1 强迫选入法操作过程 1 建立数据文件 首先将上表中所有关于术后感染影响因素资料的数据输入到SPSS中 输入格式和数据文件如图所示 29 2 选择 分析 回归 线性 命令 打开 线性回归 主对话框 如下图所示 30 3 在 线性回归 主对话框左侧的变量列表框中选中变量 术后感染 将其移入右侧的 因变量 文本框中 4 在 线性回归 主对话框左侧的变量列表框中分别选中变量 年龄 手术创伤程度 营养状态 术前预防性抗菌 白细胞数 和 癌肿病理分度 将它们选入右侧的 自变量 列表框中 在中间的 方法 文本框系统默认是 进入 选项 无需修改 31 5 在 线性回归 主对话框的右上方 单击 统计量 按钮 弹出如下所示的 线性回归 统计量 对话框 6 上面的对话框中 在 回归系数 选项组中勾选 估计 复选框 勾选 模型拟合度 R方变化 描述性 共线性诊断 等复选框 在 残差 选项组中勾选 Durbin Watson U 复选框 单击 继续 按钮 回到 线性回归 主对话框中 32 7 在 线性回归 主对话框的右上方 单击 绘制 按钮 弹出如下所示的 线性回归 图 对话框 8 在上面的对话框中 选择左侧的 ZPRED 标准化预测值 选入右侧的X2 X 文本框中 选择左侧的 ZRESID 标准化的残差值 选入右侧的Y Y 文本框中 在 标准化残差图 选项组中 勾选 直方图 和 正态概率图 复选框 单击 继续 按钮 回到 线性回归 主对话框中 33 9 在 线性回归 主对话框中 单击 确定 按钮 运行SPSS程序 34 2 强迫选入法结果解释 1 描述性统计 如下图所示为SPSS输出的关于1个因变量和6个自变量的描述性统计 其中包含 平均数 标准差 和 个数 35 2 相关矩阵 下表为7个变量之间的积差相关矩阵 以及相关系数显著性检验的概率值 P值 矩阵 有效样本个数 其作用不大 故在此处略去 根据分析可知 营养状态 和 手术创伤程度 这两个变量之间可能存在共线性问题 其他自变量之间均呈中低程度相关 36 3 选入 删除的变量 下表为在回归分析时使用的方法及选入和删除的变量 37 4 模型摘要 下表所示为回归模型的一些基本信息 每个模型中包括 多元相关系数R 多元相关系数R平方 调整后的R平方 以及 估计标准误 其中还包括5个变更统计量 分别是R平方的改变量 F改变 分子自由度 分母自由度 显著性F改变 最后还有一个Durbin Waston检验 38 2020 2 7 39 5 方差分析 如下表所示为回归模型方差分析的摘要表 40 6 回归系数显著性检验 以上方差分析结果只能大致说明该模型是否合理 但是要知道各个自变量的回归系数是否在统计学意义上显著 还要看回归系数的t检验 在下表中可以看到结果 41 7 共线性诊断 下表所示为能够预测自变量之间共线性问题的各种统计指标 共线性其实就是指自变量之间存在很高的相关 42 8 残差统计量 如下表所示 表格中主要呈现了 预测值 残差 标准化预测值 和 标准化残差 的描述性统计量 43 9 回归分析输出报表的编辑 以上的表格都是SPSS直接导出的一些表格 但是在写报告时 只需报告其中的一部分结果即可 44 例7 3 逐步回归法 某养猪场老板 想要了解每一头猪身上能产多少瘦肉 从而随机选了25头肥 考虑到猪的各个部位的瘦肉量不太一样 所以收集了与瘦肉产量有关的三方面的数据资料 想通过这三方面的数据来对瘦肉产量进行预测 请用多元线性回归分析来解决这一问题 其中 数据文件如下所示 45 1 逐步回归法操作说明 1 建立数据文件 将上表中的数据输入到SPSS中 如下图所示 46 2 选择 分析 回归 线性 命令 打开 线性回归 主对话框 如下图所示 47 3 在 线性回归 主对话框左侧的变量列表框中选中变量 瘦肉量 将其移入右侧的 因变量 文本框中 在 线性回归 主对话框左侧的变量列表框中分别选中变量 肌肉面积 腿肉量 和 腰肉量 将它们选入右侧的 自变量 列表框中 4 在中间的 方法 文本框中 单击该文本框 出现下拉菜单 选择 逐步 选项 5 对于输出 统计量 图形 的相关设置与例7 2中完全一样 故在此不再赘述 设置完成后 单击 确定 按钮 运行SPSS程序 48 2 逐步回归法的结果 1 描述性统计 下表所示为 瘦肉量 肌肉面积 腿肉量 和 腰肉量 等4个变量的描述性统计 平均数 标准差 和 次数 49 2 各个变量间的相关矩阵 从下表中可以看出各个变量之间的相关系数 从而判断出它们之间的相关程度 根据分析可知 本例的共线性问题不严重 50 3 选入和删除的变量 下表为在回归分析时使用的方法及选入和删除的变量 51 4 模型摘要 如下表所示为回归模型的摘要表 在使用逐步回归法时 回归模型会根据各自变量对因变量预测的高低 而依次将自变量逐个地放入回归模型中 当自变量的回归系数没有达到显著水平时 该自变量就要被排除在回归模型之外 52 5 方差分析 下表为两个回归模型的整体显著性检验 因为在本例中采用的是逐步回归分析法 因此在这个表格中出现的模型整体显著性检验的F值均会达到显著性水平 53 6 回归模型的系数 下表为两个回归模型的回归系数及回归系数的显著性检验 其中包括未标准化的B估计值和标准误 还有标准化的Beta分布 还有对每一个回归系数的t检验的结果 以及共线性问题相关统计量 容忍度和方差膨胀系数 VIF 54 7 回归标准化残差值的直方图 下图为回归标准化残差值的直方图 此直方图是用来检验样本观察值是否符合正态性基本假设 55 8 标准化残差的正态概率分布图 下图为标准化残差的正态概率分布图 也是用来检验样本的分布是否符合正态分布的一种方法 56 9 标准化残差值和标准化预测值交叉分布图 下图为标准化残差值和标准化预测值交叉分布图 该图用来检验样本观察值是否符合正态分布以及残差值是否符合方差齐性的假定 57 例7 4 阶层回归分析法 使用青少年心理健康自评量表对某省份的中小学生进行测量 得到了一批数据 该量表共分成三大块 社会能力 行为问题 和 身心问题 每一大块又都各自有自己的预测指标 其中 社会能力 包括了 退缩 和 社交问题 两个部分 行为问题 包括了 注意问题 违纪行为 和 攻击行为 身心问题 包括了 焦虑郁郁 躯体主诉 和 思维问题 请用阶层回归分析法对该数据进行处理 58 1 阶层回归分析法操作过程 1 打开数据文件 青少年心理健康自评量表 sav 2 选择 分析 回归 线性 命令 打开 线性回归 主对话框 如下图所示 59 3 在 线性回归 主对话框左侧的变量列表框中选中变量 青少年心理健康 将其移入右侧的 因变量 文本框中 4 在 线性回归 主对话框左侧的变量列表框中分别选中变量 退缩 和 社交问题 将它们选入右侧的 自变量 列表框中 5 在中间的 方法 文本框系统默认是 进入 选项 无需修改 60 6 如下图所示 在 线性回归 主对话框的 块1的1 选项组中 单击 下一张 按钮 出现 块2的2 选项组 然后在 线性回归 主对话框的左侧变量列表框中 选择变量 注意问题 违纪行为 和 攻击行为 将它们选入 自变量 列表框中 61 7 如下图所示 在 线性回归 主对话框的 块2的2 选项组中 单击 下一张 按钮 出现 块3的3 选项组 然后在 线性回归 主对话框的左侧变量列表框中 选择变量 焦虑抑郁 躯体主诉 和 思维问题 将它们选入 自变量 列表框中 62 8 在 线性回归 主对话框的右侧单击 统计量 按钮 弹出如下图所示的 线性回归 统计量 对话框 在 回归系数 选项组中 勾选 估计 和 协方差矩阵 复选框 勾选 模型拟合度 R方变化 描述性 部分相关和偏相关 及 共线性诊断 复选框 在 残差 选项组中勾选 Durbin Watson 复选框 单击 继续 按钮 回到 线性回归 主对话框 63 9 在 线性回归 主对话框的右侧单击 绘图 按钮 弹出如图所示的 线性回归 图 对话框 在左侧的变量列表框中选中ZRESID选项 将其选入Y Y 文本框中 在左侧的变量列表框中选中ZPRED选项 将其选入X2 X 文本框中 勾选 直方图 和 正态概率图 单击 继续 按钮 回到 线性回归 主对话框 10 在 线性回归 主对话框上的其他统计量按照SPSS默认设置即可 单击 确定 按钮运行SPSS程序 64 2 阶层回归分析法的结果 1 描述性统计量 下表呈现了 青少年心理健康 退缩 社交问题 注意问题 违纪行为 攻击行为 焦虑抑郁 躯体主诉 和 思维问题 变量的 平均数 标准差 和 次数 等描述性统计量 65 2 相关系数 下表所示为各个变量之间的相关系数 根据分析可知 本例中存在共线性问题 66 3 选入和删除的变量 在使用阶层回归分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 考试试题临床医学综合及答案2025年版
- 2025年文化旅游演艺产业集群与文化旅游产业链协同创新分析
- 2025年特色小镇文化创意产业集群项目可行性研究报告:技术创新与产业升级
- 2025年陶瓷材料3D打印增韧技术在地质勘探的创新实践
- 镭射修复专业知识培训课件
- 镜湖企业安全生产培训课件
- 企业人力资源经理招聘与培训考核试卷及答案
- 港口物流智能化改造对2025年港口成本控制影响报告
- 年产小家电电煮锅、电热水壶、养生壶、电陶炉、电饭煲和加湿器共350万台项目环评报告表
- 广东智膳产品加工生产线技术改造项目环评报告表
- 2025年新版汉字听写大赛题库(含答案)
- 古诗词诵读教学设计与实施方案
- 2025年山东省政府采购评审专家考试题库附含答案
- 眼镜验光师试题(及答案)
- 第二章 有理数的运算 单元测试(含解析)2025-2026学年人教版(2024)数学七年级上册
- 家政入股分红合同协议书
- 2025年家政服务员工作技能考试试题及答案解析
- 2025年安全生产责任主体考试题及答案
- 2025年医疗器械注册与监管考试试题及答案解析
- 安全员a证考试试题库及答案
- 秩序维护人员培训课件
评论
0/150
提交评论