第章SPSS的方差分析[]PPT课件.ppt_第1页
第章SPSS的方差分析[]PPT课件.ppt_第2页
第章SPSS的方差分析[]PPT课件.ppt_第3页
第章SPSS的方差分析[]PPT课件.ppt_第4页
第章SPSS的方差分析[]PPT课件.ppt_第5页
已阅读5页,还剩103页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章SPSS的方差分析 6 1方差分析概述方差分析 AnalysisofVariance 简称ANOVA 又称 变异数分析 或 F检验 是R A Fisher发明的 用于多个样本均数差别的显著性检验 1 一 为什么要进行方差分析 两样本T检验存在的问题是什么 1 检验过程烦琐例如 一试验包含5个处理 采用t检验法要进行10次两两平均数的差异显著性检验 若有k个处理 则要作k k 1 2次类似的检验 2 误差估计的精确性和检验的灵敏性低对同一试验的多个处理进行比较时 应该有一个统一的试验误差的估计值 若用t检验法作两两比较 由于每次比较需计算一个 故使得各次比较误差的估计不统一 同时没有充分利用资料所提供的信息而使误差估计的精确性降低 从而降低检验的灵敏性 2 例如 试验有5个处理 每个处理重复6次 共有30个观测值 进行t检验时 每次只能利用两个处理共12个观测值估计试验误差 误差自由度为2 6 1 10 若利用整个试验的30个观测值估计试验误差 显然估计的精确性高 且误差自由度为5 6 1 25 可见 在用t检法进行检验时 由于估计误差的精确性低 误差自由度小 使检验的灵敏性降低 容易掩盖差异的显著性 3 3 推断的可靠性低 若用u t检验法进行4个处理平均数间的差异显著性检验 若两两比较推断正确的概率为95 则所有比较都正确的概率为0 956 0 74 则降低了推断的可靠性 由于上述原因 多个平均数的差异显著性检验不宜用u t检验 须采用方差分析法 analysisofvariance 4 二 涉及的概念1 观察因素 观测变量2 影响因素 1 控制因素 控制变量 将控制因素的不同情况称为控制因素的不同水平 2 随机因素 观测变量 控制因素 三个水平 控制因素 5 三 分析目的 方差分析正是要分析观测变量的变动是否主要是由控制因素造成还是由随机因素造成的 以及控制变量的各个水平是如何对观测变量造成影响的 影响某农作物亩产量的因素 品种 施肥量 气候等 影响推销某种商品的推销额 不同的推销策略 价格 包装方式 推销人员的形象等 6 7 四 方差分析的类型单因素方差分析多因素方差分析协方差分析多元方差分析 8 五 方差分析的假定条件 1 样本相互独立 2 定距数据 3 随机抽样 4 正态分布 5 等方差性 9 6 2单因素方差分析检验某一个控制因素的改变是否会给观察变量带来显著影响 由于仅研究单个因素对观测变量的影响 因此称为单因素方差分析 明确观测变量和控制变量考察不同肥料对某农作物亩产量是否有显著差异 考察妇女生育率在不同地区是否有显著差异 考察不同学历是否对工资收入产生显著影响 考察不同的推销策略是否对推销额产生显著影响 10 6 2 1单因素方差分析的基本思想方差分析认为 观测变量值得变动会受控制变量和随机变量两方面的影响 据此 单因素方差分析将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分 用数学形式表述为 SST SSA SSE 11 原始数据对于它们组均值的偏差 称作组内方差 各组均值之间的偏差 则被称作组间方差 原始数据对于总体均值的偏差 称作总方差 12 组内方差 13 组间方差 14 案例 15 组内离差平方和 SSE 16 17 22 82 78 262 444 18 组间离差平方和 SSA 19 20 总离差平方和 SST 21 总离差平方和 SST 误差项离差平方和 SSE 水平项离差平方和 SSA 之间的关系 SST SSA SSE 22 6 2 3单因素方差分析的基本步骤1 提出原假设 不同水平下 各总体均值无显著差异 不同水平下控制因素的影响不显著 注意 拒绝原假设 只表明至少有两个总体的均值不相等 并不意味着所有的均值都不相等 23 2 选择检验统计量 方差分析采用的检验统计量是F统计量 即F值检验 平均组间平方和 平均组内平方和 24 在观测变量总离差平方和中 如果组间离差平方和所占比例较大 则说明观测变量的变动主要是由控制变量引起的 可以主要由控制变量来解释 控制变量给观测变量带来了显著影响 反之 如果组间离差平方和所占比例小 则说明观测变量的变动不是主要由控制变量引起的 不可以主要由控制变量来解释 控制变量的不同水平没有给观测变量带来显著影响 观测变量值的变动是由随机变量因素引起的 25 SST反映全部数据总的误差程度 SSE反映随机误差的大小 SSA反映随机误差和系统误差的大小如果原假设成立 则表明没有系统误差 组间平方和SSA除以自由度后的均方与组内平方和SSE和除以自由度后的均方差异就不会太大 如果组间均方显著地大于组内均方 说明各水平 总体 之间的差异不仅有随机误差 还有系统误差判断因素的水平是否对其观察值有影响 实际上就是比较组间方差与组内方差之间差异的大小 26 3 计算检验统计量的观测值和概率P值 该步骤的目的就是计算检验统计量的观测值和相应的概率P值 4 给定显著性水平 并作出决策 27 28 6 2 4单因素方差分析的基本操作从菜单中选择 分析比较均值单因素ANOVA 选择一个或多个因变量 选择一个自变量因子变量 29 30 6 2 5单因素方差的应用举例 31 32 6 2 6单因素方差分析的进一步分析6 2 6 1方差齐性检验 33 SPSS单因素方差分析中 方差齐性检验采用了方差同质性 homogeneityofvariance 检验方法 其原假设是 各水平下观测变量总体的方差无显著差异 34 Brown Forsythe 计算Brown Forsythe统计量以检验组均值是否相等 当方差相等的假设不成立时 这种统计量优于F统计量 Welch 计算Welch统计量以检验组均值是否相等 当方差相等的假设不成立时 这种统计量优于F统计量 35 Brown Forsythetest 36 Welch法近似t检验Welch法也是对自由度进行校正 校正公式为 37 6 2 6 1多重比较检验单因素方差分析的基本分析只能判断控制变量是否对观测变量产生了显著影响 如果控制变量确实对观测变量产生了显著影响 进一步还应确定控制变量的不同水平对观测变量的影响程度如何 其中哪个水平的作用明显区别于其他水平 哪个水平的作用是不显著的 等等 如果确定了不同施肥量对农作物的产量有显著影响 那么还需要了解哪种施肥量水平对提高农作物产量的作用不明显 哪种施肥量水平最有利于提高产量等 38 39 LSD 使用t检验执行组均值之间的所有成对比较 对多个比较的误差率不做调整 Bonferroni 使用t检验在组均值之间执行成对比较 但通过将每次检验的错误率设置为实验性质的错误率除以检验总数来控制总体误差率 这样 根据进行多个比较的实情对观察的显著性水平进行调整 Sidak 基于t统计量的成对多重比较检验 Sidak可调整多重比较的显著性水平 并提供比Bonferroni更严密的边界 40 Scheffe 为均值的所有可能的成对组合执行并发的联合成对比较 使用F取样分布 子集一致检验 可用来检查组均值的所有可能的线性组合 而非仅限于成对组合 R E G WF Ryan Einot Gabriel WelschF 基于F检验的多重比较 子集一致检验 R E G WQ Ryan Einot Gabriel WelschQ 基于学生化范围的多重比较 子集一致检验 41 S N K StudentNewmanKeuls 使用学生化的范围分布在均值之间进行子集一致检验 比较具有相同样本大小的同类子集内的均值对 均值按从高到低排序 首先检验极端差分 Tukey 使用学生化的范围统计量进行组间所有成对多重比较 还进行子集一致检验 将试验误差率设置为所有成对比较的集合的误差率 Tukey sb 使用学生化的范围分布在组之间进行子集一致检验 临界值是Tukey s真实显著性差异检验的对应值与Student Newman Keuls的平均数 42 Duncan 使用与Student Newman Keuls检验所使用的完全一样的逐步顺序成对比较子集一致检验 但要为检验的集合的错误率设置保护水平 而不是为单个检验的错误率设置保护水平 使用学生化的范围统计量 Hochberg sGT2 使用学生化最大模数的多重比较和子集一致检验 与Tukey s真实显著性差异检验相似 Gabriel 使用学生化最大模数的多重比较和子集一致检验 当单元格大小不相等时 它通常比Hochberg sGT2更为强大 当单元大小变化过大时 Gabriel检验可能会变得随意 43 Waller Duncan 基于t统计的子集一致性比较检验 使用Bayesian方法 Dunnett 将一组处理与单个控制均值进行比较的成对多重比较t检验 最后一类是缺省的控制类别 另外 您还可以选择第一个类别 双面检验任何水平 除了控制类别外 的因子的均值是否不等于控制类别的均值 控制检验任何水平的因子的均值是否大于控制类别的均值 44 Tamhane sT2 基于t检验的保守成对比较 当方差不相等时 适合使用此检验 Dunnett sT3 基于学生化最大值模数的成对比较检验 当方差不相等时 适合使用此检验 Games Howell 有时会变得随意的成对比较检验 当方差不相等时 适合使用此检验 Dunnett sC 基于学生化范围的成对比较检验 当方差不相等时 适合使用此检验 45 进行均值多重比较的选项 LSD Bonferroni Sidak Dunnett Tamhane sT2 Dunnett sT3 Games Howell Dunnett sC进行子集一致性检验的选项R E G WF R E G WQ S N K Tukey sb Duncan Waller Duncan进行均值多重比较和子集一致性检验的选项 Scheffe Tukey Gabriel Hochberg sGT2 46 6 2 6 2其他检验先验对比检验 47 趋势检验 48 6 2 7单因素方差应用举例的进一步分析 49 描述性 计算每组中每个因变量的个案数 均值 标准差 均值的标准误 最小值 最大值和95 置信区间 50 固定和随机效应 显示固定效应模型的标准差 标准误和95 置信区间 以及随机效应模型的标准误 95 置信区间和成分间方差估计 P166 51 均值图 52 6 2 7单因素方差进一步分析应用举例比较四种饲料对猪体重增加的作用有无不同 数据 SPSSforWindows统计分析 第3版 data07 01检验A D饲料对体重增加的效应及其之间是否有显著差异 检验A C饲料之和效应是否与B D之和效应有显著差异 53 练习题 1 比较四种饲料对猪体重增加的作用有无不同 数据 SPSSforWindows统计分析 第3版 data07 012 分析不同细菌对三叶草含氮量的影响 数据 SPSSforWindows统计分析 第3版 data07 023 分析不同服务行业服务质量的差异 数据 SPSSforWindows统计分析 第3版 data07 124 检验施肥量与亩产量之间的关系 数据 SPSS统计分析从入门到精通 Chapter09 施肥量与亩产量关系数据 sav 54 2020 3 19 55 6 3单变量多因素方差分析6 3 1基本思想多因素方差分析用来研究两个及两个以上控制变量是否对观测变量产生显著影响 由于研究多个因素对观测变量的影响 因此称为多因素方差分析 多因素方差分析不仅能够分析多个因素对观测变量的独立影响 更能够分析多个控制因素的交互作用能否对观测变量的分布产生显著影响 进而最终找到利于观测变量的最优组合 56 观测变量的方差1 控制变量独立作用的影响2 控制变量交互作用的影响3 随机因素的影响 57 观测变量变差 主效应 交互效应 剩余 58 59 60 品种甲 品种乙 61 62 63 6 3 2多因素方差分析的数学模型设有两个因素A B作用于试验的指标 因素A有r个水平A1 A2 Ar 因素B有s个水平B1 B2 Bs 设xijk N ij 2 i 1 2 r j 1 2 s k 1 2 t 各xijk独立 这里 ij 2均为未知参数 或写为 64 6 3 3多因素方差分析的基本步骤我们要检验因素A B及交互作用A B是否显著 要检验以下3个假设 65 当H01 1 2 r 0为真时 当假设H02为真时 当假设H03为真时 F r 1 s 1 rs t 1 FA F r 1 rs t 1 FB F s 1 rs t 1 FA B 66 6 3 4多因素方差分析的基本操作从菜单中选择 分析一般线性模型单变量 选择一个因变量 为 固定因子 随机因子 和 协变量 选择变量 如果适用于您的数据 您还可以使用 WLS权重 为加权最小二乘分析指定权重变量 如果加权变量的值为0 负数或缺失 则将该个案从分析中排除 已用在模型中的变量不能用作加权变量 67 6 3 5多因素方差分析的应用举例 SST 主效应 SSA SSB SSAB SSE 68 6 3 6多因素方差分析的进一步分析6 3 6 1饱和与非饱和模型建立非饱和模型的前提 交互作用对观测变量未产生显著影响公式 1 两因素非饱和模型 69 案例1 四种雌性白鼠 注射不同剂量雌激素 观察子宫重量变化 数据 SPSSforWindows统计分析 第3版 data07 03 70 71 72 案例2 本书案例广告 地区 销售量 73 74 75 案例3 数据 SPSSforWindows统计分析 第3版 data07 07 76 77 78 6 3 6 2多因素方差分析的其他功能 一 对比检验对比用来检验因子 控制变量 的水平之间的差值 可以为模型中的每个因子指定对比 在重复度量模型中 则是为每个主体间因子 79 80 81 二 图形分析 82 83 三 多重比较 84 四 保存 85 可以在数据编辑器中将模型预测的值 残差和相关测量另存为新变量 这些变量中有许多可用于检查关于数据的假设 1 预测值 模型为每个个案预测的值 未标准化 模型为因变量预测的值 加权 加权未标准化预测值 仅在之前已选择了WLS变量的情况下可用 标准误 对于自变量具有相同值的个案所对应的因变量均值标准差的估计 86 2 残差 未标准化残差是因变量的实际值减去由模型预测的值 还提供标准化残差 Student化的残差以及剔除残差 如果选择了WLS变量 则提供加权的未标准化残差 未标准化 观察值与模型预测值之间的差 加权 加权未标准化残差 仅在之前已选择了WLS变量的情况下可用 标准化 残差除以其标准差的估计 标准化残差也称为Pearson残差 它的均值为0 标准差为1 学生化 残差除以其随个案变化的标准差的估计 取决于每个个案的自变量值与自变量均值之间的距离 删除 当某个案从回归系数的计算中排除时 该个案的残差 它是因变量的值和调整预测值之间的差 87 3 诊断 标识以下个案的测量 自变量的值具有不寻常组合的个案 以及可能对模型产生很大影响的个案 Cook距离 在特定个案从回归系数的计算中排除的情况下 所有个案的残差变化幅度的测量 较大的Cook距离表明从回归统计量的计算中排除个案之后 系数会发生根本变化 杠杆值 未居中的杠杆值 每个观察值对模型拟合的相对影响 88 4 系数统计 将模型中的参数估计值的协方差矩阵写入当前会话中的新数据集 或写入外部PASWStatistics数据文件 而且 对于每个因变量 将存在一行参数估计值 一行与参数估计值对应的t统计量的显著性值以及一行残差自由度 对于多变量模型 每一个因变量都存在类似的行 您可以在读取矩阵文件的其他过程中使用此矩阵文件 89 五 选项 90 1 估计边际均值 选择需要的单元中的总体边际均值估计的因子和交互作用 为协变量 如果存在 调整这些均值 比较主效应 对于主体间和主体内因子 为模型中的任何主效应提供估计边际均值未修正的成对比较 只有在 显示以下项的均值 列表中选择了主效应的情况下 此项才可用 置信区间调节 选择最小显著性差异 LSD Bonferroni或对置信区间和显著性的Sidak调整 此项只有在选择了比较主作用的情况下才可用 91 2 输出 选择描述统计以生成所有单元中的所有因变量的观察到的均值 标准差和计数 功效估计给出了每个作用和每个参数估计值的偏Eta方值 Eta方统计量描述总变异性中可归因于某个因子的部分 当基于观察到的值设置备用假设时 选择检验效能可获取检验的效能 选择参数估计可为每个检验生成参数估计值 标准误 t检验 置信区间和检验效能 选择对比系数矩阵可获取L矩阵 92 6 3 7多因素方差分析应用举例的进一步分析 1 销售额多因素方差分析的饱和模型 2 不同广告形式下的销售额均值比较 3 交互效应中的随机因素分析 SPSS统计分析从入门到精通 Chapter09 心理实验数据 sav 93 练习题 1 使用两种药物治疗缺铁性贫血 根据红细胞数目增减 分析药物A B的治疗效果 数据 SPSSforWindows统计分析 第3版 data07 04 问题 1 零假设是什么 检验假设 2 绘制控制变量交互图 2 四种雌性白鼠 注射不同剂量雌激素 观察子宫重量变化 数据 SPSSforWindows统计分析 第3版 data07 03 问题 零假设是什么 检验假设比较1和2数据结构的异同 94 3 varirty 甜菜种类 rep 地块行 col 地块列 havrvest 收获次数 yield 产量 数据 SPSSforWindows统计分析 第3版 data07 05 要求 分析六种甜菜品种在相同土壤条件下的产量是否有显著性差异 4 检验不同包装方式和柜台种类对超市销售额是否有显著性影响 数据 SPSS统计分析从入门到精通 Chapter09 包装与柜台对销售额影响数据 95 6 4协方差分析6 4 1协方差分析的基本思路为了更加准

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论