第七章SPSS的方差分析新PPT课件.ppt_第1页
第七章SPSS的方差分析新PPT课件.ppt_第2页
第七章SPSS的方差分析新PPT课件.ppt_第3页
第七章SPSS的方差分析新PPT课件.ppt_第4页
第七章SPSS的方差分析新PPT课件.ppt_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章 SPSS的方差分析 本章内容 7 1方差分析概述7 2单因素方差分析7 3多因素方差分析7 4协方差分析方差分析 定类 定距 定序 定距施肥量定序 品种定类 产量定距 2 7 1方差分析概述 7 1 1方差分析的作用在诸多领域的数量分析研究中 找到众多影响因素中重要的影响因素是非常重要的 比如 在农业生产中 我们总是希望在尽量少的投入成本下得到较高的农作物产量 这就需要首先分析农作物的产量究竟受到哪些因素的影响 有许多因素会影响农作物的产量 如种子的品种 施肥量 气候 地域等 他们都会给农作物的产量带来或多或少的影响 如果我们能够掌握在众多的影响因素中 哪些因素对农作物的产量起到了主要的 关键性的作用 我们就可以根据实际情况对这些关键因素加以控制 进一步 在掌握关键影响因素 如品种 施肥量因素等之后 我们还要对不同的品种 不同的施肥量条件下的产量进行对比分析 研究究竟哪个品种的产量高 施肥量究竟多少最合适 哪种品种与哪种施肥量搭配最优 等等 在这些分析研究的基础上 我们就可以计算出各个组合方案的成本和收益 并选择最合理的种植方案 主动的在农作物种植过程中对各种影响因素加以准确控制 进而获得最理想的效果 3 7 1 2相关概念1 影响因素的分类 在所有的影响因素中根据是否可以人为控制可以分为两类 一类是人为可以控制的因素 称为控制因素或控制变量 如种子品种的选定 施肥量的多少 另一类因素是认为很难控制的因素 称为随机因素或随机变量 如气候和地域等影响因素 在很多情况下随机因素指的是实验过程中的抽样误差 2 控制变量的不同水平 控制变量的不同取值或水平 称为控制变量的不同水平 定类或者定序 如甲品种 乙品种 10公斤化肥 20公斤化肥 30公斤化肥等 3 观测变量 受控制变量和随机变量影响的变量称为观测变量 如农作物的产量等 定距 方差分析就是从观测变量的方差入手 研究诸多控制变量中哪些变量是对观测变量有显著影响的变量以及对观测变量有显著影响的各个控制变量其不同水平以及各水平的交互搭配是如何影响观测变量的一种分析方法 4 7 1 3方差分析的原理方差分析认为 如果控制变量的不同水平对观测变量产生了显著影响 那么它和随机变量共同作用必然使得观测变量值显著变动 反之 如果控制变量的不同水平没有对观测变量产生显著影响 那么观测变量值的变动就不明显 其变动可以归结为随机变量影响造成的 建立在观测变量各总体服从正态分布和同方差的假设之上 方差分析的问题就转化为在控制变量不同水平上的观测变量均值是否存在显著差异的推断问题了 综上所述 方差分析从对观测变量的方差分解入手 通过推断控制变量各水平下各观测变量的均值是否存在显著差异 分析控制变量是否给观测变量带来了显著影响 进而再对控制变量各个水平对观测变量影响的程度进行剖析 根据控制变量的个数可将方差分析分为单因素方差分析 多因素方差分析 根据观测变量的个数可将方差分析分为一元方差分析 单因变量方差分析 和多元方差分析 多因变量方差分析 5 6 随机从三个班级分别抽取5名同学参加数学竞赛 得分如下 问这三个班级同学在 数学竞赛得分 上有没有显著的差异 方差分析简例 7 2单因素方差分析 7 2 1单因素方差分析的基本思想1 定义 单因素方差分析用来研究一个控制变量的不同水平是否对观测变量产生了显著影响 例如 分析不同施肥量是否给农作物的产量产生显著影响 研究不同学历是否对工资收入产生显著影响等 2 观测变量方差的分解将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分 分别表示为 其中 SST为观测变量的总离差平方和 SSA为组间离差平方和 是由控制变量不同水平造成的观测变量的变差 SSE为组内平方和 是由抽样误差引起的观测变量的变差 7 8 方差分析的基本思想 K个水平 每个水平的样本数同为l 分解离均差平方和 SST SSE SSA分解自由度 n 1 n k k 1 注 n kl比较组间方差与组内方差有无异同 如果组间方差显著大于组内方差 超过F统计量的界值 则不能认为各组所代表的总体均数相同 只能认为三个班级的得分有显著差异 9 与其他统计过程的联系 方差分析常用于均数比较 研究控制因素 定性 与观测变量 定量 间的关系 与回归分析 方差分析是回归分析的一种特例 可以用回归模型来表示 10 各水平的样本数不同情形 11 3 比较观测变量总离差平方和各部分的比例在观测变量总离差平方和中 如果组间离差平方和所占比例较大 则说明观测变量的变动主要是由于控制变量引起的 可以主要由控制变量来解释 即控制变量给观测变量带来了显著影响 这里我们用F统计量来表示这种比例关系 如果控制变量的不同水平对观测变量造成了显著影响 那么观测变量总变差中控制变量所占的比例较大 则F值就比较大 反之 如果控制变量的不同水平对观测变量没有造成显著影响 那么观测变量总变差中控制变量所占的比例较小 则F值就比较小 12 7 2 2单因素方差分析的基本步骤提出原假设 控制变量不同水平下观测变量各总体的均值无显著差异 计算检验统计量和概率P值给定显著性水平与p值做比较 如果p值小于显著性水平 则应该拒绝原假设 反之就不能拒绝原假设 13 7 2 3单因素方差分析的基本操作步骤在利用SPSS进行单因素方差分析时 应注意数据的组织形式 SPSS要求定义两个变量分别存放观测变量值和控制变量的水平值 基本操作步骤如下 1 选择菜单Analyze Comparemeans One WayANOVA 出现窗口 14 2 将观测变量选择到DependentList框 3 将控制变量选择到Factor框 控制变量有几个不同的取值表示控制变量有几个水平 至此 SPSS便自动分解观测变量的方差 计算组间方差 组内方差 F统计量以及对应的概率p值 完成单因素方差分析的相关计算 并将结果显示到输出窗口中 15 7 2 4单因素方差分析的应用举例某企业在制订某商品的广告策略时 对不同广告形式在不同地区的广告效果 销售额 进行了评估 这里以商品销售额为观测变量 广告形式和地区为控制变量 通过单因素方差分析方法分别对广告形式 地区对销售额的影响进行方差分析 16 7 2 5单因素方差分析的进一步分析1 方差齐性检验由于方差分析的前提是各水平下的总体服从正态分布并且方差相等 因此有必要对方差齐性进行检验 即对控制变量不同水平下各观测变量不同总体方差是否相等进行分析 SPSS单因素方差分析中 方差齐性检验采用了方差同质性 HomogeneityofVariance 的检验方法 其零假设是各水平下观测变量总体方差无显著性差异 实现思路同SPSS两独立样本t检验中的方差齐性检验 17 2 多重比较检验上面的基本分析可以判断控制变量是否对观测变量产生了显著影响 如果控制变量确实对观测变量产生了显著影响 进一步还应确定 控制变量的不同水平对观测变量的影响程度如何 其中哪个水平的作用明显大于其它水平 哪些水平的作用是不显著的 例如已经确定不同施肥量会对农作物的产量产生显著影响 便希望进一步了解究竟是10公斤 20公斤还是30公斤施肥量最有利于提高产量 哪种施肥量对农作物产量没有显著影响 掌握了这些信息 我们就能够制定合理的施肥方案 多重比较检验就是分别对每个水平下的观测变量均值进行逐对比较 判断两均值之间是否存在显著差异 其零假设是相应组的均值之间无显著差异 差值检验 若用两独立样本的T检验进行两两比较 会增加犯第一类错误的概率 拒真错误 作N次比较后 实际的显著性水平为1 1 a N 多重比较可以解决这个问题 N CK2 18 SPSS提供的多重比较检验的方法比较多 有些方法适用在各总体方差相等的条件下 有些适用在方差不相等的条件下 其中LSD方法和Bonferroni适用于各总体方差相等的情况 特点是比较灵敏 各观测值的个数可以不等 Tukey方法和S N K方法适用于各水平下观测变量个数相等的情况 Scheffe方法比Tukey方法不灵敏 各水平下观测变量个数也相等 19 20 多重比较方法的选择策略 尊重相关研究领域的统计惯例 如果存在明确的对照组 要进行的是验证性研究 即计划好的某两个或几个组间 和对照组 的比较 宜用Bonferroni LSD 法若需要进行的是多个均数间的两两比较 探索性研究 且各组个案数相等 适宜用Tukey法 SNK也很常用 其它情况宜用Scheffe法 3 其他检验 1 先验对比检验如果发现某些水平与另一些水平的均值差距显著 就可以进一步比较这两组总的均值是否存在显著差异 在检验中 SPSS根据用户确定的各均值的系数 再对其线性组合进行检验 来判断各相似性子集间均值的差异程度 2 趋势检验当控制变量为定序变量时 趋势检验能够分析随着控制变量水平的变化 观测变量值变化的总体趋势是怎样的 21 4 单因素方差分析进一步分析的操作 1 Option选项Option选项用来对方差分析的前提条件进行检验 并可输出其他相关统计量和对缺失数据进行处理 Homogeneityofvariancetest选项实现方差齐性检验 Descriptive选项输出观测变量的基本描述统计量 Brown Forsythe Welch选项可计算其统计量以检验各组均值的相等性 当方差齐性不成立时应选择使用这两个统计量而不是F统计量 MeansPlot选项输出各水平下观测变量均值的折线图 MissingValues框中提供了两种缺失数据的处理方式 22 23 2 PostHoc选项PostHoc选项用来实现多重比较检验 提供了18种多重比较检验的方法 其中EqualVariancesAssumed框中的方法适用于各水平方差齐性的情况 在方差分析中 由于其前提所限 应用中多采用EqualVariancesAssumed框中的方法 多重比较检验中 SPSS默认的显著性水平为0 05 可以根据实际情况修改Significancelevel后面的数值以进行调整 当P小于0 05 有显著差异 24 25 3 Contrasts选项Contrasts选项用来实现先验对比检验和趋势检验 如果进行趋势检验 则应选择Polynomial选项 然后在后面的下拉框中选择趋势检验的方法 其中Linear表示线性趋势检验 Quadratic表示进行二次多项式检验 Cubic表示进行三次多项式检验 4th和5th表示进行四次和五次多项式检验 如果进行先验对比检验 则应在Coefficients后依次输入系数ci 并确保 ci 0 应注意系数输入的顺序 它将分别与控制变量的水平值相对应 检验 ci j 0 26 27 28 上机练习 广告 城市与销售额 控制因素 广告形式 报纸 广播 宣传品 体验城市 按照人口密度从高到低排列的18个城市观测变量 销售额 具体数值型变量分析要求 考虑不同广告形式对产品销售是否有显著的影响 并进行多重比较检验 比较哪种形式对销售的影响最为显著 考虑不同地区对产品销售是否有显著的影响 并画出不同地区销售折线图观察 假如忽略宣传品广告 认为报纸广告的效果与广播和体验的整体效果基本一致 试进行先验对比检验 检验这种假设是否成立 对城市与销售额的关系进行趋势检验 7 3多因素方差分析 7 3 1多因素方差分析的基本思想1 定义 多因素方差分析用来研究两个及两个以上控制变量的不同水平是否对观测变量产生了显著影响 多因素方差分析不仅能够分析多个因素对观测变量的独立影响 还能够分析多个控制变量的交互作用能否对观测变量产生显著影响 例如 分析不同品种 不同施肥量是否给农作物的产量产生显著影响 并进一步研究哪种品种和哪种施肥量是提高农作物产量的最优组合 2 观测变量方差的分解将观测变量总的离差平方和分解为 其中 SST为观测变量的总离差平方和 SSA SSB分别为控制变量A B独立作用引起的变差 SSAB为控制变量A B两两交互作用引起的变差 SSE为随机因素引起的变差 29 30 研究内容与前提条件 拟研究 两个及以上控制因素对观测变量的影响 包括各因素的独立作用和交互作用 是实验设计的常用分析方法 常用于寻找最佳的实验因素组合 前提条件 同单因素方差分析 要求每一单元格的样本数据符合独立性 正态性及方差齐性 但对正态性和方差齐性的要求不严格 只要无极端值 前提条件稍有偏离是可以耐受的 31 双因子方差分析的数据结构 32 分析步骤 确定观测变量和若干个控制变量剖析观测变量的离差平方和SST控制变量的独立作用SSA SSB控制变量的交互作用SSAB随机因素的影响SSESST SSA SSB SSAB SSE分解自由度比较各部分方差的大小 33 双因子方差分析数学模型 设因素A有r个水平 因素B有s个水平 在每个单元格内有l个样本 则在因素A的Ai水平和因素B的Bj水平下的第k个样本值xijk 可定义为 34 双因子 有交互作用 方差分析表 35 相关概念 饱和模型 FullFactorial 即全因素模型 方差分析模型中包含所有因素的独立作用和可能的交互作用 不饱和模型 非全因素模型 主效应 控制变量的独立作用 交互效应 控制变量之间的相互作用 如果一个因素的效应大小在另一因素不同水平下明显不同 则二者存在交互效应 36 交互作用 A B无交互作用 A B有交互作用 37 固定效应与随机效应 固定效应 考察因素的水平数是可控的 在研究中对该因素的所有可能水平都进行了考察 不需要进一步外推 如性别 因素的效应是固定 随机效应 考察因素难以控制在固定的水平上 或因素的所有可能水平并未都出现在样本中 因此要用样本来推论总体情况 包括未出现的水平 这不可避免的存在误差 即随机效应 需要估计该误差的大小 因而其效应具有随机性 如受教育水平 两种方差分解完全相同 检验统计量有差别 38 基本步骤 提出假设H0 各控制变量不同水平下观测变量各总体的均值无统计学差异 确定显著性水平 构造模型 并计算检验统计量固定效应模型 Fixedfactor 39 随机效应模型 Randomfactor 2020 1 15 40 7 3 2多因素方差分析的基本步骤提出原假设 各控制变量不同水平下观测变量各总体的均值无显著差异 控制变量交互作用对观测变量无显著影响 另一种表示 计算检验统计量和概率P值给定显著性水平与p值做比较 如果p值小于显著性水平 则应该拒绝原假设 反之就不能拒绝原假设 41 7 3 3多因素方差分析的基本操作步骤在利用SPSS进行多因素方差分析时 应首先将各个控制变量以及观测变量分别定义成多个SPSS变量 并组织好数据再进行分析 1 选择菜单Analyze GeneralLinearModel Univariate 出现主窗口 2 把观测变量指定到DependentVariable框中 3 把固定效应的控制变量指定到FixedFactor s 框中 把随机效应的控制变量指定到RandomFactor s 框中 至此 SPSS将自动建立多因素方差分析的饱和模型 并计算各检验统计量的观测值和对应的概率p值 并将结果显示到输出窗口中 42 43 7 3 4多因素方差分析应用举例利用某企业不同广告形式在不同地区的广告效果 销售额 进行评估的数据 通过多因素方差分析方法对广告形式 地区 广告形式和地区的交互作用给销售额的影响进行分析 进而为制订广告和地区的最优宣传组合方案提供依据 这里 以广告形式和地区为控制变量 销售额为观测变量 建立固定效应的饱和模型 零假设为 不同广告形式没有对销售额产生显著影响 不同地区的销售额没有显著差异 广告形式和地区对销售额没有产生显著的交互影响 44 7 3 5多因素方差分析的进一步分析1 多因素方差分析的非饱和模型在饱和模型中 观测变量总的变差被分解为控制变量独立作用 控制变量交互作用及随机误差三部分 例 SST SSA SSB SSAB SSE 如果研究发现 控制变量的某阶交互作用没有给观测变量产生显著影响 那么可以尝试建立非饱和模型 区别在于将饱和模型中某些部分合并到SSE中 例如两因素非饱和模型为 SST SSA SSB SSE 45 2 均值检验在SPSS中 利用多因素方差分析功能还能够对各个控制变量不同水平下的均值是否存在显著差异进行比较 实现方式有两种 多重比较检验 PostHoc 和对比检验 Contrast 多重比较检验的方法与单因素方差分析类似 不再重复 对比检验采用的是单样本t检验的方法 46 检验值可以指定一下几种 None SPSS默认 不做对比分析 Deviation 表示以观测变量的总体均值为标准 比较各水平上观测变量的均值是否有显著差异 Simple 表示以第一水平或最后一个水平上的观测变量均值为标准 比较各水平上的观测变量均值是否有显著差异 Difference 表示将各水平上观测变量均值与其前一个水平上的观测变量均值做比较 Helmert 表示将各水平上观测变量均值与其后一个水平上的观测变量均值做比较 47 3 控制变量交互作用的图形分析控制变量的交互作用可以通过图形直观分析 如果控制变量之间无交互作用 各水平对应的直线是近于平行的 如果控制变量间存在交互作用 各水平对应的直线会相互交叉 4 模型分析这里模型分析的主要任务有三个 第一 利用多因素方差分析模型计算观测变量预测值 第二 计算各种残差值 评价模型对数据的拟合程度 第三 对数据中的异常点进行诊断 48 7 3 6多因素方差分析中进一步分析的操作步骤1 建立非饱和模型的操作SPSS多因素方差分析中默认建立的是饱和模型 如果希望建立非饱和模型 则应在主窗口中单击Model按钮 出现窗口 49 默认的选项是Fullfactorial 表示饱和模型 此时Factors Covariates框 Model框以及BuildTerm s 下拉框均呈不可用状态 如果选择Custom项 则表示建立非饱和模型 且Factors Covariates框 Model框以及BuildTerm s 下拉框均变为可用状态 此时便可自定义非饱和模型中的数据项 其中Interaction为交互作用 Maineffects为主效应 All2 way All3 way等表示二阶 三阶或更高阶交互作用 50 2 均值比较的操作如果通过多因素方差分析得知某控制变量的不同水平对观测变量产生显著影响 进一步可对各水平间的均值进行比较 如果采用多重比较检验方法 则单击PostHoc按钮 选择合适的多重比较检验方法 51 如果采用对比检验方法 则单击Contrasts按钮 默认是不进行对比检验 显示如x1 None 如果进行对比检验 可展开Contrast后的下拉框 指定对比检验的检验值 并单击Change按钮完成指定 52 3 控制变量交互作用图形分析的操作如果希望通过图形直观判断控制变量间是否存在交互作用 则应在主窗口单击Plots按钮 首先选择一个控制变量作为交互图形中的横轴 并将其选择到HorizontalAxis框中 其次 指定在交互图中各直线代表的是哪个控制变量的不同水平 并将其选择到SeparatedLines框中 最后 如果控制变量有三个 由于交互作用图只能反映两控制变量的交互情况 此时第三个变量只能选入SeparatePlots框中 第三个变量有几个水平便绘制出几张交互图 53 54 4 模型分析的操作SPSS多因素方差模型建立完成后 可以在主窗口中单击Save按钮对模型进行分析 并将分析结果以变量的形式存入SPSS数据编辑窗口中 其中 PredictedValues框中的选项用来计算模型的预测值 Residuals框中的各选项用来计算各种残差 Diagnostics框实现异常值的诊断 各选项具体含义同回归分析 55 7 3 7多因素方差分析进一步分析应用举例在前面的应用举例中对广告形式 地区对销售额的影响进行了多因素方差分析 建立了饱和模型 分析可知 广告形式和地区的交互作用不显著 可以进一步尝试建立非饱和模型 并进行均值比较分析 交互作用图形分析 56 7 4协方差分析 7 4 1协方差分析的基本思想无论是单因素方差分析还是多因素方差分析 控制变量是可以控制的 其各个水平可以通过人为努力得到控制和确定 但是在实际问题中 有些控制变量很难人为控制 但他们的不同水平确实对观测变量产生较为显著的影响 比如 不同地块对农作物产量的影响 在方差分析中 如果忽略这些因素的存在而单纯去分析其他因素对观测变量的影响 往往会夸大或缩小其他因素对观测变量的影响 使分析结论不准确 因此 为了更加准确的研究控制变量不同水平对观测变量的影响 应尽量排除其他因素对分析结论的影响 研究控制变量对观测变量的影响时 如果存在对观测变量确有影响的其他因素 而该因素又不能在实验设计时予以排除 当该因素为连续性变量时 可用协方差分析其作用 该变量为协变量 57 1 定义 协方差分析就是将那些很难人为控制的因素作为协变量 并在排除协变量对观测变量影响的条件下 分析控制变量对观测变量的影响 从而更加准确的对控制变量进行分析 2 协方差分析的特点方差分析中的控制变量都是定性变量 包括定类和定序变量 线性回归分析中的解释变量 自变量 都是定距变量 而协方差分析中的控制变量是定性变量 而协变量一般是定距变量 所以说协方差分析是一种介于方差分析和线性回归分析之间的分析方法 例如 在研究生猪的饲养问题的协方差分析中 饲料是控制变量 生猪的初始体重是协变量 协方差分析中要求多个协变量之间无交互作用 且观测变量与协变量之间有显著的线性关系 58 59 前提 观测变量与协变量间有显著的线性关系 在控制因素不同水平下 观测变量与协变量的总体回归系数应相等 即控制因素与协变量无交互作用 多个协变量间无交互作用 各比较组间协变量的取值范围不宜相差过大 60 数学模型与假设检验 单因素协方差分析 假设检验H0 协变量对观测变量的线性影响不显著 余同前 3 离差平方和的分解在协方差分析中 将观测变量的总离差平方和分解为由控制变量独立作用引起的 由控制变量交互作用引起的 由协变量引起的和随机变量引起的 以单因素协方差分析为例 观测变量的总变差可以分解为 61 4 比较观测变量总离差平方和各部分的比例在观测变量总离差平方和中 如果SSA所占比例较大 则说明控制变量A是引起观测变量的变动主要因素之一 观测变量的变动可以部分的由控制变量A来解释 即控制变量A给观测变量带来了显著影响 62 7 4 2协方差分析的基本步骤提出原假设 协变量对观测变量的线性影响是不显著的 在扣除协变量的影响条件下 控制变量各水平下观测变量的各总体均值无显著差异 计算检验统计量和概率P值给定显著性水平与p值做比较 如果p值小于显著性水平 则应该拒绝原假设 反之就不能拒绝原假设 63 7 4 3协

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论