第7章+方差分析与实验设计.ppt_第1页
第7章+方差分析与实验设计.ppt_第2页
第7章+方差分析与实验设计.ppt_第3页
第7章+方差分析与实验设计.ppt_第4页
第7章+方差分析与实验设计.ppt_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

作者贾俊平 统计学 第三版 2008 2008年8月 警惕过多地假设检验 你对数据越苛求 数据会越多地向你供认 但在威逼下得到的供词 在科学询查的法庭上是不容许的 StephenM Stigler 统计名言 第7章方差分析与实验设计 7 1方差分析的基本原理7 2单因子方差分析7 3双因子方差分析7 4实验设计初步 2008年8月 学习目标 方差分析的基本思想和原理单因子方差分析多重比较双因子方差分析的方法实验设计方法与数据分析 2008年8月 不同运动队的平均成绩之间是否有显著差异 奥运会女子团体射箭比赛 每个对有3名运动员 进入最后决赛的运动队需要进行4组射击 每个队员进行两次射击 这样 每个组共射出6箭 4组共射出24箭在2008年8月10日进行的第29届北京奥运会女子团体射箭比赛中 获得前3名的运动队最后决赛的成绩如下表所示 2008年8月 不同运动队的平均成绩之间是否有显著差异 每个队伍的24箭成绩可以看作是该队伍射箭成绩的一个随机样本 获得金牌 银牌和铜牌的队伍之间的射箭成绩是否有显著差异呢 如果采用第6章介绍的假设检验方法 用分布做两两的比较 则需要做次比较 这样做不仅繁琐 而且每次检验犯第 类错误的概率都是 作多次检验会使犯第 类错误的概率相应地增加 检验完成时 犯第 类错误的概率会大于 同时 随着检验的次数的增加 偶然因素导致差别的可能性也会增加采用方差分析方法很容易解决这样的问题 它是同时考虑所有的样本数据 一次检验即可判断多个总体的均值是否相同 这不仅排除了犯错误的累积概率 也提高了检验的效率方差分析方法就很容易解决这样的问题 它是同时考虑所有的样本数据 一次检验即可判断多个总体的均值是否相同 这不仅排除了犯错误的累积概率 也提高了检验的效率 7 1方差分析的基本原理7 1 1什么是方差分析 7 1 2从误差分析入手7 1 3在什么样的前提下分析 第7章方差分析与实验设计 7 1 1什么是方差分析 7 1方差分析的基本原理 2008年8月 什么是方差分析 ANOVA analysisofvariance 方差分析的基本原理是在20世纪20年代由英国统计学家RonaldA Fisher在进行实验设计时为解释实验数据而首先引入的检验多个总体均值是否相等通过分析数据的误差判断各总体均值是否相等研究分类型自变量对数值型因变量的影响一个或多个分类型自变量两个或多个 k个 处理水平或分类一个数值型因变量有单因子方差分析和双因子方差分析单因子方差分析 涉及一个分类的自变量双因子方差分析 涉及两个分类的自变量 2008年8月 什么是方差分析 例题分析 例 确定超市的位置和竞争者的数量对销售额是否有显著影响 获得的年销售额数据 单位 万元 如下表 因子 水平或处理 样本数据 2008年8月 什么是方差分析 例题分析 如果只考虑 超市位置 对销售额是否有显著影响 实际上也就是要判断不同位置超市的销售额均值是否相同若它们的均值相同 意味着 超市位置 对销售额没有显著影响 若均值不全相同 则意味着 超市位置 对销售额有显著影响 超市位置 就是分类自变量 销售额 则是数值因变量 超市位置 是要检验的对象 称为因子 factor 商业区 居民小区 写字楼是因子的3个取值 称为水平 level 或处理 treatment 每个因子水平下得到的销售额为样本观测值方差分析要解决的问题就是判断超市的位置对销售额是否有显著影响 设商业区 居民小区和写字楼3个位置超市的销售额均值是否相同 7 1 2从误差分析入手 7 1方差分析的基本原理 2008年8月 方差分析的基本原理 误差分解 总误差 totalerror 反映全部观测数据的误差称所抽取的全部36家超市的销售额之间差异随机误差 randomerror 组内误差 within grouperror 由于抽样的随机性造成的误差反映样本内部数据之间的随机误差处理误差 treatmenterror 组间误差 between grouperror 不同的处理影响所造成的误差反映样本之间数据的差异 2008年8月 方差分析的基本原理 误差分解 数据的误差用平方和 sumofsquares 表示 记为SS总平方和 sumofsquaresfortotal 记为SST反映全部数据总误差大小的平方和抽取的全部36家超市销售额之间的误差平方和组内平方和 within groupsumofsquares 记为SS组内反映组内误差大小的平方和比如 每个位置超市销售额的误差平方和只包含随机误差组间平方和 between groupsumofsquares 记为SS组间反映组间误差大小的平方和比如 同位置超市销售额之间的误差平方和既包括随机误差 也包括处理误差 2008年8月 方差分析的基本原理 误差分解 误差平方和的分解及其关系 总误差 总平方和 SST 随机误差 处理误差 组内平方和 SS组内 组间平方和 SS组间 2008年8月 方差分析的基本原理 误差分析 误差的大小用均方 meansquare 来表示 也称为方差 variance 平方和除以相应的自由度总平方和 SST 的自由度为n 1 组内平方和 SS组内 的自由度为n k 组间平方和 SS组间 的自由度为k 1组内平方和除以相应的自由度结果称为组内方差 within groupvariance 组间平方和除以相应的自由度结果称为组间方差 between groupvariance 2008年8月 方差分析的基本原理 误差分析 判断原假设是否成立 就是判断组间方差与组内方差是否有显著差异若原假设成立 组间均方与组内均方的数值就应该很接近 它们的比值就会接近1若原假设不成立 组间均方会大于组内均方 它们之间的比值就会大于1当这个比值大到某种程度时 就可以说不同水平之间存在着显著差异 即自变量对因变量有影响 7 1 3在什么样的前提下分析 7 1方差分析的基本原理 2008年8月 方差分析的基本假定 正态性 normality 每个总体都应服从正态分布 即对于因子的每一个水平 其观测值是来自正态分布总体的简单随机样本在例7 1中 要求每个位置超市的销售额必须服从正态分布检验总体是否服从正态分布的方法有很多 包括对样本数据作直方图 茎叶图 箱线图 正态概率图做描述性判断 也可以进行非参数检验等方差齐性 homogeneityvariance 各个总体的方差必须相同 对于分类变量的个水平 有 12 22 k2在例7 1中 要求不同位置超市的销售额的方差都相同独立性 independence 每个样本数据是来自因子各水平的独立样本 该假定不满足对结果影响较大 在例7 1中 3个样本数据是来自不同位置超市的3个独立样本 2008年8月 方差分析中基本假定 如果原假设成立 即H0 m1 m2 m3不同位置超市的平均销售额相等意味着每个样本都来自均值为 方差为 2的同一正态总体 X f X 1 2 3 4 2008年8月 方差分析中基本假定 若备择假设成立 即H1 mi i 1 2 3 不全相等至少有一个总体的均值是不同的3个样本分别来自均值不同的3个正态总体 X f X 1 2 3 7 2单因子方差分析7 2 1检验步骤7 2 2关系有多强 7 2 3哪些均值之间有显著差异 第7章方差分析与实验设计 7 2 1检验步骤 7 2单因子方差分析 2008年8月 单因子方差分析 one wayanalysisofvariance 只考虑一个分类型自变量影响的方差分析比如 在例7 1中 只考虑超市位置一个因子对销售额度影响 或者只考虑竞争者数量对销售额的影响 都属于单因子方差分析分析步骤包括提出假设构造检验统计量做出决策 2008年8月 提出假设 一般提法H0 m1 m2 mk自变量对因变量没有显著影响H1 m1 m2 mk不全相等自变量对因变量有显著影响注意 拒绝原假设 只表明至少有两个总体的均值不相等 并不意味着所有的均值都不相等 2008年8月 构造检验的统计量F 将组间方差MS组间除以组内方差MS组内即得到所需要的检验统计量F当H0为真时 二者的比值服从分子自由度为k 1 分母自由度为n k的F分布 即 组间平方和 组内平方和 2008年8月 做出决策 将统计量的值F与给定的显著性水平 的临界值F 进行比较 或计算出统计量的P值 做出决策若PF 不拒绝原假设H0 无证据表明所检验的因子对观察值有显著影响 2008年8月 作出决策 F分布与拒绝域 如果均值相等 F MS组间 MS组内 1 2008年8月 单因子方差分析 例题分析 例 检验超市位置对销售额是否有显著影响 0 05 2008年8月 单因子方差分析 例题分析 提出假设 设不同位置超市销售额的均值分别为 1 商业区 2 居民小区 和 3 写字楼 提出的假设为H0 1 2 3H1 1 2 3不全相等检验方差分析的前提进行分析并做出决策 2008年8月 单因子方差分析 方差分析假定的判断 箱线图分析 好像不一样 2008年8月 单因子方差分析 方差分析假定的判断 概率图分析 2008年8月 用Excel进行方差分析 第1步 选择 工具 下拉菜单第2步 选择 数据分析 选项第3步 在分析工具中选择 单因子方差分析 然后选择 确定 第4步 当对话框出现时在 输入区域 方框内键入数据单元格区域在 方框内键入0 05 可根据需要确定 在 输出选项 中选择输出区域 用Excel进行方差分析 2008年8月 单因子方差分析 例题分析 拒绝H0 7 2 2关系有多强 7 2单因子方差分析 2008年8月 关系强度的测量 拒绝原假设表明因子 自变量 与观测值之间有显著关系组间平方和 SS组间 度量了自变量 超市位置 对因变量 销售额 的影响效应当组间平方和比组内平方和 SSE 大 而且大到一定程度时 就意味着两个变量之间的关系显著 大得越多 表明它们之间的关系就越强 反之 就意味着两个变量之间的关系不显著 小得越多 表明它们之间的关系就越弱 2008年8月 关系强度的测量 变量间关系的强度用自变量平方和 SS组间 占总平方和 SST 的比例大小来反映自变量平方和占总平方和的比例记为R2 即其平方根R可以用来测量两个变量之间的关系强度 例题分析 R2 44 74 R 0 6689 表明超市位置 自变量 对销售额 因变量 的影响效应占总效应的44 74 尽管并不高 但超市位置对销售额的影响都已经达到了统计上显著的程度 R表明超市位置与销售额之间已达到中等以上的相关 7 2 2哪些均值之间有显著差异 7 2单因子方差分析 2008年8月 多重比较的意义 在拒绝原假设的条件下 通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异比较方法有多种 若Fisher提出的最小显著差异方法 简写为LSD 2008年8月 多重比较的LSD方法 提出假设H0 mi mj 第i个总体的均值等于第j个总体的均值 H1 mi mj 第i个总体的均值不等于第j个总体的均值 计算检验的统计量 计算LSD决策 若 拒绝H0 2008年8月 多重比较的LSD方法 例题分析 第1步 提出假设检验1 检验2 检验3 第2步 计算检验统计量检验1 检验2 检验3 2008年8月 多重比较的LSD方法 例题分析 第3步 计算LSD第4步 做出决策 不拒绝H0 没有证据表明商业区和居民小区的超市销售额之间有显著差异 拒绝H0 商业区和写字楼的超市销售额之间有显著差异 拒绝H0 居民小区和写字楼的超市销售额之间有显著差异 2008年8月 用SPSS进行方差分析和多重比较 在用SPSS中进行方差分析时 需要把多个样本的观测值作为一个变量输入 本例为 投诉次数 然后设计另一个变量用于标记每个观测值所属的样本 本例为 行业 1表示零售业 2表示旅游业 3表示航空公司 4表示家电制造业 第1步 选择 Analyze CompareMeans One Way ANOVA 进入主对话框第2步 因变量 投诉次数 选入 DependentList 将自变量 行业 选入 Factor 第3步 需要多重比较时 点击 Post Hoc 从中选择一种方法 如LSD 需要均值图时 在 Options 下选中 Meansplot 需要相关统计量时 选择 Descriptive 点击 Continue 回到主对话框 点击 OK 用SPSS进行方差分析 2008年8月 用SPSS进行方差分析和多重比较 方差齐性表检验 方差分析表 2008年8月 用SPSS进行方差分析和多重比较 多重比较 2008年8月 用SPSS进行方差分析和多重比较 带误差线 ErrorBar 的均值图 MeansPlots 总体均值95 的置信区间 7 3双因子方差分析7 3 1不考虑交互作用7 3 3考虑交互作用 第7章方差分析与实验设计 7 3 1不考虑交互作用 7 3双因子方差分析 2008年8月 双因子方差分析 two wayanalysisofvariance 分析两个因子 行因子Row和列因子Column 对实验结果的影响如果两个因子对实验结果的影响是相互独立的 分别判断行因子和列因子对实验数据的影响 这时的双因子方差分析称为无交互作用的双因子方差分析或无重复双因子方差分析 Two factorwithoutreplication 如果除了行因子和列因子对实验数据的单独影响外 两个因子的搭配还会对结果产生一种新的影响 这时的双因子方差分析称为有交互作用的双因子方差分析或可重复双因子方差分析 Two factorwithreplication 2008年8月 双因子方差分析的基本假定 每个总体都服从正态分布对于因子的每一个水平 其观察值是来自正态分布总体的简单随机样本各个总体的方差必须相同对于各组观察数据 是从具有相同方差的总体中抽取的观察值是独立的 2008年8月 双因子方差分析 例题分析 例 有4个品牌的彩电在5个地区销售 为分析彩电的品牌 品牌因子 和销售地区 地区因子 对销售量的影响 对每显著个品牌在各地区的销售量取得以下数据 试分析品牌和销售地区对彩电的销售量是否有显著影响 0 05 2008年8月 分析步骤 提出假设 提出假设对行因子提出的假设为H0 m1 m2 mi mk mi为第i个水平的均值 H1 mi i 1 2 k 不全相等对列因子提出的假设为H0 m1 m2 mj mr mj为第j个水平的均值 H1 mj j 1 2 r 不全相等 2008年8月 双因子方差分析 例题分析 提出假设对品牌因子提出的假设为H0 m1 m2 m3 m4 品牌对销售量无显著影响 H1 mi i 1 2 4 不全相等 有显著影响 对地区因子提出的假设为H0 m1 m2 m3 m4 m5 地区对销售量无显著影响 H1 mj j 1 2 5 不全相等 有显著影响 2008年8月 分析步骤 构造检验的统计量 计算平方和 SS 总误差平方和行因子误差平方和列因子误差平方和随机误差项平方和 2008年8月 分析步骤 构造检验的统计量 总误差平方和 SST 行因子平方和 SS行 列因子平方和 SS列 误差项平方和 SS残差 之间的关系 SST SS行 SS列 SS残差 2008年8月 分析步骤 构造检验的统计量 计算均方 MS 误差平方和除以相应的自由度三个平方和的自由度分别是总误差平方和SST的自由度为kr 1行因子平方和SSR的自由度为k 1列因子平方和SSC的自由度为r 1误差项平方和SSE的自由度为 k 1 r 1 2008年8月 分析步骤 构造检验的统计量 计算均方 MS 行因子的均方 记为MS行 计算公式为列因子的均方 记为MS列 计算公式为误差项的均方 记为MS残差 计算公式为 2008年8月 分析步骤 构造检验的统计量 计算检验统计量 F 检验行因子的统计量检验列因子的统计量 2008年8月 分析步骤 做出决策 计算出统计量的P值与给定的显著性水平 比较 若PR 拒绝原假设H0 表明均值之间的差异是显著的 即所检验的行因子对观察值有显著影响若PC 拒绝原假设H0 表明均值之间有显著差异 即所检验的列因子对观察值有显著影响 用Excel进行无重复双因子分析 2008年8月 双因子方差分析 关系强度的测量 行平方和 SS行 度量了品牌这个自变量对因变量 销售量 的影响效应列平方和 SS列 度量了地区这个自变量对因变量 销售量 的影响效应这两个平方和加在一起则度量了两个自变量对因变量的联合效应联合效应与总平方和的比值定义为R2其平方根R反映了这两个自变量合起来与因变量之间的关系强度 2008年8月 双因子方差分析 关系强度的测量 例题分析品牌因子和地区因子合起来总共解释了销售量差异的83 94 其他因子 残差变量 只解释了销售量差异的16 06 R 0 9162 表明品牌和地区两个因子合起来与销售量之间有较强的关系 7 3 2考虑交互作用 7 3双因子方差分析 2008年8月 可重复双因子分析 提出假设 提出假设对行因子提出的假设为H0 m1 m2 mi mk mi为第i个水平的均值 H1 mi i 1 2 k 不全相等对列因子提出的假设为H0 m1 m2 mj mr mj为第j个水平的均值 H1 mj j 1 2 r 不全相等对交互作用的假设为H0 不无交互作用H1 有交互作用 2008年8月 可重复双因子分析 平方和的计算 总平方和 行变量平方和 列变量平方和 交互作用平方和 误差项平方和 SST SS行 SS列 SS交互 SS残差 2008年8月 可重复双因子分析 构造检验统计量 检验行因子的统计量检验列因子的统计量检验交互作用的统计量 计算出统计量的P值 若P 拒绝原假设 2008年8月 可重复双因子分析 例题分析 例 检验超市位置 竞争者数量及其交互作用对销售额是否有显著影响 0 05 2008年8月 可重复双因子分析 Excel检验步骤 第1步 选择 工具 下拉菜单 并选择 数据分析 选项第2步 在分析工具中选择 方差分析 可重复双因子分析 然后选择 确定 第3步 当对话框出现时在 输入区域 方框内键入数据区域 A1 C11 在 方框内键入0 05 可根据需要确定 在 每一样本的行数 方框内键入重复实验次数 5 在 输出区域 中选择输出区域选择 确定 用Excel进行可重复双因子分析 7 4实验设计初步7 4 1完全随机化设计7 4 2随机化区组设计7 4 3因子设计 第7章方差分析与实验设计 2008年8月 实验设计与方差分析 7 4 1完全随机化设计 7 4实验设计初步 2008年8月 完全随机化设计 completelyrandomizeddesign 处理 被随机地指派给实验单元的一种设计 处理 是指可控制的因子的各个水平 实验单元 experimentunit 是接受 处理 的对象或实体在实验性研究中 感兴趣的变量是明确规定的 因此 研究中的一个或多个因子可以被控制 使得数据可以按照因子如何影响变量来获取对完全随机化设计的数据采用单因子方差分析 2008年8月 完全随机化设计 例题分析 这里的 小麦品种 就是实验因子或因子 品种1 品种2 品种3就是因子的3个不同水平 称为处理假定选取3个面积相同的地块 这里的 地块 就是接受处理的对象或

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论