




已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章方差分析 教学目的和要求 1 掌握方差分析的基本原理及其基本概念 包括方差分析的理论模型 处理因素 处理水平 单元 元素 均衡交互作用等 2 掌握多重比较的概念及其常用的多重的几种多重比较的方法 3 进行方差分析的基本条件 方差齐次性检验 4 掌握进行双因子及多因子方差分析的条件和类型 5 熟练掌握应用SPSSforWindows下进行方差分析的步骤并且能对处理结果作出正确的解释 教学难点 1 均方的分解 2 试验处理和水平的确定 第一节方差分析的基本原理 问题的提出 某猪场对4个不同品种幼猪进行4个月增重量的测定 每个品种选择体重接近的幼猪4头 测定结果列于表中 请问那个品系的增重效果最好 p85 例6 1 如果采用T检验进行一对一比较的方法检验4个样本平均数之间的差异显著性 就需要做 6次检验 每次无效假设的概率都是1 0 95 而且这些检验都是独立的 那么6次都接受的概率是0 956 0 735 犯 错误的概率为1 0 735 0 265 即6次犯错误可能性的累积 因此所犯错误的概率大大增加 方差分析的概念 方差分析的概念最早由英国著名科学家R A Fisher提出 方差分析是分析试验 或观测 数据的一种分析方法 所要解决的基本问题是通过数据分析 查明与研究对象有关的各个因素以及各个因素间交互作用对该研究对象的影响 方差分析所研究的对象都假定服从正态分布 方差分析的数学模型 假定有k组观测数据 每组有n个观测值 则用线性可加模型来描述每一观测值 有 xij i ij xij是在第i次处理下的第j次观测值 为总体平均数 i为处理效应 ij是试验误差 要求 ij是相互独立的 且服从正态分布N 0 2 对于由样本估计的线性模型为 为样本平均数 ti为样本的处理效应 eij为试验误差 模型的类型及相关概念 方差分析模型xij i ij 根据 I的特征 固定模型 随机模型 各个处理的效应值 i是固定的 各个处理的平均效应 i i 是一个常量 且 除去随机误差之后每个处理所产生的效应是固定的 i是一个随机变量 是从期望均值为0 方差为 2的正态总体中得到的随机变量 两种模型的区别 1 固定因素是指因素的水平可以严格地人为控制 它的效应值也是固定的 试验重复时可以得到相同的结果 随机因素的水平不能严格人为控制 在水平确定之后其效应值并不固定 重复试验时也很难得出相同的结果 2 随机模型和固定模型在设计思想和统计推断上有明显不同 因此进行方差分析时的公式推导也有所不同 在进行统计推断时假设检验构成的统计数不同 3 模型分析的侧重点也不完全相同 固定模型主要侧重于效应值 i的估计和比较 而随机模型则侧重效应方差的估计和检验 4 对于多因素试验来说还金出现混合模型的情况 进行方差分析的几个重要的概念 1 因素 Factor 因素是可能对应变量有影响的变量 通常就是数学模型中的处理 一般来说 因素会有不止一个水平 分析的目的就是考察或比较各个水平对应变量的影响是否相同 因素的取值范围不能无限 只能有若干个水平 在SPSS中应当将因素作为分类变量来处理 2 水平 Level 因素的不同取值等级称作水平 例如性别有男 女两个水平 需要注意的是有时候水平是人为划分出来的 比如身高被分为高 中 低三个水平 在SPSS中 定义水平均在Values中定义不同水平 3 单元 Cell 指各因素水平之间的组合 我们所说的方差齐就是指的各个单元间的方差齐 4 均衡 Balance 如果一个实验设计中任一因素各水平在所有单元格中出现的次数相同 且每个单元格内的元素数相同 则该试验是均衡的 否则 就被称为不均衡 不均衡的实验设计在分析时较为复杂 5 交互作用 Interaction 如果一个因素的效应大小在另一个因素不同水平下明显不同 则称为两因素间存在交互作用 方差分析的数学推导和计算过程 平方和和自由度的分解 平方和的分解总变异 处理间变异 处理内变异SST SSt SSe 自由度的分解总自由度 处理间自由度 处理内自由度dfT dft dfe 统计假设的显著性检验 F检验H0 同时给出HA 结论 平方和的分解 设试验A具有k个处理样本 每个样本有n个观测值 则试验A共有nk个观测值 试验变异 总变异 处理间变异 处理内变异 处理间平方和 处理内平方和 总平方和 各变异部分的平方和与各部自由度之比 即为度量各部变异的大小指标 自由度分解 总自由度dfT nk 1 处理间自由度dft k 1 处理内自由度dfe k n 1 各部方差 处理间方差 处理内方差 统计假设的显著性检验 F检验 从一个总体随机抽取两个样本 其样本方差分别为和 其比值为F值 服从F分布 F分布 设从一正态总体N 2 中随机抽取样本容量为n1和n2的两个独立样本 其样本方差为和 则定义和的比值为F F值具有的自由度df1 n1 1和的自由度df2 n2 1 如果对一正态总体在特定的df1和df2进行一系列随机独立抽样 则所有可能的F值就构成一个F分布 F分布的概率密度函数是由两个独立 2变量的概率密度所构成的联合概率密度 其方程为 F分布的概率累积函数为 F分布有以下特征 1 F分布的平均数 F 1 F的取值区间为 0 2 F分布曲线的形状仅决定于df1和df2 在df1 1或2时 F分布曲线呈严重倾斜的反向J型 当df1 3时转为左偏曲线 图3 14 例6 1 1 建立数据文件 2 计算 3 结果 多重比较 F检验只能说明k个平均数间有没有显著差异 但并不能说明哪些平均数间有显著差异 要明确不同处理平均数两两间差异的显著性 每个处理的平均数都要与其他的处理进行比较 这种差异显著性的检验就叫多重比较 最小显著差数法 LSD法 最小显著差数法的实质是两个平均数相比较的t检验法 检验的方法是首先计算出达到差异显著的最小差数 记为LSD 然后用两个处理平均数的差与LSD比较 若 即为在给定的 水平上差异显著 反之 差异不显著 在t检验中 例6 1 最小显著差数法 LSD法 的局限性 LSD法实际上是两组数据比较的t检验直接用于多重比较 t检验要求所检验的两组样本相互独立 但是对于方差分析的k组样本来说 并非总是相互独立的 也就是说对k组样本的k个平均数两两比较时 共有k k 1 2个比较 这k个平均数不可能完全相互独立 如果将它们作为相互独立的比较来处理 必然降低显著性水平 导致 值增大 从而导致犯第一类错误的概率显著增加 Cochran和Cox曾经指出 在比较三个平均数时其最大的差数将有14 的可能性大于LSD0 05 比较6个平均数时 超过40 比较10个平均数时 超过60 比较20个平均数时 其最大的差数将有90 的可能性大于LSD0 05 所以 用LSD法来比较全部平均数时 尤其是在分组超过3组时 是极为不恰当的 往往会导致错误的结论 针对LSD法的局限性 现在提出了许多进行k组平均数比较的方法 最小显著极差法 LSR法 新复极差检验 SSR检验 q检验 LSR法采用不同平均数间用不同的显著差数标准进行比较 可用于平均数间的所有相互比较 又称Duncan法 也称为Newman Keuls检验 1 新复极差检验 SSR检验 按相比较的样本容量计算平均数标准误 n1 n2 n 查所具有自由度dfe和比较所含平均数个数k时的SSR值 附表8 然后算出最小显著极差值 将各平均数按大小顺序排列 用各个M值的LSR 值即可检验各平均数间极差的显著性 当n1 n2时 中n为下式计算得到 例6 1 结论 猪的4个品种中只有大白与沈黑 大白与沈白4个月增重量差异达到显著 其他品种间差异不显著 SPSS进行Duncan检验 Q检验 q检验法也称为Newman Keuls检验 方法与新复极差检验相似 其区别仅在于计算最小显著极差LSR 时不是查SSR 而是查q 值 附表9 SPSS处理过程 第二节单因素方差分析 一 组内观测次数相等的方差分析 二 组内观测次数不相等的方差分析 利用SPSS进行单因子方差分析 例6 2测定东北 内蒙古 河北 安徽 贵州5个地区黄鼬冬季针毛的长度 每个地区随机抽取4个样本 测定的结果如表6 11 试比较各地区黄鼬针毛长度差异显著性 分析步骤 建立数据文件 Analyze Comparemeans One wayANPVA One WayANOVA 确定分析变量及分组 选择进行多组比较的方法 计算结果 多重比较表 第三节二因素方差分析 一 模型的选用 在二因素试验中 当二因素都是固定因素时称为固定模型 二因素均为随机因素时 称为随机模型 一个因素是固定因素另一个因素是随机因素时 称为混合模型 二 主效应与交互作用 各试验因素的相对独立作用称为该因素的主效应 简称主效 某一因素在另一因素的不同水平上所产生的效应不同 则二因素间存在交互作用 简称互作 因素间的交互作用显著与否关系到主效应的利用价值 若交互作用不显著 则各因素的效应可以累加 各因素的最优水平组合起来 即为最优的处理组合 若交互作用显著 则各因素的效应就不能累加 最优处理组合的选定应根据各处理组合的直接表现选定 有时交互作用相当大 甚至可以忽略主效应 二因素间是否存在交互作用有专门的统计判断方法 有时也可根据专业知识判断 三 数学模型 1 无交互作用 xij i j ij 2 有交互作用 xijk i j ij ijk 双因子方差分析数据表 进行SPSS分析处理的要点 例6 5为了研究某种昆虫滞育期长短与环境的关系 在给定的温度和光照条件下在实验室培养 每一处理记录4只昆虫的滞育天数 结果列于表6 25中 试对该资料进行方差分析 分析 本题属于典型的双因子固定模型方差分析实验 根据昆虫发育特征 往往光照和温度均显著影响昆虫的滞育 因此温度和光照周期之间可能具有交互作用存在 SPSS分析 1 数据文件的建立 两因子 每一因子3个水平 2 Analyze Generallinearmodel Univariate 变量 因子和模型的选择 分析结果 第四节多因素方差分析 实际工作中 如果需要考察三个或多个因素的效应时 相当于把二因素方差分析扩展到一般情况 在一个试验中 A因素有a水平 B因素有b水平 C因素有c水平等 假设每一处理都有n次重复 总观测次数为abcn次 本节仅对三因素的情况进行分析 数学模型 xijkl表示A因素第i水平 B因素第j水平 C因素第k水平第l次重复的观测值 其中i 1 2 a j 1 2 b k 1 2 c l l 2 n 为总体平均数 i j k分别表示A因素 B因素 C因素的效应 ij ik jk分别表示A B A C B C的交互效应 ijk表示三因素的交互效应 A B C ijkl表示试验误差 同队应满足条件 2 是独立分布 服从N 0 2 三因子方差分析表 实际分析时 可列出三个两向表 把三因素方差分析化为二因素方差分析 例6 7 为了研究在猪饲料中添加肮氨酸 因素A 蛋氨酸 因素B 和蛋白质 因素C 对猪日增重 kg 的影响 设计了下面的试验 每一组共用两头猪作重复 结果如表6 33 试作方差分析 数据输入 分析步骤 结果分析 第五节方差分析缺失数据的估计 用方差分析的数据通常根据事先设计好的实验数据结果 意外事件常使某一个或某几个数据丢失 比如收获的作物可能遭到毁坏 动物可能有死亡 或者在记录时可能漏记或记错等等 数据的缺失使平方和的线性可加模型无效 因此无法直接进行方差分析 缺失的数据可用统计方法从理论上估计出 填写在表内的表格之中 然后用前面介绍过的方法进行分析 但有一点必须明确 缺失数据估计并不能恢复原来的数据 只能是补足后不致干扰其余数据 估计的数据并不能提出任何新的信息 因此 试验中应尽量避免这类情况发生 弥补缺失数据的原则是 使补上缺失的数据后 误差平方和最小 一 缺失一个数据的估计方法 解该方程 得x 42 875 43 把这个数据填在表内 方差分析除总自由度dfT和误差自由度dfe各需减1外 其他仍可以按前面介绍的方法进行 二 缺失两个数据的估计方法 假定x23和x37都缺失 分别称为x和y 其弥补原则和弥补一个数据是一样的 即使SSe达到极小 先由下式求出误差平方和 SSe SST SSA SSB 丢失的数据补上后仍按通常方法计算 误差自由度及总自由度均减2 由于误差自由度减小 F检验的灵敏度相应降低 对分析问题是不利的 补救的数据只是不干扰方差分析 并不能提供丢失的信息 所以进行试验时 要谨慎小心 尽量避免数据的丢失 第六节方差分析的基本假定和数据转换 一 方差分析的基本假定 1 正态性 试验误差应当是服从正态分布的独立的随机变量 因为方差分析只能估计随机误差 顺序排列或顺序取样资料不能作方差分析 2 可加性处理效应与误差效应应该是可加的 并服从方差分析的数学模型 即xij i ij 这样才能将试验的总变异分解为各种原因所引起的变异 以确定各变异在总变异中所占的比例 对试验结果作出客观评价 3 方差同质性所有试验的误差方差应具备同质性 也叫方差的齐性 即 二 数据转换 在生物学中有时会遇到一些样本 其所来自的总体和上面提到的方差分析基本假定相抵触 这些数据在作方差分析之前必须经过适当处理即数据转换来变更测量标尺 样本的非正态性 不可加性和方差的异质性通常连带出现 主要的是考虑处理效应与误差效应的可加性 其次才考虑介差同质性 一 平方根转换 有些生物学观测数据为波松分布而非正态分布 比如一定面积上某种杂草株数或昆虫头数等 样本平均数与其方差有比例关系 采用平方根转换可获得同质的方差 一般将原观测值转换成 数据较小时采 例如表6 40中所列的一定面积燕麦田中杂草的株数 从直观上看 A1 A2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年国内知名企业数据分析师岗位招聘面试题及答案
- 2025年人事专员面试问题及模拟题答案
- 2025年健康照护师专业资格认证考试模拟题及答案
- 2025年旋挖钻机项目建议书
- 2025年口服降血糖药项目建议书
- 2025年生物质气化机组项目建议书
- 抛光粉尘安全知识培训课件
- 抗过敏药课件
- 广西南宁市西乡塘区、江南区2024-2025学年七年级下学期期末检测地理试卷(含答案)
- 2025年电视节目自动播出设备项目建议书
- 2025年司法考试刑法案例分析实战演练试卷(附司法解释案例解析)含答案
- 全员安全生产责任制考核制度和考核标准
- 山东吕剧教学课件
- 2025年养老护理员考试试卷及答案
- 2025年宜宾市中考语文试题卷(含答案详解)
- 新能源装备制造业行业研究报告
- 家博会现场抽奖活动方案
- 古建筑保护和修复工程项目可行性研究报告
- 第1章 勾股定理 问题解决策略 课件 北师大版数学八年级上册
- 三方检测公司管理制度
- 湖北省枣阳市实验中学2025届七年级英语第二学期期末考试试题含答案
评论
0/150
提交评论