




已阅读5页,还剩101页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章方差分析 1 第一节方差分析的基本原理 1 1概念方差分析 AnalysisofVariance 简称ANOVA 又称 变异数分析 或 F检验 是R A Fisher发明的 用于两个及两个以上样本均数差别的显著性检验 2 例如 医学界研究几种药物对某种疾病的疗效 农业研究土壤 肥料 日照时间等因素对某种农作物产量的影响 不同饲料对牲畜体重增长的效果等 都可以使用方差分析方法去解决 3 方差或叫均方 是标准差的平方 是表示变异的量 在一个多处理试验中 可以得到一系列不同的观测值 造成观测值不同的原因是多方面的 有的是处理不同引起的 叫处理效应或条件变异 有的是试验过程中偶然性因素的干扰和测量误差所致 称为实验误差 4 方差分析的基本思想是将测量数据的总变异按照变异原因不同分解为处理效应和实验误差 并作出其数量估计 方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和 5 1 2方差分析的适用条件各处理组样本来自正态总体 各样本是相互独立的随机样本 各处理组的总体方差相等 即方差齐性 6 1 3数学模型假定有k组观测数据 每组有n个观测值 则用线性可加模型来描述每一观测值 有 是在第i次处理下的第j次观测值 为总体平均数 为处理效应 是试验误差 要求是相互独立的 且服从正态分布 7 对于由样本估计的线性模型为 为样本平均数 为样本的处理效应 为试验误差 8 1 4平方和和自由度的分解因此 要把一个试验的总变异依据变异来源分为相应的变异 首先要将总平方和和总自由度分解为各个变异来源的相应部分 9 1 4 1平方和的分解总平方和 处理间平方和 处理内平方和 10 1 4 2自由度的分解总自由度也可分解为处理间自由度和处理内自由度 即 总自由度 处理间自由度 处理内自由度 11 根据各变异部分的平方和和自由度 可得处理间方差和处理内方差 12 例1 对四个污水处理厂污水中的氨氮含量进行测定 测定结果列于下表 试进行方差分析 表1 氨氮含量 ppm 13 本例中 品种数k 4 重复数n 4 观测数据总数nk 4 4 16 1 平方和计算 矫正数C 14 2 自由度的计算 总自由度处理间自由度处理内自由度 15 3 方差计算 处理间方差处理内方差 16 1 5统计假设的显著性检验 F检验处理内方差可以作为误差方差的估计量 处理间方差作为不同处理工艺差异的估计量 已知从一个总体随机抽取两个样本 其样本方差的比值为F 即 17 一般将大方差作分子 小方差作分母 使F值大于1 进行不同处理差异显著性的F检验时 一般是把处理间方差作为分子 称为大方差 误差方差作分母 称为小方差 18 无效假设把各个处理的变量假设来自同一总体 即处理间方差不存在处理效应 只有误差的影响 因而处理间的样本方差与误差的样本方差相等 即H0 无效假设是否成立 决定了计算的F值在F分布中出现的概率 例1中的F值为 19 根据确定的显著标准从F值表中查出在和下的值 如果所计算的F P 0 05 则接受H0 说明处理间差异不显著 若F P 0 05 应否定H0 接受 说明处理间差异是显著的 并在计算的F值的右上角标上 号 20 表2 F值 P值与统计结论 21 例1中查F值表 F 应否定H0 说明不同处理间污水氨氮含量差异是显著的 将方差分析结果列成方差分析表 22 1 6多重比较用F检验如果否定了H0 接受HA 仅说明k个平均数间有显著差异 但不能说明哪些平均数间有显著差异 例如4个不同污水处理工艺对污水氨氮含量有显著差异 但不是所有处理下氨氮平均数间的差异都显著 有些处理间可能差异极显著 有些处理间可能差异不显著 23 例如 如果确定了不同施肥量对农作物的产量有显著影响 那么还需要了解10公斤 20公斤 30公斤肥料对农作物产量的影响幅度是否有差异 其中哪种施肥量水平对提高农作物产量的作用不明显 哪种施肥量水平最有利于提高产量等 24 因此 要明确不同处理平均数两两间差异的显著性 每个处理的平均数都要与其他的处理进行比较 这种差异显著性的检验就叫多重比较 多重比较检验问题也是假设检验问题 因此也遵循假设检验的基本步骤 多重比较的方法很多 常用最小显著差异法 LSD 和最小显著极差法 LSR 25 1 6 1最小显著性差异法LSD LeastSignificantDifference实质是两个平均数相比较的t检验法 检验的方法是首先计算出达到差异显著的最小差数 记为LSD 然后用两个处理平均数的差与LSD比较 若 LSD 即在给定的水平上差异显著 反之 差异不显著 26 由 得若 或 就可以在0 05或0 01水平上拒绝H0 接受HA 27 其中平均数差数标准误计算公式 为处理内误差方差 n为每一处理观察次数 28 例1 表1 氨氮含量 ppm 29 根据例1 将氨氮含量平均数差数列于表中 并和LSD值比较 30 1 6 2多重比较结果的表示列梯形表法 表3 标记字母法 表4 31 A与D差异达到极显著标准 A与C之间的差异达到显著标准 其他处理间差异不显著 表3 不同处理间氨氮含量差异显著表 列梯形表法 32 表4 不同处理间氨氮含量差异显著表 标记字母法 33 进行LSD检验时 必须注意这一对平均数的比较是检验之前已经指定的 而且经F检验证实平均数间差异已达显著之后 可以进行LSD检验 34 练习 35 1 6 3最小显著极差法 LSR法 LSR法采用不同平均数间用不同的显著差数标准进行比较 可用于平均数间的所有相互比较 LSR法的常用方法有新复极差检验和q检验 36 1 按相比较的样本容量计算平均数标准误 2 查所具有自由度和比较所含平均数个数k时的SSR值 然后算出值 37 3 将各平均数按大小顺序排列 用各个k值的值即可检验各平均数间极差的显著性 38 第二节单因素方差分析2 1概念是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响 这里 由于仅研究单个因素对观测变量的影响 因此称为单因素方差分析 因素与处理 因素是影响因变量变化的客观条件 处理是影响因变量变化的人为条件 也可通称为因素 常用大写字母 A B 来表示 水平 因素的不同等级称作水平 水平值取有限的离散值 如 性别中的0 1 男 女 等常用代表该因素的字母添加下标来表示 A1 A2 B1 B2 39 例如 分析不同施肥量是否给农作物产量带来显著影响 考察地区差异是否影响妇女的生育率 研究学历对工资收入的影响等 这些问题都可以通过单因素方差分析得到答案 40 单因素方差分析的第一步是明确观测变量和控制变量 例如 上述问题中的观测变量分别是农作物产量 妇女生育率 工资收入 控制变量分别为施肥量 地区 学历 41 单因素方差分析的第二步是剖析观测变量的方差 方差分析认为 观测变量值的变动会受控制变量和随机变量两方面的影响 据此 单因素方差分析将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分 用数学形式表述为 SST SSA SSE 42 单因素方差分析的第三步是通过比较观测变量总离差平方和各部分所占的比例 推断控制变量是否给观测变量带来了显著影响 43 在观测变量总离差平方和中 如果组间离差平方和所占比例较大 则说明观测变量的变动主要是由控制变量引起的 可以由控制变量来解释 控制变量给观测变量带来了显著影响 反之 如果组间离差平方和所占比例小 则说明观测变量的变动不是主要由控制变量引起的 不可以主要由控制变量来解释 控制变量的不同水平没有给观测变量带来显著影响 观测变量值的变动是由随机变量因素引起的 44 2 2组内观测次数相等的方差分析K组处理中 每一处理皆有n个观测值 其方差分析方法同前 表5 组内观测次数相等的单因素方差分析 45 例2 测定东北 内蒙古 河北 安徽 贵州五个地区冬季针矛的长度 每个地区随机抽取4个样本 测定结果如表示 试比较各地区针毛长度差异显著性 46 表5 不同地区冬季针毛长度 mm 47 表6 数据统计表 48 本例中 k 5 n 4 计算离均差平方和与自由度 49 进行F检验 说明五个地区冬季针矛的长度差异非常显著 50 表7 不同地区冬季针矛长度方差分析表 51 为了确定各个地区之间的差异是否显著 需要进行多重比较 用LSD法进行检验 52 表8 不同地区冬季针矛长度比较 53 2 3组内观测次数不相等的方差分析k个处理的观测次数依次是n1 n2 nk的单因素分组资料仍可使用前述的分析方法 但总观测次数不是nk 而是次 表9 组内观测次数不相等的方差分析 54 在作多重比较时 首先计算平均数的标准误 需先计算各ni的平均数n0 55 第三节二因素方差分析3 1概念在实际工作中经常会遇到两种因素共同影响试验结果的情况 例如 为了研究某种昆虫滞育的情况 同时选用几种温度 因素A 和光照时间 因素B 进行室内培养 每一观测值都是某一特定温度与光照条件共同作用的结果 56 在二因素试验中 固定模型 二因素都是固定因素 实际中应用最多 随机模型 二因素均为随机因素 混合模型 一个因素是固定因素 另一个因素是随机因素 57 3 2类型双因素方差分析有两种类型 一个是无交互作用的双因素方差分析 它假定因素A和因素B的效应之间是相互独立的 不存在相互关系 交互作用不显著 则各因素的效应可以累加 另一个是有交互作用的双因素方差分析 它假定因素A和因素B的结合会产生出一种新的效应 58 3 3无重复观测值的二因素方差分析A因素有a个水平 B因素有b个水平 每个处理组合只有一个观测值 59 表10 无重复观测值的二因素分析 60 3 3具重复观测值的二因素方差分析A因素有a个水平 B因素有b个水平 每一次重复都包含ab次试验 试验重复n次 试验总次数为abn次 61 表11 具重复观测值的二因素分组资料方差分析表 62 63 例3 为研究某种昆虫滞育期长短与环境的关系 在给定的温度和光照条件下在实验室培养 每一处理记录4只昆虫的滞育天数 结果列于表中 试作方差分析 64 表12 不同温度及光照条件下某种昆虫滞育天数 65 表13 某昆虫滞育天数方差分析计算表 66 67 68 表14 某昆虫滞育天数方差分析表 69 要了解各种光照时间及温度对滞育期的影响 需进行不同光照间及不同温度间的多重比较 方法参照前述 70 第三节多因素方差分析 在实际工作中 有时需考虑三个或多个因素的效应 如在一个试验中 A因素有a水平 B因素有b水平 C因素有c水平等等 假设每一处理都有n次重复 则总观测次数为abcn次 本节以三因素的情况进行分析 71 表15 三因素方差分析表 72 例4 为了研究猪饲料中添加异氨酸 因素A 蛋氨酸 因素B 和蛋白质 因素C 对猪日增重 Kg 的影响 设计下面的试验 每一组公用2头猪做重复 结果如表 试作方差分析 73 74 表16 AXB表 75 表17 BXC表 76 表18 AXC表 77 由于3个因素均可控制 所以属于固定模型 1 将数据分别累加 记入表16 表17中 2 计算平方和 a 4 b 3 c 2 n 2 78 79 3 自由度的分解 80 4 将以上结果列为方差分析表 81 第四节SPSS软件操作 ANOVA 4 1SPSS简介 StatisticalPackagefortheSocialScience 社会科学统计软件 用户的数据管理和统计分析工作可以非常方便的通过鼠标点选菜单并配合简单的对话框输入来实现 免去了记忆命令和参数的负担 也不需任何计算机编程 82 SPSS分析基本步骤 定义SPSS数据文件的结构 录入修改保存SPSS数据 83 84 85 4 2单因素方差分析的SPSS操作 例2 测定东北 内蒙古 河北 安徽 贵州五个地区冬季针矛的长度 每个地区随机抽取4个样本 测定结果如表示 试比较各地区针毛长度差异显著性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030LED封装设备发展趋势分析与未来投资战略咨询研究报告
- 2025至2030InGaAsAPD模块行业市场占有率及投资前景评估规划报告
- 2025-2030装配机器人市场发展现状分析及行业投资战略研究报告
- 村民族联谊活动方案
- 松门公司团建活动方案
- 景区迎亚运活动方案
- 村书记消薄竞赛活动方案
- 暑假感恩实践活动方案
- 服务礼仪月活动方案
- 服装贴牌公司策划方案
- 海绵城市总结课件
- 摄影构图(共86张PPT)
- 金蝉的养殖管理
- 大海(张雨生)原版五线谱钢琴谱正谱乐谱
- 有限空间作业实操评分标准
- 规划展览馆方案-南京军区军史馆布展总体方案
- (完整版)煤矿主扇司机考试卷(含答案)
- 双柏县工业用大麻开发种植实施计划方案
- 租赁房屋交接清单
- 吊顶检验报告(共5页)
- (完整版)10KV电力线路施工组织设计方案
评论
0/150
提交评论