




已阅读5页,还剩75页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
卫生统计学 第五版 卫生统计学与数学教研室 第九章方差分析 一 完全随机设计资料的方差分析二 随机区组设计资料的方差分析三 析因设计资料的方差分析四 重复测量资料的方差分析五 多个样本均数的两两比较六 方差分析前提条件和数据转换 一 掌握内容1 方差分析基本思想 1 多组计量资料总变异的分解 组间变异和组内变异的概念 2 多组均数比较的检验假设与F值的意义 3 方差分析的应用条件 2 常见实验设计资料的方差分析 1 完全随机设计的单因素方差分析 适用的资料类型 总变异分解 包括自由度的分解 方差分析的计算 方差分析表 2 随机区组设计资料的两因素方差分析 适用的资料类型 总变异分解 包括自由度的分解 方差分析的计算 方差分析表 3 多个样本均数间的多重比较方法 LSD t检验法 Dunnett t检验法 SNK q检验法 二 熟悉内容多组资料的方差齐性检验 变量变换方法 三 了解内容两因素析因设计方差分析 重复测量设计资料的方差分析 教学大纲要求 第一节完全随机设计资料的方差分析 方差分析 一 方差分析的基本思想 二 完全随机设计资料的方差分析的基本步骤 三 小结 思考几个问题 在前面的章节已经学过t检验 他们的适用于何种资料类型 应用条件是什么 t检验解决了两样本均数比较的问题 当出现多组比较的情况怎么办 多组比较时能否直接用两两比较的t检验得出结论 例某医生为研究一种四类降糖新药的疗效 以统一的纳入标准和排除标准选择了60名2型糖尿病患者 按完全随机设计方案将患者分为三组进行双盲临床试验 其中 降糖新药高剂量组21人 低剂量组19人 对照组20人 对照组服用公认的降糖药物 治疗4周后测得其餐后2小时血糖下降值 结果如表所示 问治疗4周后 餐后2小时血糖下降值的三组总体平均水平是否不同 对多个处理进行平均数差异显著性检验时 采用t检验法的缺点 1 检验过程烦琐 试验包含 个处理 t检验 C42 6次 缺点 缺点 2 无统一的试验误差 误差估计的精确性和检验的灵敏性低 t检验 C42 6次 需计算6个标准误 误差估计不统一 误差估计精确性降低 缺点 3 推断的可靠性低 检验时犯 错误概率大 t检验 C42 6次 H0的概率 1 0 95 6次检验相互独立 6次都接受的概率 0 95 6 0 735 犯 错误的概率 1 0 735 0 265 犯 错误的概率明显增加 例如我们用t检验的方法检验4个样本平均数之间的差异显著性 0 05 t检验可以判断两组数据平均数间的差异显著性 而方差分析既可以判断两组又可以判断多组数据平均数之间的差异显著性 方差 随机变量离散的重要衡量方法 离均差平方和 总体方差 样本方差 试验指标 experimentalindex 为衡量试验结果的好坏和处理效应的高低 在实验中具体测定的性状或观测的项目称为试验指标 常用的试验指标有 身高 体重 日增重 酶活性 DNA含量等等 试验因素 experimentalfactor 试验中所研究的影响试验指标的因素叫试验因素 当试验中考察的因素只有一个时 称为单因素试验 若同时研究两个或两个以上因素对试验指标的影响时 则称为两因素或多因素试验 因素水平 leveloffactor 试验因素所处的某种特定状态或数量等级称为因素水平 简称水平 如研究3个品种奶牛产奶量的高低 这3个品种就是奶牛品种这个试验因素的3个水平 试验处理 treatment 事先设计好的实施在实验单位上的具体项目就叫试验处理 如进行饲料的比较试验时 实施在试验单位上的具体项目就是具体饲喂哪一种饲料 试验单位 experimentalunit 在实验中能接受不同试验处理的独立的试验载体叫试验单位 一只小白鼠 一条鱼 一定面积的小麦等都可以作为实验单位 重复 repetition 在实验中 将一个处理实施在两个或两个以上的试验单位上 称为处理有重复 一处理实施的试验单位数称为处理的重复数 例如 用某种饲料喂4头猪 就说这个处理 饲料 有4个重复 因素 因子 可以控制的试验条件因素的水平 因素所处的状态或等级单 双 因素方差分析 讨论一个 两个 因素对试验结果有没有显著影响 处理因素为单个时 称为单因素 每个因素在数量上或强度上可有不同 这种数量或强度上的不同就称为水平 依照研究因素与水平的不同 可产生四类实验 1 单因素单水平 2 单因素多水平 4 多因素多水平 3 多因素单水平 如研究某药对原发性高血压患者的降压作用 如研究某药不同剂量的降血糖作用 如比较不同药物或不同疗法对某病的治疗效果 如某肿瘤的联合化疗方案 随机变量是对随机事件的数学描述而一个随机变量的分布特征我们用什么方法描述呢 数学期望 E X 分布的中心位置方差 V X 2 分布的离散程度 随机变量的数字特征 方差 随机变量离散的重要衡量方法 离均差平方和 总体方差 样本方差 方差分析就是将全部观察值的变异 总变异 按设计和需要分解成两个或多个组成部分 再进行变异来源和大小的分析 方差分析 比较2个或2个以上的总体均值是否有显著性差异 用组间的方差与组内方差相比 据以判别误差主要源于组间的方差 不同组工人的产量 条件误差 还是源于组内方差 随机误差 第九章方差分析 方差分析的基本思想 根据资料设计的类型及研究目的 可将总变异分解为两个或多个部分 每个部分的变异可由某因素的作用来解释 通过比较可能由某因素所至的变异与随机误差 即可了解该因素对测定结果有无影响 用公式概括为 总变异 组间变异 组内变异 各因素引起 由个体差异引起 误差 一 方差分析的基本思想 第一节完全随机设计资料的方差分析 变异度的大小可以用标准差或方差来衡量 此处既然是方差分析就用方差来衡量 只不过将方差的分子离均差平方和及分母自由度 分开 分别考虑 方差分析 Analysisofvariance ANOVA 又叫变量分析 是英国著名统计学家R A Fisher于20世纪提出的 它是用以检验两个或多个均数间差异的假设检验方法 它是一类特定情况下的统计假设检验 或者说是平均数差异显著性检验的一种引伸 为纪念Fisher 以F命名 故方差分析又称F检验 方差分析的定义 方差分析的基本功能 不受比较组数的限制 可比较多组均数可同时分析多个因素的作用可分析因素间的交互作用 二 方差分析的优点 独立性 各样本是相互独立随机的样本正态性 各样本都来自正态总体方差齐性 各样本的总体方差相等 三 方差分析的应用条件 进行两个或两个以上样本均数的比较 可以同时分析一个 两个或多个因素对试验结果的作用和影响 分析多个因素的独立作用及多个因素之间的交互作用 进行两个或多个样本的方差齐性检验等 方差分析对分析数据的要求及条件比较严格 即要求各样本为随机样本 各样本来自正态总体 各样本所代表的总体方差齐性或相等 四 方差分析的主要用途 1 单因素方差分析 one wayANOVA 也称为完全随机设计 completelyrandomdesign 的方差分析 该设计只能分析一个因素下多个水平对试验结果的影响 2 双因素方差分析 two wayANOVA 称为随机区组设计 randomizedblockdesign 的方差分析 该设计可以分析两个因素 一个为处理因素 也称为列因素 一个为区组因素 也称为行因素 四 方差分析的类型 3 三因素方差分析也称为拉丁方设计 Latinsquaredesign 的方差分析 该设计特点是 可以同时分析三个因素对试验结果的作用 且三个因素之间相互独立 不能有交互作用 4 析因设计 factorialdesign 的方差分析当两个因素或多个因素之间存在相互影响或交互作用时 可用该设计来进行分析 该设计不仅可以分析多个因素的独立作用 也可以分析多个因素间的交互作用 是一种高效率的方差分析方法 5 正交试验设计的方差分析如果要分析的因素有三个或三个以上 可进行正交试验设计 orthogonalexperimentaldesign 的方差分析 当分析因素较多时 试验次数会急剧增加 用此设计进行分析则更能体现出其优越性 该设计利用正交表来安排各次试验 以最少的试验次数 得到更多的分析结果 完全随机设计 completelyrandomdesign 是采用完全随机化的分组方法 将全部试验对象分配到g个处理组 水平组 各组分别接受不同的处理 试验结束后比较各组均数之间的差别有无统计学意义 推论处理因素的效应 第一节完全随机设计资料的方差分析 1 特点单因素方差分析是按照完全随机设计的原则将处理因素分为若干个不同的水平 每个水平代表一个样本 只能分析一个因素对试验结果的影响及作用 其设计简单 计算方便 应用广泛 是一种常用的分析方法 但其效率相对较低 该设计中的总变异可以分出两个部分 即SS总 SS组间 SS组内 2 常用符号及其意义 1 Xij意义为第i组的第j个数据 其中下标i表示列 j表示行 2 意义为将第i组的全部j个数据合计 第一节完全随机设计资料的方差分析 3 将第i组的j个数据合计后平方 再将所有各i组的平方值合计 4 变异来源 SS总 表示变异由处理因素及随机误差共同所致 SS组间 表示变异来自处理因素的作用或影响 SS组内 表示变异由个体差异和测量误差等随机因素所致 即SS总 SS组间 SS组内 例9 1某医生为研究一种四类降糖新药的疗效 以统一的纳入标准和排除标准选择了60名2型糖尿病者 按完全随机设计方案将患者分为三组进行双盲临床试验 其中降糖新药高剂量组21人 低剂量组19人 对照组20人 对照组服用公认的降糖药物 治疗四周后测得其餐后2小时血糖下降值 mmol L 结果如表9 1所示 问治疗四周后 餐后2小时血糖下降值的三组总体平均水平是否不同 分组方法 先将60名糖尿病患者从1开始到60编号 从随机数字表 附表15 中的任一行任一列开始 依次读取三位数作为一个随机数录于编号下 然后将全部随机数从小到大编序号 数据相同的按先后顺序编序号 将每个随机数对应的序号记录 规定序号1 21为甲组 序号22 40为乙组 序号41 60为丙组 记总均数为 各处理组均数为 总例数为N nl n2 ng g为处理组数 总体方差为 各处理组方差为 试验数据有三个不同的变异 总变异 Totalvariation 全部测量值Xij与总均数间的差别组间变异 betweengroupvariation 各组的均数与总均数间的差异组内变异 withingroupvariation 每组的原始数据与该组均数的差异 用公式概括为 总变异 组间变异 组内变异 1 总变异60名2型糖尿病患者的餐后2小时血糖Xij大小各不相同 与它们的总均数 overallmean 也不相同 这种变异称为总变异 totalvariation 该变异既包含了随机误差 即2型糖尿病患者的个体差异和测量误差 又包含了三组用药即处理的不同 其大小用所有数据 N 60 的方差即均方SS总来表示 1 总变异 SS总反映了所有测量值之间总的变异程度 SS总 各测量值Xij与总均数差值的平方和 变异度的大小可以用标准差或方差来衡量 此处既然是方差分析就用方差来衡量 只不过将方差的分子离均差平方和SS及分母的自由度v分开 分别来考虑 2 组间变异各处理组由于接受处理的水平不同 各组的样本均数 i 1 2 g 也大小不等 三组2型糖尿病患者餐后2小时血糖的样本均数各不相同 它与总均数也不相同 这种变异称为组间变异 其大小可用各组均数与总均数的离均差平方和表示 记为SS组间 它反映了三组用药不同的影响 如处理确实有作用 同时也包括了随机误差 2 组间变异 SS组间反映了各组均数间的变异程度组间变异 随机误差 处理因素效应 176 7612 自由度 组间 组数 k 1 3 组内变异在同一处理组中 虽然每个受试对象接受的处理相同 但测量值仍各不相同 各组内2型糖尿病患者的餐后2小时血糖Xij大小各不相同 与本组的样本均数也不相同 这种变异称为组内变异 误差 组内变异可用组内各测量值Xij与其所在组的均数的差值的平方和表示 记为SS组内 表示随机误差 含个体差异和测量误差 的影响 又称误差变异 在同一处理组内 虽然每个受试对象接受的处理相同 但测量值仍各不相同 这种变异称为组内变异 SS组内仅仅反映了随机误差的影响 也称SS误差 3 组内变异 自由度 组内 总例数 N 组数 k 4 三种 变异 之间的关系 随机误差 含个体差异和测量误差 处理因素 包含了三组用药即处理的不同 5 均方 MS 其中k表示处理组数 表示总例数 各种变异的表示方法 SS总 总MS总 SS组内 组内MS组内 SS组间 组间MS组间 三者之间的关系 SS总 SS组内 SS组间 总 组内 组间 6 均方之比 F F统计量 当 12 22时 F S12 S22 7 F分布 F分布概率密度函数 F分布曲线 F界值表 附表3F界值表 方差分析用 单侧界值 上行 P 0 05下行 P 0 01 3 统计量F的计算及其意义 F MS组间 MS组内 通过这个公式计算出统计量F 查表求出对应的P值 与 进行比较 以确定是否为小概率事件 与t检验公式进行对比 自由度 组间 组数 1 组内 N 组数 假设检验 方差分析的基本思想 首先将总变异分解为组间变异和误差 组内 变异 然后比较两者的均方 即计算F值 若F值大于某个临界值 表示处理组间的效应不同 若F值接近甚至小于某个临界值 表示处理组间效应相同 差异仅仅由随机原因所致 对于不同设计的方差分析 其思想都一样 即均将处理间平均变异与误差平均变异比较 不同之处在于变异分解的项目因设计不同而异 方差分析的应用条件 各样本是相互独立的随机样本 各样本来自正态总体 各处理组总体方差相等 即方差齐性或齐同 上述条件与两均数比较的t检验的应用条件相同 当组数为2时 方差分析与两均数比较的t检验是等价的 对同一资料 有 完全随机设计分析也叫单因素方差分析 将受试对象随机地分配到各个处理组的设计 二 完全随机设计资料的方差分析的基本步骤 一 随机分组方法1 编号 确定分组方案 如较少10个随机数为A 中间10个数为B 较大10个随机数为C 2 产生随机数字 附表15 或电脑 排序3 按方案分组 将数据按同一处理的不同水平进行分组整理 二 方差分析的步骤 H0 m1 m2 m3 mk m1 m2 m3 H1 notallthemiareequal m1 m2 m3 建立检验假设 确定检验水准 即A B C三种方案效果相同 三个总体均数不全相等 即A B C三种方案的效果不全相同 2 计算检验统计量F 3 确定P值 做出推断结论 计算F值 方差分析表 自由度 组间 组数 k 1 组内 总例数 N 组数 k 完全随机统计设计方差分析的计算公式 变异来源SSdfMSF 确定P值 做出推断结论 查附表三的F界值表得P值 有统计学意义 可以认为多个总体均数不全相同 即多个总体均数中至少有两个不同 至于多个总体均数中哪些不同 可用本章第五节的方法进行多个均数间的两两比较 无统计学意义 本例 可以认为2型糖尿病患者经药物 新药和标准药 治疗4周 其餐后2小时血糖的总体平均水平不全相同 即三个总体均数中至少有两个不同 结论 计算F值 方差分析表 完全随机统计设计方差分析的计算公式 方差分析 自由度 组间 组数 k 1 组内 总例数 N 组数 k 变异来源SSdfMSF 方差分析 analysisofvariance ANOVA 的基本思想就是根据资料的设计类型 即变异的不同来源将全部观察值总的离均差平方和 sumofsquaresofdeviationsfrommean SS 和自由度分解为两个或多个部分 除随机误差外 其余每个部分的变异可由某个因素的作用 或某几个因素的交互作用 加以解释 如各组均数的变异SS组间可由处理因素的作用加以解释 通过各变异来源的均方与误差均方比值的大小 借助F分布作出统计推断 判断各因素对各组均数有无影响 方差分析的基本思想 方差分析的基本思想 把全部数据关于总均值的离均差平方和分解成几部分 每一部分表示某因素诸水平交互作用所产生的效应 将各部分均方与误差均方相比较 从而确认或否认某些因素或交互作用的重要性 用公式概括为 总变异 组间变异 组内变异 各因素引起 由个体差异引起 误
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学校教育与职业技能培训协议
- 企业运营成本控制方案库
- 艺术流派及发展历程概述:美术课堂教学设计
- 直接引语与间接引语的转换规则:六年级英语语法课教案
- 小猪学样550字(11篇)
- 纪念塔课件教学
- 银滩之旅250字(12篇)
- 关于七夕节的英语作文11篇
- 2025年事业单位招聘统计类试卷:统计学在美学中的
- 2025年商务英语(BEC)中级考试真题模拟卷:模拟实战演练
- 变化与更新-2025中国家居家装行业发展研究报告-树懒生活fine-202501
- 《脑卒中与急救》课件
- 九上英语单词表人教版
- 2025年北京车牌租赁合同范本
- 2024年高考新课标Ⅱ卷语文试题讲评课件
- 4S店企业职业卫生培训
- 静脉配液治疗操作核对流程
- 检验科糖尿病
- 产科医疗安全与质量控制制度
- 石油化工设备维护与检修手册
- 拆迁工程成本控制方案
评论
0/150
提交评论