




已阅读5页,还剩70页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
方差分析与秩和检验,第五讲,两两比较次数 同类指标数(数量越多) 亚组分析与期中分析,方差分析(analysis of variance) ANOVA基本思想,根据资料的设计类型,即变异的不同来源,将全部观察值总的离均差平方和以及自由度分解为两个或多个部分,每个部分的变异与自由度组成均方(MS),均方比值(统计量)服从F分布,由此做出统计推断,从而了解各因素对观察指标影响有无统计学意义。,第一部分 方差分析 Analysis Of Variance(ANOVA),R Fisher(1890-1962)在20世纪30年代发表以F分布为基础的用于多组计量资料均数比较假设检验-方差分析,有时又被称为变异分析或 F检验等。,R A Fisher, the founder of statistical inference, working on a mechanical calculator,Within group variance is large compared to variability between means. Unclear separation of means.,x,y,-4,-3,-2,-1,0,1,2,3,4,F统计量的抽样分布,方差分析的理论基础:F分布,F分布是方差分析的基础,通过F分布确定P值 F分布也是一簇连续性分布,分布类型与第一、二自由度有关。 当第一、二自由度固定时,F值越大,其对应的P值越小;反之亦然。,方差分析的概述,方差分析核心是变异的分解:将所有观察值之间的变异分解成几部分,每一部分均反映了特定的内容(如某因素的作用、交互作用) 通过变异间的相互比较,并构建统计量F值,基于F分布,计算P值。 方差分析的用途很广,按照设计类型又可细为很多亚型。,方差分析的主要设计类型,成组设计(完全随机设计):单因素多组 配伍设计:研究因素/配伍因素多组 交叉设计:多个因素 析因设计:两因素及其交互作用 拉丁方设计: 正交试验设计:多因素,多水平。 。,方差分析主要用途,推断两个及以上总体均数有无区别; 分析两个或多个因素主效应及其交互作用 回归方程的线性假设检验。,一、成组设计资料的方差分析 (实例分析),例1、某医院对31名石棉矿工中的石棉肺患者、可疑患者、非患者进行了用力肺活量测定,结果见下,问三组石棉矿工的用力肺活量有无差别?,表1 三组石棉矿工的用力肺活量 石棉肺患者 可疑患者 非患者 1.8 2.3 2.9 1.4 2.1 3.2 1.5 2.1 2.7 2.1 2.1 2.8 1.9 2.6 2.7 1.7 2.5 3.0 1.8 2.3 3.4 1.9 2.4 3.0 1.8 2.4 3.4 1.8 3.3 2.0 3.5 均数 1.79 2.31 3.4 2.51(合) 例数 11 9 11,1、成组设计方差分析的变异分解,总变异 = 组间变异 + 组内变异,(1.79-2.51) + (1.8-1.79) ,(1.8-2.51) = ,表1 三组石棉矿工的用力肺活量 石棉肺患者 可疑患者 非患者 1.8 2.3 2.9 1.4 2.1 3.2 1.5 2.1 2.7 2.1 2.1 2.8 1.9 2.6 2.7 1.7 2.5 3.0 1.8 2.3 3.4 1.9 2.4 3.0 1.8 2.4 3.4 1.8 3.3 2.0 3.5 均数 1.79 2.31 3.4 2.51(合) 例数 11 9 11 第一组第一例变异(1.8-1.79)+(1.79-2.51),总变异,31名矿工的用力肺活量的测试值大小不等,这种变异称为总变异。其大小SS总=(Xij -X )2 ,即每个观察值与总均数X 的离均差平均和。,组内变异,每个组内的个体测量值也大小不等,这种变异称为组内变异(SS组内),反映了随机误差的大小。 SS组内(Xij -Xi )2 ,因SS组内与样本例数有关,为排除其影响,用组内均方代替:组内SS组内(N-K),组间变异,三组间的均数大小不等,称为组间变异(SS组间),反映了干预效应与随机误差 SS组间ni(Xi -X )2, 为排除组数多少的影响,用组间均方代替: 组间SS组间(K)。 变异的分解:SS总SS组间SS组内 自由度的分解:总组间组内,组间变异(MS组间) / 组内变异(MS组内)=F 组数减1为第一自由度,合并例数减组数为第二自由度. 根据F统计量与一、二自由度确定F分布,计算P值.,2、方差分析过程,变异原因 变异 统计量,3、假设检验的步骤,建立假设: H0:三组矿工用力肺活量的总体均数相等, H1:三组矿工用力肺活量的总体均数不等或不全等 12=3, 1=23, 1= 3 2, 123 =0.05 构筑统计量:F=组间变异/组内变异 =组间组内,确定 P 值: 假设无效假设成立的情况下,干预无效应,即组间与组内接近,则值接近于,在附近出现的机率多,而出现较大值的机率小,当值大到一定界值时,根据小概率事件原则,就有理由认为无效假设不成立,从而拒绝0,而接受H1。,表2 方差分析结果,变异来源 SS 总 10.8 30 组间 9.266 2 4.633 84.54 0.01 组内 1.534 28 0.0548,按照=0.05的水准,拒绝H0,接受H1,可认为三组矿工的用力肺活量不同。,SPSS分析结果,4、方差分析及两两比较,方差分析只能表明三组工人的用力肺活量的总体均数有差别,还不能说明任何两组间是否有差别,还需做两两比较检验。 ; ; 两两比较:任两个均数比较以及多个实验组与一个对照组比较两个类型。 计算组间比较的均数差值及95%可信区间。,5、两两比较与95%可信区间,效应量及其95%可信区间,5、成组设计的方差分析资料特点,本例资料为成组设计的单因素计量资料,进行多组均数间比较。,总变异,组间变异,组内变异,6、方差分析的应用条件,各样本来自正态总体:中等程度、大样本 方差齐性:最好是例数相等,敏感(变量变换、修剪) 各样本为相互独立的随机样本(独立性,代表性) 基线均衡性与效应可加性,二、配伍设计多个样本均数比较,1、资料特点分析,是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病程等)将受试对象配成区组(block),再分别将各区组内的受试对象随机分配到各处理或对照组。,1、资料特点分析,研究因素有两个: A:药物因素-不同药物组的重量是否 有差别? B:个体变异因素-不同个体间重量有否差 别? 方差分析变异的分解: SS总SS组间SS配伍 SS组内 , 总组间配伍 组内,2、变异的分解,总变异,组间变异,组内变异,配伍变异,3、方差分析过程,建立假设: 假设1:药物因素 0:三种药物作用后的肉瘤重量总体均数相等, H1:三种药物作用后肉瘤重量总体均数不等或不全等 =0.05 假设2:个体变异因素 0:5个区组重量的总体均数相等 H1: 5个区组重量的均数不等或不全等 =0.05,确定P值和做出结论,以1 =2,2 =8,查F界值表, 得P0.05, 按照=0.05的水准,拒绝0,而接受H1,可认为不同药物的肿瘤重量不同。 以1 =4,2 =8,查F界值表, 得P0.05, 按照=0.05的水准,拒绝0,而接受H1,可认为不同区组的重量不同。,两两比较及计算效应量的95%可信区间,药物因素(不同药物):两两比较的q检验及其均数差值的95%可信区间。,两两比较及计算效应量的95%可信区间,个体变异因素两两比较的q检验,以及计算均数差值的95%可信区间。?,4、设计方案与检验效能的关系,成组设计与配伍设计的区别在于后者考虑了个体变异因素,使检验效能增加。 配伍设计: 总变异=药物变异+个体(配伍)变异+组内变异 成组设计: 总变异=药物变异+(个体变异+组内变异) 设计阶段不能控制个体变异,可以测量后在分析阶段使用协方差分析。,组内变异,三、析因设计的方差分析,表4 家兔神经缝合后的轴突通过率(%),比较不同缝合方法及缝合后时间对轴突通过率的影响。,B因素(时间2水平) 缝合后1月 缝合后2月,2因素2水平析因试验示意图,A因素(缝合2水平) 外膜缝合 束膜缝合,组1:24 组2:44 组3:28 组4:52,1. A、B因素主效应,2.交互作用 :当某因素的各个单独效应随另一因素变化而变化时,则称这两个因素间存在交互作用(interaction)。,图2 两因素交互作用示意图,表5 家兔神经缝合后的轴突通过率(%),方差分析,表6 析因试验结果方差分析表,结论:尚不能认为两种缝合方法对神经轴突通过率有影响;可以认为缝合后2月与1月相比,神经轴突通过率提高。 鉴于析因设计需要样本量大且组间例数相等,用于临床试验不宜实现。,3、变异的分解,总变异,组间变异,组内变异,A,B,AB,四、交叉试验设计的方差分析,1、资料特点,交叉设计能均衡试验顺序的影响,同时把处理效应和时间先后顺序的效应区分开。 前后处理间有一洗脱期;适用于慢性并需要长期维持治疗的疾病。 总变异可以分成四部分, 即个体间变异,阶段间变异,处理间变异和误差变异。 SS总SS处理SS阶段SS个体+ SS误差 , 总处理阶段个体误差,例4 假定有12名高血压病人,要研究A B两种治疗方案的疗效差别.用随机的方法让其6名病人先以A法治疗,后用B法治疗,另外6名病人先以B法治疗,后用A法治疗,分别记录了如下的结果:,表7 12名病人用不同方法治疗血压的下降值,阶段 病人的编号 阶段合计 疗法合计 1 2 3 9 10 11 12 B B A B B B A I 23 10 33 8 17 26 18 240 252 A A B A A A B II 21 11 28 11 14 26 13 216 204 个体 合计 44 21 61 19 31 52 31 456 456,2、交叉试验变异的分解,总变异,处理间变异,阶段间变异,个体间变异,组内变异,表8 交叉设计方差分析结果,变异来源 SS MS F P 处理 96 1 96 4.57 0.05 阶段 24 1 24 1.14 0.05 个体 1008 11 91.36 4.36 0.05 误差 210 10 21 总变异 1338 23 从结果来看: 只有个体间的差异有统计学意义,不同治疗方案,不同阶段均无统计学意义。,六、方差分析的误用,例5 为观察764-3(丹参的有效成分)对低氧性肺动脉高压及右心室肥厚等是否有保护作用进行了如下试验: 取180-220G雄性大鼠141只,随机分成三组:即正常组,单纯低氧组,764-3处理低氧组 每组再分成2个小组,分别于3天,21天时处死大鼠,测量相关指标的数值。,表9 764-3对低氧所致右心室收缩压变化的影响,组别 收缩压(xSE) 3天 21天 对照 3.060.12 3.020.12 单纯低氧 3.370.12* 3.850.12* 764-3+低氧 3.350.15 3.330.09* 注: 原作者采用t检验分析资料,得:与对照组比, p0.05,* *P0.01,与单纯低氧组比p0.05。 存在的问题?,七、方差分析的小结,方差分析的目的是推断多个总体均数间有无差别: 不能检验那些有差别、那些无差别; 不能说明差别的显著程度;需通过两两比较,计算效应量及其95%可信区间; 两两比较不同于多个t检验比较.,两两比较的方法优选 事先设置比较: 检验水准校正法 Bonferroni(或Dunns)多重比较过程(次数较少) 界值扩大因子(与比较次数及自由度有关) ANOVA后Post hoc两两比较 非成对比较(Scheff过程) 任意两对均数比较(Tukey HSD, SNK) 多组干预与对照组比较(Dunnett) 建议不要使用: LSD Duncan,根据设计类型选择具体方差分析方法. 设计方案决定检验效能的大小 成组设计; 配伍设计; 交叉设计; 析因设计; 拉丁方设计; 正交设计,方差分析要求: 基本条件:资料的正态性、方差齐性、独立性 其中对方差齐性要求最高,采用Levene检验 若方差不齐,变量变换(四种),否则秩和检验 额外条件:均衡性、效应可加性;,考察各组均数与方差的关系,变量变换的参考依据,第二部分 秩和检验,参数统计:总体分布类型已知,对总体参数进行估计或检验。 非参数统计:总体分布类型未知或已知分布类型与其应用条件不符,并非是参数间的比较,而是用于分布间的比较。,一、“应用条件”,优:非参数检验不受总体分布的限定,且对等级资料、不能被准确测量的资料、有不确定值的资料等均可进行。 劣:与参数检验相比,检验效能降低。 根据不同的资料特点与设计类型选用不同秩和检验方法。,二、秩和检验,配对设计数值变量资料的秩和检验(Wilcoxon配对法,1945) 例6 某研究者对病人治疗前后的生存质量进行了测量,资料见下,问病人生存质量治疗前后有无变化?,表8 病人治疗前后的生存质量评分,病人编号 治疗前 治疗后 评分差值 秩次 1 7 10 3 +9 2 7 9 2 +6 3 7 7 0 4 6 7 1 +3 5 7 10 3 +9 6 7 6 -1 - 3 7 8 9 1 +3 8 2 6 4 +11 9 9 8 -1 - 3 10 6 9 3 +9 11 4 6 2 +7 12 6 6 0 13 6 7 1 +3,秩和检验的基本步骤,建立假设: 0:生存质量差值的总体中位数Md =0 H1:Md 0 =0.05 计算差值并编秩:依差值的绝对值从小到大编秩,再根据差值的正负给秩次冠以正负号;差值为0时不编秩;差值相等符号相同仍按顺序编秩;差值相等符号不同取平均秩次。 求秩和并确定检验统计量:分别计算正、负秩次之和,任取其一为T。 确定P值和做出推断结论:当n50时,超出T界值表范围,采用正态近似法。,成组设计两样本比较的秩和检验(Wilcoxon两样本比较法),例7 某实验室观察局部温热治疗小鼠移植性肿瘤的疗效,以生存日数作为观察指标,实验结果见下表,试检验两组小鼠生存日数有无差别?,表9 两组小鼠发癌后生存天数,实验组 对照组 生存天数 秩次 生存天数 秩次 10 9.5 2 1 12 12.5 3 2 15 15 4 3 15 16 5 4 16 17 6 5 17 18 7 6 18 19 8 7 20 20 9 8 23 21 10 9.5 90以上 22 11 11 12 12.5 13 14,资料特点与基本步骤,两组比较成组设计资料,存在截尾值。 基本步骤: 1:建立假设:0:两组小鼠生存天数总体分布相同 H1: 两组小鼠生存天数总体分布不同 =0.05 2:编秩及计算秩和: 将两组数据由小到大统一编秩。原始数据相同时,若相同数据在同一组按顺序编秩;若相同数据在不同组时,取平均秩次。当两组样本例数不等时,以样本例数较小者的秩和为T;当例数相等时,任取其中一个秩和为T。 3:确定P值和做出推断结论: 当n111,n2-n111时,查T界值表,T分布同上;当样本量较大超出T界值表范围时,采用正态近似法。,多组比较的秩和检验,1、多组成组设计的秩和检验及两两比较 Kruskal-Wallis检验 两两比较采用Wilcoxon两组比较秩和检验+ 2、配伍设计的秩和检验及两两比较 Friedman秩和检验 两两
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 孕期离婚协议模板定制与婚姻财产分割指导合同
- 离婚房产归女方协议书:女方权益保障范本
- 离婚协议书范本:无子女双方协议书
- 石家庄市二手房买卖交易合同终止后权益保障协议
- 离婚协议6865I版:财产分割及债务处理细则
- 城市综合体物业管理与能源采购合同
- 食品企业生产信息保密及食品安全责任合同
- 班组级安全培训内容模板课件
- 小班教学水果课件
- 2025年病理生理学乳腺组织病理变化模拟考试卷答案及解析
- 不交社保劳动合同模板
- 2024年云南省中考数学试题(含答案)
- GB 14102.1-2024防火卷帘第1部分:通用技术条件
- 越野跑策划方案
- 《光学含沙量测量仪率定规范》
- 高考日语应用文写作失物招领寻物启事课件
- 产值计算方案
- 冬季抢工措施方案
- 运用PDCA循环降低急诊科医护人员职业暴露发生率
- 充电桩施工组织设计
- 静脉治疗护理技术操作标准2023
评论
0/150
提交评论