医学统计学--方差分析_第1页
医学统计学--方差分析_第2页
医学统计学--方差分析_第3页
医学统计学--方差分析_第4页
医学统计学--方差分析_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,掌握内容:,1、方差分析的基本思想,2、完全随机设计的单因素方差分析,3、随机区组设计的两因素方差分析,熟悉内容:,1、多个样本均数间的多重比较,第四章方差分析,2,第一节方差分析的基本思想,1、方差分析的意义,前述的t检验和u检验适用于两个样本均数的比较,对于k个样本均数的比较,如果仍用t检验或u检验,,需比较,次,,如四个样本均,数需比较6次。假设每次比较所确定的检验水准,则每次检验拒绝H0不犯第一类错误的概率,为1-0.05=0.95;,那么6次检验都不犯第一类错误的,概率为(1-0.05)6=0.7351,而犯第一类错误的概率为0.2649,3,目的:推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的总体差异是否有统计学意义.,方差分析(analysisofvariance,ANOVA)由英国统计学家R.A.Fisher首先提出,以F命名其统计量,故方差分析又称F检验或变异数分析。,4,1.成组设计的的方差分析,即单因素方差分析。,2.随机区组设计(配伍组设计)的方差分析,即两因素方差分析。,两类方差分析的基本步骤相同,只是变异的分解方式不同;,5,2.方差分析的基本思想,表5.1试验结果示意,方差分析是将试验结果的变异进行分解,以单因素方差分析为例。它将总的变异分解为两部分,即组间变异和组内变异。因此,全部试验结果存在三种不同种变异。,6,1)总变异总变异可用离均差平方和(sumofsquaresofdeviationfrommean,SS)表示,记为SS总,v总是总变异的自由度。,离均差平方和受观察值个数影响,即与v总=N-1有关,,7,各处理组间的均数大小也不同,这种变异称为组间变异。其大小可用组间均数与总均数的离均差平方和表示:,2)组间变异,自由度,8,3)组内变异各处理组内部观察值也大小不等,这种变异称为组内变异。其大小可用个体观察值与组均数的离均差平方和表示,记为SS组内:,自由度,9,4)三种变异的关系,数理统计证明,总离均差平方和等于各部分离均差平方和之和,即:,=N-1=(k-1)+(N-k)=,10,通过上述分解可以看出,方差分析的基本思想就是根据资料的设计类型,将全部观测值的总变异按影响结果的诸因素分解为相应的若干部分变异,构造出反映各部分变异作用的统计量,在此基础上,构建假设检验统计量,以实现对总体参数的推断。,11,方差分析是将总变异分解为组间变异(处理因素)和组内变异(随机误差),即:SS总=SS组间+SS组内,而其大小又与自由度有关系;故则有v总=N-1=(k-1)+(N-k)=v组间+v组内,常用各自的均方来表示其变异;MS组间=SS组间/v组间;MS组内=SS组内/v组内。,12,4.1,13,方差分析的统计量F值计算如下:,成组设计的单因素方差分析资料:F=MS组间/MS组内;结果判断:以F,(v1,v2)查F界值表,再与统计量F比较,并确定P值而作出结论:若FF,(v1,v2),P,则不拒绝H0;若FF,(v1,v2),P,则拒绝H0;,14,表5.2单因素方差分析计算公式,15,4.方差分析的应用条件,(1)可比性,若资料中各组均数本身不具可比性则不适用方差分析。(2)正态性,即偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。(3)方差齐性,即若组间方差不齐则不适用方差分析。多个方差的齐性检验可用Bartlett法,它用卡方值作为检验统计量,结果判断需查阅卡方界值表。,16,5.方差分析的基本步骤,(1)建立检验假设、确定检验水准:H0:多个样本总体均数相等H1:多个样本总体均数不等或不全相等=0.05(2)计算检验统计量F值;(3)查F界值表、确定P值并作出推断结果。,17,第二节完全随机设计的方差分析,完全随机设计(completelyrandomdesign)不考虑个体差异的影响,仅涉及一个处理因素,所以亦称单因素实验设计或单因素方差分析(one-wayANOVA)。在实验研究中按随机化原则将受试对象随机分配到一个处理因素的多个水平中去,然后观察各组的试验效应;,18,例5.1用四种不同的饲料喂养大白鼠,每组4只,然后测其肝重占体重的比值。试比较四组均数间有无差异。饲料ABD2.622.822.913.922.232.763.023.002.362.433.283.322.402.733.183.04,19,基本步骤:,(1)建立检验假设、确定检验水准:H0:1=2=3=4H1:1,2,3,4不等或不全相等=0.05(2)计算下表下半部基本数据:(3)按照表5.2中的公式计算各指标和检验统计量F值;(4)以F,(v1,v2)查F界值表、确定P值并作出推断结果(见表4.3)。,20,表5.3四组均数间测定结果比较-A-2.622.822.913.92Xij2.232.763.023.002.362.433.283.322.402.733.183.04-Xij9.6110.7412.3913.2846.02(X)ni444416(N)Xi2.40252.68503.09753.32002.8763(X)X2ij23.166928.927838.459344.6304135.1844(X2)-,21,-变异来源SSvMSFP-组间2.0230.6710.24F0.01,(3,12)=5.95,得P0.01,按=0.05水准拒绝H0,接受H1,故可认为四种不同饲料喂养后大白鼠肝/体比值的均数不同;应注意此结论并不表示每两组均数间均不同;若要分析则应作两两均数比较分析(见第四节);,23,第三节随机区组设计的方差分析,随机区组设计(randomizedblockdesign)考虑了个体差异的影响,可分析处理因素和个体差异对实验效应的影响,所以又称两因素实验设计(亦称配伍组设计),它比完全随机设计的检验效率高。,24,该设计是将受试对象先按配比条件配成配伍组(如动物实验时,可按同窝别、同性别、体重相近进行配伍),每个配伍组有三个或三个以上受试对象,再按随机化原则分别将各配伍组中的受试对象分配到各个处理组。,25,随机区组设计的两因素方差分析是把总变异中的离均差平方和SS与自由度分别分解成处理间、区组间和误差三部分,其计算公式见表5.5。,26,表5.5两因素方差分析的计算公式,27,例5.215名贫血儿童治疗前后不同时间Hb含量(g/L)见表5.6,请分析不同治疗时间各患者的Hb含量的差异有无统计学意义?,28,表5.615名贫血儿童治疗前后不同时间Hb含量(g/L)-治疗后时间(月)患者号治疗前后-Xij123-1115104120120459Xb2-15-,29,基本步骤:,(1)建立检验假设、确定检验水准:H0:4个不同治疗时间贫血儿童Hb含量的总体均数相等H1:4个不同治疗时间贫血儿童Hb含量的总体均数不等或不全相等=0.05H0:15个配伍组间贫血儿童Hb含量总体均数相等H1:15个配伍组间贫血儿童Hb含量总体均数不等或不全相等=0.05(2)计算表5.6下半部基本数据:(3)按照表4.5中的公式计算各指标和检验统计量F值;(4)以F,(v1,v2)查F界值表、确定P值并作出推断结果(见表5.7)。,30,-变异来源SSvMSFP-处理间3754.4531251.4840.580.01配伍间5276.8314376.9212.22F0.01,(3,42)=4.29,得PF0.01,(14,42)=2.54,得P0.01,按=0.05水准拒绝H0,接受H1,故可认为各贫血儿童Hb含量也是不同的;,32,第四节多个样本均数间的多重比较,经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。此时,若要得到各组均数间更详细的信息,应在方差分析的基础上,进行多个样本均数间的两两(多重)比较。,目的:是推断差别究竟存在于哪些总体均数之间。,33,1.常用多个样本均数间的多重比较方法,1)检验某几个特定的总体均数间是否相等:2)多个实验组(处理后组)与一个对照组(处理前组)总体均数间两两比较;3)某几个实验组(处理后组)总体均数间两两比较;,34,适用于多个样本均数间均作两两比较;统计量q的计算公式为:,2.SNK-q检验,式中为方差分析误差项均方;nA、nB分别为两样本的样本含量。,35,在计算时应先将各组按样本均数从大到小排序或从小到大排序;,计算各对比组均数的差值,计算各对比组均数差值的标准误,计算统计量q;,确定组数a;,查q界值。,q检验的一般计算步骤:,36,对例5.1作两两比较:1.H0:任意两总体均数相等,即A=BH1:任意两总体均数不相等,即AB=0.052.选择检验方法,计算统计量将样本均数从小到大排列,并编上组次、组别:组次1234均数3.323.092.682.40组别DCBA,37,表5.8四个样本均数两两比较的q检验,-对比组两均数之差标准误q值组数q界值PA与BxA-xBsxA-xBa0.050.01-1:40.910.127.1444.205.500.052:40.690.125.4033.775.050.05-,38,3.确定P值,判断结果按=0.05的水准,1:2(C:D)和3:4(A:B)差异无显著性;其他任两种饲料间差别均有显著性,,可认为喂C,D饲料的大白鼠肝/体比值较喂A,B号的高。,39,第五节变量变换,参数统计分析方法对资料有一定的要求,如t检验和方差分析要求样本来自正态分布总体,并且方差齐同;直线相关(回归)分析要求两变量间呈直线关系。但实际工作中并非所有的统计资料都能满足参数统计分析方法的条件;对于不能满足条件的资料,则不能直接应用参数统计分析方法,否则有可能导致错误的结论。,40,解决的办法:一是通过适当的变量变换,使之达到方法的要求,这是本节所要介绍的方法;二是选用非参数统计分析方法。一般情况下,若能通过变量变换使资料符合参数方法条件时,应尽量用参数统计方法。,41,常用的变量变换方法有,1对数变换(transformationoflogarithm)将原始数据X取对数,以其对数值作为分析变量。,对数变换的用途:使服从对数正态分布的资料正态化;使方差不齐且各组的接近的资料达到方差齐的要求;使曲线直线化,常用于曲线拟合。,42,2平方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论