医学统计学第七章方差分析_第1页
医学统计学第七章方差分析_第2页
医学统计学第七章方差分析_第3页
医学统计学第七章方差分析_第4页
医学统计学第七章方差分析_第5页
已阅读5页,还剩56页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学第七章方差分析

第七章方差分析

方差分析(analysisofvariance,ANOVA)是英国著名统计学家R.A.Fisher在20世纪20年代提出的一种统计学分析方法,为纪念Fisher,又称F检验。用途:适用于多个样本均数间的比较。[主要内容]第一节方差分析的基本思想和应用条件第二节多个样本方差齐性检验和变量变换第三节

完全随机设计资料的方差分析第三节随机区组设计资料的方差分析第四节多个样本均数间的两两比较

1.掌握

方差分析的基本思想和应用条件;完全随机设计资料的方差分析;随机区组设计资料的方差分析。2.熟悉

多个样本均数间的两两比较方法:SNK-q检验;Dunnett-t检验。3.了解

多个样本方差齐性检验;变量变换。[学习目标]

第一节方差分析的基本思想和应用条件一、方差分析的基本思想二、方差分析的应用条件1.根据变异的来源把全部观察值之间的变异(即总变异),按研究目的和设计类型分解成两个或多个组成部分;2.除随机误差外,其余每个部分的变异可以由某个因素的作用(或某几个因素的交互作用)加以解释,如组间变异可由处理因素的作用加以解释。3.通过不同变异来源的均方与误差均方比值大小的比较,借助F分布做出统计推断,从而判断各研究因素对观察指标有无影响。一、方差分析的基本思想例7-1某研究者为研究一种降脂新药物的临床疗效,按统一纳入标准选择了某地年龄相同、体重接近的36例高脂血症患者,随机分为3组,每组12例,分别为对照组、低剂量降脂药物组和高剂量降脂药物组,服用一个月后,测定血清总胆固醇(mmol/L),结果见表7-1,试分析三组患者的血清总胆固醇有无差别?表7-1三种不同处理水平患者的血清总胆固醇(mmol/L)表7-1上半部分为原始数据,每个原始数据可用表示

下标i表示处理组号,i=1,2,3,…k,本例k=3,

下标j表示各组内观察单位序号,j=1,2,3,…ni

,本例ni

=12。表7-1下半部分为与上半部分原始数据有关的合计数,分别为:(一)变异分解观测值之间的差异可以分为以下三种变异:1.总变异(totalvariation):即全部数据之间的变异2.组间变异

(variationbetweengroups):即各个处理组间的变异3.组内变异(variationwithingroups):即同一处理组内数据间的变异1.总变异用总离均差平方和表示,即各测量值与总均数差值的平方和,记为。反映了所有测量值之间总的变异情况计算公式为:,(7-1)式中,N为总观察例数2.组间变异可用各组样本均数与总均数的离均差平方和表示,记为。该变异既包含了各处理组不同处理水平的影响,同时也包括了随机误差。计算公式为:,(7-2)式中ni为各处理组样本例数,k为处理组数。

3.组内变异

可用组内各测量值Xij与所在组的均数的离均差平方和表示,记为。该变异仅反映了随机误差,又称误差变异。计算公式为:

(7-3)离均差平方和与自由度变异分解:总离均差平方和可以分解为组间离均差平方和及组内离均差平方和,即(7-4)相应的总自由度也分解为组间自由度和组内自由度,即(7-5)(二)变异比较与分析

——计算统计量F值→借助F分布,做出统计推断1.计算统计量F值:(1)统计量F值的计算公式为:

,(7-8)式中MS:即均方,是各部分的离均差平方和除以各自的自由度所得比值,称为均方差,简称均方(meansquare)。(2)组间均方和组内均方的计算公式分别为:

(7-6),(7-7)2.借助F分布,做出统计推断(1)F统计量服从F分布,F分布有两个自由度,ν1为组间自由度,ν2为组内自由度,记为Fa(ν1,

ν2)

(2)由F界值表(附表4),可查出按所取的检验水准α,供方差分析用的单侧F界值,作为判断统计量F大小的标准。

如F≥时,则P≤0.05,拒绝H0,接受H1,说明各样本来自不全相同的总体,即认为各样本的总体均数不全相同。

相反,如时,则P>0.05,不拒绝H0,尚不能认为各样本的总体均数不全相同的结论。

F值越大,P

值越小,拒绝H0的理由越充分。二、方差分析的应用条件

(一)方差分析的应用条件1.各样本是互相独立的随机样本,均服从正态分布。2.各样本的总体方差相等,即具有方差齐性(homogeneityofvariance)。对于非正态分布或方差不齐的资料可进行变量变换变为正态或接近正态后再进行方差分析,或者采用秩和检验进行分析。第二节多个样本方差齐性检验和变量变换一、多个样本方差齐性检验二、变量变换一、多个样本方差齐性检验——Bartlett检验

1.

Bartlett检验的基本思想2.统计量值的计算公式3.举例说明Bartlett检验的步骤1.

Bartlett检验的基本思想将各组的样本方差之和除以方差个数得合并方差;假如各组总体方差相等,那么,各组样本方差与合并方差相差不会很大,其统计量值也不会很大,即出现大的值的可能性很小;反之,如果各组总体方差不相等,就会出现大的值,因而有理由拒绝原假设。2.统计量值的计算公式式中是各比较组的方差,为合并方差(即误差的均方MS组内或MS误差),k是参加比较的组数,为各组的样本含量,N为总观测例数。例7-2

对例7-1中三组资料做方差齐性检验。Bartlett检验要求资料具有正态性。二、变量变换变量变换:是将原始数据作某种函数转换,如转换为对数值。用途:对于明显偏离正态性或方差齐性条件的资料,常采用变量变换(datatransformations)或改用秩变换的非参数统计(nonparametricstatistics)方法。目的:①使资料转为正态分布;②使各组达到方差齐性;③曲线直线化。以满足t检验或方差分析的应用条件。常用的变量变换方法:对数变换(logarithmictransformation)、平方根变换(squareroottransformation)、倒数变换(reciprocaltransformation)、平方根反正弦变换(arcsinesquareroottransformation)等。变量变换虽然改变了资料分布的形式,但不改变各组资料间的关系。表7-2常用变量变换方法及其应用第三节完全随机设计资料的方差分析一、完全随机设计的特点二、变异分解三、分析步骤一、完全随机设计的特点完全随机设计(completelyrandomizeddesign)是采用完全随机化的分组方法,将同质的受试对象分配到各处理组分别接受不同的处理,比较各组均数之间的差别有无统计学意义,推断处理因素的效应。特点:完全随机设计只考察一个处理因素,是单因素多水平的实验设计方法,又称为单因素方差分析(one-wayANOVA)。例7-1资料设计分析某研究者为研究一种降脂新药物的临床疗效(1)采用完全随机的分组方法:将统一纳入标准选择的某地年龄相同、体重接近的36例高脂血症患者随机分为3组,每组12例分别接受不同处理(2)单因素多水平的处理因素:对照组、低剂量降脂药物组和高剂量降脂药物组。(3)差别比较,推断处理因素的效应:一个月后,比较三组患者的血清总胆固醇有无差别,推断该降脂新药的效应。二、变异分解完全随机设计方差分析的总变异可分为组间变异和组内变异两部分。变异分解:见表7-3完全随机设计方差分析表表7-3完全随机设计资料的方差分析表表中校正数:三、分析步骤——结合例7-1说明完全随机设计资料方差分析的基本步骤:

当k=2时,完全随机设计方差分析结果与两样本均数比较的t检验等价,有。第四节随机区组设计资料的方差分析一、随机区组设计的特点二、变异分解三、分析步骤一、随机区组设计随机区组设计(randomizedblockdesign)又称配伍组设计,即先将受试对象按自然属性(如动物的窝别、体重,病人的年龄、性别、病情等影响结果的非处理因素)相同或相近的原则配成区组(配伍组),再分别将各个区组中的受试对象随机分配到各处理或对照组。特点:既要考察处理因素的作用,还要考察区组的作用,统计分析处理因素和区组因素各个水平组间均数有无统计学意义,因而又称为双因素方差分析(two-wayANOVA)。例7-3为了解不同饲料对肝脏的影响,将24只大白鼠按窝别、体重分成8个配伍组,每个配伍组的3只大白鼠随机分配到3个处理组,分别用三种不同的饲料喂养60天后,测定其肝重占体重的比值(%),结果见表7-5,试比较三种不同饲料喂养后肝重占体重的比值有无差异?表7-5三种饲料喂养的大白鼠肝重占体重比值(%)例7-3资料设计分析研究因素有两个:

处理因素:三种不同的饲料

区组因素:大白鼠将第j(j=1,2,…,b)区组的受试对象随机分配接受处理因素第i(i=1,2,…,k)水平的处理本例:总例数N=b×k,b为区组数,k为处理组数二、变异分解1.随机区组设计方差分析的总变异分为处理组变异、区组变异和误差三部分,即:(7-10)(7-11)2.变异分解:见表7-6随机区组设计资料的方差分析表表7-6随机区组设计资料的方差分析表三、分析步骤—以例7-3说明随机区组设计方差分析的步骤三、分析步骤—以例7-3说明随机区组设计方差分析的步骤

当k=2时,随机区组设计方差分析与配对设计资料的t检验等价,有。注意:方差分析的结果拒绝H0,接受H1,不能说明各组总体均数间两两均有差别。如果要分析哪两组间有差别,可进行多个均数间的两两比较。随机区组设计确定区组因素应是对研究结果有影响的非处理因素。区组的选择原则:区组间差别越大越好,区组内差别越小越好。当区组间差别有统计意义时,这种设计的误差比完全随机设计小,试验效率得以提高。第五节多个样本均数间的两两比较一、SNK-q检验二、Dunnett-t检验多个样本均数间的两两比较不能用t检验进行两两比较。由于涉及的对比组数大于2,若仍用两样本均数比较的t检验对资料进行两两比较,将会增大犯第I类错误(把本无差别的两个总体均数判为有差别)的概率。一、SNK-q检验

(一)基本概念

SNK-q检验,又称q检验,其中SNK为Students-Newman-Keuls三个人姓氏的缩写,适用于多个样本均数两两之间的全面比较的探索性研究。1.检验统计量为q

2.自由度为方差分析表中误差自由度

3.查q界值表。检验统计量q值计算公式(7-12)(7-13)(二)分析步骤—结合例7-1说明SNK-

q检验的分析步骤

例7-4对例7-1资料三组总体均数进行两两比较。二、Dunnett-t检验(一)基本概念Dunnett-t检验适用于k-1个处理组与一个对照组均数差别的两两比较。1.检验统计量为tD2.自由度为方差分析表中误差自由度3.查Dunnett-t界值表Dunnett-t检验——检验统计量tD的计算公式为

(7-14)(7-15)式中,、为处理组的样本均数和样本例数,、为对照组的样本均数和样本例数,为两比较组均数差值的标准误,为方差分析中算得的误差均方,计算出t值后,根据误差自由度、处理组数T=k-1(不包括对照组)以及检验水准查附表6(Dunnett-t界值表),确定P值,作出结论。(二)分析步骤例7-5

对例7-1资料,问低剂量降脂药物组和高剂量降脂药物组与对照组比较,其血清总胆固醇总体均数是否不同?学习小结

1.本章介绍了方差分析的基本思想和应用条件;同时介绍常用的多个样本方差齐性检验方法——Bartlett检验和常用的变量变换方法。

2.学习了完全随机设计资料的方差分析、

随机区组设计资料的方差分析、多个样本均数间的两两比较——SNK-q检验和Dunnett-t检验。学习小结

3.方差分析过程流程图可概括如下:一、最佳选择题

1.完全随机设计的方差分析中,必然有

A.SS组间>SS组内

B.MS总=MS组间+MS组内

C.SS总=SS组间+SS组内

D.MS组间<MS组内

E.ν组间>ν组内2.完全随机设计资料的变异分解过程中,以下哪项描述不正确A.SS总=SS组间+SS组内

B.MS总=MS组间+MS组内

C.ν总=ν组间+ν组内

D.MS组间=SS组间/ν组间E.MS误差=MS组内复习题3.完全随机设计的方差分析中,有A.MS组内>MS误差

B.MS组间<MS误差C.MS组间=MS误差

D.MS组内=MS误差E.MS组间<MS组内4.完全随机设计方差分析的实例中,当H0为,则H1为:

A.B.C.D.E.

以上说法都不对复习题5.随机区组设计资料的方差分析将总变异分为A.组间变异、组内变异两部分B.处理、区组、误差三部分C.标准差、标准误两部分D.抽样、系统、随机测量三部分E.以上说法都不对6.随机区组设计的方差分析中,处理组F值的计算公式是

A.MS区组/MS处理

B.MS处理/MS区组

C.MS处理/MS误差

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论