医学统计学第4讲方差分析_第1页
医学统计学第4讲方差分析_第2页
医学统计学第4讲方差分析_第3页
医学统计学第4讲方差分析_第4页
医学统计学第4讲方差分析_第5页
已阅读5页,还剩110页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、高文龙高文龙兰州大学公共卫生学院兰州大学公共卫生学院第第4章章 方差分析方差分析q第第1节节 方差分析的基本思想方差分析的基本思想q第第2节节 单因素方差分析单因素方差分析q第第3节节 双因素方差分析双因素方差分析q第第4节节 析因设计的方差分析析因设计的方差分析q第第5节节 重复测量资料的方差分析重复测量资料的方差分析q第第6节节 多个样本均数的两两比较多个样本均数的两两比较q第第7节节 多个方差的齐性检验多个方差的齐性检验学习要求学习要求1.掌握方差分析的基本思想;2.掌握单因素、双因素、两阶段、析因设计和重复测量资料方差分析的应用条件、意义及计算方法;3.熟悉多个均数间两两比较的意义及方

2、法;4.了解方差齐性检验的意义及方法;5.熟悉变量变换的意义和方法。第第1节节 方差分析的基本思想方差分析的基本思想 方差分析(方差分析(analysis of variance,缩写为,缩写为ANOVA)是常用的统计分析方法之一。其)是常用的统计分析方法之一。其应用广泛,分析效率高,节省样本含量。应用广泛,分析效率高,节省样本含量。什么是方差?什么是方差? 方差方差 变异变异离均差平方和(SS)自由度总体方差总体方差样本方差样本方差 例例4-1:某医生为研究一种四类降糖新药的疗:某医生为研究一种四类降糖新药的疗效,选择了效,选择了60名名II型糖尿病患者,按完全随机设型糖尿病患者,按完全随机

3、设计方案将患者分为三组进行双盲临床试验。其计方案将患者分为三组进行双盲临床试验。其中,降糖新药高剂量组中,降糖新药高剂量组21人、低剂量组人、低剂量组19人、人、对照组对照组20人。对照组服用公认的降糖药物,治人。对照组服用公认的降糖药物,治疗疗4周后测得其餐后周后测得其餐后2小时血糖的下降值小时血糖的下降值(mmol/L)结果如下表:问治疗结果如下表:问治疗4周后餐后血糖下降值各组周后餐后血糖下降值各组的平均水平是否不同?的平均水平是否不同?表4-1 2型糖尿病患者治疗4周后2小时血糖下降量(mmol/L)分析资料的基本情况分析资料的基本情况 处理因素:不同方式给处理因素:不同方式给(降糖降

4、糖)药药 因素水平:降糖新药高剂量组、降糖新药低剂量组、因素水平:降糖新药高剂量组、降糖新药低剂量组、对照组(公认降糖药物)对照组(公认降糖药物) 观测指标:餐后观测指标:餐后2小时血糖下降值小时血糖下降值 目目 的:通过比较不同组给药方式后餐后的:通过比较不同组给药方式后餐后2小时血小时血糖下降值存在的差异,从而判断不同剂量新药和对糖下降值存在的差异,从而判断不同剂量新药和对照药物治疗照药物治疗2型糖尿病患者的疗效是否相同。型糖尿病患者的疗效是否相同。试验数据中存在的变异试验数据中存在的变异总变异(总变异(Total variation) 全部测量值全部测量值Xij与总均数与总均数 间的差别

5、间的差别 ,反映了所有测量值之间总的变异程度。反映了所有测量值之间总的变异程度。 X 2TSSXX 组间变异(组间变异( between group variation ) 各组的均数各组的均数 与总均数与总均数 间的差异。间的差异。XiXSSSS组间反映了各组均数组间反映了各组均数 间的变异程度间的变异程度组间变异随机误差组间变异随机误差+ +处理因素效应处理因素效应 iXmi mmi m组间变异组间变异 SSB22()XX 21()XX 23()XX 1X2X3XX2()BetweeniiSSn XX lSum of squares between groupsn1 n2 n3 组内变异(

6、组内变异(within group variation ) 每组的原始数据与该组均数每组的原始数据与该组均数 的差的差异。异。iX 在同一处理组内,虽然每个受在同一处理组内,虽然每个受试对象接受的处理相同,但测量值试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变仍各不相同,这种变异称为组内变异。异。SSSS组内仅仅反映了随机误差的组内仅仅反映了随机误差的影响。也称影响。也称SSSS误差误差 m i m i变异的分解组间变异组间变异总变异总变异组内变异组内变异三种三种“变异变异”之间的关系之间的关系组内组内组间组间总总SSSSSS+=, 且 总 =组间 +组内 组组内内变变异异 SS

7、组组内内: 随随机机误误差差 组组间间变变异异 SS组组间间:处处理理因因素素 + 随随机机误误差差 变异程度除与离均差平方和的大小有关外,变异程度除与离均差平方和的大小有关外, 还与其自由度有关,由于各部分自由度不相等,还与其自由度有关,由于各部分自由度不相等, 因此各部分离均差平方和不能直接比较,须将因此各部分离均差平方和不能直接比较,须将 各部分离均差平方和除以相应自由度,其比值各部分离均差平方和除以相应自由度,其比值 称为均方差,简称均方称为均方差,简称均方(mean square,MS)。组。组 间均方和组内均方的计算公式为间均方和组内均方的计算公式为: SSMS组间组间组间 SSM

8、S组内组内组内 分析变异分析变异方差比的分布!误差变异误差变异处理因素变异组内组间MSMSF 基本思想:根据实验设计的类型,将全部基本思想:根据实验设计的类型,将全部观测值总的离均差平方和及其自由度分解观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如组某几个因素的交互作用)加以解释,如组间变异间变异SS组间可由处理因素的作用加以解组间可由处理因素的作用加以解释。通过比较不同变异来源的均方,借助释。通过比较不同变异来源的均方,借助F

9、分布作出统计推断,从而推论各种研究因分布作出统计推断,从而推论各种研究因素对试验结果有无影响。素对试验结果有无影响。一、方差分析的用途及应用条件一、方差分析的用途及应用条件 主要用途主要用途 进行两个或两个以上样本均数的比较;进行两个或两个以上样本均数的比较; 可以同时分析一个、两个或多个因素对可以同时分析一个、两个或多个因素对试验结果的作用和影响;试验结果的作用和影响; 分析多个因素的独立作用及多个因素之分析多个因素的独立作用及多个因素之间的交互作用;间的交互作用; 进行两个或多个样本的方差齐性检验等。进行两个或多个样本的方差齐性检验等。 应用条件应用条件 方差分析对分析数据的要求及条件比较

10、方差分析对分析数据的要求及条件比较严格,即要求各样本为随机样本,各样本严格,即要求各样本为随机样本,各样本来自正态总体,各样本所代表的总体方差来自正态总体,各样本所代表的总体方差齐性或相等。齐性或相等。v处理因素可分为若干个等级或不同类型,通常称为水平。在不同的水平下进行若干次试验并取得多个数据,可以将在每个水平下取得的这些数据看作一个样本。若某个因素有四个水平,每个水平的数据代表一个样本,则获得四个样本的数据。 v设有k个相互独立的样本,分别来自k个正态总体x1,x2,xk,且方差相等,即要求检验假设v假设的意义为,在某处理因素的不同水平下,各样本的总体均数相等。 222221kkHmmm2

11、10:二、方差分析变异分解过程二、方差分析变异分解过程 1.设某因素有g个水平,即试验数据产生g个样本;每个样本有ni个观测。由多个样本的全部数据可以计算出总变异,称为总的离均差平方和。即SS总。 2.数理统计证明,SS总可以由几个部分构成。单因素方差分析中,SS总由组间变异和组内变异构成。 SS总SS组间SS组内 3.组间变异主要受到处理因素和个体误差两方面影响,组内变异主要受个体误差的影响。当H0为真时,由于处理因素不起作用,组间变异只受个体误差的影响。此时,组间变异与组内变异相差不能太大。 4.各种变异除以相应的自由度,称为均方,用MS表示,也就是方差。当H0为真时,组间均方与组内均方相

12、差不大,两者比值F值约接近于1。即 F组间均方组内均方1。 5.当H0不成立时,处理因素产生了作用,使得组间均方增大,此时,F1,当大于等于F临界值时,则P0.05可认为H0不成立,各样本均数不全相等。1. 单因素方差分析(one-way ANOVA):也称为完全随机设计(completely random design)的方差分析。该设计只能分析一个因素下多个水平对试验结果的影响。2. 双因素方差分析(two-way ANOVA):称为随机区组设计(randomized block design)的方差分析。该设计可以分析两个因素。一个为处理因素,也称为列因素;一个为区组因素,也称为行因素。

13、三、方差分析的类型三、方差分析的类型3. 三因素方差分析: 也称为拉丁方设计(Latin square design)的方差分析。该设计特点是,可以同时分析三个因素对试验结果的作用,且三个因素之间相互独立,不能有交互作用。4. 析因设计(factorial design)的方差分析: 当两个因素或多个因素之间存在相互影响或交互作用时,可用该设计来进行分析。该设计不仅可以分析多个因素的独立作用,也可以分析多个因素间的交互作用,是一种高效率的方差分析方法。5.正交试验设计的方差分析 : 如果要分析的因素有三个或三个以上,可进行正交试验设计(orthogonal experimental desig

14、n)的方差分析。当分析因素较多时,试验次数会急剧增加,用此设计进行分析则更能体现出其优越性。该设计利用正交表来安排各次试验,以最少的试验次数,得到更多的分析结果。第第2 2节节 单因素方差分析单因素方差分析 1.特点 单因素方差分析是按照完全随机设计的原则将处理因素分为若干个不同的水平,每个水平代表一个样本,只能分析一个因素对试验结果的影响及作用。其设计简单,计算方便,应用广泛,是一种常用的分析方法,但其效率相对较低。该设计中的总变异可以分出两个部分,即SS总SS组间SS组内。 2. 变异来源 SS总:表示变异由处理因素及随机误差共同所致; SS组间:表示变异来自处理因素的作用或影响; SS组

15、内:表示变异由个体差异和测量误差等随机因素所致。 例例4-2:某医生为了研究一种降血脂新药的临床疗:某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择效,按统一纳入标准选择120名高血脂症患者,采名高血脂症患者,采用完全随机设计方法将患者等分为用完全随机设计方法将患者等分为4组,进行双盲组,进行双盲试验。试验。6周后测得低密度脂蛋白作为试验结果,见周后测得低密度脂蛋白作为试验结果,见表表4-2。问。问4个处理组患者的低密度脂蛋白含量总个处理组患者的低密度脂蛋白含量总体均数有无差别?体均数有无差别?表4-2 四个处理组低密度脂蛋白测量值(mmol/L)221122111111=-=1ii

16、iingijnnngggijijijijijijijxSSxxxxCNN总总22221111111=-=1iiinnngijijijgggjijjiiiiiiixxxSSn xxCnNng组间组间变异分解:变异分解:=-=-SSSSSSN g处 理组 内总处 理组 内总211ingijijxCN整理如下表:表4-3 完全随机设计资料的方差分析表例4-2 计算2nxxx 假设检验假设检验 (1) 建立检验假设建立检验假设 H0:四个处理组低密度脂蛋白总体均数相同,四个处理组低密度脂蛋白总体均数相同,12 3; H1:四个处理组低密度脂蛋白总体均数不全四个处理组低密度脂蛋白总体均数不全相同。相同。

17、 0.05, (2) 计算检验统计量计算检验统计量F值值: 由表由表4-2的数据计算的数据计算有:有:4302211430211()324.30876.42120120958.52876.4282.1011201119ijijijxCSSxCN 总总2222211(102.91)(81.46)(80.94)(58.99)876.4232.1630303030=4-1=3inijgjiixSSCn组间组间32.1610.723SSMS组间组间组间49.940.43116SSMS组内组内组内10.7224.930.43MSFMS组间组内=-=82.10-32.1649.94=119-3=116SS

18、SSSS组内总组间组内0.01 3,116,0.01FFP(3) 列方差分析表: 见表4-4。(4)确定P值: 根据0.05,1组间2, 2组内24,查附表4,F界值表,得F界值:F0.01(2,24)=5.61。本例F54.39,大于界值F0.01(2,24)=5.61,则P0.01。(5) 推断结论: 由于P0.01,在=0.05水准上拒绝H0,接受H1,差异有统计学意义。可以认为四个处理组低密度脂蛋白总体均数不全相同。表4-4 方差分析表 该结论的意义为,至少有两组低密度脂蛋白总体均数不同。如果想确切了解哪两个低密度脂蛋白总体均数有差异,可进一步作多个样本均数的两两比较。第第3 3节节

19、双因素方差分析双因素方差分析1.特点 按照随机区组设计的原则来分析两个因素对试验结果的影响及作用。其中一个因素称为处理因素,一般作为列因素;另一个因素称为区组因素或配伍组因素,一般作为行因素。两个因素相互独立,且无交互影响。双因素方差分析使用的样本例数较少,分析效率高,是一种经常使用的分析方法。双因素方差分析的设计对选择受试对象及试验条件等方面要求较为严格,应用该设计方法时要十分注意。该设计方法中,总变异可以分出三个部分:SS总SS处理SS区组SS误差2. 各种变异来源 SS总:总变异, 由处理因素、区组因素及随机误差的综合作用而形成。 SS处理:各处理组之间的变异,可由处理因素的作用所致。

20、SS区组或SS配伍:各区组之间的变异,可由区组因素的作用所致。 SS误差:从总变异中去除SS处理及SS区组后剩余的变异。此变异由个体差异和测量误差等随机因素所致。 例例4-3:某研究者采用随机区组设计进行实验,比:某研究者采用随机区组设计进行实验,比较三种抗癌药物对小白鼠肉瘤的抑瘤效果,先将较三种抗癌药物对小白鼠肉瘤的抑瘤效果,先将15只染有肉瘤小白鼠按体重大小配成只染有肉瘤小白鼠按体重大小配成5个区组,每个区组,每个区组内个区组内3只小白鼠随机接受三种抗癌药物,以肉只小白鼠随机接受三种抗癌药物,以肉瘤重量为指标,试验结果见表瘤重量为指标,试验结果见表4-5。问三种不同药。问三种不同药物的抑瘤

21、效果有无差别?物的抑瘤效果有无差别?表4-5 三种不同药物作用后小白鼠肉瘤重量(g)221122111111=-=1gnijgggnnnijijijijijijijxSSxxxxCNN 总总22221111111=-=1gnnnijijijgggjijjiiiixxxSSnxxCnNng 处 理处 理变异分解:变异分解:=-=-11SSSSSSSSgn处理区组总误差处理区组总误差211ingijijxCN22221111111=-=1gnggijijijnnnijiijjjjxxxSSgxxCgNgn 区 组区 组表4-6 随机区组设计资料的方差分析表整理如下表:整理如下表:例4-3 计算(1

22、)建立检验假设H0:三种不同药物作用后小白鼠肉瘤重量的总体均数相同,123;H1:三种不同药物作用后小白鼠肉瘤重量的总体均数不全相同。 0.05(2)计算统计量F值 假设检验假设检验35221135211()6.81876.42153.62453.09170.5328115114ijijijijxCNSSxCN 总总252223113.072.171.573.0917=0.228055=3-1=2ijjixSSC处理处理23222225111.981.501.050.931.353.0917=0.228433=5-1=4ijijxSSC区组区组=0.0764= 5-1 3-1 =8SSSSSS

23、SS处理区组总误差误差0.2280=0.11402SSMS处理处理处理0.2284=0.05714SSMS区组区组区组0.0764=0.00968SSMS误差误差误差0.1140=11.880.0096MSFMS处理处理误差0.0571=5.950.0096MSFMS区组区组误差0.05 280.01 28=4.46=8.65FF,0.2280=0.11402SSMS处理处理处理0.2284=0.05714SSMS区组区组区组0.0764=0.00968SSMS误差误差误差0.2280=0.11402SSMS处理处理处理0.2284=0.05714SSMS区组区组区组表4-7 方差分析表(3)

24、建立方差分析表(4)确定P值 根据0.05,处理2, 误差8,查附表3,F界值表,得F0.05(2,8)4.46 ,F0.01(2,8)8.65。本例F处理11.88, P0.01。(5) 推断结论 由表4-7知,处理组间的P0.05,在0.05水准上拒绝H0,差异有统计学意义。可以认为三种不同药物作用后小白鼠肉瘤重量的总体均数不全相同。1.完全随机设计的ANOVA2.随机区组设计的ANOVA所关心的问题:所关心的问题:一个处理因素不一个处理因素不同处理水平间的同处理水平间的均数有无差异?均数有无差异? 以上第2个设计中,设立单位组(区组)的目的是控制混杂因素。使混杂因素在各处理水平间达到均衡

25、,提高检验效率。第第4节节 析因设计的方差分析析因设计的方差分析1、两个或以上处理因素的各处理水平间的均、两个或以上处理因素的各处理水平间的均数有无差异?即主效应有无统计学意义?数有无差异?即主效应有无统计学意义?2、两个或以上处理因素之间有无交互作用?、两个或以上处理因素之间有无交互作用? 完全随机的两因素完全随机的两因素22析因设计析因设计析因设计的析因设计的4个实例个实例 实例实例2:白血病患儿的淋巴细胞转化率(),问:白血病患儿的淋巴细胞转化率(),问不同缓解程度、不同化疗时期淋转率是否相同?不同缓解程度、不同化疗时期淋转率是否相同?两者间有无交互作用?两者间有无交互作用?完全随机的两

26、因素完全随机的两因素22析因设计析因设计 实例实例3:小鼠种别:小鼠种别A、体重、体重B和性别和性别C对皮内移植对皮内移植SRS瘤细胞生长特征影响的结果(肿瘤体积瘤细胞生长特征影响的结果(肿瘤体积cm3)问)问A、B、C各自的主效应如何?三者间有无交互作用各自的主效应如何?三者间有无交互作用?完全随机的三因素完全随机的三因素2 22 22 2析因设计析因设计 实例实例4:研究小鼠在不同注射剂量和不同注射频次下:研究小鼠在不同注射剂量和不同注射频次下药剂药剂ACTH对尿总酸度的影响。问对尿总酸度的影响。问A、B各自的主各自的主效应如何?二者间有无交互作用?效应如何?二者间有无交互作用?随机区组的

27、两因素随机区组的两因素3 32 2析因设计析因设计1、特点、特点2个或以上(处理)因素(个或以上(处理)因素(factor)(分类变量分类变量) (本节只考虑两个因素)(本节只考虑两个因素)每个因素有每个因素有2个或以上水平(个或以上水平(level)每一组合涉及全部因素,每一因素只有一个水平参与每一组合涉及全部因素,每一因素只有一个水平参与几个因素的组合中至少有几个因素的组合中至少有 2个或以上的观察值个或以上的观察值观测值为定量数据(需满足随机、独立、正态、等方观测值为定量数据(需满足随机、独立、正态、等方差的差的ANOVA条件)条件)两因素析因设计资料的方差分析两因素析因设计资料的方差分

28、析2、变异来源、变异来源SS总:总变异,由总:总变异,由A,B处理因素及它们的交互效应,处理因素及它们的交互效应,随机误差共同引起。随机误差共同引起。SSA:A处理变异,主要由处理变异,主要由A处理因素作用引起;处理因素作用引起;SSB:B处理变异,主要由处理变异,主要由B处理因素作用引起;处理因素作用引起;SSAB:AB交互变异,主要由交互变异,主要由AB两个处理因素共同两个处理因素共同作用引起;作用引起;SS误差:误差变异,主要由个体差异和随机误差引误差:误差变异,主要由个体差异和随机误差引起。起。3、基本符号设定、基本符号设定 两个处理因素:两个处理因素:A、BA、B因素各有因素各有a、

29、b个水平,共有个水平,共有ab种组合种组合 每一组合下有每一组合下有n个受试对象个受试对象 全部实验受试对象总数全部实验受试对象总数N为为abni (i=1,2,)表示因素表示因素A的水平号,的水平号,j (j=1,2,b)表示因素表示因素B的水平号,的水平号,k (k=1,2,n)表示在每一组合下的受试对象号。表示在每一组合下的受试对象号。4、变异间满足的基本公式、变异间满足的基本公式=+=+=+=ABABABABSSSSSSSSSSSSSS处理总误差误差处理总误差误差SS总及其自由度: 5、变异分解、变异分解22221111111111112111()= -1abnabnabnabnijk

30、ijkijkijkijkijkijkijkabnijkijkN abnSSxxxxNxCCxNN总总SS处理及其自由度:22111111bbanBjijkjjikBSSan xxxCanb 22111111aabnAiijkiijkASSb n xxxCb na SSA及其自由度:21111111ababnijijkijijkSSn xxxCnab 处理处理SSB及其自由度: SSAB及其自由度:1 (1) (1)1 (1)(1)ABABABSSSSSSSSababab a bab 处 理() SS误差及其自由度:1(1)(1)ABSSSSSSabnabanbabab n处理总误差()计算MS

31、A,MSB,MSAB和统计量F AAASSMSAAMSFMS误差SSMS误差误差误差BBBSSMSABABABSSMSBBMSFMS误差ABABMSFMS误差 例例4-4 将将20只家兔随机等分只家兔随机等分4组,每组组,每组5只,进行只,进行神经损伤后的缝合试验。神经损伤后的缝合试验。A因素为缝合方法:外因素为缝合方法:外膜缝合和束膜缝合;膜缝合和束膜缝合;B因素为缝合后的时间:缝因素为缝合后的时间:缝合后合后1个月,缝合后个月,缝合后2个月。试验结果为家兔神经个月。试验结果为家兔神经缝合后的轴突通过率(缝合后的轴突通过率(%)(注:测量指标视为)(注:测量指标视为计量资料),见表计量资料)

32、,见表4-11。欲比较不同缝合方法及。欲比较不同缝合方法及缝合后时间对轴突通过率的影响,试做析因分析。缝合后时间对轴突通过率的影响,试做析因分析。表4-8 家兔神经缝合后的轴突通过率(%) 单独效应:单独效应: 是指其他因素水平固定时,同一因素不同水平的效应之差。是指其他因素水平固定时,同一因素不同水平的效应之差。主效应:主效应: 是指某一因素各水平间的平均差别。是指某一因素各水平间的平均差别。交互作用:交互作用: 是指两个或多个因素间的效应互不独立的情形。如果是指两个或多个因素间的效应互不独立的情形。如果A因素因素的单独效应变化时,的单独效应变化时,B因素的单独效应也发生变化,则认为因素的单

33、独效应也发生变化,则认为AB两个因素存在交互作用。两个因素存在交互作用。 表4-9 2因素2水平析因试验的均数差别 单独效应的计算:计算一个因素的单独效应为将单独效应的计算:计算一个因素的单独效应为将另一个因素水平固定,求均值差。另一个因素水平固定,求均值差。 计算计算A因素的单独效应:把因素的单独效应:把B因素水平固定为因素水平固定为b1水平水平,则则A因素的单独效应为因素的单独效应为28-24=4;把;把B因素固因素固定为定为b2水平,则水平,则A因素的单独效应为因素的单独效应为52-44=8。主效应计算:一个因素的主效应为单独效应和的主效应计算:一个因素的主效应为单独效应和的平均值。平均

34、值。 计算计算A因素的主效应:因素的主效应:A因素两个单独效应和的因素两个单独效应和的一半。一半。(4+8)/2=6。两因素的交互效应计算:任何一个因素单独效应两因素的交互效应计算:任何一个因素单独效应差的一半。差的一半。假设检验假设检验 1.提出检验假设,确定检验水准。 (1)处理因素A假设 H0:不同缝合方法轴突通过率的总体均数相等; H1:不同缝合方法轴突通过率的总体均数不等。 (2)处理因素B假设 H0:不同缝合时间轴突通过率的总体均数相等; H1:不同缝合时间轴突通过率的总体均数不等。 (3)交互作用AB假设 H0:不同缝合方式与缝合后时间长短对轴突通过率无交互影响; H1:不同缝合

35、方式与缝合后时间长短对轴突通过率有交互影响。 0.05 2. 计算统计量F例例4-5计算计算221112222221117402738020=()1010.+6030273807420=20-1=19abnijkijkabnabnijkijkijkijkCxabnSSxxxC总总 计算SS总和自由度 计算SS处理和自由度22222211111=()120 220 140 26027380=262051 4 1ababnijijkijijkSSn xxxCnvab 处理处理(+)-22111221=()1120220140260273801802 5211aabnAiijkiijkASSbn x

36、xxCbn 22111221=()11201402202602738024202 5211bbanBjijkjjikBSSan xxxCan 计算SSA和自由度 计算SSB和自由度180/1 180AMS 2420/1 2420BMS 20/1 20A BMS4800/16 300MS误差1800.60300AF24208.07300BF 200.07300ABF =-2620242018020111ABABABSSSSSSSSab处理=-742026204800=12 2 416SSSSSSab n 处理总误差误差 计算SSAB和自由度 计算SS误差和自由度计算各因素的MS和统计量F3、 列

37、析因设计的方差分析表4 确定P值,进行统计推断 查F界值表,得到相应的P值。5 结论: 缝合后时间对轴突通过率有影响,尚不能认为缝合方式对轴突通过率有影响。第第5节节 重复测量资料的方差分析重复测量资料的方差分析 数据特征 1、前后测量设计:与配对设计t检验的试验结果表达完全相同,但却是两种不同类型的实验设计。2、 设立对照的前后测量设计效应指标对环境等一些处理以外的因素敏感,确定处理前后测量设计必须增加平行对照。如表4-10, 高血压患者治疗前后舒张压下降的疗效评估。表4-10 高血压患者治疗前后的舒张压(mmHg)3、 重复测量设计测量次数m3与随机区组设计数据很相似。如表4-14表4-1

38、1 受试者血糖浓度(mmol/L)重复测量设计与随机区组设计方法的比较重复测量设计在进行随机区组资料方差分析是必须做重复测量设计在进行随机区组资料方差分析是必须做“球对称球对称”假设的检验。假设的检验。通常用通常用Mauchly检验:成立:用直接用随机区组设计资料的方差检验:成立:用直接用随机区组设计资料的方差分析进行;不成立分析进行;不成立:用用“球对称球对称”系数系数对对F界值进行校正。界值进行校正。G-G法,法,H-F法,法,LB法。法。不满足不满足“球对球对称称”假设假设2=15.844P=0.008重复测量设计的优缺点重复测量设计的优缺点 优点: 每一个个体作为自身的对照,克服了个体

39、间的变异。分析时可更好地集中于处理效应。 因重复测量设计的每一个个体作为自身的对照,所以研究所需的个体相对较少,因此更加经济。 缺点: 滞留效应(Carry-over effect):前面的处理效应有可能滞留到下一次的处理。 潜隐效应(Latent effect):前面的处理效应有可能激活原本以前不活跃的效应。 学习效应(Learning effect):由于逐步熟悉实验,研究对象的反应能力有可能逐步得到了提高。重复测量设计数据两因素分析重复测量设计数据两因素分析l 目的:推断处理、时间、处理时间对试验对象目的:推断处理、时间、处理时间对试验对象的试验指标的作用。的试验指标的作用。l 资料:资

40、料:l 处理因素分处理因素分g个水平,每组随机分配个水平,每组随机分配n个试验对象,个试验对象,共共ng个,个,g1l 时间因素分时间因素分m个水平(个水平(m个时点),每个对象有个时点),每个对象有m个时点上的测量值,共个时点上的测量值,共gnm个,个,m2l 特例:特例:g1,单组重复测量资料,单组重复测量资料l m2,前后重复测量资料,前后重复测量资料l 资料特征分析l 重复测量数据的两因素多水平设计,两因素包括一个干预因素(A因素)和测量时间因素(B因素);l 多水平指干预(A因素)有g(2)个水平,测量时间(B因素)有m(2)个水平(测量时间点)。l 随机化分组采用完全随机设计的分组

41、方式,将gn个观察对象随机分配到g 个处理组中。l 数据收集在m个时间点上进行,每一个观察对象在完全相同的时间点上重复进行m次测量。 例例4-5:将手术要求基本相同的:将手术要求基本相同的15名患者随即分名患者随即分3组,分别采用组,分别采用A、B、C三种麻醉诱导方法。在三种麻醉诱导方法。在T0 、T1 、T2 、T3 、T4 五个时像测量患者收缩压五个时像测量患者收缩压 数数据如下:据如下:对象内对象内Mk对象间对象间Bj g3 m5 n5AiAiTij重复测量设计资料的统计分析方法重复测量设计资料的统计分析方法对于重复测量数据(临床上常称纵向监测数据),实质上每个受试对象的观察结果是多次重

42、复测量结果的连线,统计分析的目的是比较这些连线变化趋势的特征。重复测量试验数据的方差分析需要考虑两个因素,一是处理分组,二是测量时间。可采用的统计分析方法:1. 多元方差分析方法2. 重复测量数据的方差分析变异分解思路变异分解思路重复测量两因素数据的变异由两大部分组成。一是观察对象间差异,二是重复测量间差异。观察对象间差异包括处理组间差异和观察对象个体间变异两部分;重复测量间差异包括测量时间之间差异、处理与测量时间的交互作用和组内误差三个部分。因此,重复测量数据的总变异可分解为处理组、测量时间、处理组与测量时间的交互作用、观察对象间随机误差以及重复测量误差等五个部分。符号说明符号说明 重复测量

43、数据中两个因素分别为A因素和B因素(时间因素); A因素有g个水平(g2),B因素有m个水平(m2)。 i (i=1,2,g)表示因素A的水平号, j (j=1,2,m)表示因素B的水平号, k (k=1,2,n)表示因素A每一个水平的受试对象号。SSSSSS总对象重复测量SSSSSS误差对象误差重复测量误差ASSSSSS对象对象误差BABSSSSSSSS重复测量重复测量误差设A因素和B因素(时间因素)22111111=()ggmnmnijkijkijkijkSSxxxC总2111() /gmnijkijkCxgnm2211111=()()ggnnikikikikSSm xxxCm对象=1gm

44、n总=1gn对象221111=()()gmnAgjkijkSSmn xxxCmn=-ASSSSSS对象对象误差=1Ag=gng对象误差=-SSSSSS重 复 测 量总对 象=gnmgn重复测量221111=()()gmnBmikjikSSgn xxxCgnA BSSA BSS=-BA BSSSSSSSS重复测量重复测量误差2211111=()()ggmmtjijtjijSSn xxxCn处理-A BABSSSSSSSS处理=1gm处理=1Bm=1Bm= (1)(1)ABgm=gnmgngmg重 复 测 量 误 差假设检验:假设检验:1、提出检验假设,确定检验水准、提出检验假设,确定检验水准 H

45、0: H1: =0.052、选择统计方法:、选择统计方法:1)正态性)正态性 处理因素的各处理水平的样本个体之间处理因素的各处理水平的样本个体之间是相互独立的随机样本,其总体均数服从正态分是相互独立的随机样本,其总体均数服从正态分布布2)方差齐性)方差齐性 相互比较的各处理水平的总体方差相相互比较的各处理水平的总体方差相等,即具有方差齐同;等,即具有方差齐同;3) 各时间点组成的协方差阵具有球形性特征。各时间点组成的协方差阵具有球形性特征。3、计算统计量、计算统计量 (由计算机完成由计算机完成)4、结论:按照、结论:按照=0.05/0.01 的检验水准,拒绝的检验水准,拒绝/尚不尚不能拒绝能拒

46、绝H0,差异有差异有/无统计学意义无统计学意义(统计学结统计学结论论)。重复测量数据统计分析常见的误用情况重复测量数据统计分析常见的误用情况 重复进行各时间点的t检验,必然增加假阳性错误,即类错误的概率; 忽略个体曲线变化特征,而直接取平均值;重复测量数据不满足常规曲线拟合的独立性要求; 差值比较缺乏效度(学术界存在争议); 协方差分析也是解决前后测量设计的一种方法,但必须满足其应用条件。第第6节节 多个样本均数间的两两比较多个样本均数间的两两比较一、均数两两比较的特点和意义 当分析结果为P,拒绝H0时,得出的结论只是指各总体均数不全相等。如果想要确切了解哪两个样本均数之间的差异有统计学意义(

47、总体均数不等),哪两个样本均数之间的差异无统计学意义(总体均数相等),可以进行多个样本均数的两两比较。当有三个及三个以上样本均数比较时,如果仍使用一般的t检验对样本均数两两组合后进行比较,会使检验水平值增大,即增大第一类错误的概率,这样,就可能把本来无差别的两个总体均数判为有差别。例如,有4个样本均数进行两两比较,如用一般的t检验,则可以比较:6)!24( ! 2! 424Cl 若每次比较的检验水准0.05,则每次比较不犯第一类错误的概率为(10.05)=0.95。那么根据概率的乘法法则,比较6次均不犯第一类错误的概率为(1-0.05)60.7351。此时,总的显著性水平变为:10.73510

48、.2649。此值已远远大于规定的检验性水平0.05。 (一)特点及意义 LSD英文全称为least-significant-difference,译为最小显著差异法或最小有意义差异法,也可简称为LSD法。LSD法实际上是一种t检验法,但它与以前描述的一般t检验法有所不同。两种t检验法的主要区别在于计算标准误中的合并方差及自由度的不同。 LSD法在计算标准误时,用MS组内或MS误差取代一般 t 检验标准误中的 ,自由度则用MS误差的自由度误差NK或误差(k-1)(b-1)取代一般t检验法中的自由度n1+n22。根据及 ,查一般的t值表得t界值,与LSD计算的统计量t值的大小进行比较,并确定P值。

49、据此作出判断和结论。2cS一、一、LSDt检验法检验法(二)计算公式(二)计算公式 BAXXBASXXt|)(误差BAXXnnMSSBA11 误差 或组内 (三)计算实例(三)计算实例例例 仍用例仍用例4-24-2为计算实例为计算实例, ,说明说明LSDLSD法的计算过程。法的计算过程。(1 1)建立检验假设)建立检验假设H0: H0: 任意两样本的总体均数相等,任意两样本的总体均数相等,AABBH1: H1: 任意两样本的总体均数不相等,任意两样本的总体均数不相等,ABAB双侧双侧0.050.05(2 2)计算统计量)计算统计量t t值值列出样本均数两两比较列出样本均数两两比较t t检验表,

50、见表检验表,见表4-144-14。1212111182.430.1730 30X XSM Snn误 差( ) ( )12|0.714.180.17ABXXXXtS(3)推断结论 在=0.05水准上拒绝H0,接受H1,除2.4g与4.8g组外,其它各组样本均数的两两比较的差异均有统计学意义。表4-13 样本均数两两比较t检验表比较组A与B两均数之差标准误 t值t 0.05t 0.01P值(1)(2)(3)(4)(5)(6)(7)1与20.710.174.181.9812.6190.011与30.730.174.291.9812.6190.011与41.460.178.591.9812.6190.

51、012与30.020.170.121.9812.6190.052与40.750.174.411.9812.6190.013与40.730.174.291.9812.6190.01(一)特点及意义(一)特点及意义在进行科研时,经常需要设立一个对照组和若干个实验组或在进行科研时,经常需要设立一个对照组和若干个实验组或处理组。按照研究目的和设计要求,有时只需要将各个处处理组。按照研究目的和设计要求,有时只需要将各个处理组的试验结果与一个对照组进行比较,而各处理组之间理组的试验结果与一个对照组进行比较,而各处理组之间并不需要比较。此时,仍可应用前述并不需要比较。此时,仍可应用前述SNKq检验法或检验法

52、或LSDt检验法处理资料。因为前两种检验方法均包括所检验法处理资料。因为前两种检验方法均包括所有各组之间的比较。但处理此类资料也有非常常用而经典有各组之间的比较。但处理此类资料也有非常常用而经典的方法,称为的方法,称为Dunnettt检验法。该法在大型统计软件中检验法。该法在大型统计软件中的应用非常广泛。的应用非常广泛。 Dunnett-t 检验(二)计算公式(二)计算公式ciXXciSXXt|)(误差ciXXnnMSSci11n/MSSciXX误差2当比较组两样本含量ni相等时 当比较组两样本含量ni不相等时 (三)计算实例(三)计算实例顺序1234均数3.432.722.701.97组别安

53、慰剂组2.4g降血脂新药4.8g降血脂新药7.2g降血脂新药表4-14 各组均数排列顺序 例 以例4-2为计算实例,说明该方法的计算过程。表4-15 Dunnettt检验表比较组A与B两均数之差组数a标准误 t值t 0.05t 0.01P值(1)(2)(3)(4)(5)(6)(7)(8)2与10.7130.174.182.402.980.013与10.7330.174.292.402.980.014与11.4630.178.592.402.980.01 计算均数差值的标准误:132/2 0.43/300.17XXSMSn误差(3)推断结论 本例三组降血脂新药与安慰剂组P0.01,故在0.05水

54、准上拒绝H0,接受H1,差异有统计学意义。可以认为各降血脂新药组与安慰剂组的低密度脂蛋白含量总体均数有差别。 三、三、SNKSNKq q 检验法检验法 (一)特点及意义(一)特点及意义 SNK SNKq q检验法,全称为检验法,全称为Student-Newman-Keuls Student-Newman-Keuls q q检验法,也简称为检验法,也简称为SNKSNK法。这是国内外常用而较为经典的法。这是国内外常用而较为经典的检验方法。可以对所有对照组及处理组的样本均数进行两检验方法。可以对所有对照组及处理组的样本均数进行两两比较。式中:两比较。式中:q q 为检验统计量,为检验统计量, 及及

55、为任意比较的为任意比较的两样本均数两样本均数, , 为两样本均数差值的标准误。为两样本均数差值的标准误。 AXBXBAXXSBAXXBASXXq|l 当两样本n相等时l 误差 l 当两样本n不相等时l 上式中MS误差在单因素方差分析中即为MS组内。 nMSSBAXX误差)(误差BAXXnnMSSBA112(二)计算公式(二)计算公式(三)计算步骤及方法(三)计算步骤及方法1.首先将多个样本均数由大到小顺序排列。首先将多个样本均数由大到小顺序排列。2.按照两均数组合原则,计算出每两个样本均数比较的统计按照两均数组合原则,计算出每两个样本均数比较的统计量量q 值。值。3.根据误差的自由度和两样本间隔组数根据误差的自由度和两样本间隔组数a,查,查q界值表得界值表得q界值。界值。注意:组

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论