重复测量资料的方差分析20160428_第1页
重复测量资料的方差分析20160428_第2页
重复测量资料的方差分析20160428_第3页
重复测量资料的方差分析20160428_第4页
重复测量资料的方差分析20160428_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、中国疾病预防控制中心中国疾病预防控制中心重复测量资料的重复测量资料的方差分析方差分析于石成 2016-04-28中国疾病预防控制中心中国疾病预防控制中心讲授内容讲授内容p 重复测量数据特征重复测量数据特征p 重复测量资料方差分析重复测量资料方差分析p 实例及实例及SASSAS实现实现p 多变量方差分析多变量方差分析中国疾病预防控制中心中国疾病预防控制中心 同一受试对象的同一观察指标在不同时间点上进行多次测量所得的资料,常用来分析该观察指标在不同时间点上的变化。目的:就是比较不同时间点动态变化趋势。目的:就是比较不同时间点动态变化趋势。一、重复测量数据特征(1)平衡资料:如果每一个体重复测量的时

2、间和次数相同,)平衡资料:如果每一个体重复测量的时间和次数相同,称为称为平衡资料平衡资料。(2)非平衡资料:不同个体重复测量的时间点不同,或重)非平衡资料:不同个体重复测量的时间点不同,或重复次数不同,称为复次数不同,称为非平衡资料非平衡资料。中国疾病预防控制中心中国疾病预防控制中心中国疾病预防控制中心中国疾病预防控制中心(1) 同一观察对象的重复测量值之间是非独立的,后一次测量的数据可能受前一次测量结果的影响。这不符合传统的统计分析方法中关于独立性的假设。(2) 观察指标在所测量的时间范围内可能成趋势性变化。(3) 观察值的变异来源较多,有来自个体内的变异,个体间的变异,或更高水平上的变异;

3、变异可能与时间有关,或与其他协变量有关。重复测量资料的特点:重复测量资料的特点:中国疾病预防控制中心中国疾病预防控制中心研究对象时间点1时间点2时间点m1y11y12y1m2y21y22y2m3y31y32y3mnyn1yn2ynm 当对同一受试对象在不同时间重复测量次数p3时,称为重复测量数据。中国疾病预防控制中心中国疾病预防控制中心分组因素研究对象时间点1时间点2时间点m11y111y112y11m12y121y122y12m1n121y211y212y21m22y221y222y22m2n2p1yp11yp12yp1mp2yp21yp22yp2mpn3中国疾病预防控制中心中国疾病预防控制

4、中心举例1:中国疾病预防控制中心中国疾病预防控制中心 为研究某食物对血清胆固醇浓度的影响,各取7只兔子,分别以正常食物和待研究食物喂养,在实验前、喂养5星期、10星期后,各取血测量其中胆固醇浓度,其自然对数转换后的数据见下表。问血清胆固醇浓度随时间变化的趋势是否受该食物的影响?举例2:中国疾病预防控制中心中国疾病预防控制中心中国疾病预防控制中心中国疾病预防控制中心每一根线代表每一根线代表1只家兔只家兔中国疾病预防控制中心中国疾病预防控制中心举例3:每一根线代表每一根线代表1名病人名病人中国疾病预防控制中心中国疾病预防控制中心同一观察单位具有多个观察值,而这些观察值来自同一受试对象的不同时点(部

5、位等),这类数据间往往有相关性存在,违背了方差分析要求数据满足独立性基本条件。二、重复测量资料方差分析中国疾病预防控制中心中国疾病预防控制中心重复测量资料不合适的处理:重复测量资料不合适的处理:p 简单处理简单处理: : 对平衡的重复测量资料,分别在各时间点上进行对平衡的重复测量资料,分别在各时间点上进行分析;集合分析分析;集合分析: : 将各个体的几次不同观察值相加,得到该将各个体的几次不同观察值相加,得到该个体的一个综合值,再进行比较分析。个体的一个综合值,再进行比较分析。 重复测量资料的分析方法:重复测量资料的分析方法:p 重复测量的方差分析重复测量的方差分析(ANOVA with re

6、peated measuresANOVA with repeated measures); ;p 广义估计方程(广义估计方程(generalized estimating equationsgeneralized estimating equations,GEE GEE ); ;p 多水平统计模型(多水平统计模型(multilevel statistical modelmultilevel statistical model)。)。中国疾病预防控制中心中国疾病预防控制中心两因素重复测量资料方差分析:重复测量资料的方差分析总思想:将总变异分解为: 对象间(between subjects)变异

7、SS受试对象间=SS处理+SS个体间误差 对象内(within subject)变异 SS受试对象内=SS时间+SS处理与时间交互+SS个体内误差中国疾病预防控制中心中国疾病预防控制中心中国疾病预防控制中心中国疾病预防控制中心重复测量方差分析模型:重复测量方差分析模型:p 中国疾病预防控制中心中国疾病预防控制中心两因素重复测量资料的方差分解:两因素重复测量资料的方差分解:郭海强:两因素重复测量资料的方差分析及其SAS程序实现. 中国卫生统计.中国疾病预防控制中心中国疾病预防控制中心1. 单组重复测量 指同一组内(或接受同一种处理)的多个受试者,在多个时间点上的反应变量所作的测量,又称为单变量重

8、复测量。测测 量量 时时 间间 点点受试者受试者 1 2 p1 y11 y12 y1p2 y21 y22 y2p:n yn1 yn2 y n p中国疾病预防控制中心中国疾病预防控制中心2.多组重复测量 指将受试者按处理的不同水平分为几个组,对这些组内的每一受试者,都在不同时间点对他们的反应变量进行测量。中国疾病预防控制中心中国疾病预防控制中心重复测量资料方差分析条件:重复测量资料方差分析条件: 1.正态性:处理因素的各处理水平的样本个体之间是相互独立的随机样本,其总体均数服从正态分布; 2.方差齐性:相互比较的各处理水平的总体方差相等,即方差齐; 3.各时间点组成的协方差阵(covarianc

9、e matrix)具有球形性 (Sphericity) 特征。 中国疾病预防控制中心中国疾病预防控制中心2221 11 212222 12 2222212221 11121 212211212222()(1)()()(1)aaaaa aiiiiiiiijijiijjssssssVssssyynsyyyynyyyynsrss 重复测量资料的协方差矩阵:中国疾病预防控制中心中国疾病预防控制中心中国疾病预防控制中心中国疾病预防控制中心球形对称的含义:所有两两时间点变量间差值对应的方差相等。p对于 yi 与y j 两时间点变量间差值对应的方差可采用协方差矩阵计算为:中国疾病预防控制中心中国疾病预防控制

10、中心对于yi与yj两时间点变量间差值对应的方差可采用协方差矩阵计算122222222211221222ijijijyyyyy yyyssssssss如:协方差阵协方差阵 A1A2A3A4A110 510 15A2520 15 20A310 15 30 25A415 20 25 40s1-22 = 10 + 20 2 (5) = 20s1-32 = 10 + 30 - 2(10) = 20s1-42 = 10 + 40 - 2(15) = 20s2-32 = 20 + 30 - 2(15) = 20s2-42 = 20 + 40 - 2(20) = 20s3-42 = 30 + 40 - 2(2

11、5) = 20本例差值对应的方差相等,说明球形对称。中国疾病预防控制中心中国疾病预防控制中心球形对称的检验:Mauchly法检验协方差阵是否为球形:pH0:资料符合球形要求 H1:资料不满足球形要求 检验的P P值若大于研究者所选择的显著性水准=0.05时,说明协方差阵的球形性质得到满足。中国疾病预防控制中心中国疾病预防控制中心如果如果满足球性假定条件满足球性假定条件,可直接采用普通的,可直接采用普通的单变量方差分析单变量方差分析。如果不满足球性假定条件,可用两种方法:如果不满足球性假定条件,可用两种方法:(1 1)采用多变量方差分析采用多变量方差分析(MANOVAMANOVA); ;(2 2

12、)对单变量方差分析的结果进行校正对单变量方差分析的结果进行校正。球性假定不满足时的处理:球性假定不满足时的处理:中国疾病预防控制中心中国疾病预防控制中心p该法通过校正自由度从而实现校正该法通过校正自由度从而实现校正P P值,值,它它并不影响并不影响参数参数的的估计值。估计值。p校正系数校正系数 (EpsilonEpsilon),它反映球性假定偏离程度。),它反映球性假定偏离程度。当当 =1=1时,表示对球性无偏离,时,表示对球性无偏离,即即满足球性假定;满足球性假定; 11时,表示偏离球性时,表示偏离球性, , 距离距离1 1越远,偏离越远,偏离程度程度越大。越大。p常用的校正方法有两种,即常

13、用的校正方法有两种,即G-GG-G(Greenhouse-Greenhouse-GeisserGeisser)和)和H-FH-F(Huynh-FeldtHuynh-Feldt)系数校正。)系数校正。校正方法:校正方法:中国疾病预防控制中心中国疾病预防控制中心两种校正方法的比较:两种校正方法的比较:p两种方法校正后,两种方法校正后,F F临界值较原先大,提高临界值较原先大,提高了拒绝了拒绝H H0 0的界值,减少犯的界值,减少犯I I类错误的概率。类错误的概率。p一般认为一般认为G-GG-G校正校正较较保守保守,GirdenGirden建议建议:p当当 0.75 0.75时,最好采用时,最好采用

14、H-FH-F校正;校正;p当当 0.750.75时,采用时,采用G-GG-G校正。校正。中国疾病预防控制中心中国疾病预防控制中心SASSAS实现调整:实现调整:pproc glm data=repeatanova;pclass type;pmodel t1 t2 t3 t4=type /nouni; p repeated time 4 /printe; p means type;p run; /* The NOUNI option suppresses the display of univariate statistics */* PRITE provides the test for th

15、e sphericity. 中国疾病预防控制中心中国疾病预防控制中心p The GLM Procedurep Repeated Measures Analysis of Variance Sphericity Tests MauchlysVariables DF Criterion Chi-Square P-value Transformed Variates 5 0.433514 5.6186426 0.3451Orthogonal Components 5 0.317919 7.7033893 0.1734中国疾病预防控制中心中国疾病预防控制中心若资料不满足球对称性,应对自由度进行效正,用

16、Greenhouse-Geisser (G-G)法或Huynh-Feldt ( H-F )法的“球对称”系数Epsilon乘以受试对象内各变异的自由度,得效正“自由度”(调小),再查F界值表获得P P值。中国疾病预防控制中心中国疾病预防控制中心proc glm ;class 分组变量;model 分析变量=分组变量;lsmeans 分组变量;means 分组变量;repeated 重复测量变量名 /。三、实例及SAS实现中国疾病预防控制中心中国疾病预防控制中心 repeated 重复测量变量名重复测量变量名 /;【repeated】后必须指定重复测量变量名,测量水平可选,】后必须指定重复测量变

17、量名,测量水平可选,转换项也是可选的。如:转换项也是可选的。如:repeatedtime4;表示指定重复测量变量名为表示指定重复测量变量名为time,测量,测量水平(即重复次数)为水平(即重复次数)为4次,中间均以空格隔开。其中次,中间均以空格隔开。其中time由读者自行命名,也可为其它名称,如由读者自行命名,也可为其它名称,如repeatedt4,repeatedmeasure4等均可。等均可。中国疾病预防控制中心中国疾病预防控制中心repeated语句后的语句后的主要用于各次测量之间的比较,常用的有两主要用于各次测量之间的比较,常用的有两种转换方式:种转换方式:contrast和和poly

18、nomial。contrast表示指定一个参照水平,其它均与参照水平比较。表示指定一个参照水平,其它均与参照水平比较。如如repeatedtime4contrast(1);表示共有表示共有4次重复测量,以第次重复测量,以第1次测量为参次测量为参照,第照,第2、3、4次测量分别与第次测量分别与第1次测量水平进行比较。次测量水平进行比较。polynomial表示正交多项式对比,即正交转换后判断曲线的表示正交多项式对比,即正交转换后判断曲线的n阶水平阶水平是否有统计学意义。如:是否有统计学意义。如:repeatedtime4polynomial;表示表示4次重复测量次重复测量,分别对一次、二次和三次

19、曲线分析是否有统计学意义,也就是判断测,分别对一次、二次和三次曲线分析是否有统计学意义,也就是判断测量值随时间变化大致呈何种趋势。量值随时间变化大致呈何种趋势。中国疾病预防控制中心中国疾病预防控制中心printe该选项可输出一些相关矩阵(不是我们所关心该选项可输出一些相关矩阵(不是我们所关心的),更重要的是给出球性检验结果。的),更重要的是给出球性检验结果。summary 输出重复测量各水平间的比较结果。如果没有输出重复测量各水平间的比较结果。如果没有该 选 项 , 即 使 前 面 指 定 了该 选 项 , 即 使 前 面 指 定 了 c o n t r a s t 或或polynomial,

20、也不会显示比较结果,也不会显示比较结果中国疾病预防控制中心中国疾病预防控制中心例 1:试分析ALT变化趋势。中国疾病预防控制中心中国疾病预防控制中心p data alt;p input id t1 t2 t3 t4;p cards;p 1 160 105 147 135p 2 415 371 258 182p 3 327 94 36 51p 4 174 113 63 50p 5 201 26 55 20p 6 289 20 17 21p 7 85 44 56 62p 8 176 165 136 83p 9 76 215 34 81p 10 75 94 51 59p ;p run;中国疾病预防控

21、制中心中国疾病预防控制中心p proc glm;proc glm;p model t1 t2 t3 t4=/nouni; /model t1 t2 t3 t4=/nouni; /* * model model语句指定语句指定4 4个因变量,即个因变量,即t1-t4t1-t4, nouni nouni表示不输出单变量分析结果表示不输出单变量分析结果 * */ /p repeated time 4 contrast(1)repeated time 4 contrast(1) /printe summary; / /printe summary; /* *repeatedrepeated语句指定有语

22、句指定有4 4个时间点个时间点; ; contrast(1) contrast(1)表示后表示后3 3个时间点分别与第个时间点分别与第1 1时时 间点比较间点比较; ; printe printe输出球性检验输出球性检验; ; summary summary输出后输出后3 3个时间点分别与第个时间点分别与第1 1时间时间 点比较的结果点比较的结果* */ /p run;run;中国疾病预防控制中心中国疾病预防控制中心p 第一部分第一部分是是重复测量的重复测量的基本信息及基本信息及部分矩阵信部分矩阵信息。息。p 给出了误差给出了误差SSCPSSCP矩阵的矩阵的偏偏相关系数相关系数阵阵以及以及误差

23、误差SSCPSSCP(交叉交叉乘积矩阵平乘积矩阵平方和方和)矩阵矩阵等。等。中国疾病预防控制中心中国疾病预防控制中心p 第二部分是球性检验第二部分是球性检验(sphericity testssphericity tests)结果。结果。这里这里repeatedrepeated语句语句没有没有指定指定polynomialpolynomial转换,转换,用用正交成分(正交成分(Orthogonal ComponentsOrthogonal Components)的结果作为判断标准。)的结果作为判断标准。p 本例本例P P值为值为0.04370.0437,提示不满足球性假定,提示不满足球性假定;因此

24、因此,后面的后面的分析应以分析应以校正结果校正结果或多变量方差分析结果为准。或多变量方差分析结果为准。中国疾病预防控制中心中国疾病预防控制中心第第三三部分是单变量方差分析结果部分是单变量方差分析结果,F F=7.77=7.77,P=P=0.0007,0.0007, 可以看出可以看出altalt随时间变化趋势显著随时间变化趋势显著。这里要看调整的结果这里要看调整的结果。G-GG-G校正系数和校正系数和H-FH-F校正系数分别为校正系数分别为0.58440.5844和和0.71440.7144,提示对球,提示对球性假定的偏离较大性假定的偏离较大(=1=1,无偏离),无偏离),在校正系数小于,在校正

25、系数小于0.750.75时,时,可采用可采用G-GG-G校正。校正。中国疾病预防控制中心中国疾病预防控制中心第四部分是contrast比较结果,治疗12周与疗前相比alt差异无统计学意义(P P=0.0907),治疗24周与疗前相比差异有统计学意义(P=P=0.0072)。中国疾病预防控制中心中国疾病预防控制中心p 本例分析结果本例分析结果显示:显示:4次次alt检测检测存在相关性,采用单变量存在相关性,采用单变量方差分析方差分析,要应用校正的结果,要应用校正的结果;4次次alt之间存在之间存在显著显著的趋的趋势势,有统计学意义,有统计学意义。p 下一个问题,下一个问题,存在什么趋势存在什么趋

26、势?我们?我们在在repeated语句中指定语句中指定polynomial来来进行检验进行检验。procglm;modelt1-t4=/nouni;repeatedtime4polynomial/printesummary;run;中国疾病预防控制中心中国疾病预防控制中心中国疾病预防控制中心中国疾病预防控制中心p time_Ntime_N表示正交多项式的第表示正交多项式的第n n阶水平,也就是阶水平,也就是n n次曲线。因此次曲线。因此time_1time_1表示对表示对1 1次次曲线(也就是直线)的分析,曲线(也就是直线)的分析,time_2time_2是对是对2 2次曲线的分析。次曲线的分

27、析。p 从结果看,曲线在从结果看,曲线在1 1阶上有统计学意义(阶上有统计学意义(P= =0.00360.0036),二阶),二阶和三阶和三阶上无统计学上无统计学意义,提示意义,提示4 4次时间的变化趋势是直线趋势,而不是二次次时间的变化趋势是直线趋势,而不是二次或三次或三次曲线趋势。曲线趋势。 p Analysis of variance of contrast variablesp Time_N represents the nth degree polynomial contrast for time中国疾病预防控制中心中国疾病预防控制中心例 2:某食物对血清胆固醇浓度的影响。中国疾病预

28、防控制中心中国疾病预防控制中心pdata cholesterol;pinput t1 t2 t3 type;pcards; p0.772.012.621p0.92.051.621p0.351.132.191p1.071.942.231p0.581.660.981p0.981.922.911p1.051.631.221p0.370.660.562p0.990.580.462p0.590.950.592p0.711.351.032p0.860.240.612p0.150.880.752p0.870.550.542p;prun;中国疾病预防控制中心中国疾病预防控制中心pprocglm;pclasst

29、ype;pmodelt1t2t3=type/nouni;prepeatedtime3polynomial/printesummary;prun;p 注注: :当当repeatedrepeated语句指定语句指定polynomialpolynomial变换时,如果观测变换时,如果观测的的时时间间隔不等,必须在间间隔不等,必须在timetime后用后用括号括号指定指定时间点时间点,如,如time(0 time(0 5 9)5 9)。因为正交多项式系数在等间隔和不等间隔时是截。因为正交多项式系数在等间隔和不等间隔时是截然不同的。如不指定,则默认为等间隔,计算的正交多然不同的。如不指定,则默认为等间隔

30、,计算的正交多项式结果会有偏差。项式结果会有偏差。中国疾病预防控制中心中国疾病预防控制中心第1部分中国疾病预防控制中心中国疾病预防控制中心p第二部分第二部分SASSAS给出给出球性检验结果球性检验结果,由于做了正交,由于做了正交转换,两个检验结果是一致的,提示满足球性假转换,两个检验结果是一致的,提示满足球性假设设(P P=0.4006=0.4006),直接直接用用单变量结果。单变量结果。中国疾病预防控制中心中国疾病预防控制中心第三部分第三部分结果结果:两组间差异两组间差异有有统计学意义(统计学意义(F F=36.30=36.30,PP0.00010.0001); ; 时时间点差异有统计学意义

31、(间点差异有统计学意义(F F=10.50=10.50,P P0.00050.0005); ; 时间和组别的交互作时间和组别的交互作用有统计学意义(用有统计学意义(F F=9.27=9.27,P P=0.0010=0.0010)。)。中国疾病预防控制中心中国疾病预防控制中心第第四四部分部分为为正交多项式结果正交多项式结果,由于共,由于共3 3次观测,因此给出了次观测,因此给出了2 2个阶次的结果。其中个阶次的结果。其中meanmean表示时间点之间的差异,表示时间点之间的差异,typetype表示两组曲线趋势的差异。可表示两组曲线趋势的差异。可见见typetype在在第第1 1个阶次上有统计学

32、意义,在个阶次上有统计学意义,在第第2 2个阶次上个阶次上无无统计学意义统计学意义,提示提示在在1 1阶上阶上两组的两组的变化趋势不同。变化趋势不同。meanmean在在1 1阶和阶和2 2阶上阶上均均有统计学意义,提示在有统计学意义,提示在1 1阶和阶和2 2阶阶上上各时各时间点是有差异的。间点是有差异的。中国疾病预防控制中心中国疾病预防控制中心中国疾病预防控制中心中国疾病预防控制中心四、多变量方差分析p 多变量方差分析是把多次重复测量值看作是一个多维的多变量方差分析是把多次重复测量值看作是一个多维的结构,通过多维变量的协方差矩阵进行统计推断。结构,通过多维变量的协方差矩阵进行统计推断。p 在单变量的方差分析中,总的离均差平方和可分解为组在单变量的方差分析中,总的离均差平方和可分解为组间和组内两部分。多变量方差分析由于是多维结构,因间和组内两部分。多变量方差分析由于是多维结构,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论