SAS 协方差分析.pptx_第1页
SAS 协方差分析.pptx_第2页
SAS 协方差分析.pptx_第3页
SAS 协方差分析.pptx_第4页
SAS 协方差分析.pptx_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SAS 协方差分析,实验设计课件,当定量的影响因素对观察结果有难以控制的影响,甚至还有交互作用时,采用协方差分析,这些影响变量称为协变量,扣除(或消除)协变量的影响,可以得到修正后的均值估计,一、协方差分析概述,协方差分析(analysis of covariance)又称带有协变量的方差分析(analysis of variance with covariates),是将回归分析与方差分析结合起来使用的一种分析方法。 在各种试验设计中,对主要变量y研究时,常常希望其他可能影响和干扰y的变量保持一致以到达均衡或可比,使试验误差的估计降到最低限度,从而可以准确地获得处理因素的试验效应。 但是有时

2、,这些变量难以控制,或者根本不能控制。 为此需要在试验中同时记录这些变量的值,把这些变量看作自变量,或称协变量(covariate),建立因变量y随协变量变化的回归方程,这样就可以利用回归分析把因变量y中受协变量影响的因素扣除掉,从而,能够较合理地比较定性的影响因素处在不同水平下,经过回归分析手段修正以后的因变量的总体均值之间是否有显著性的差别。 简单地说,协方差分析是扣除协变量的影响,或者将这些协变量处理成相等,再对修正的y的均值作方差分析。,协方差分析的假定,各样本来自具有相同方差 的正态分布总体,即要求各组方差齐性。 协变量与主要变量y间的总体回归系数不等于0。 各组的回归线平等,即回归

3、系数 。 如果上述的假定满足,就作协方差分析。前述的各种试验设计,如完全随机化设计、随机区组设计、析因设计、拉丁方设计等,都可以带一个或多个协变量,按设计方案扣除协变量的影响后,对主要变量y的修正均值作比较,得出统计结论。,协方差分析的模型,最简单的单因素一元协方差分析的模型,是由单因素效应模型 加上协变量的影响因素 而得出: 其中 为协变量, 为协变量在分类水平i和j上的记录值, 为所有协变量的平均值, 为相关的回归系数。设 为平均截距。上式可以化简成 设 , ,上式可以化简成 (26.3) 很明显 是第i组回归线的截距,等于回归线的平均截距 加上本组的效应 。这个式揭示了,观察值 的模型可

4、以表示成一组相似的回归线,且各组具有共同的回归系数 ,和各组自己的截距 。,SAS 协方差分析模型,用SAS中的glm过程进行协方差分析时,要注意不同试验设计时class语句和model语句的写法。设分类变量为A、B,协变量为X,观察值为Y,则有: 单因素k水平设计的协方差分析模型 class A; model X A ; 随机区组设计的协方差分析模型 class A B; model X A B ; 两因素析因设计的协方差分析模型 class A B; model X A B A*B;,实例分析,一元协方差分析 多元协方差分析,一元协方差分析,例1 研究牡蛎在不同温度的水中不同位置上的生长情

5、况。 有人做了如下试验:分别在通向发电站的入口处(温度较低)不同位置(底部和表层)和出口处(温度较高)不同位置(底部和表层)及电站附近的深水处(底部和表层的中间)总共5个不同位置点上,随机地各放4袋牡蛎(每袋中有10个),共54=20袋。在将每袋牡蛎放入位置点之前,先洗干净称出每袋的初始体重,放在5个不同点一个月后再称出最后体重。试验结果数据见表26.1所示。,表1 牡蛎在不同温度和位置上的生长数据,SAS程序,data growth; do trt=1 to 5; do rep=1 to 4; input x y ; output; end; end; cards; 27.2 32.6 32

6、.0 36.6 33.0 37.7 26.8 31.0 28.6 33.8 26.8 31.7 26.5 30.7 26.8 30.4 28.6 35.2 22.4 29.1 23.2 28.9 24.4 30.2 29.3 35.0 21.8 27.0 30.3 36.4 24.3 30.5 20.4 24.6 19.6 23.4 25.1 30.3 18.1 21.8 ; Run;,proc anova data=growth; class trt; model y=trt; proc glm data=growth; class trt; model y=trt x /solution;

7、 means trt; lsmeans trt /stderr tdiff; contrast trt12 vs trt34 trt -1 -1 1 1 0; estimate trt1 adj mean intercept 1 trt 1 0 0 0 0 x 25.76; estimate trt2 adj mean intercept 1 trt 0 1 0 0 0 x 25.76; estimate adj trt diff trt 1 -1 0 0 0; estimate trt1 unadj mean intercept 1 trt 1 0 0 0 0 x 29.75; estima

8、te trt2 unadj mean intercept 1 trt 0 1 0 0 0 x 27.175; estimate unadj trt diff trt 1 -1 0 0 0 x 2.575; Run;,定性变量trt的5个不同位置点对y可能有较大的影响,class语句中分组变量为trt,先选用anova过程进行方差分析,牡蛎的初始体重x对牡蛎的最后体重y可能也有一定的影响,故适合选用glm过程进行协方差分析,在model语句中不仅包括分组变量trt,而且应包括协变量x。,选择项solution要求输出回归系数的估计值及其标准误差和假设检验等结果,means和lsmeans语句要求

9、输出分组变量trt各水平下y的未修正均值和修正后的均值,选择项stderr要求输出y的修正均值的标准误差、各修正均值与0比较的假设检验结果;选择项tdiff要求输出y的各修正均值之间两两比较所对应的t值和p值。,Contrast语句是用来比较入口处底部和顶部均值之和与出口处底部和顶部均值之和是否相等。前三条estimate语句是用来估计入口处底部和顶部调整后的均值及它们之差,并假设检验是否为0,后三条estimate语句是用来估计入口处底部和顶部未调整的均值及它们之差,并假设检验是否为0。程序输出的主要结果见表26.2(a)(b)(c)所示。,结果分析,The SAS System Analy

10、sis of Variance Procedure Dependent Variable: Y Source DF Sum of Squares Mean Square F Value Pr F Model 4 198.40700000 49.60175000 4.64 0.0122 Error 15 160.26250000 10.68416667 Corrected Total 19 358.66950000 R-Square C.V. Root MSE Y Mean 0.553175 10.59706 3.26866436 30.84500000 Source DF Anova SS M

11、ean Square F Value Pr F TRT 4 198.40700000 49.60175000 4.64 0.0122,结果分析:对分组变量trt的方差分析表明,即使当初始体重x不考虑,各分组最后体重均值的区别也统计显著(0.01220.05),其中分组变量trt的平方和为198.40700000。,结果分析,The GLM Procedure Dependent Variable: y Sum of Source DF Squares Mean Square F Value Pr F Model 5 354.4471767 70.8894353 235.05 F trt 4 1

12、98.4070000 49.6017500 164.47 F trt 4 12.0893593 3.0223398 10.02 0.0005 x 1 156.0401767 156.0401767 517.38 .0001,结果分析,而在协方差分析中,分组变量trt的类型1的平方和等于方差分析中的平方和198.40700000,分组变量trt的类型3的平方和为12.08935928,大大小于类型1的平方和,是因为类型3的平方和反映了经过共同的协变量x调整后的平方和,减去了协变量的影响,所以平方和大幅减小。 类型1是一种未经过调整的平方和,因为它的优先级高于协变量的调整。 更进一步分析,我们注意

13、到方差分析中均方误差为10.68416667,而协方差分析中却缩小到0.30159452,相应地分组变量trt的F统计量从4.64增加到10.02,说明包含了协变量后分组的区别更加显著,原因是简单方差分析中,大多数的误差是由于初始体重x的变异造成的。,Standard Parameter Estimate Error t Value Pr |t| Intercept 2.494859769 B 1.02786287 2.43 0.0293 trt 1 -0.244459378 B 0.57658196 -0.42 0.6780 trt 2 -0.280271345 B 0.49290825 -

14、0.57 0.5786 trt 3 1.654757698 B 0.42943036 3.85 0.0018 trt 4 1.107113519 B 0.47175112 2.35 0.0342 trt 5 0.000000000 B . . . x 1.083179819 0.04762051 22.75 .0001,选择项solution的输出结果,对模型中的截距、各分组变量和协变量的回归系数进行估计和检验,在这个单因素trt的情况下,估计是以最后一个水平trt5(trt=5)为对照组,并且设置它的系数为0,因此截距intercept的估计值是分组trt5的估计值。其他四个分组trt的系数

15、估计是每一个与trt5进行比较而得到的。 注意,出口处的trt3和trt4分组是不同与trt5分组。 协变量x的系数是合并各组内y和x所得到的回归系数,即是由5个独立的trt分组,分别回归y和x后得到回归系数然后加权平均。协变量x的系数估计值表明,初始体重变动1个单位最后体重y相关地要变动1.083179819单位。,表2(b) 未调整均值和调整均值及均值之间的比较,有计划的均值对比和参数估计,否为0进行假设检验,结果却为非常显著。因此,我们可以看到使用调整后均值进行估计是必要的。,多元协方差分析,例2 研究男女儿童的体表面积是否相同。考虑到儿童的身高和体重对表面积可能有影响,在某地测量了男女

16、各15名初生至3周岁儿童的身高、体重和体表面积,得到测量数据见表26.3所示。,表2 周岁男女儿童的身高、体重和体表面积,proc format; value sexname 1=male 2=female; data child; do i=1 to 15; do sex=1 to 2; input x1 x2 y ; format sex sexname.; output; end; end; cards; 54.0 3.00 2446.2 54.0 3.00 2117.3 50.5 2.25 1928.4 53.0 2.25 2200.2 51.0 2.50 2094.5 51.5 2.

17、50 1906.2 56.5 3.50 2506.7 51.0 3.00 1850.3 52.0 3.00 2121.0 51.0 3.00 1632.5 76.0 9.50 3845.9 77.0 7.50 3934.0 80.0 9.00 4380.8 77.0 10.0 4180.4 74.0 9.50 4314.2 77.0 9.50 4246.1 80.0 9.00 4078.4 74.0 9.00 3358.8 76.0 8.00 4134.5 73.0 7.50 3809.7 96.0 13.5 5830.2 91.0 12.0 5358.4 97.0 14.0 6013.6 9

18、1.0 13.0 5601.7 99.0 16.0 6410.6 94.0 15.0 6074.9 92.0 11.0 5283.3 92.0 12.0 5299.4 94.0 15.0 6101.6 91.0 12.5 5291.5 ; proc glm data=child; class sex; model y=sex x1 x2 /solution; lsmeans sex /stderr tdiff; run;,程序说明:本例为带有两个协变量x1和x2,一个分组变量sex的完全随机化设计的多元协方差分析。 data步中为了便于读人数据,sex分组变量取值为1和2,但又为了显示清楚,用format过程自定义了sexname.格式,用于sex变量的显示格式。在class语句中只能有sex分组变量,而在model语句中应把观察指标放在等号的左边,分组变量和协变量放在等号的右边,solution选项求回归方程的系数估计。lsmeans语句求修正后均值,stderr选项求均值的标准误差,tdiff选项求均值对比的t值和p值。程序输出的主要结果见表26.4所示。,Source DF Type I SS Mean Square F Value Pr F SEX 1 714100.40833333 714100

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论