第3章方差分析精品课程_第1页
第3章方差分析精品课程_第2页
第3章方差分析精品课程_第3页
第3章方差分析精品课程_第4页
第3章方差分析精品课程_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章方差分析(初稿)3.1单因素方差分析的数学模型首先让我们看两个例子:例3.1 设甲、乙、丙三块麦田的基本苗数(按面积大小抽取样本点数)得表3.1,问三块地的基本苗数是否有显著差别?表3.1三块麦田的基本苗数甲乙丙2120242925222425282223252529213031262724.2626.20.21.例3.2为了研究淬火温度和等温温度对铣刀硬度的影响三种不同淬火温度和三种等温温度淬火,测得铣刀平均硬度如表3.2,检验淬火温度及等温温度是否对硬度y有显著影响。 表3.2 淬火温度与等温温度对硬度的影响淬火温度等温温度B1B2B3A1646668A2666867A3656768

2、这两个例子和以前回归分析的问题不同首先,它们都只考察某种因素(地块、淬火温度、等温温度)在一系列试验中对产品某个指标(寿命、得率)的影响是否显著,而不要求建立回归方程;其次,这些因素可以不是定量的(如地块),即或这些因素是定量(如淬火温度与等温温度)但其数值也不作为回归中变量的观察值,而只是代表一种处理(试验方案);最后,当因素确定后,可以作反复的试验。这两个例子和以前均值假设检验也不同,均值假设检验不考虑因素问题,而方差分析要考虑。 在许多科学研究中都遇到和这两个例子类似的问题。尤其是科学研究中常涉及许多因素,例如研究作物栽培时,要考虑播种期、品种、土质、施肥方式、灌溉方式对产量的影响;在化

3、学反应中要观察原料成分、剂量、催化剂、温度、压力,搅拌速度等对得率的影响。这些因素中要选出影响大的,以进一步安排更细致的试验,而判断一个因素的影响“是否大”的主要方法就是方差分析。 我们所考察的。影响产品指标的因素(如产地,温度等)也称为因子,用大写字母A,B,C表示,例1有一个因子(地块),例2有2个因子(如淬火温度与等温温度)。因素所能处的状况,如甲、乙、丙;60,65,70,75,称为因子的水平,简称为水平。例1的因子有三个水平(甲、乙、丙),例2每个因子恰也有3个水平,水平常以表示。因子也可以看成是一种变量,其取值不是数,而是水平。例如“产地”是一个变量,它取的值是“北京”、“上海”、

4、“南京”等。这种变量称为属性变量,定性变量或分类变量本节只讨论一个因子,即一个分类变量的方差分析单因子方差分析。方差分析的目的在于找出自变量与因变量之间的线性关系,或自变量对因变量的实验效果。这种实验效果可分为:主效果、交互效果、镶嵌效果。Qualitative Variable(自变量,又称独立变量、定性变量),Classification Variable(分类变量,其数值多半是不连续的。Response Variable(因变量,又称反应变量,其数值则是连续的)一般地,假设因素A有k个水平:。第j个水平做实验次,得指标y,的个数据。例3.1中。通常作如下假设:(1) 同一个水平下得到的观

5、测值,是由于实验过程中各种偶然因素的干扰及测量误差所致,每次实验中这些偶然因素的总和称为实验误差,它们是方差相同的零均值正态随机变量;(2) 所有误差相互独立;(3) 由于水平的不同,可能会给一个定量的确定性的影响,其大小是未知的。于是我们建立单因子方差分析数学模型 (3.1)其中相互独立,。(4.1)式称为单因素方差分析的数学模型。判断这个因素的影响是否显著就是要检验假设:,不全相等令 ,容易证明是的最小二乘估计 作方差分解并令,即:-总的误差平方和组内差,反映试验误差影响的大小。-组间差,反映因素A的各个水平不同引起的误差,若A的水平引起的误差显著时,就比较大,反之就比较小。则有:分别称为

6、组内差和组间差。组内差又称为误差,用以估计实验误差影响的大小;组间差反映因素A的水平不同引起的系统差异。若A的水平不同引起的系统差异(即组间的差距)显著时,SSA就比较大;反之,当A引起的系统差异不显著时,SSA就比较小而SSE主要是由试验误差引起的。SSA由k个平方之和形成,但有一个恒等式约束,只有k-1个自由度;同理SSE有n-k个自由度。下列定理给出SSA/SSE的分布定理: 对于所给的模型,若成立时,则 如果F的值超过临界值(通常取为),就否定;当F超过时,就称为高度显著。当成立时,F的值不应太大,若F的值大于临界值时,就应否定,即认为间存在显著差异。一般总用方差分析表表示计算结果,其

7、形式为:方差来源平方和自由度均方F值临界值因素AK-1F误差N-K总和N-13.2 方差分析的计算方差分析的计算一般都很复杂,可用SAS软件计算。SAS中有GLM,ANOVA和NESTED等过程可用方差分析。其中GLM过程和ANOVA最常用。3.2.1 PROC ANOVAPROC ANOVA 执行对均衡数据的方差分析,其应变量取连续值。所谓均衡数据是指对每个类变量的组合有同样多的响应变量观察值数。如果数据的非均衡的就要用PROC GLM,做方差分析。ANOVA的语法为: PROC ANOVA DATA= SAS-data-set MANOVA MULTIPASS OUTSTAT= SAS-d

8、ata-set; CLASS variables; /* required */ MODEL dependents=effects / options; /* required */ ABSORB variables; BY variable-list; FREQ variable; MANOVA H= effects E= effect M= equations. MNAMES= names PREFIX= name / options; MEANS effects / options; REPEATED factorname levels(levelvalues) transformati

9、on<,.> / options;TEST H= effects E= effect;其中PROC ANOVA、CLASS variables和MODEL dependents=effects / options是必须的。CLASS variables给出分类变量名,这些变量可以是数值的也可以是字符型的,而且CLASS必须在MODEL语句之前。MODEL dependents=effects ,给出应变量和自变量。其后有若干选项。322 PROC GLMPROC GLM 用最小二乘法拟合线性模型。该过程可以用来做回归、方差分析、协方差分析等。PROC GLM是在广义线性模型的框架下

10、分析数据。处理的数据可以是类变量、离散变量或连续变量。其只要功能是:A、simple regression B、 multiple regression C、 analysis of variance (ANOVA), especially for unbalanced data D、 analysis of covariance E、response-surface models F、weighted regression G、 polynomial regression H、 partial correlation I、 multivariate analysis of variance

11、(MANOVA) J、repeated measures analysis of variance. 其语法为:PROC GLM options ; CLASS variable-list; MODEL dependents= independents / options; /* required */ ABSORB variable-list; BY variable-list; FREQ variable; ID variable-list; WEIGHT variable; CONTRAST 'label' effect values. / options; ESTIMA

12、TE 'label' effect values. / options; LSMEANS effects / options; MANOVA H= effects E= effect M= equations. MNAMES= names PREFIX= name / options; MEANS effects / options; OUTPUT OUT= SAS-data-set keywords= names. ; RANDOM effects / options; REPEATED factorname levels (levelvalues) transformati

13、on<,.> / options;TEST H= effects E= effect / options;其中PROC GLM options 、CLASS variable-list、MODEL dependents= independents /是必须的。MODEL dependents= independents 的选项有:NOINT INTERCEPT NOUNI SOLUTION TOLERANCE E E1 E2 E3 E4 SS1 SS2 SS3 SS4 ALPHA= p CLM CLI P XPX INVERSE SINGULAR= value ZETA= valu

14、e *|上述选项可分为五大类:第一类选项 与截距的界定有关,有两个选项:(1) NOINT 要求GLM将截距的参数排除在模型之外(2) INT要求GLM印出截距的统计鉴定。第二类选项 与报表的打印有关,有三个选项:(1) NOUNI(2) SOLUTION(3) TOLERANCE第三类选项与原假设的检验有关,有九个:E E1E2E3E4SS1SS2SS3SS4第四类选项与控制计算过程有关:XPXINVERSE第五类选项可用来调整统计的精度:ZETAGLM过程主要有四个语句:PROC GLM,CLASS,MODEL和LSMEANS语句PROC GLM语句用以调用GLM过程,有许多选项,其中DA

15、TA选项用以说明GLM过程所加工的数据集。CLASS语句说明哪些变量是分类变量。方差分析中的因素都是分类变量,响应变量和协方差分析中的协变量不是分类变量。例如class x z;就指示计算机把因子x ,z作为分类变量。MODEL语句中有等号,等号前是响应变量.LSMEANS语句用以求待估参数的最小二乘估计。323 计算实例例3.1(续),可用下列SAS程序dataseed;input area $ y;cards;甲21甲 29甲 24甲 22甲 25甲 30甲 27甲 26乙 20乙 25乙 25乙 23乙 29乙 31乙 24乙 26乙 20乙 21丙 24丙 22丙 28丙 25丙 21

16、丙 26;procglm;class area;model y=area;run;执行此程序后,得到的主要输出有The GLM ProcedureDependent Variable: y Sum of Source DF Squares Mean Square F Value Pr > F Model 2 6.7666667 3.3833333 0.32 0.7314Error 21 223.7333333 10.6539683 Corrected Total 23 230.5000000 R-Square Coeff Var Root MSE y Mean 0.029356 13.1

17、8805 3.264042 24.75000 Source DF Type I SS Mean Square F Value Pr > F area 2 6.76666667 3.38333333 0.32 0.7314 Source DF Type III SS Mean Square F Value Pr > F area 2 6.76666667 3.38333333 0.32 0.7314其中DF列表示自由度,Som of Squares列表示平方和。从 Error行DF列可查得误差自由度为2,从Som of Squares列可查得误差(残差平方和)为223.7333333

18、;由area 行DF列可查得组间查自由度为21,从Type III SS列可查得组间差为6.76666667,从F Value列查得F值为0.32;从 Pr > F查得自由度为(2 ,21)的 F分布随机变量大于0.32的概率为0.7314。它们构成表3.3。表3.3 例3.1的方差分析表方差来源平方和自由度均方F值F分布随机变量大于1.14的概率因素area6.7666666723.383333330.320.7314误差223.73333332110.6539683总和230.500000023表3.3中自由度为(2 ,21)的 F分布随机变量大于0.32的概率为0.7314,大于0

19、.05,所以地块因素(area)作用不显著,即由于地块不同,基本苗数没有差异。例3.1的SAS程序也可简化为data seed;/*建立数据库seed*/do area=1to3;/*循环语句开始,area=1,2,3分别表示甲乙丙三地块*/input y ;/*读入y的值*/output;/*将area 、y的值存入建立数据库seed*/end;/*结束循环*/cards;2120242925222425282223252529213031262724.2626.20.21.;procglm;class area;model y=area;run;例33 本文件(CLOVER)包含一个自变量

20、及一个因变量。自变量是苜蓿的培养基,下分六种(即3DOK1, 3DOK4,3DOK5,。,COMPOS等,因变量是红色苜蓿内氮气的含量。这是一个平衡的实验设计,我们用ANOVAC程序执行单因素的方差分析,并比较各培养基组的平均氮气含量。 data clover; input strain $ nitrogen ; cards; 3dok1 19.4 3dok1 32.6 3dok1 27.0 3dok1 32.1 3dok1 33.0 3dok5 17.7 3dok5 24.8 3dok5 27.9 3dok5 25.2 3dok5 24.3 3dok4 17.0 3dok4 19.4 3do

21、k4 9.1 3dok4 11.9 3dok4 15.8 3dok7 20.7 3dok7 21.0 3dok7 20.5 3dok7 18.8 3dok7 18.6 3dok13 14.3 3dok13 14.4 3dok13 11.8 3dok13 11.6 3dok13 14.2 compos 17.3 compos 19.4 compos 19.1 compos 16.9 compos 20.8 ; proc anova; class strain; model nitrogen=strain; means strain / duncan waller; means strain /

22、lsd tukey cldiff; run;结果分析:六组含氮量经F检验后证明不尽相同。3DOK5组与3DOK4,3DOK13两组也有显著的不同。3DOK7与3DOK5组的平均数近似,3DOK4与3DOK13两组的结果十分接近。其他的不能达成共识。这个例子是均衡数据,既可以用ANOVA也可以用GLM实现,而前一个 例子是非均衡数据只能用GLM进行计算。SAS的GLM过程采用采用哑变量方法,以便作方差分析和协方差分析。该过程的数学原理是建立一般线性模型(类似回归模型): (3.2)并用最小二乘法求解。在方差分析问题中,引进的变量都是示性变量,即只取0或1的变量。GLM过程对每一因子的每一水平,通

23、过class语句产生1个示性变量。对于例4.1的计算,一般线性模型是其中对于地块甲=1,否则为0;对于地块乙=1,否则为0;对于地块丙=1,否则为0。从而设计矩阵是1100110011001100110011001010101010101010101010101010101010101010100110011001100110011001 对于一般线性模型,由于设计矩阵不满秩,的解不是唯一的,但残差平方和是唯一确定的,从而F检验可行。这从以下例3.1的一般线性模型计算可见。 令。为使S最小,分别对偏导得、注意到是是示性函数,=+,所以的解不是唯一的。由、分别可得代入可得最小值。SAS-GLM过

24、程的假设检验总要用到3型平方和(Type III SS)。3型平方和定义如下:设方差分析问题有m个因子,不包含某个因子一般线性模型的残差平方和减去包含全体因子一般线性模型的残差平方和之差称为该因子的3型平方和。例3.1中Type III SS计算步骤如下:先求不含地块因子的最小值=223.7333333再求求不含地块因子的最小值= 230.5000000Type III SS=230.5-223.7333333=6.76666667参见复旦大学编,概率论,第二册,第一分册29页,定理4(Cochran),37页定理5。3.3 多因子方差分析实际问题中往往要考虑多因素的影响,例如,检验药效时,要

25、用多种剂量的药对不同品种动物试验观察其效果;化工反应要考虑反应温度、浓度、反应时间等对得率的影响。和单因子方差分析一样,需要检验这些因子的影响是否显著,这就是多因子方差分析问题。例3.2中的因子就是淬火温度及等温温度,是双因子分析问题。由于因素越多,公式越复杂,我们着重介绍两因素的方差分析,更多因素的方差分析的原理是一样的,用SAS计算的程序也是相同的。331一般双因素无重复试验无交互作用的模型设有两个因子A、B,各有p、q个水平,时y的观测值为。假设:(1) A的第I个水平使y增加;(2) B的第j个水平使y增加 ;(3) 试验误差是方差相等均值为零的正态随机变量;(4) 试验误差相互独立。

26、则得到模型为:要检验因素A、B的影响是否显著,就相当于分别检验以下假设:,不全为零;,不全为零。令,可以证明:是的最小二乘估计;是的最小二乘估计。作方差分解并令,其中SSA称为A的组间差,它由p个平方和组成,有一等式约束,自由度是p一1,反映A引起的系统差异;SSB称B的组间差,反映B引起的系统差异,自由度是q一1;SSE称为误差,反映各种随机因素引起的差异,由pq个平方和组成,包含(p+q-1) 个等式(等式可用上述等式中前p个之和减去后q-1个之和而得)所以自由度为(p-1(q-1)即有: 则有方差分解:其中反映了A引起的系统误差,反映了B引起的系统误差,反映了其它随机误差。我们有定理:定

27、理3。2: 当为真时,有:当当为真时,有:可由是否超过临界值,判断响应的假设是否成立。上述结果可以类似地用方差分析表的形式给出。例5.2(续),可用下列SAS程序data quench;do eqt=1to3;do qut=1to3;input hard ;output;end;end;cards;64 66 6866 68 6765 67 68;procglm;class eqt qut;model hard=eqt qut;run; 执行此程序得到的主要输出有Dependent Variable: hard Sum of Source DF Squares Mean Square F Va

28、lue Pr > F Model 4 13.11111111 3.27777778 4.21 0.0962 Error 4 3.11111111 0.77777778 Corrected Total 8 16.22222222 R-Square Coeff Var Root MSE hard Mean 0.808219 1.325084 0.881917 66.55556 Source DF Type I SS Mean Square F Value Pr > F eqt 2 1.55555556 0.77777778 1.00 0.4444 qut 2 11.55555556 5

29、.77777778 7.43 0.0450 Source DF Type III SS Mean Square F Value Pr > F eqt 2 1.55555556 0.77777778 1.00 0.4444 qut 2 11.55555556 5.77777778 7.43 0.0450从 Error行DF列可查得误差自由度为4,从Som of Squares列可查得误差(残差平方和)为3.11111111。由eqt行DF列可查得等温温度组间差自由度为2,从Type III SS列可查得组间差为1.55555556,从F Value列查得等温温度F值为1.00;从 Pr &

30、gt; F查得自由度为(2 ,2)的 F分布随机变量大于1.0的概率为0.444 4。由qut行DF列可查得淬火温度组间差自由度为2,从Type III SS列可查得淬火温度组间差为11.55555556,从F Value列查得淬火温度F值为7.43;从 Pr > F查得自由度为(2 ,2)的 F分布随机变量大于7.43的概率为0.0450。对于例3.2全部计算结果可以列成方差分析表表35.4表3.4方差来源平方和自由度平均平方和F临界值因素A(等温温度)1.555620.77781.0=6.94因素B(淬火温度)11.555625.77787.43=6.94误差3.111040.777

31、8总和16.22228由表3.4可见:不否定,否定从而B因素的作用是显著的,A因素的作用不显著,即淬火温度对铣刀硬度有显著影响,而等温温度(即闷火温度)没有显著影响模型式的优点是不需做重复试验,即对A,B不同水平,每一组合只需做一次试验,这大大节省人力、物力,但也有缺点,如例4.3所示。 对于多因子方差分析,GLM过程对每一因子的每一水平,通过class语句产生1个示性变量。例3.2中有6个示性变量(3个示性变量表示等温温度,3个示性变量表示沾火温度)。一般线性模型是由于设计矩阵不满秩,解不唯一。但残差平方和是唯一确定的,从而F检验可行。 例3.2中Type III SS计算步骤如下:先求包含

32、所有因子的最小值=3.1111再求不含等温温度因子的最小值=4.66667等温温度因子的3型平方和就是Type III SS=4.66667-3.11111=1.55556然后求不含沾火温度因子的最小值=14.66667沾火温度因子的3型平方和就是Type III SS=14.66667-3.11111=11.55556332 双因素有重复试验有交互作用模型例3.4对三种推进器(、)和四种燃料(、)试验火箭的射程,得表5.5。推进器M与燃料F的作用是否显著?表3.5 火箭的射程推进器燃料58.2,52.656.2,41.265.3,60.849.1,42.854.1,50.551.69,48.

33、460.1,58.370.9,73.239.2,40.775.8,71.558.2,51.048.7,41.4以F与M为因素按模型(4.4)式分析时,可采用SAS程序data rockey;do f=1to4;do m=1to3;do rep=1to2;input r;output;end;end;end;cards;58.2 52.6 56.2 41.2 65.3 60.849.1 42.8 54.1 50.5 51.6 48.460.1 58.3 70.9 73.2 39.2 40.775.8 71.5 58.2 51.0 48.7 41.4;procglm;class f m;model

34、 r=f m;run;从所得结果可见推进器和燃料引起的射程差异不显著,是否这些推进器和燃料对射程的影响不大呢?并不是这样的,从表(4.5)中可见,和的组合射程很远;和的组合射程很近,不同水平的射程值作了平均后就不大不小了的缘故。因而模型(4.4)不能反映推进器和燃料的搭配对射程的影响。为了反映两种因素搭配后的影响,必须引入“交互作用”的概念。设有两个因子A、B,各有p、q个水平,对A、B的每个组合作k次重复试验(为了检验交互作用必须有重复实验)。y的观测值为。假设:(1) 的第I个水平使y增加;(2) B的第j个水平使y增加 ;(3) 的交互作用使Y增加。(4) 试验误差是方差相等均值为零的正

35、态随机变量;(5) 试验误差相互独立。于是有数学模型:其中分别称为因子A、B的主效应;称为A与B的交互效应。当考虑交互作用时,方差分析问题就要检验,不全为零;,不全为零;,不全为零。并令,其中SSA称为A的组间差,反映A引起的发散程度,统计它们包含等式个数容易看出,自由度是p一1;SSB称B的组间差,反映B引起的发散,自由度是q一1;SSAB反映AB交互作用效应引起的发散;自由度是(p-1)(q-1),SSE称为误差,反映各种随机因素引起的发散,自由度是pq(k-1)。则有方差分解:其中反映了A引起的系统误差,反映了B引起的系统误差,反映了A与B的交互作用,反映了其它随机误差。我们有定理:定理

36、: 当为真时,有:当当为真时,有:当为真时,有可由是否超过临界值,判断响应的假设是否成立。而且这3个检验是相互独立的。所以当之一大于临界值时,A,B因素的主效应或交互作用效应显著。上述结果可以类似地用方差分析表的形式给出。表5.8 方差分析方差来源平方和自由度平均平方和F因子ASSAp一1SSA(p一1)因子BSSBq一1SSB(q一1)交互作用SSAB(p-1)(q-1)SSAB/(p-1(q-1)误差SSEpq(k-1)总和TSSPq(k-1)用SAS软件计算交互作用时,只需在有关因子中加*号。例如MODEL z=a b c a*b;指示计算机把a,b,c作为因子;考虑a,b的交互作用。例

37、3.4 的解:考虑交互作用的方差分析可用下述模型其中,且相互独立。并用程序data rockey;/*建立数据库rockey*/do f=1 to 4;/*开始循环,燃料因子取水平1、2、3、4*/do m=1 to 3; /*循环,发动机因子取水平1、2、3*/do rep=1 to 2;/*每个组合重复2次,变量rep计算中不起作用*/input r;/*读入变量r*/output;end;end;end;cards;58.2 52.6 56.2 41.2 65.3 60.849.1 42.8 54.1 50.5 51.6 48.460.1 58.3 70.9 73.2 39.2 40.7

38、75.8 71.5 58.2 51.0 48.7 41.4;proc glm;class f m;model r=f m f*m;/*对主效应f、m和交互作用效应 f*m*作方差分析/lsmeans f m f*m; /*求主效应f、m和交互作用效应 f*m*的最小二乘估计/run;执行此程序后得到主要输出如下General Linear Models ProcedureDependent Variable: R Sum of MeanSource DF Squares Square F Value Pr > FModel 11 2401.348333 218.304394 11.06

39、0.0001Error 12 236.950000 19.745833Corrected Total 23 2638.298333 R-Square C.V. Root MSE R Mean 0.910188 8.080549 4.443628 54.99167从 Error行DF列可查得误差自由度为12,从Som of Squares列可查得误差(残差平方和)为236.95,从 Pr > F的值为0.0001可见,一般线性模型的线性关系是高度显著的。Dependent Variable: RSource DF Type I SS Mean Square F Value Pr >

40、FF 3 261.675000 87.225000 4.42 0.0260M 2 370.980833 185.490417 9.39 0.0035F*M 6 1768.692500 294.782083 14.93 0.0001Source DF Type III SS Mean Square F Value Pr > FF 3 261.675000 87.225000 4.42 0.0260M 2 370.980833 185.490417 9.39 0.0035F*M 6 1768.692500 294.782083 14.93 0.0001由F行DF列可查得燃料组间差自由度为3,

41、从Type III SS列可查得燃料组间差为261.675000,从F Value列查得燃料F值为4.42;从 Pr > F查得发动机自由度为(3 ,12)的 F分布随机变量大于4.42的概率为0.0260。由M行DF列可查得发动机组间差自由度为2,从Type III SS列可查得发动机组间差为370.980833,从F Value列查得淬火温度F值为9.39;从 Pr > F列查得自由度为(2 ,12)的 F分布随机变量大于9.39的概率为0.0035。由F*M行DF列可查得交互作用自由度为6,从Type III SS列可查得交互作用组间差为1768.692500,从F Valu

42、e列查得交互作用F值为14.93;从 Pr > F查得自由度为(2 ,12)的 F分布随机变量大于14.93的概率为0.0001。此表配合前表即可得例3.3方差分析表表3.4 表3.4 例3.3方差分析表方差来源自由度平方和平均平方和F值Pr>FF(燃料)3261.65700087.2250004.420.0260M(发动机)2370.980933185.490174.390.0035F*M(交互作用)61768.692500294.78208614.93·0.0001SSE(误差)12236.950019.745833总和232638.29833从方差分析表可见:F(燃

43、料)对应的概率在0.01与0.05之间,说明燃料的作用显著;M(发动机)及F*M(交互作用)对应的概率小于0.01,说明发动机与交互作用的影响高度显著。Least Squares Means F R LSMEAN 1 55.7166667 2 49.4166667 3 57.0666667 4 57.7666667上表给出不同燃料的射程均值(的最小二乘估计)。 Least Squares Means M R LSMEAN 1 58.5500000 2 56.9125000 3 49.5125000上表给出不同发动机的射程均值(的最小二乘估计)。 Least Squares Means F M

44、R LSMEAN 1 1 55.4000000 1 2 48.7000000 1 3 63.0500000 2 1 45.9500000 2 2 52.3000000 2 3 50.0000000 3 1 59.2000000 3 2 72.0500000 3 3 39.9500000 4 1 73.6500000 4 2 54.60000004 3 45.0500000上表给出不同燃料与发动机组合的射程均值(的最小二乘估计)。由表可见,最远的射程是由第四种燃料与第一种发动机组合形成的,平均射程为7365公里。注意:考虑交互作用时,不要写赋值语句333 PROC ANOVA的进一步讨论和实例P

45、ROCANOVA 前面已经做了一些介绍。下面进一步作一些讨论。假设有一个平衡的实验设计,含有三个自变量(A、B、C),因变量以Y记,则此三个因子的主效应方差分析可以用下面的程序来执行:PROC ANOVA;CLASS A B C;MODEL Y=A B C;交互效应的统计模型以上述三个因子为例,其对应的主效应以及交互效应可用下列程序来执行:PROC ANOVA;CLASS A B C ;MODEL Y=A B C A*B B*C A*CA*B*C;当实验设计含多个自变量时,交互效应会变得繁杂。此时可用“|”来简化。如上例的MODEL指令可简化为:MODEL Y=A|B|C;它相当于 MODEL Y=AB

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论