[理学]第4章 方差分析.ppt_第1页
[理学]第4章 方差分析.ppt_第2页
[理学]第4章 方差分析.ppt_第3页
[理学]第4章 方差分析.ppt_第4页
[理学]第4章 方差分析.ppt_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章 方差分析目录 方差分析 4.1 单因素方差分析 4.2 两因素方差分析 4.3 正交实验方差分析 4.4 方差分析条件的检验 4.5 方差分析在医学案例中的应用 返回 1 方差分析 在实际工作中有时需要对多个正态总体 的均值进行比较,方差分析是解决此类问 题的常用方法。 本章目录 2 方差分析 设有 个样本,需要检验它们的均值是否相等,即 本章目录 方差分析则是将总变异(即方差)分解为由各因素引 起的变异和由不可控因素引起的变异(即随机误差引 起的变异),然后检验由各因素引起的变异是否显著 ,从而达到检验多个样本均值是否相等的目的。 3 方差分析 若由各因素引起的变异显著,还要检验出到底是由 哪些因素引起,即进行多重比较。 多重比较的方法很多,常用的有Tukey法、Scheff法、 LSD法、Duncan和SNK法等。 本章目录 4 方差分析 Tukey和Scheff两种方法不仅可以对某因素的水平进行 两两比较,而且还可以推广到一般线性函数的比较,但 二者间还是有些区别: 对于两两比较,Tukey法比Scheff法灵敏,也即 Scheff法比Tukey法保守; 对于非两两比较的一般线性比较,Scheff法比Tukey 法灵敏; Tukey法只能处理实验重复数相同的情况,即均衡设 计的情况,而Scheff法则不受此条件的限制。 本章目录 5 方差分析 LSD法,即最小显著差数法,实质上是通常意义下的两 总体的检验应用于多总体均值的比较,但检验要求这两 个总体是相互独立的条件没法办到,因而这一方法进行 多重比较是不合理的,但若将其应用于实验组与对照组 的比较,这时两总体的独立性便能得到满足。 Dunnett(Dunnettu、Dunnettl)是专用于同对照组进行 均值比较的检验法,其中Dunnett是进行双尾检验, Dunnettu、Dunnettl则是进行单侧检验。 Duncan(又称SSR检验)和SNK(即所谓的q检验法)是 在LSD基础上发展起来的,是进行多重比较的常用方法 ,其中Duncan法比SNK法灵敏。 本章目录 6 方差分析 1 单因素方差分析 设所考虑的因素为A,它有 个水平,对第 个水平 得到一容量为的 样本,记为 ( ), 设 , 且独立,其中 表示因 素A的第 个水平下的理论均值。我们的目的是要知 道这 个水平的差异,即要检验的假设是 。 为了得到各水平的影响大小,将 进行如下分解, ,它称为因素第 个水平的效应, 令 , 本章目录 7 方差分析 1 单因素方差分析 单因素方差分析的数学模型: 本章目录 8 方差分析 1 单因素方差分析 单因素方差分析表: 本章目录 9 方差分析 1 单因素方差分析 例1 设有三个小麦品种,经试种得第公顷产量的数据如下( 单位:) 品种1:4350 4650 4080 4275 品种2:4125 3720 3810 3960 3930 品种3:4695 4245 4620 现问不同品种的小麦产量之间有无显著的差异? 本章目录 10 方差分析 1 单因素方差分析 data var1; input kind$ yield; cards; 1 4350 1 4650 1 4080 1 4275 2 4125 2 3720 2 3810 2 3960 2 3930 3 4695 3 4245 3 4620 ; proc anova; class kind; model yield=kind; means kind/snk t alpha=0.05; /*多重比较*/ means kind; run; 本章目录 例1 SAS程序 11 方差分析 1 单因素方差分析 本章目录 例1 输出结果 12 方差分析 1 单因素方差分析 多重比较的结果1:LSD比较结果 本章目录 13 方差分析 1 单因素方差分析 多重比较的结果2:SNK比较结果 本章目录 14 方差分析 1 单因素方差分析 例1 结果 多重比较的结果: 多重比较结果在表示上有如下约定: 标有相同字母的组,表示他们之间没有显著差异; 对标有不同字母的组,则表示有显著差异。 从二者比较的结果看所得的结论一致,也就是品种1和品 种3的产量之间没有明显差异,而品种2与品种1和3的 产量之间均有明显差异。 本章目录 15 方差分析 1 单因素方差分析 means kind;语句输出的结果如下: 本章目录 16 方差分析 1 单因素方差分析 PROC ANOVA(GLM)选择项1; CLASS 变量表; MODEL 因变量=自变量表; MEANS 效应/选择项2; BY 变量表; FREQ 变量表; TEST H=效应项 E=误差项; 本章目录 必选项必选项 可选项可选项 17 方差分析 1 单因素方差分析 PROC ANOVA(GLM)的常用选择项为: DATA=SAS数据集 指明ANOVA(GLM)过 程要处理的数据集,缺省值为SAS最近 产生的数据集。 OUTSTA=SAS数据集 将结果输出到指定 的数据集中。 本章目录 18 方差分析 1 单因素方差分析 CLASS语句定义分组变量。 MODEL语句指定因变量和自变量,因变量为连续变量 ,自变量常常是分组变量。设A、B为分类变量,y为 因变量,则以下几个MODEL语句的含义如下: MODEL y=A;单因素(A因素)方差分析。 MODEL y=A B 主效应模型,无交互作用的两因素方 差分析。 MODEL y=A B A*B 析因模型(带交互作用项),有 交互作用的两因素方差分析 其中CLASS语句必须出现在MODEL语句前面。 本章目录 19 方差分析 1 单因素方差分析 MEANS 语句要求ANOVA(GLM)过程计算出该语句 后列出的每个水平所对应的因变量的均值。选择项2 指明进行多重比较的方法,常用的TUKEY、 SCHEFFE、LSD、DUNCAN和SNK等,同时还可规 定检验的显著性水平的值(由ALPHA=值,缺省值为 0.05)。不用选择项2时,可计算各水平对应因变量的 均值。 TEST语句要检验的效应和误差项。其中H=后指定的是 要检验的效应,E=后指定作为误差项的效应,此项必 需指定,缺省是用MSE作为误差项。 本章目录 20 方差分析 2 两因素方差分析 本章目录 21 方差分析 2 两因素方差分析 (1)无交互作用 (I)式中 =0时,表示无交互作用。为检验因素A 和因素B的各水平是否有显著影响,我们需要检验 假设 和 ,同 单因素方差分析一样,对总平方和及其自由度分别进行 分解,得方差分析表, 本章目录 交互作用指一个因子的水平好坏或好坏的程度受另一 个因子水平制约的情况,称为因子A与B的交互作用 ,记为A*B或AB。 22 方差分析 2 两因素方差分析 (1)无交互作用 本章目录 23 方差分析 2 两因素方差分析 (2)有交互作用 对于要考虑交互作用的情况,我们最关心的检验 是 ,当然还可以考虑因素A、B 影响的显著性问题,即检验 和 ,则有如下的方差分析表 本章目录 24 方差分析 2 两因素方差分析 (2)有交互作用 本章目录 25 方差分析 2 两因素方差分析 例2 不考虑交互作用的两因素方差分析 为了考察蒸馏水的pH值和硫酸铜溶液浓度对化验血清中 白蛋白与球蛋白的影响。pH值(A)取四种水平其值 为5.40 5.60 5.70 5.80,记为A1、A2、A3和A4,硫酸铜 浓度(B)取三种水平其值分别为0.04 0.08 0.10,记为B1 、B2和B3,采用两因素的全面试验,所得结果如下 A1A2A3A4 B13.52.62.01.4 B22.32.01.50.8 B32.01.91.20.3 本章目录 26 方差分析 2 两因素方差分析 例2 data var2; do B=1 to 3; do A=1 to 4; input y; output; end; end; cards; 3.5 2.6 2.0 1.4 2.3 2.0 1.5 0.8 2.0 1.9 1.2 0.3 ; proc anova ; class A B; model y=A B; means A B/snk; run; 本章目录 27 方差分析 2 两因素方差分析 本章目录 这一部分给出的结果说明,模型是有效的,即这两种因 素有影响。 Analysis of Variance Procedure Dependent Variable: Y Source DF Sum of Squares F Value Pr F Model 5 7.51083333 34.89 0.0002 Error 6 0.25833333 Corrected Total 11 7.76916667 28 方差分析 2 两因素方差分析 例2 Source DF Anova SS F Value Pr F A 3 5.28916667 40.95 0.0002 B 2 2.22166667 25.80 0.0011 本章目录 这部分给出因素A、B效应的检验结果,从Pr F列的 概率值均比0.05小,说明这两种因素均有显著影响。 29 方差分析 2 两因素方差分析 多重比较的结果为: Analysis of Variance Procedure Student-Newman-Keuls test for variable: Y Alpha= 0.05 df= 6 MSE= 0.043056 Number of Means 2 3 4 Critical Range 0.41456 0.5198111 0.5864881 Means with the same letter are not significantly different. SNK Grouping Mean N A A 2.6000 3 1 B 2.1667 3 2 C 1.5667 3 3 D 0.8333 3 4 本章目录 结果显示: 因素A的四个水平之间均有显著性差异; 30 方差分析 2 两因素方差分析 多重比较的结果为: Analysis of Variance Procedure Student-Newman-Keuls test for variable: Y Alpha= 0.05 df= 6 MSE= 0.043056 Number of Means 2 3 Critical Range 0.3590195 0.4501696 Means with the same letter are not significantly different. SNK Grouping Mean N B A 2.3750 4 1 B 1.6500 4 2 B 1.3500 4 3 本章目录 结果显示: 因素B的B1水 平与其它两个 水平B2、B3间 均有显著性差 异,水平B2和 B3之间没有显 著性差异。 31 方差分析 2 两因素方差分析 例3 有交互作用的两因素方差分析(需要有重复) 考察合成纤维中对纤维弹性有影响的两个因素, 收缩率A和总拉伸倍数B,A和B各取四个水平,整个实 验重复一次,试验的结果如下: 0(A1)4(A2)8(A3)12(A4) 460(B1)71,7373,7576,7375,73 520(B2)72,7376,7479,7773,72 580(B3)75,7378,7774,7570,71 640(B4)77,7574,7474,7369,69 32 方差分析 2 两因素方差分析 例3 有交互作用(需要有重复) data var3; do B=1 to 4; do A=1 to 4; do i=1 to 2; input y; output; end; end; end; cards; 71 73 73 75 76 73 75 73 72 73 76 74 79 77 73 72 75 73 78 77 74 75 70 71 77 75 74 74 74 73 69 69 ; proc anova; class A B; model y=A B A*B; means A B A*B/snk; run; 本章目录 33 方差分析 2 两因素方差分析 输出的结果如下: Analysis of Variance Procedure Dependent Variable: Y Source DF Sum of Squares F Value Pr F Model 15 158.71875000 7.87 0.0001 Error 16 21.50000000 Corrected Total 31 180.21875000 Source DF Anova SS F Value Pr F A 3 70.59375000 17.51 0.0001 B 3 8.59375000 2.13 0.1363 A*B 9 79.53125000 6.58 0.0006 上述结果表明,在0.05显著性水平下,因素A有显著性影 响,因素B则没有显著性影响,同时还可看出它们的交互 作用达到了显著性水平。34 方差分析 2 两因素方差分析 输出的结果如下: Student-Newman-Keuls test for variable: Y Alpha= 0.05 df= 16 MSE= 1.34375 Number of Means 2 3 4 Critical Range 1.2286 1.4955 1.6582 Means with the same letter are not significantly different. SNK Grouping Mean N A A 75.1250 8 3 A 75.1250 8 2 B 73.6250 8 1 C 71.5000 8 4 本章目录 35 方差分析 2 两因素方差分析 输出的结果如下: Student-Newman-Keuls test for variable: Y Alpha= 0.05 df= 16 MSE= 1.34375 Number of Means 2 3 4 Critical Range 1.2286997 1.4955629 1.6582506 Means with the same letter are not significantly different. SNK Grouping Mean N B A 74.5000 8 2 A 74.1250 8 3 A 73.6250 8 1 A 73.1250 8 4 本章目录 36 方差分析 两因素的影响我们考虑的是全面实验,即两因素的所 有水平组合均做实验; 然而实际中要进行这样的全面实验往往行不通,一方面 是若影响的因素较多,则各因素的水平组合会很大, 另一方面实验材料和时间的限制,也不允许进行全面 实验,能否用较少的实验就能得出结论呢? 一个较好的方法即进行正交实验,它对每一因素的各水 平安排的实验次数是一样的,其次任两个因素之间又 是交叉分组的全面实验。 要安排一个正交实验,只要选用相应的正交表去安排实 验就可以了。 3 正交实验方差分析 本章目录 37 方差分析 3 正交实验方差分析 例5 无重复正交实验的方差分析 为提高某化工产品的转化率,选择了三个有关的因素, 反应温度(A),反应时间(B),用碱量(C),选 取的水平如下:(检验水平为0.1) 因素 温度(A)时间(B)用碱量(C ) 水 平 18090分5% 285120分6% 390150分7% 本章目录 38 方差分析 3 正交实验方差分析 例5 无重复正交实验的方差分析 现按三因素正交表L9(34)表进行实验,所得的实验数据 如下,请给出相应的分析。 本章目录 1(A)2(B)3(C)4转转化率y 1111131 2122254 3133338 4212353 5223149 6231242 7313257 8321362 9332164 39 方差分析 3 正交实验方差分析 例5 无重复正交实验的方差分析 说明:三因素正交表L9(34) 1、“L”是正交表的代号,L的下标“9”表示表的行数,表 示要做9个不同条件的试验; 2、圆括号中的指数“4”表示表的列数,在试验中表示用 这张表安排试验的话,最多可安排4个因子; 3、圆括号中的底数“3”表示表的主体只有3个不同的数字 :1,2,3,在试验中它代表因子水平的编号,即用这 张表安排试验时每个因子应取3个不同水平。 本章目录 40 方差分析 3 正交实验方差分析 例5 无重复正交实验的方差分析 正交表具有正交性,是指有如下两个特征: 1、每列中不同的数字重复次数相同。在表L9(34)中, 每列有3个不同数字:1,2,3,每一个各出现3次。 2、将任意两列的同行数字看成一个数对,那么一切可能 数对重复次数相同。在表L9(34)中,任意两列有9种 可能的数对:(1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1), (3,2), (3,3)。 本章目录 41 方差分析 3 正交实验方差分析 例5 无重复正交实验的方差分析 data var5; input A B C y; cards; 1 1 1 31 1 2 2 54 1 3 3 38 2 1 2 53 2 2 3 49 2 3 1 42 3 1 3 57 3 2 1 62 3 3 2 64 ; proc anova; class A B C; model y=A B C; run; 本章目录 42 方差分析 3 正交实验方差分析 其输出结果发如下: Analysis of Variance Procedure Dependent Variable: Y Source DF Sum of Squares F Value Pr F Model 6 966.00000000 17.89 0.0539 Error 2 18.00000000 Corrected Total 8 984.00000000 Source DF SS F Value Pr F A 2 618.00000000 34.33 0.0283 B 2 114.00000000 6.33 0.1364 C 2 234.00000000 13.00 0.0714 结果表明,因素A在显著性水平0.05下,因素C在显著性水 平0.1下均有显著差异,说明因素A和因素C的各水平对指 标值y的影响有显著差异,而因素B的各水平则对指标值y 的影响无显著性差异。 43 方差分析 3 正交实验方差分析 例6 有重复正交实验的方差分析 为提高在梳棉机上纺粘锦混纺纱的质量,选取了三个因 素,每因素二个水平,见下表。 因素 金属针布 (A) 产量水平 (B) 锡林速度 (C) 水 平 1日本的6公斤238转/分 2青岛的10公斤320转/分 本章目录 44 方差分析 3 正交实验方差分析 例6 有重复正交实验的方差分析 这些因素间可能有交互作用,选用正交表L8(27)进行 实验设计,据L8(27)表头设计的特点如下: 本章目录 列号1234567 因素ABABCACBCAB C 45 方差分析 3 正交实验方差分析 例6 有重复正交实验的方差分析 实验数据如下 本章目录 试验试验 号ABC棉结结粒数(y) 11110.3 21120.35 31210.2 41220.3 52110.15 62120.5 72210.15 82220.4 46 方差分析 3 正交实验方差分析 例6 有重复正交实验的方差分析 data var6; input A B C y; cards; 1 1 1 0.3 1 1 2 0.35 1 2 1 0.20 1 2 2 0.30 2 1 1 0.15 2 1 2 0.50 2 2 1 0.15 2 2 2 0.40 ; proc anova ; class A B C; model y=A|B|C2; /*两两交互作用*/ run; 本章目录 47 方差分析 3 正交实验方差分析 例6 有重复正交实验的方差分析 其结果显示为: Analysis of Variance Procedure Dependent Variable: Y Source DF Sum of Squares F Value Pr F Model 6 0.10437500 6.19 0.2985 Error 1 0.00281250 Corrected Total 7 0.10718750 R-Square C.V. Y Mean 0.973761 18.05379 0.29375000 Source DF Anova SS F Value Pr F A 1 0.00031250 0.11 0.7952 B 1 0.00781250 2.78 0.3440 A*B 1 0.00031250 0.11 0.7952 C 1 0.07031250 25.00 0.1257 A*C 1 0.02531250 9.00 0.2048 B*C 1 0.00031250 0.11 0.7952 本章目录 48 方差分析 3 正交实验方差分析 例6 有重复正交实验的方差分析 结果表明,各个因素对整个模型的作用并不明显, 但注意到因素A及交叉项A*B和B*C的平方和比误差项 的平方和都小,说明这几项的作用并不明显,将其 归并到误差,再进行分析。 本章目录 49 方差分析 3 正交实验方差分析 例6 有重复正交实验的方差分析 将上面程序中的MODEL语句改写为如下形式: model y=B C A*C; 其分析的结果如下: 本章目录 50 方差分析 3 正交实验方差分析 Analysis of Variance Procedure Dependent Variable: Y Source DF Sum of Squares F Value Pr F Model 4 0.10375000 22.64 0.0141 Error 3 0.00343750 Corrected Total 7 0.10718750 R-Square C.V. Y Mean 0.967930 11.52346 0.29375000 Source DF Anova SS F Value Pr F B 1 0.00781250 6.82 0.0796 C 1 0.07031250 61.36 0.0043 A*C 2 0.02562500 11.18 0.0407 从而可看出因 素B、C的主效 应以及因素A 、C间的交互 效应均在0.1下 达到显著 51 方差分析 3 正交实验方差分析 MEANS语句的输出结果为 Analysis of Variance Procedure Level of -Y- B N Mean SD 1 4 0.32500000 0.14433757 2 4 0.26250000 0.11086779 Level of -Y- C N Mean SD 1 4 0.20000000 0.07071068 2 4 0.38750000 0.08539126 Level of Level of -Y- A C N Mean SD 1 1 2 0.25000000 0.07071068 1 2 2 0.32500000 0.03535534 2 1 2 0.15000000 0.00000000 2 2 2 0.45000000 0.07071068 由于在不同条件下 棉结粒数愈小愈好 ,因此对于因素B 的水平2(B2)其 对应的均值较小, 故选它,其次对因 素C应用其水平1( 即C1),再考虑因 素A、C的交互作用 ,对应于C1,因素 A应取水平2(即A2 ),故可选出最优 工艺条件为A2B2C1 ,这正是第7号实验 。 52 方差分析 3 正交实验方差分析 例7 水平数不等正交实验的方差分析 为探索某胶压板工艺,考虑压力(A)分别为8、10、11及12公 斤,温度(B)分别为95和90;时间(C)分别为9分和 12分。用正交表L8(424)来安排实验,所得结果如下表 试验试验号ABCY 11116664 21226544 32114322 42224432 53122111 63214442 74124321 8421654253 方差分析 3 正交实验方差分析 DATA VAR7; INPUT A B C; DO I=1 TO 4; INPUT y; OUTPUT; END; CARDS; 1 1 1 6 6 6 4 1 2 2 6 5 4 4 2 1 1 4 3 2 2 2 2 2 4 4 3 2 3 1 2 2 1 1 1 3 2 1 4 4 4 2 4 1 2 4 3 2 1 4 2 1 6 5 4 2 ; 本章目录 PROC ANOVA; CLASS A B C; MODEL y=A B C; MEANS A B C; RUN; 例7 水平数不等正交实验的方差分析 54 方差分析 3 正交实验方差分析 其结果如下: Analysis of Variance Procedure Dependent Variable: Y Source DF Sum of Squares F Value Pr F Model 5 49.40625000 8.41 0.0001 Error 26 30.56250000 Corrected Total 31 79.96875000 R-Square C.V. Y Mean 0.617819 31.25610 3.46875000 Source DF Anova SS F Value Pr F A 3 33.34375000 9.46 0.0002 B 1 7.03125000 5.98 0.0215 C 1 9.03125000 7.68 0.0102 本章目录 表明这三个 因素对胶压 板工艺均有 显著影响。 55 方差分析 3 正交实验方差分析 MEANS语句的输出为: Level of -Y- A N Mean SD 1 8 5.12500000 0.99103121 2 8 3.00000000 0.92582010 3 8 2.37500000 1.40788595 4 8 3.37500000 1.68501802 Level of -Y- B N Mean SD 1 16 3.00000000 1.82574186 2 16 3.93750000 1.23659479 Level of -Y- C N Mean SD 1 16 4.00000000 1.50554531 2 16 2.93750000 1.56923548 由于y值越大越好 ,从上面的输出结 果可以看出, A1B2C1为最优工 艺条件,即压力是 8公斤、温度是 90、时间为9分 钟的组合。 56 方差分析 4 方差分析条件的检验 在方差分析中,要求各样本是来自正态总体且相互独 立,而且还要求各处理间方差相同。因此这是在进行 方差分析时首先要解决的问题,独立性一般好保证, 只要各次实验相不干扰即可,而正态性和等方差性往 往也能满足,但有时也不能满足,因此要对正态性检 验和等方差性进行检验。 若正态性不能满足,则要考虑用其它分析方法如非参 数方差分析,若等方差不能满足,则可用变量变换的 方法使其达到或基本达到。 如对泊松分布的计数资料可考虑用平方根变换;对服 从二项分布的比率资料可用平方根反正弦变换;当标 准差与均数成正比的数据或各组变异系数值接近时可 用对数变换;当标准差与均值的平方成正比的关系时 可考虑倒数变换,等等。 本章目录 57 方差分析 4 方差分析条件的检验 (1)方差齐性(等方差性)检验 例9 为了诊断某种疾病,需要测量一个指标,并且在四种不同 的条件下(记为A1,A2,A3,A4)来测量一个指标以增加 诊断的可靠性。今对四位健康人测得的数据如下 本章目录 1234 A14000000150000010000000100000 A22200013000300008500 A360003400160005200 A47807201900550 58 方差分析 4 方差分析条件的检验 (1)方差齐性(等方差性)检验 要检验这四种条件有无显著的差异,若 无显著的差异也就没有必要每人测四次。 直观上,由于A1的数量级在107左右,A2 在105左右,A3在104左右,A4在103左右,故 等方差性的条件可能得不到满足。 本章目录 59 方差分析 4 方差分析条件的检验 (1)方差齐性(等方差性)检验 DATA VAR9; DO A=1 TO 4; DO I=1 TO 4; INPUT y; OUTPUT; END; END; CARDS; 4000000 1500000 10000000 100000 22000 13000 30000 8500 6000 3400 16000 5200 780 720 1900 550 ; PROC ANOVA; CLASS A; MODEL y=A; MEANS A; RUN;本章目录 60 方差分析 4 方差分析条件的检验 其输出为: Analysis of Variance Procedure Dependent Variable: Y Source DF Sum of Squares F Value Pr F Model 3 4.5420161E+13 3.16 0.0640 Error 12 5.7420372E+13 Corrected Total 15 1.0284053E+14 R-Square C.V. Y Mean 0.441656 222.8128 981753.125 Source DF Anova SS F Value Pr F A 3 4.5420161E+13 3.16 0.0640 结果表明,在0.05水平下没有显著差别,只有在0.1水平下才 有显著差别。可以想象这可能是由于方差不等所造成的 61 方差分析 4 方差分析条件的检验 (1)方差齐性(等方差)性检验 62 方差分析 4 方差分析条件的检验 (1)方差齐性(等方差性)检验 DATA VAR6; DO A=1 TO 4; DO I=1 TO 4; INPUT y; OUTPUT; END; END; CARDS; 4000000 1500000 10000000 100000 22000 13000 30000 8500 6000 3400 16000 5200 780 720 1900 550 ; proc means noprint data=var6; var y; by A; output out=ty1 css=ss n=n std=s; run; data ty2; set ty1; f=n-1; u=1/f; _type_=1; logs=2*f*log(s); run; proc means noprint data=ty2; var ss n f u logs _type_; output out=mx3 sum=t_ss t_n t_f t_u t_logs k; data result; set mx3; sc2=t_ss/t_f; fz=t_f*log(sc2)-t_logs; fm=1+1/3/(k-1)*(t_u-1/t_f); df=k-1; chisqr=fz/fm; prob=1-probchi(chisqr,df); proc print noobs; var chisqr df prob; run; 63 方差分析 4 方差分析条件的检验 (1)方差齐性(等方差性)检验 其输出为 CHISQR DF PROB 99.4059 3 0 说明方差不是齐性的。 本章目录 64 方差分析 4 方差分析条件的检验 (1)方差齐性(等方差性)检验 前面程序中的MEANS语句的输出为: Level of -Y- A N Mean SD 1 4 3900000.00 4374928.57 2 4 18375.00 9568.83 3 4 7650.00 5671.86 4 4 987.50 616.08 本章目录 从而可以看出,均值大的组,其标准差也大,说明二 者之间有某种比例关系,故对数据进行对数变换 。 65 方差分析 4 方差分析条件的检验 (1)方差齐性(等方差性)检验 DATA VAR6; DO A=1 TO 4; DO I=1 TO 4; INPUT y; x=log(y); OUTPUT; END; END; CARDS; 4000000 1500000 10000000 100000 22000 13000 30000 8500 6000 3400 16000 5200 780 720 1900 550 ; 本章目录 PROC ANOVA; CLASS A; MODEL x=A; MEANS A; RUN; 66 方差分析 4 方差分析条件的检验 (1)方差齐性(等方差性)检验 方差分析的输出为 Analysis of Variance Procedure Dependent Variable: X Source DF Sum of Squares F Value Pr F Model 3 120.50969066 32.18 0.0001 Error 12 14.97925748 Corrected Total 15 135.48894814 R-Square C.V. X Mean 0.889443 11.31060 9.87799713 Source DF Anova SS F Value Pr F A 3 120.50969066 32.18 0.0001 从这里可看出,方差不等确实会造成分析的失误,经过 这样变换后,因素A的各水平均已达到显著性水平。 本章目录 67 方差分析 4 方差分析条件的检验 (1)方差齐性(等方差性)检验 多重比较的情况如下: Student-Newman-Keuls test for variable: X Alpha= 0.05 df= 12 MSE= 1.248271 Number of Means 2 3 4 Critical Range 1.7213174 2.1075882 2.3454222 Means with the same letter are not significantly different. SNK Grouping Mean N A A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论