概率论与数理统计茆诗松课后第八章习题参考答案_第1页
概率论与数理统计茆诗松课后第八章习题参考答案_第2页
概率论与数理统计茆诗松课后第八章习题参考答案_第3页
概率论与数理统计茆诗松课后第八章习题参考答案_第4页
概率论与数理统计茆诗松课后第八章习题参考答案_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 第八章 方差分析与回归分析 第八章 方差分析与回归分析 本章前三节研究方差分析,讨论多个正态总体的比较,后两节研究回归分析讨论两个变量之间的相 关关系 8.1 方差分析 8.1.1 问题的提出 上一章讨论了单个或两个正态总体的假设检验,这里讨论多个正态总体的均值比较问题 通常为了研究某一因素对某项指标的影响情况,将该因素在多种情形下进行抽样检验,作出比较一 般将该因素称为一个因子,所检验的每种情形称为水平在每个水平下需要考察的指标都分别构成一个总 体,比较它们的总体均值是否相等对每一个总体都分别抽取一个样本,样本容量称为重复数 如果只对一个因子中的多个水平进行比较,称为单因子方差分析,对多个因子的水平进行比较,称为 多因子方差分析本章只进行单因子方差分析 例 在饲料养鸡增肥的研究中,现有三种饲料配方:A1 , A2 , A3 ,为比较三种饲料的效果,特选 24 只相似 的雏鸡随机均分为三组,每组各喂一种饲料,60 天后观察它们的重量实验结果如下表所示: 饲料 鸡重/g A1 1073 1009 1060 1001 1002 1012 1009 1028 A2 1107 1092 990 1109 1090 1074 1122 1001 A3 1093 1029 1080 1021 1022 1032 1029 1048 在此例中,就是要考察饲料对鸡增重的影响,需要比较三种饲料对鸡增肥的作用是否相同这里,饲 料就是一个因子,三种饲料配方就是该因子的三个水平,每种饲料喂养的雏鸡 60 天后的重量分别构成一 个总体,这里共有 3 个总体,每一个总体抽取样本的重复数都是 8,比较这 3 个总体的均值是否相等 8.1.2 单因子方差分析的统计模型 设因子 A 有 r 个水平 A1 , A2 , , Ar ,在每个水平下需要考察的指标都构成一个总体,即有 r 个总体, 分别记为 Y1 , Y2 , , Yr ,对每一个总体都分别抽取一个样本,首先考虑重复数相等的情形,设重复数都是 m,总体 Yi的样本 Yi1 , Yi2 , , Yim ,i = 1, 2, , r作出以下假定: (1)每一个总体都服从正态分布,即riNY iii , 2, 1),( 2 L=; (2)各个总体的方差都相等,即 22 2 2 1r =L,都记为 2; (3)各个总体及抽取的样本相互独立,即 Yij相互独立,i = 1, 2, , r,j = 1, 2, , m 需要比较它们的总体均值是否相等,即检验的原假设与备择假设为 H0: 1 = 2 = = r vs H1: 1 , 2 , , r不全相等, 如果 H0成立,就可以认为这 r 个水平下的总体均值相同,称为因子 A 不显著;反之,如果 H0不成立,就 称为因子 A 显著 在水平 Ai下的样品 Yij与该水平下的总体均值 i之差 ij = Yij i为随机误差由于 Yij N ( i , 2 ), 因此随机误差 ij N (0 , 2 )对所有 r 个水平下的总体均值求平均,即 = =+= r i ir rr 1 21 1 )( 1 L 称为总均值每个水平 Ai下的总体均值 i与总均值 之差 a i = i 称为该水平 Ai下主效应显然所有 主效应 a i之和等于 0,即 0 1 = = r i i a, 2 检验所有水平下的总体均值是否相等,也就是检验所有主效应 a i是否全等于 0这样单因子方差分析在重 复数相等的情形下,统计模型为 = =+= = )., 0( ; 0 ;, 2, 1, 2, 1, 2 1 N a mjriaY ij r i i ijiij 相互独立,且都服从 LL 检验的原假设与备择假设为 H0:a 1 = a 2 = = a r = 0 vs H1:a 1 , a 2 , , a r不全等于 0 8.1.3 平方和分解 一试验数据 对于 r 个总体下的试验数据 Yij , i = 1, 2, , r,j = 1, 2, , m ,记 Ti表示第 i 个总体下试验数据总和, i Y表示第 i 个总体下样本均值,n = rm 表示总的样本容量,T 表示总的试验数据总和,Y表示总的样本均 值,即 = = m j iji YT 1 , = = m j ij i i Y mm T Y 1 1 , i = 1, 2, , r, = = r i m j ij r i i YTT 111 , = = = r i i r i m j ij Y r Y rm T n Y 111 111 , 用 i Y作为 i的点估计,Y作为 的点估计又记 i 表示第 i 个总体下随机误差平均值,表示总的随机误 差平均值,即 = = m j iji m 1 1 , i = 1, 2, , r, = = = r i i r i m j ij rn 111 11 显然有 += iii Y,+=Y 在单因子方差分析中通常将试验数据及基本计算结果写成表格形式 因子水平 试验数据 和 和的平方 平方和 A1 Y11 Y12 Y1m T1 2 1 T 2 1j Y A2 Y21 Y22 Y2m T2 2 2 T 2 2 j Y Ar Yr1 Yr2 Yrm Tr 2 r T 2 rj Y T = r i i T 1 2 = r i m j ij Y 11 2 3 二组内偏差与组间偏差 数据 Yij与样本总均值Y之差YYij称为样本总偏差,可以分成两部分之和: )()(YYYYYY iiijij += , 其中 =+= iijiiijiiij YY)()( 是第 i 个总体内数据与该总体内样本均值的偏差,称为组内偏差,反映第 i 个总体内的随机误差; +=+= iiiii aYY)()( 是第 i 个总体内样本均值与总样本均值的偏差,称为组间偏差,反映第 i 个总体的主效应 三偏差平方和及其自由度 在统计学中,对于 k 个独立数据 Y1 , Y2 , , Yk ,平均值 = = k i i Y k Y 1 1 ,称 Yi与Y之差为偏差,所有偏差 的平方和 = = k i i YYQ 1 2 )( 称为这 k 个数据的偏差平方和,反映这 k 个数据的分散程度由于所有偏差之和 0)( 11 = = YkYYY k i i k i i , 即这 k 个偏差由 k 个独立数据受到一个约束条件形成,可以证明它们与 k 1 个独立(随机)变量可以相互 线性表示,称之为等价于 k 1 个独立(随机)变量一般地,若 k 个独立数据受到 r 个不相关的约束条件, 则它们等价于 k r 个独立(随机)变量在统计学中,把形成平方和的变量所等价的独立变量个数,称为 该平方和的自由度,通常记为 f如上述偏差平方和 Q 的自由度为 k 1,即 fQ = k 1 由于平方和的大小与变量个数(或自由度)有关,为了对偏差进行比较,通常考虑偏差平方和与其自 由度之商,称为均方和,记为 MS,反映一组数据的平均分散程度,如样本方差 = = n i i XX n S 1 22 )( 1 1 就 是样本数据偏差的均方和 四总平方和分解公式 总偏差平方和记为 ST或 SST,其自由度记为 fT ,有 = = r i m j ijT YYS 11 2 )(,fT = rm 1 = n 1; 组内偏差平方和记为 Se或 SSE,其自由度记为 fe ,有 = = r i m j iije YYS 11 2 )(,fe = r (m 1) = n r; 组间偏差平方和记为 SA或 SSA,其自由度记为 fA ,有 = = = r i i r i m j iA YYmYYS 1 2 11 2 )()(,fA = r 1 4 组内偏差平方和反映所有总体内的随机误差,组间偏差平方和反映所有总体的主效应 定理 总偏差平方和 ST可以分解为组内偏差平方和 Se与组间偏差平方和 SA之和,其自由度也可作相应的 分解,即 ST = Se + SA ,fT = fe + fA ,称之为平方和分解公式 证: = = += r i m j iiij r i m j ijT YYYYYYS 11 2 11 2 )()()( = = = += r i m j iiij r i m j i r i m j iij YYYYYYYY 1111 2 11 2 )(2)()( AeAe r i iAe r i m j iijiAe SSSSYYSSYYYYSS+=+=+=+= = = 00)(2 )()(2 111 , 且显然有 fT = n 1 = (n r) + (r 1) = fe + fA 8.1.4 检验方法 由于组内偏差平方和反映所有总体内的随机误差,组间偏差平方和反映所有总体的主效应,通过比较 组内偏差平方和与组间偏差平方和检验因子的显著性下面将证明在假设所有主效应都等于 0 成立的条件 下,它们的均方和之商服从 F 分布 定理 在单因子方差分析模型中,组内偏差平方和 Se与组间偏差平方和 SA满足 (1)E(S e) = (n r) 2,且)( 2 2 rn Se ; (2) = += r i iA amrS 1 22 ) 1()E(,且当 H0:a 1 = a 2 = = a r = 0 成立时,) 1( 2 2 r SA ; (3)Se与 SA相互独立 证:根据第五章的定理结论知: 设 X1 , X 2 , , Xn相互独立且都服从正态分布 N ( , 2 ),记 = = n i i X n X 1 1 , = = n i i XXS 1 2 0 )(, 则X与 S0相互独立,且) 1( 2 2 0 n S (1) = = r i m j iije YYS 11 2 )(,Yi1 , Yi2 , , Yim相互独立且都服从正态分布 N ( i, 2 ), = = m i iji Y m Y 1 1 , 则 = m j iij YY 1 2 )(与 i Y相互独立,且) 1()( 1 2 1 2 2 = mYY m j iij , 因在不同水平下的样本都相互独立, 则 = r i m j iij YY 11 2 )(与 r YYY, 21 L也相互独立,且根据独立 2变量的可加性知 )()( 1 2 11 2 2 rrmYY r i m j iij = , 故)()( 1 2 11 2 22 rnYY S r i m j iij e = = ,即得 E(S e) = (n r) 2; 5 (2) = = = = +=+= r i ii r i i r i i r i ii r i iA ammamamYYmS 11 2 1 2 1 2 1 2 )(2)()()(, 因 ij (i = 1, 2, , r, j = 1, 2, , m) 相互独立且都服从正态分布 N (0, 2 ), 有 = = m j iji m 1 1 (i = 1, 2, , r) 相互独立且都服从正态分布), 0( 2 m N , = = r i i r 1 1 , 则0)E()E()E(= ii 且) 1( )( 2 2 1 2 = r m r i i ,即 m r r i i 2 1 2 ) 1()(E = = , 故 2 1 2 11 2 1 2 ) 1()E(2)(E)E(+=+ += = = = ramammamS r i i r i ii r i i r i iA , 当 H0:a 1 = a 2 = = a r = 0 成立时, = = = r i i r i iA mYYmS 1 2 1 2 )()(, 故) 1( )( 2 2 1 2 2 = = r m S r i i A ; (3)因 = = r i m j iije YYS 11 2 )(与 r YYY, 21 L相互独立,有 S e与 = = r i i Y r Y 1 1 相互独立, 且 = = r i iA YYmS 1 2 )(, 故 S e与 S A相互独立 由于)( 2 2 rn Se ,当 H0:a 1 = a 2 = = a r = 0 成立时,) 1( 2 2 r SA ,且 Se与 SA相互独立,则 根据 F 分布的定义可知:当 H0成立时,有 ), 1( )( ) 1( 2 2 rnrF MS MS fS fS rn S r S F e A ee AA e A = = 由于 = += r i iA amrS 1 22 ) 1()E(,则 F 越大,即 S A越大时,越有可能发生 a i 0,则检验的拒绝域为 右侧 步骤:假设 H0:a1 = a2 = = a r = 0 vs H1:a1 , a2 , , a r不全等于 0, 统计量), 1(rnrF MS MS fS fS F e A ee AA =, 显著水平 ,右侧拒绝域 W = f f1 (r 1, n r), 计算 f,并作出判断 这是 F 检验法 6 通常列成方差分析表: 来源 平方和 自由度 均方和 F 比 因子 S A f A = r 1 MS A = S A / f A F = MS A / MS e 误差 S e f e = n r MS e = S e / f A 总和 S T f T = n 1 为了计算方便,可给出三个偏差平方和的计算公式对于一组数据 X1 , X 2 , , Xn ,记 = = n i i X n X 1 1 , 则有 2 11 22 1 2 1 2 1 )( = = n i i n i i n i i n i i X n XXnXXX, 记 = = m j iji YT 1 , = = r i m j ij r i i YTT 111 , 可得 2 11 2 2 1111 22 11 2 11 2 11 )(T n YY n YYnYYYS r i m j ij r i m j ij r i m j ij r i m j ij r i m j ijT = = = , 2 1 2 2 111 2 1 2 1 2 1 2 1111 )(T n T m Y n mrY m mYrYmYYmS r i i r i m j ij r i m j ij r i i r i iA = = = = = , = = r i i r i m j ijATe T m YSSS 1 2 11 2 1 例 在饲料养鸡增肥的研究中,现有三种饲料配方:A1 , A2 , A3 ,为比较三种饲料的效果,特选 24 只相似 的雏鸡随机均分为三组,每组各喂一种饲料,60 天后观察它们的重量实验结果如下表所示: 饲料 鸡重/g A1 1073 1009 1060 1001 1002 1012 1009 1028 A2 1107 1092 990 1109 1090 1074 1122 1001 A3 1093 1029 1080 1021 1022 1032 1029 1048 在显著水平 = 0.05 下检验这三种饲料对雏鸡增重是否有显著差别 解:假设 H0:a 1 = a 2 = a 3 = 0 vs H1:a 1 , a 2 , a 3不全等于 0, 统计量), 1(rnrF MS MS fS fS F e A ee AA =,平方和 显著水平 = 0.05,n = 24,r = 3,m = 8,右侧拒绝域 W = f f0.95 (2, 21) = f 3.47, 试验数据计算表 因子水平 试验数据 Yij Ti 2 i T = m j ij Y 1 2 A1 1073 1009 1060 1001 10021012100910288194 67141636 8398024 A2 1107 1092 990 1109 10901074112210018585 73702225 9230355 A3 1093 1029 1080 1021 10221032102910488354 69789316 8728984 总和 25133 210633177 26357363 7 计算可得 0833.966025133 24 1 210633177 8 111 22 1 2 = = T n T m S r i iA , 875.28215210633177 8 1 26357363 1 1 2 11 2 = = r i i r i m j ije T m YS, 方差分析表 来源 平方和 自由度 均方和 F 比 因子 9660.0833 2 4830.0417 3.5948 误差 28215.875 21 1343.6131 总和 37875.9583 23 有 F 比 f = 3.5948 W, 故拒绝 H0 ,接受 H1 ,可以认为这三种饲料对雏鸡增重有显著差别, 并且检验的 p 值 p = PF 3.5948 = 1 0.9546 = 0.0454 = 0.05 8.1.5 参数估计 在方差分析问题中,可对总均值 ,误差的方差 2作参数估计 当检验结果为因子不显著时,各水平下指标的总体均值与总体方差都相同,可将所有水平的指标看作 一个统一的总体,全部试验数据是来自正态总体 Y N ( , 2 ) 的一个容量为 n = rm 的样本,因此样本均 值 n T Y n Y r i m j ij = =11 1 , 样本方差 1 )( 1 1 11 22 = = = n S YY n S T r i m j ij 这样总均值 和误差的方差 2的点估 计分别为Y=, 22 S= ,置信度为 1 的置信区间分别是 ) 1( 2/1 n S ntY , ) 1( ) 1( , ) 1( ) 1( 2 2/ 2 2 2/1 2 2 n Sn n Sn 当检验结果为因子显著时,还可进一步对主效应 a i作参数估计 一点估计 由于试验数据 Y ij , (i = 1, 2, , r, j = 1, 2, , m) 相互独立且都服从正态分布 N ( + a i , 2 ),根据最 大似然估计法,得到总均值 ,误差的方差 2及主效应 a i的点估计似然函数 = = r i m j iij r i m j ijr ay ypaaaL 11 2 2 2 11 2 21 2 )( exp 2 1 )(),( L = = r i m j iij n ay 11 2 2 2 2 )( 2 1 exp )2( 1 , 取对数,得 = = r i m j iij ay nn L 11 2 2 2 )( 2 1 )ln( 2 )2ln( 2 ln 令关于 的偏导数等于 0,有 = = r i i r i m j ij r i m j iij amnyay L 111 2 11 2 1 ) 1()(2 2 1ln 8 0 1 0 1 11 2 11 2 = = = = nyny r i m j ij r i m j ij , 得yy n r i m j ij = =11 1 ,故总均值 的最大似然估计为Y= 令关于 a k的偏导数等于 0,有 0 1 ) 1()(2 2 1ln 1 2 1 2 = = = k m j kj m j kkj k mamyay a L , k = 1, 2, , r, 得= = k m j kjk yy m a 1 1 , 故主效应 a i的最大似然估计为YYYa iii = , i = 1, 2, , r , 相应, 第 i 个水平下的总体均值 i的最大似然估计为 =+= iii Y a 令关于 2的偏导数等于 0,有 0)( 2 11 2)( ln 11 2 422 =+= = r i m j iij ay nL , 得 = = r i m j iij ay n 11 22 )( 1 ,故误差的方差 2 的最大似然估计为 n S YY n e r i m j iijM = = 11 22 )( 1 由于 E(S e) = (n r) 2,可知 2 M 不是 2的无偏估计,修偏得 2的无偏估计 e e MS rn S = = 2 二置信区间 对总均值 ,误差的方差 2及第 i 个水平下的总体均值 i给出置信区间 第 i 个水平下总体均值 i的点估计为 = = m j ijii Y m Y 1 1 , 因试验数据 Y ij , (i = 1, 2, , r, j = 1, 2, , m) 相互独立且都服从正态分布 N ( i , 2 ),则有),( 2 m NY ii ,即 ) 1, 0( N m Y ii , 但 未知,用 rn Se =替换由于)( 2 2 rn Se 且 S e与 i Y相互独立,则根据 2分布的定义可得 )( )( 2 rnt m Y rn S m Y ii e ii = , 故第 i 个水平下总体均值 i的置信度为 1 的置信区间是 )( 2/1 m rntYi i 9 总均值 的点估计为 = = r i m j ij Y n Y 11 1 ,因数据 Y ij , (i = 1, 2, , r, j = 1, 2, , m) 相互独立且都服 从正态分布 N ( i , 2 ),有Y服从正态分布,且 = = r i i r i m j i r i m j ij n m n Y n Y 11111 1 )E( 1 )E(, n n nn Y n Y r i m j r i m j ij 2 2 2 11 2 2 11 2 11 )Var( 1 )Var( = = , 得),( 2 n NY ,即 ) 1, 0( N n Y , 但 未知,用 rn Se =替换由于)( 2 2 rn Se 且 S e与Y相互独立,则根据 t 分布的定义可得 )( )( 2 rnt n Y rn S n Y e = , 故总均值 的置信度为 1 的置信区间是 )( 2/1 n rntY 误差的方差 2的点估计为 rn Se = 2 ,且)( 2 2 rn Se ,故误差的方差 2的置信度为 1 的置信 区间是 = )( )( , )( )( )( , )( 2 2/ 2 2 2/1 2 2 2/ 2 2/1 2 rn rn rn rn rn S rn S ee 例 由前面的鸡饲料对鸡增重问题的数据给出总均值 ,误差的方差 2及三个水平下总体均值1 , 2 , 3 的点估计和置信区间( = 0.05) 解:前面已检验知因子显著,则三个水平下总体均值1 , 2 , 3的点估计为 25.1024 8 8194 1 11 = m T Y, 125.1073 8 8585 2 22 = m T Y, 25.1044 8 8354 3 33 = m T Y, 总均值 的点估计为 2083.1047 24 25133 = n T Y, 10 误差的方差 2的点估计为 6131.1343 2 = = e e MS rn S , 置信度为 0.95 的置信区间是 2008.1051,2992.997 8 6131.1343 0796. 225.1024 )21( 975. 011 = m tY , 0758.1100,1742.1046 8 6131.1343 0796. 2125.1073 )21( 975. 022 = m tY , 2008.1071,2992.1017 8 6131.1343 0796. 225.1044 )21( 975. 033 = m tY , 7684.1062,6482.1031 24 6131.1343 0796. 22083.1047 )21( 975. 0 = n tY , 9608.2743,2861.795 2829.10 875.28215 , 4789.35 875.28215 )21( , )21( 2 025. 0 2 975. 0 2 = = ee SS 8.1.6 重复数不等的情形 如果每个水平下试验次数不全相等,称为重复数不等的情形,其检验方法与在重复数相等的情形下类 似,只是在对数据的表述和处理上有几点区别 一数据 设第 i 个水平 A i下的重复数为 m i ,所取得的样本为 i imii YYY, 21 L,i = 1, 2, , r显然重复数总数 为 n,即 m 1 + m 2 + + m r = n 二总均值 总均值 是各水平下总体均值 i的以频率 n mi 为权数的加权平均,即 = =+= r i iir r m nn m n m n m 1 2 2 1 1 1 L 三主效应约束条件 第 i 个水平下主效应 a i = i ,则满足 0 11 = = nmam r i ii r i ii 四模型 单因子方差分析在重复数不等的情形下,统计模型为 = =+= = )., 0( ; 0 ;, 2, 1, 2, 1, 2 1 N am mjriaY ij r i ii iijiij 相互独立,且都服从 LL 检验 H0:a1 = a2 = = a r = 0 vs H1:a1 , a2 , , a r不全等于 0 11 五平方和的计算 记 = = i m j iji YT 1 , = = i m j ij ii i i Y mm T Y 1 1 , = = r i i r i m j ij TYT i 111 , = = = r i ii r i m j ij Ym n Y nn T Y i 111 11 , 则各平方和的计算公式为 n T YYnYYYS r i m j ij r i m j ij r i m j ijT iii 2 11 22 11 2 11 2 )(= = , n T m T YnYmYYmYYS r i i i r i ii r i ii r i m j iA i 2 1 2 2 1 2 1 2 11 2 )()(= = = = , = = r i i i r i m j ijATe m T YSSS i 1 2 11 2 例 某食品公司对一种食品设计了四种新包装,为了考察哪种包装最受顾客欢迎,选了 10 个地段繁华程 度相似、 规模相近的商店做试验, 其中两种包装各指定两个商店销售, 另两种包装各指定三个商店销售 在 试验期内各店货架排放的位置、空间都相同,营业员的促销方法也基本相同,经过一段时间,记录其销售 量数据,见下表 包装类型 销售量数据 A1 12 18 A2 14 12 13 A3 19 17 21 A4 24 30 在显著水平 = 0.01 下检验这四种包装对销售量是否有显著影响 解:假设 H0:a1 = a2 = a3 = a4 = 0 vs H1:a1 , a2 , a3 , a4不全等于 0, 统计量), 1(rnrF MS MS fS fS F e A ee AA =, 显著水平 = 0.01,n = 10,r = 4,右侧拒绝域 W = f f0.99 (3, 6) = f 9.78, 销售量数据计算表 因子水平 销售量数据 Yij mi Ti ii mT 2 = m j ij Y 1 2 A1 12 18 2 30 450 468 A2 14 12 13 3 39 507 509 A3 19 17 21 3 57 1083 1091 A4 24 30 2 54 1458 1476 总和 10 180 3498 3544 计算可得 258180 10 1 3498 1 22 1 2 = = T nm T S r i i i A , 4634983544 1 2 11 2 = = r i i i r i m j ije m T YS, 12 方差分析表 来源 平方和 自由度 均方和 F 比 因子 258 3 86 11.2174 误差 46 6 7.6667 总和 304 9 有 F 比 f = 11.2174 W, 故拒绝 H0 ,接受 H1 ,可以认为这四种包装对销售量有显著影响, 并且检验的 p 值 p = PF 11.2174 = 1 0.9929 = 0.0071 = 0.01 由于因子显著,则四个水平下总体均值1 , 2 , 3 , 4的点估计为 15 2 30 1 1 11 = m T Y, 13 3 39 2 2 22 = m T Y, 19 3 57 3 3 33 = m T Y, 27 2 54 4 4 44 = m T Y, 总均值 的点估计为 18 10 180 = n T Y, 误差的方差 2的点估计为 6667. 7 2 = = e e MS rn S , 置信度为 0.99 的置信区间是 2587.22,7413. 7 2 6667. 7 7074. 315 )6( 1 995. 011 = m tY , 9267.18,0733. 7 3 6667. 7 7074. 313 )6( 2 995. 022 = m tY , 9267.24,0733.13 3 6667. 7 7074. 319 )6( 3 995. 033 = m tY , 2587.34,7413.19 2 6667. 7 7074. 327 )6( 4 995. 044 = m tY , 2462.21,7538.14 10 6667. 7 7074. 318 )6( 995. 0 = n tY , 0775.68,4801. 2 6757. 0 46 , 5476.18 46 )6( , )6( 2 005. 0 2 995. 0 2 = = ee SS 13 8.2 多重比较 上一节是将多个总体作为一个整体进行检验如果检验结果是因子 A 显著,则可以认为各水平下的均 值 i不全相等,但却不能直接说明 i中哪些可以认为相等,哪些可以认为不等这一节是对各个 i两两之 间进行比较,对 i j ,也就是效应差 a i a j作出估计、检验 8.2.1 效应差的置信区间 效应差 a i a j = i j的点估计为 ji YY因 Yik N ( i , 2 ), (i = 1, 2, , r, k = 1, 2, , m i ),则 ),( 1 2 1 i i m k ik i i m NY m Y i = =,),( 1 2 1 j j m k jk j j m NY m Y j = = , 且当 i j 时, i Y与 j Y相互独立,可得 ) 11 ( ,( 2 ji jiji mm NYY+ , 即 ) 1, 0( 11 )()( N mm YY ji jiji + , 但 未知,用 rn Se =替换由于)( 2 2 rn Se 且 S e与 ji YY,相互独立,则根据 t 分布的定义可得 )( 11 )()( )( 11 )()( 2 rnt mm YY rn S mm YY ji jiji e ji jiji + = + , 故效应差 a i a j = i j的置信度为 1 的置信区间是 11 )( 2/1 ji jiji mm rntYY+ 例 由前面的鸡饲料对鸡增重问题的数据给出各效应差 i j的点估计和置信区间( = 0.05) 解:因 m 1 = m 2 = m 3 = 8,n = 24,r = 3,有 25.1024 8 8194 1 1 1 = m T Y,125.1073 8 8585 2 2 2 = m T Y,25.1044 8 8354 3 3 3 = m T Y, 则各效应差 i j的点估计分别为 875.48125.107325.1024 2121 = YY, 2025.104425.1024 3131 = YY, 875.2825.1044125.1073 3232 = YY; 14 因6553.36 21 875.28215 = = rn Se , 有1142.385 . 06553.360796. 2 11 )21( 975. 0 =+ ji mm t, 则各效应差 i j的置信度为 0.95 的置信区间分别是 7608.10,9892.861142.38875.48 8 1 8 1 )21( 975. 02121 =+ tYY, 1142.18,1142.581142.3820 8 1 8 1 )21( 975. 03131 =+ tYY, 9892.66,2392. 91142.38875.28 8 1 8 1 )21( 975. 03232 =+ tYY 例 由前面的食品包装对销售量影响问题的数据给出各效应差 i j的点估计和置信区间( = 0.01) 解:因 m 1 = 2,m 2 = 3,m 3 = 3,m 4 = 2,n = 10,r = 4,有 15 2 30 1 1 1 = m T Y,13 3 39 2 2 2 = m T Y,19 3 57 3 3 3 = m T Y,27 2 54 4 4 4 = m T Y, 则各效应差 i j的点估计分别为 21315 2121 = YY,41915 3131 = YY, 122715 4141 = YY,61913 3232 = YY, 142713 4242 = YY,82719 4343 = YY; 因7689. 2 6 46 = = rn Se ,有2653.107689. 27074. 3)6( 995. 0 =t,则各效应差 i j的置信 度为 0.99 的置信区间分别是 3709.11,3709. 79129. 02653.102 3 1 2 1 )6( 995. 02121 =+ tYY, 3709. 5,3709.139129. 02653.104 3 1 2 1 )6( 995. 03131 =+ tYY, 7347. 1,2653.22 12653.1012 2 1 2 1 )6( 995. 04141 =+ tYY, 3816. 2,3816.148165. 02653.106 3 1 3 1 )6( 995. 03232 =+ tYY, 6291. 4,3709.239129. 02653.1014 2 1 3 1 )6( 995. 04242 =+ tYY, 3709. 1,3709.179129. 02653.108 2 1 3 1 )6( 995. 04343 =+ tYY 15 8.2.2 多重比较问题 对各个 i两两之间进行比较,也就是检验任意两个水平 Ai与 Aj下的总体均值是否相等,即检验假设 ji ij H=: 0 vs ji ij H: 1 , i, j = 1, 2, , r 对于每一个假设 ij H0可以采取上一章两个正态总体的均值比较方法进行检验,但这里需要同时检验 2 ) 1( 2 = rr Cr个这种假设 设需要同时检验 k 个假设kiH i , 2, 1, 0 L=,每一个假设的显著水平是 ,即在 i H0成立的条件下,接 受 i H0的概率为 1 ,但在所有 k 个假设 i H0都成立的条件下,要同时接受所有假设 i H0的概率就可能远 小于 1 事实上,此时对每一个假设 i H0,拒绝 i H0的概率为 ,而对所有 k 个假设kiH i , 2, 1, 0 L=, 至少拒绝其中一个 i H0的概率最大时可能达到 k ,即同时接受所有假设 i H0的概率就可能只有 1 k 可见,需要同时检验多个假设时,一般不应逐个检验每一个假设,而是采用多重比较方法同时检验多 个假设多重比较方法,就是针对所有假设,构造一个统一的拒绝域,再逐个进行比较 这里,需要检验假设 ji ij H=: 0 vs ji ij H: 1 , 1 i j r, 在 ij H0成立的条件下, i Y与 j Y不应相差太大对每一个假设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论