(概率论与数理统计专业论文)关于均值向量的置换检验的研究.pdf_第1页
(概率论与数理统计专业论文)关于均值向量的置换检验的研究.pdf_第2页
(概率论与数理统计专业论文)关于均值向量的置换检验的研究.pdf_第3页
(概率论与数理统计专业论文)关于均值向量的置换检验的研究.pdf_第4页
(概率论与数理统计专业论文)关于均值向量的置换检验的研究.pdf_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要 置换检验是一种统计检验方法。它是由r a f i s h e r 于1 9 3 5 年就已经提出,但由于计 算量大,在二十世纪八十年代之前一直没有引起人们的重视。八十年代后,高运算速 度计算机的普及、专门的统计软件的出现以及在高维小样本数据( 如基因表达数据) 的需 要使得置换检验的研究受到关注。 置换检验有许多优点:比如它是精确检验,几乎不需要分布假设等。但目前的研 究成果主要是一维情形,多维的研究成果并不多。本文主要对多维情形下的均值向量 的置换检验进行研究。 本文主要通过随机模拟方法来研究和评价置换检验。具体包括:( 1 ) 检验统计量的 选择。通过模拟p 值分布来评价检验的可行性。( 2 ) 置换检验与其它检验方法的比较。主 要通过模拟实际显著水平和势进行比较。 研究结果表明,置换检验在多维情形同样显示其优势。当总体分布为正态分布 时,置换检验不比参数检验效果差,小样本时还比参数检验有更高的势;当总体分布 不是正态分布或分布未知时,置换检验要明显优于参数检验。 置换检验也有其局限性。置换检验是通过置换样本信息来得到置换样本。如果置 换的前提不能得到满足,那么,置换检验的实际显著水平将偏离理论显著水平。 关键词:置换检验,均值,p 值,势,调整p 值。 英文摘要 a b s t r a c t p e r m u t a t i o nt e s ti so n ep o p u l a rn o n p a r a m e t r i cm e t h o df o rs t a t i s t i ci n f e r e n c e ,i n i t i a l l y i n t r o d u c e db yf i s h e r ( 1 9 3 5 ) a n dp i t m a n ( 1 9 3 7 ,1 9 3 8 ) i n1 9 3 0 s d u et oh i g hc o m p u t a - t i o n a lc o s ti nt h ee a r l yy e a r s ,i th a sn o tb e e nw i d e l ya p p l i e du n t i l1 9 8 0 s a st h er e c e n t d e v e l o p m e n to fh i g hp o w e rc o m p u t e r sa n ds t a t i s t i c a ls o f t w a r e s ,p e r m u t a t i o nt e s t sb e c o m e m o r ea n dm o r ea t t r a c t i v et op r a c t i t i o n e r s e s p e c i a l l yi tb e c o m e sau s e f u lt o o li nd e a l i n g w i t hd a t ao fs m a l ls a m p l es i z ea n dh i g hd i m e n s i o n ,s u c ha sg e n ee x p r e s s i o nd a t a t h ea d v a n t a g e so fp e r m u t a t i o nt e s ta r em a n i f o l d i ti sa ne x a c tt e s ta n dd o e sn o t r e q u i r ea n yd i s t r i b u t i o n a la s s u m p t i o na p a r tf r o me x c h a n g e a b i l i t yo ft h eo b s e r v a t i o n s t h e l i t e r a t u r eo fp e r m u t a t i o nt e s ti sr i c h ( g o o d ,2 0 0 5 ;p e s a r i n ,2 0 0 1 ;f i s h e r ,1 9 3 5 ;p i t m a n ,1 9 3 7 ,1 9 3 8 ;e d g i n g t o n ,2 0 0 5 ;w e l c h ,1 9 9 0 ;a l b e r s ,1 9 7 6 ;b i c k e l ,1 9 7 8e t c ) t h i sa r t i c l ef o c u s o nm u l t i d i m e n s i o n a lc a s et os t u d yt h ep e r m u t a t i o nt e s t sf o rm e a nv e c t o r si no n e - s a m p l e a n dm u l t i - s a m p l ec a s e s m o n t ec a r l os i m u l a t i o ni su s e dt os t u d yt h ep r o p e r t i e so fp e r m u t a t i o nt e s t s o u r r e s e a r c hi n c l u d e s :( 1 ) s e l e c t i o no ft e s ts t a t i s t i c ;a n d ( 2 ) c o m p a r i s o n sb e t w e e np e r m u t a t i o n t e s t sa n do t h e re x i s t i n gt e s t s t h ee m p i r i c a ld i s t r i b u t i o no fp - v a l u e si se x a m i n e db y s i m u l a t i o nt os e et h ef e a s i b i l i t yo ft h ep e r m u t a t i o nt e s t t h ep e r f o r m a n c e sa r ec o m p a r e d t h r o u g ha c t u a ls i z ea n dp o w e r t h es i m u l a t i o nr e s u l t ss h o wt h a tp e r m u t a t i o nt e s t sp e r f o r mw e l li nm u l t i - d i m e n s i o n a l c a s ei ng e n e r a l w h e nt h ep o p u l a t i o nd i s t r i b u t i o ni sn o r m a l ,t h ep e r m u t a t i o nt e s ti sn o t i n f e r i o rt ot h eu s u a lp a r a m e t r i ct e s t sa n dh a sh i g h e rp o w e ri ns m a l ls a m p l ec a s e s ;w h e n t h ep o p u l a t i o nd i s t r i b u t i o ni sn o tn o n n o r m a lo ru n k n o w n ,t h ep e r m u t a t i o nt e s t sa r e f o u n dt ob es u p e r i o rt h a nt h ep a r a m e t r i ct e s t t h eu s eo fp e r m u t a t i o nt e s ti sl i m i t e db yi t sa s s u m p t i o no fe x c h a n g e a b i l i t yo fo b s e r v a - t i o n s i ft h i sc o n d i t i o ni sn o ts a t i s f i e d t h ea c t u a ls i g n i f i c a n c el e v e lo ft h et e s tw i l ld e v i a t e f r o mt h et h e o r e t i c a ls i g n i f i c a n c el e v e l k e yw o r d s :p e r m u t a t i o nt e s t ,m e a n ,p - v a l u e ,p o w e r ,a d j u s tp - v a l u e l v 学位论文独创性声明 本人所呈交的学位论文是我在导师的指导下进行的研究工作及取得的研究成 果。据我所知,除文中已经注明引用的内容外,本论文不包含其他个人已经发表或撰 写过的研究成果。对本文的研究做出重要贡献的个人和集体,均已在文中作了明确 说明并表示谢意。 作者签名: 学位论文使用授权的说明 本人完全了解华东师范大学有关保留、使用学位论文的规定,学校有权保留学 位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版。有权将学位论 文用于非赢利目的的少量复制并允许论文进入学校图书馆被查阅。有权将学校论文 的内容编入有关数据库进行检索。有权将学位论文的标题和摘要汇编出版。保留的 学位论文在解密后适用本规定。 作者签名: 日期: 诌巍 导师签名: 日 徉k 第一章介 绍 1 1 问题背景 第一章介绍 统计学的基本问题是利用观测到的数据推断总体的一些性质。假设检验是一种 重要的统计推断方法。关于均值的假设检验是非常重要的一类假设检验,许多实际问 题都会涉及到均值的检验。例如,基因表达是否有差异,新药疗效是否有提高,其毒 性是否降低,两种治疗方案疗效是否有显著差异等等都是均值的检验问题。 均值的假设检验中,当总体分布为正态分布时,已经推导出一些检验统计量的 分布,用参数检验方法对均值假设进行检验。常用的检验方法一维有u 检验、亡检 验和f 检验4 2 1 ,多维有h o t e l l i n gt 2 检验,w i l k sa 检验 4 0 1 。当总体分布非正态或未 知时,检验统计量在凰下的分布是什么就成为统计学家关心的问题。为此,前人 提出了很多方法。r a f i s h e r ( 1 9 3 5 ) 1 1 和e p i t m a n ( 1 9 3 7 ,1 9 3 8 ) 2 6 1 2 7 提出了置换检 验,f w i l c o x o n ( 1 9 4 5 ) 3 1 提出了秩和检验,e f r o n ( 1 9 7 9 ) 8 1 提出了自助检验。 置换检验( 又称随机化检验) 是一种统计检验方法。它是r a f i s h e r i l e p i t m a n 于二 十世纪三十年代就已经提出,但由于计算量大,在二十世纪八十年代之前一直都没有 得到广泛应用。八十年代后,计算机的普及和运算速度的提高以及专门的统计软件的 出现使得置换检验的广泛应用成为可能;m i e l k e 2 1 】f 2 2 和b o i k 4 】的倡导以及基因表达数 据这样的样本量小维数高的样本数据的出现也促使人们研究置换检验。置换检验重新 引起人们的关注。 关于均值的置换检验根据样本是一维还是多维,是单样本、两样本还是七( 七 2 ) 样 本,其检验方法又有所不同。目前对一维的单样本、两样本以及后( 七 2 ) 样本的置换检验 已有一些研究,对一维单样本对称分布的均值检验提出了符号置换检验,对一维两样 本和k 样本的均值检验提出了一般的置换检验,关于检验的统计量的选择、检验优劣的 评价也有了一些结论。对于多维情形的置换检验研究的非常少,有许多问题值得去研 究。 一1 一 1 2 置换检验 1 2 置换检验 1 2 1 置换检验的概念 定义1 1 :根据一定的原则置换样本信息,将置换的一个结果称为一个置换样 本( p e r m u t a t i o ns a m p l e ) 。对所有不重复的置换样本逐个计算其检验统计量的值,得 到的检验统计量的分布称为检验统计量的置换分布( p e r m u t a t i o nd i s t r i b u t i o n ) 。将 置换前最原始的样本称为初始样本( o r i g i n a ls a m p l e ) 。由初始样本计算得到的检验统 计量的值称为检验统计量的初始值( o r i g i n a lv a l u e ) 。根据检验统计量的初始值和置换 分布进行的假设检验称为置换检验( p e r m u t a t i o nt e s t ) 。 1 2 2 置换检验的基本过程 置换检验的基本过程与一般的假设检验过程相似又略有不同。其基本过程如下: 第一步:提出原假设凰和备择假设1 ; 第二步:确定置换方法,获得置换样本; 第三步:确定检验统计鼍,计算检验统计最的初始值和置换分布; 第四步:根据检验水平确定拒绝域,对假设作出推断。 置换检验的关键之一是获得置换样本。置换样本是通过置换样本信息而来,那 么,我们该置换样本的什么信息? 如何置换? 置换后能得到多少的置换样本? 首先,置换的样本信息因具体情况不同,置换的方法也就不同。例如,在一维单 样本情形,如果总体x 的分布是对称分布,则对称中心就是均值肛。x p 的分布就是 关于原点对称的对称分布。要检验假设h o :p = 肋,相当于检验x 一肛。的对称中心是原 点。如果z 是x 一肛。的观测值中的一个,则在凰下我们有充分的理由认为一x 有相等的可 能作为x 一脚的观测值出现。我们的想法就是任意置换x 一加的观测值中每个数的正 负号,得到置换样本。再例如,在两样本情形,要检验假设h o :肛】= 肛2 ,如果两个总 体的方差相等,那么,在凰下我们可以认为两个样本是来自同一总体。我们可以将两 个样本的观测值任意在组间置换,第一个样本中的观测值换到第二个中,第二个样本 中的观测值换到第一个中,得到的置换样本仍然是来自两个相同总体的样本。 其次,因初始样本的容量是有限数,置换后能得到的不同置换样本的数量是有限 的。对单样本情形下对称分布均值的检验,如果样本中有n 个非零的数,每个数的符号 可以是正号,也可以是负号。置换符号一共可以得至l j 2 个不同置换样本。在两样本情 形,两个样本容量分别是佗。,佗。的样本,置换后共能得到铅+ 。个不同的置换样本。 一2 一 第一章介绍 置换检验的关键之二是计算置换分布。这个问题看起来简单,只是将置换样本中 的数据代入检验统计量中计算即可,但这个计算量许多时候会大的让人无法承受,既 使是计算机计算也是一件很费时的工作。例如,当两样本容量各是1 0 时,置换样本共 有c 2 , o o = 1 8 4 7 5 6 个,要让计算机计算1 8 4 7 5 6 个置换样本的检验统计量值,计算机首先 要得到1 8 4 7 5 6 个置换样本,这要用许多的命令来完成,计算机还要计算1 8 4 7 5 6 个检验 统计量的值,工作量之大是可想而知。因此,置换检验也就有了两种分化:( 1 ) 小样本 情形下的完全样本置换检验,即根据全部的不重复的置换样本计算置换分布。( 2 ) 样 本量较大情形下的不完全样本置换检验,即从全部的个置换样本中随机选择m 个不 重复的置换样本计算近似置换分布。m a r c o ( 2 0 0 4 ) 2 0 i 1 匝过大量的蒙特卡罗模拟表明, 为了估计检验水平口= 0 0 5 置换检验的势( p o w e r 】,只需要5 0 0 至u l o o o 个随机样本就够 了。因此当置换样本总量大于1 0 0 0 时,我们可以不用得到所有的置换样本,只要随机 选取5 0 0 至u 1 0 0 0 个不同的置换样本计算置换分布就可以了。本文在不加说明的情况下的 置换检验是指完全样本置换检验。 置换检验的关键之三是确定拒绝域。置换检验作出推断的思想是:检验统计 量的初始值如果在置换分布中处于非常极端的位置,我们就有理由拒绝假设。 因此,拒绝域的确定是由置换分布的分位数做为临界值来确定拒绝域。设咒满 足p ( t 死) = o l ,乃一q 满足p ( t 乃一a ) = q ( 其中q t o ) - - - - 、- - b , 胪t2 尸( t 妯) , p ( t t o ) 0 5 p ( t t o ) 0 5 1 2 3置换检验的优缺点 置换检验作为一种非参数检验方法几乎不需要分布假设,它不象参数检验受正态 假设的限制,所以在检验统计量的选择上总是选择最能区分原假设和备择假设的统计 量,这是置换检验的一大优点。已有的研究结果表明,置换检验还具有以下的优点: ( 1 ) 置换检验是精确检验,因为置换分布是精确的。 ( 2 ) 置换检验具有一定的稳健性。 ( 3 ) 置换检验在小样本情况下许多时候比参数检验具有更高的势。 一3 一 1 3 我的研究 置换检验也有以下的不足之处: 置换检验置换的前提是在原假设凰下观测值是可交换的。例如,在单样本情形检 验均值等于已知量,要置换符号就要求分布对称,在两样本情形检验均值相等,要在 组间置换就要求两样本方差相等。 1 3 我的研究 1 3 1研究的内容 ( 1 ) 对一维。f f f y d - f 均值的置换检验做简要总结,并对已有结果进行验证性研究。 ( 2 ) 主要对多维情形下均值向量的置换检验进行研究,具体分单样本、两样本及多 样本三种情况,研究置换的方法、检验统计量的选择,检验优劣的评价,多重检验的 至少有一个为真的原假设被拒绝的概率及p 值的调整。 1 3 2研究的方法 ( 1 ) 通过模拟p 值的分布函数图象评价检验的水平及检验的可行性。 一个原假设凰为简单假设的检验,p 值的分布应为 0 ,1 】区间上的均匀分布,分布函 数的图象应该是( 0 ,o ) 到( 1 ,1 ) 的直线。如果检验过程某个环节出了问题,p 值的分布将会 出现偏差。所以,p 值的分布是评价检验是否可行的最基本的标准。 ( 2 ) 通过模拟势函数图象来评价检验的优劣性。 由于假设检验会犯两种类型的错误:第一类错误和第二类错误。检验犯第一类错 误的概率也就是检验的显著水平q = 尸( 拒绝凰i s o ) ,犯第二类错误的概率p = p ( 接 受凰i 凰) 我们当然希望犯两类错误的概率都尽可能小,但这两类错误一个变小,另一 个就变大。我们的原则是控制第一类错误率不超过给定水平的前提下使第二类错误率 尽可能小。在凰的参数空间上,检验的势是不犯第二类错误的概率,所以,势曲线高 的检验是好的检验。我们评价检验好坏的最有效的标准就是势曲线。 ( 3 ) 通过模拟样本量对实际显著水平的影响来评价检验的实用性。 在假设检验中,实际的检验水平常常与理论检验水平不一致。我们的实际检验水 平是否与理论上设定的检验水平一致? 样本量对其有什么影响? 在符合理论检验水平 的前提下样本量小的检验是经济实用的检验。所以,我们也通过观察样本量对实际显 著水平的影响来评价检验的实用性。 一4 一 第二章一维情形下均值的置 蠡检验 第二章一维情形下均值的置换检验 一维情形下均值的置换检验具体可分为三种:样本来自单个总体的单样本情形、 样本来自两个总体的两样本情形和样本来自k ( k 2 ) 个总体的七样本情形。下面对三种 情形分别进行论述。 2 1 单样本均值的符号置换检验 设x l ,咒,为来自总体x 的样本。对均值p 的检验就是检验假设: h o :p = p ov s 日1 :p p o ( p p o ) 当总体分布为正态分布时,对均值p 的检验常用参数检验。具体的有u 检验和z 检 验,它们都是非常好的检验方法。当总体分布非正态或未知时,检验的方法有符号置 换检验 1 3 】、自助检验 6 】 8 9 】 1 0 】、符号检验和符号秩和检验 4 5 】。 2 1 1 符号置换检验 符号置换检验的思想来源于对称分布的对称性。假设已知分布是对称分布,均值 就是对称中心,关于均值的检验就是关于对称中心的检验。设z 。,z 2 ,z n 表示样本 观测值偏离对称中心p 的值。如果凰成立,则x p o 有相等的可能取到z 。和一z 1 。符号 置换检验抓住对称分布的这个的特点,通过置换样本观测值与对称中心偏差的符号得 到置换样本。例如,将z 。的符号置换为相反的符号,得到的一z 。,z 2 ,z n 也可以看作 是x 一加的又一个样本,并且,置换符号前后的两个样本出现的机会是相等的。重复 此过程,就可得至l j 2 个不同的置换样本。 检验统计量的选择要从置换样本的特征来考虑。由于分布的对称性,在凰成立 的条件下,z l ,z 2 ,z n 的正数和负数总和应该比较接近0 。如果z 1 ,z 2 ,z n 中正数足够 多,则说明p 肋。但正数多到什么程度就可以拒绝h o :p = p o ,认为肛 肋呢? 而当 正数少到什么程度就可以拒绝h o :肛= 脚,认为p 0 计算t 的置换分布,当t 的初始值亡。处于非常的极端位置时,拒绝假设。 一5 一 2 1 单样本均值的符号置换检验 例2 1 已知总体x 的分布关于参数p 对称,现有观测值一1 ,1 5 ,2 ,3 ,5 ,在显著 水平0 0 5 下能否认为肛 o 1 3 】? 解:问题为检验假设凰:p = 0v sh l :肛 0 。置换观测值的符号,共有3 2 种不同 的置换样本。检验统计量选为丁= 。 o 甄。对每个置换样本求t 的值( 表2 1 ) 。 表2 1置换样本与检验统计量值 序号置换样本 3 - 十序号置换样本 r + z 二一 111 52351 2 5211 52351 1 5 3 l 一1 5 2 3 51 1411 52351 0 511 52351 0 5 611 52359 5 7l一1 52359811 5 2 358 911 52359 51 011 52358 5 1 1 1 1 5 2 3 581 21一1 52357 1 311 52357 51 4 1 1 5 2356 5 1 51一1 523561 611 52355 1 7l1 5 2 357 51 8 一l1 52356 5 1 911 523562 011 5 2 3 5 5 2 111 52355 52 211 52354 5 2 3l一1 5 2 3 542 4一11 52353 2 511 5235 4 5 2 6 11 52353 5 2 711 523532 8一11 5 2 3 5 2 2 9 11 52352 53 011 52351 5 3 1l1 5235 1 3 2 11 52350 因为当凰为真时,t 的值倾向于大,所以,拒绝域为右侧拒绝域。初始样本的丁的 值是1 1 5 ,检验的p 值为p ( t 1 1 5 ) = 2 3 2 = 0 0 6 2 5 0 0 5 ,不能拒绝假设凰。 一般地,符号检验置换样本总共有2 竹个,要做显著水甲为0 0 5 的检验,单边检验初 始样本量最小是5 。以右单边检验为例,初始样本量是5 ,共有3 2 个不同的置换样本, 假设3 2 个置换样本的检验统计量也没有相等的,当检验统计量的初始值为最大时拒绝 假设,检验的p 值是1 3 2 = 0 0 3 1 2 5 。而初始样本量是4 时,共有1 6 个不同的置换样本,检 验的p 值最小是0 0 6 2 5 ,既使检验统计量的初始值最大,也不能得出拒绝假设的结论。 双边检验由于拒绝域要取两边,初始样本量最小是6 。 2 1 2 符号置换检验与其它检验比较的结果 对四种方法模拟比较,有以下结论 4 1 】: 一6 一 第二章一维情形下均值的置 囊检验 ( 1 ) 从检验是否精确的角度来看,符号置换检验、参数检验、符号检验和符号秩和 检验都是精确检验,自助检验不是精确检验。 ( 2 ) 从检验方法适用的广度来看,符号置换检验、符号检验、符号秩和检验都只需 要分布对称,参数检验需要正态总体的假设,适用范围最小,自助检验不需要任何假 设,适用范围最广。 ( 3 ) 从样本量的角度来说,符号置换检验需要的样本量小,参数检验犯第一类错误 的概率对样本容量不敏感。自助检验样本量小时犯第一类错误的概率偏大。 ( 4 ) 符号置换检验与参数检验相比,符号置换检验在正态性满足时检验的效果不比 参数检验差。参数检验在正态性满足时是非常好的方法。但正态性不满足时,使用参 数方法检验的效果就很差。 2 2 两样本均值的置换检验 设x l ,咒,k 。与m ,k ,k 。是来自总体x 和y 的样本,p 1 和肛2 分别为x 和y 的 均值。贾= 击罂。x ,矿= 石1 翟。k 。检验两均值是否相等就是检验假设 h o :肛l = p 2v sh 1 :p 1 * 2 ( p 1 p 2 ,p 1 p 2 。如果凰成立,两 样本方差也没有显著差异,我们可以将两样本看作是来自同分布的两个总体的样 本。任意置换样本中每个数的位置,共有2 0 种不同结果。检验统计量取第一组中数的 和t = 崮3 翰,置换样本和置换分布如表2 2 。 表2 - 2 置换样本及置换分布 序号第一组第二组 t 序号第一组第二组 t 11 2 11 1 81 1 03 42 21 23 4 921 2 11 1 83 41 1 02 21 22 7 3 31 2 11 1 03 41 1 82 21 22 6 541 1 81 1 03 41 2 12 21 22 6 2 51 2 11 1 82 21 1 03 41 22 6 161 2 11 1 02 21 1 83 41 22 5 3 71 2 11 1 81 21 1 03 42 22 5 181 1 81 1 02 21 2 13 41 22 5 0 91 2 11 1 01 21 1 83 42 22 4 31 01 1 81 1 01 21 2 13 42 22 4 0 1 l1 2 13 42 21 1 81 1 01 21 7 71 21 1 83 42 21 2 11 1 01 21 7 4 1 31 2 13 41 21 1 81 1 02 21 6 7 1 4 1 1 03 42 2 1 2 11 1 81 21 6 6 1 51 1 83 41 21 2 11 1 02 21 6 41 61 1 03 41 21 2 11 1 82 21 5 6 1 71 2 12 21 21 1 81 1 03 41 5 51 81 1 82 21 21 2 11 1 03 41 5 2 1 91 1 02 21 2 1 2 11 1 83 41 4 4 2 0 3 42 21 21 2 11 1 81 1 06 8 检验的拒绝域为右侧拒绝域。检验统计量的初始值为3 4 9 ,检验的p 值为p = p ( t 3 4 9 ) = 0 0 5 ,在显著水平0 0 5 时拒绝假设凰。 2 2 2 置换检验与其它检验比较的结果 在比较两样本均值时,除了置换检验外的其它检验方法有参数检验、自助检 验署d w i l c o x o n 秩和检验。总体分布正态的情形下,两方差已知的u 检验、两方差未 知但相等的t 检验是最经典的方法,经常被使用。两方差未知也不相等时的均值相 等检验仍然是个难题,很多人研究了这个问题。w e l c h 提出了w e l c ht 统计量。但是 在m i n ( n ,m ) 2 ) 样本均值的置换检验 设x l l x 1 2 ,墨n 。,x 2 l ,托2 ,蚴,虬l ,x k 2 ,凰n k 是来自总 体x l ,恐,虬的样本,p l ,p 2 ,鲰为x l ,恐,k 的均值。n = n l + 佗2 + + n k , 戈t = 击薹b ,兄= 去姜砀, 组内偏差平方和 组间偏差平方和 总偏差平方和 检验假设: ,兄= - - n k l j_lxkj,贾2寺i=1j=lrsk 如 , 七 n t 七 n t s s t = ( 确一元) = s s e + s s b i = ij = 1 h o :p l = p 2 = p 七v sh i :p l ,p 2 ,p l i c 不全等 在总体分布为正态时,常用的检验方法是基于方差分析的f 检验。在总体分布非正 态或未知时,检验方法有置换检验,自助检验,k r u s k a l - w a l l i s 检验。 2 3 1 置换检验 k 样本均值相等的置换检验,其基本思想是与两样本基本一致:如果已知k 个方差 相等,则在原假设凰下,我们可以认为k 个样本是来自有相同分布的k 个总体。将k 个 样本合并构成合样本,合样本仍然可看作是来自相同总体的样本。将合样本中观测值 的位置置换,再将前n 。个看作是来自第一个总体的样本,将接下来孔2 个看作来自第二 个总体的样本,最后的n 七个看作是来自第k 个总体的样本,就得到了一个新的来 一9 一 p一鼍 一 翰 m 芦 七斟 l l ec 0s 铲n 一 一恐m 七:i = 尸 一x 一 一墨啦 七甜 = bss 2 3k ( k 2 ) 样本均值的置换检验 自尼个总体的置换样本。如此重复可得到而毒个置换样本。 在选择检验统计量时,值得注意的是对置换样本来说叉和s s t 是常数。可以将 取s s b 为检验统计量简化为 七 t = 寇2 i - - - - - l 当t l t 较大时,认为这k 个均值不全相等,拒绝假设凰。拒绝域为右侧拒绝域。 2 3 2 置换检验与其它检验比较的结果 将置换检验和参数f 检验、自助检验、k r u s k a l - w a l l i s 检验进行比较的结果表 明f 4 1 1 : ( 1 ) 在小样本情形,置换检验和k r u s k a l - w a l l i s 检验具有较高的势,参数检验其次, 自助检验的势曲线较低。 ( 2 ) 当各样本不是来自同一分布的时,检验的结果都有偏差,置换检验的偏差较 小。 1 0 一 第三章多维情形下均值的置换检验 第三章多维情形下均值的置换检验 多维情形下均值向量的置换检验其得到置换样本的方法与一维情形基本相似,但 多维情形由于均值由一维变成m 维向量,检验由检验一个假设变成同时检验m 个假设, 问题变得较为复杂。下面我们分别对单样本、两样本和k ( k 2 ) 样本三种情形下的均值 向量的置换检验进行研究。为叙述方便,在本章经常将均值向量简称为均值。 3 1 单样本均值的符号置换检验 x ( 1 ) = ( x n ,x 1 2 ,x l m ) 7 ,x ( 2 ) - - ( x 2 l ,x 2 2 ,托m ) 7 ,五n ) = ( k 1 ,x , a , ,k m ) 7 是来自m 维总体x = ( x 1 ,x 2 ,) 7 的样本。p = ( p l ,p 2 ,上m ) 7 为x 的 均值,p o = ( p t o ,p 2 0 ,p m o ) 7 为一已知的均值,记x = 丢釜。 ,t = l ,2 ,m ,一x = ( 一x l ,一x 2 ,_ m ) ,砰= 击l ( 玛t 一瓦) 2 ( 1 = 1 ,2 ,m ) 。 关于均值p 的检验可表示为: 它等价于同时检验m 个假设 h o :p = j u o ;v sh1ho:p p o:p = j:p p o h 1 0 :p 1 = p l o ,2 0 :p 2 = p 2 0 ,o := p , n ov sh i :h i o ,o 不全成立 检验这样的假设常有两种方法: ( 1 ) 确定一个检验统计量,它能够将m 维样本压缩为一维,用此检验统计量一次性 检验m 个假设。这样的检验方法的优点在于“错误的拒绝凰”的概率容易控制。当检 验的显著水平为n 时,则“错误的拒绝凰”的概率就是q 。不足在于当凰被拒绝时,不 知道具体的是哪个假设被拒绝,而这有时恰是我们想知道的。 ( 2 ) 确定m 个统计量,用第i 个统计量去检验第i 个假设,共检验m 次。这种检验方法 称为多重检验( 或同时检验) 。这样的检验方法的优点在于能够知道具体的是哪个假设被 拒绝,不足在于错误拒绝凰的概率不容易控制。因为检验一个假设的显著水平若为口, 则这个检验犯第一类错误的概率为0 t 。如果将m 个假设同时进行检验,每个的检验的显 著水平为0 t ,那么,m 个假设至少有一个检验犯第一类错误的概率不再是q ,也就是错 误拒绝凰的概率不是o t 。这个问题我们将在3 1 3 中详细讨论。 一1 1 3 1 单样本均值的符号置换检验 3 1 1 符号置换检验 对于单样本情形,我们可类似于一维,仍然采用符号置换检验,但多维情形由于 要涉及到分量之间不一定独立,所以,置换初始样本的符号时要将初始样本中向量整 体置换符号,不能将某分量单独置换符号,除非已知分量间是独立的。检验统计量可 取: 一 t :m 觚掣 l 只一q ( m ,n m ) 此时的检验,我们可选择参数检验,也可选择置换检验。对两种检验进行模拟比 较,模拟了表3 - 1 中的m o d e l - l - m o d e l - 4 ,模拟结果如图3 _ 2 。 o “ o o 茎暑 。 藿 薹 i 八 j 了vj i 、 量,7 。v 一、 ,i 一、: , ,一,: , 、 m um um u 图3 2符号置换检验的势及比较 一1 3 3 1 单样本均值的符号置换检验 模拟结果显示: ( 1 ) 小样本对称分布情形下用参数检验和符号置换检验,符号置换检验优于参数检 验。 ( 2 ) 当分布对称性不满足时,符号置换检验也能以较小的概率拒绝为真的原假 设凰,而以更高的可能接受为真的备择假设日l 。 ( 3 ) 当n m 不成立时,h o t e l l i n gt 2 检验不能使用,符号置换检验却不受限制,仍 然可以检验假设。 3 1 3 多重符号置换检验及f w e r 当我们想知道m 个假设中都是哪些原假没被拒绝时,我们必须对m 个假设逐一检 验。此时,我们会关心这样的检验方法“错误拒绝凰”的概率是多少。假设m 个假设 中有m o ( m ) 个假设为真,不妨设前m o 个假设为真,后m m o 个为假。我们逐个做检 验水平为q 的检验,检验结果中接受和拒绝假设的情况如表3 - 2 。 表3 2m 个原假设被接受和拒绝的个数 接受拒绝合计 原假设为真矿y m o 原假设为假t s m t r t 0 合计 m r冗m 在m o 个为真的假设中有y 个被拒绝,意味着有y 个检验犯了第一类错误。如果 用f w e r ( f a m i l y w i s ee r r o rr a t e ) 表示至少有一个为真的假设被拒绝的概率,则有 f w e r = p f y 1 一 j 如果凰为真,即m 个原假设全为真( m o = m ) ,那么,错误拒绝凰的概率 就是f w e 兄。对f 彤e 冗我们首先要明白的就是:当m 个假设每个的检验水平 为n 时,f w e r 已不是q 。究竟是多少呢? 我们来大致计算一下。设晟( i = 1 ,2 ,m ) 表示第i 个假设鼠。被拒绝,瓦( t = 1 ,2 ,m ) 表示鼠。未被拒绝, 则p ( e ) = q ,p ( 巨) = 1 一o t 。当日,易,相互独立时, f w e r = p ( e 1 u e 2u ue m ) = 1 一p ( 一e 1 己_ m ) = 1 一p ( e 1 ) p ( e 2 ) p ( e m ) ) = 1 一( 1 一q ) m 一1 4 第三章多维情形下均值的置捷检验 而一般情况下有 f w e 冗= p ( 蜀u 易u u ) 尸( e 1 ) + p ( e 2 ) + + p ( 风) ) = m n 这些公式能说明什么呢? 假设在独立情形下口= 0 0 5 ,m = 5 ,则f w e r = o 2 2 6 2 。 试想,某种疾病的诊断要用5 个独立的指标来判断,如果有一项异常则判为有 病。f w e r = 0 2 2 6 2 说明1 0 0 个本无此病的人来体检,大约就有2 3 人被判为有此 病,那将是什么状况。所以,我们必须对检验方法进行修正,使得f w e 剧滏制在要 求的水平q ,为了区别于单个检验的检验水平q ,我们称这个o l 为多重检验的显著水平 或f w e r 水平,显然,f w e r 水平o t 1 。 为了使f w e r a ,许多人对单个检验的水平进行了修 正。b o n f e r r o n i 3 0 、h o l m ( 1 9 7 9 ) 1 6 、w - e s t 龇a n dy o u n g ( 1 9 9 3 ) 3 0 、s i d a k ( 1 9 6 7 ) 2 9 提 出了一些调整的方法( 详见h s u ( 2 0 0 0 ) 1 8 ,w e s t f a l la n dy o u n g ( 1 9 9 3 ) 3 0 ) 。 下面,我们将选择合适的检验统计量对m 个假设进行多重置换检验。我们选择m 个 统计量: 互= 坠掣,i :1 ,2 ,m i t2 一,2 上,z ,m o t 记检验统计量的初始值为亡舻n 个置换样本的检验统计量值为 对仇个假设单独检验的p 值为 p i = t i j t i o ,j = 1 ,2 , 盟,江1 川2 一 n 其意义为根据检验统计量的观测值t 能够做出拒绝假设凰。的最小显著水平【4 2 】o 多重 检验的施与单重检验的p 值含义相似,但又略有不同。下面我们给出多重检验的p 值的 定义。 定义2 1 :多重检验中根据m 个检验统计量正,死,的观测值t l o ,亡2 0 ,亡m o 至少能够拒绝一个原假设的最小f w e 兄水平称为多重检验的p 值。而根 据t t o ( i = 1 ,2 ,m ) 能够拒绝第i 个假设鼠。的最小f e 尼水平称为多重检验的 第i 调酆值,简称调整p 值,记为磊。 下面,我们用不同多重检验方法进行多重置换检验。 一1 5 一 3 1 单样本均值的符号置换检验 1 基于b o n f e r r o n i 法的多重置换检验及f e 冗 b o n f e r r o n i 方法的多重检验是一种最简单的多重检验方法。它是一步完成多重检 验,所以又称单步法。其检验的基本思想就是将单独检验一个假设的显著水平统一调 整为a m 1 s 】。 结合我们现在的具体情况,根据初始样本和置换样本的检验统计量值,我们可以 得到检验的p 值p 1 ,p 2 ,p m ,然后对每个假设进行检验。如果p i q m ,则拒绝第i 个 假设。拒绝第i 个假设的f w e r 水平a 应该满足 q m p i 所以,拒绝第i 个假设的最小f w e r 水平就为m p t 。因此,在多重检验中的第i 个检验 的p 值应调整为m p i 。又f w e r 水平口1 ,所以多重检验的第i 调整p 值应为 磊= m i n ( m p i ,1 ) 而军少有一个假设被拒绝时,o t m p l ,o l m p 2 ,口m p , n 至少有一个成立,即 o l m i n ( m p l ,m p 2 ,m 猡m ) 最小的f w e r 水平就为 m i n ( m p :,r a p 2 ,) 观样由于f 彬e r 水平a 1 ,所以,多重检验的p 值为 p 2 m m ( m p l ,m p 2 ,上j2m m ( p l ,沈,j ,- 、,、 基- = b o n f e r r o n i 方法的多重置换检验将m 个检验的显著水平都调整为q m ,因 此,p ( e i ) = a m , f e 冗= p ( e 1u 易u u ) p ( 易) + p ( e 2 ) + + p ( ) ) = m 口m = o l 所以,基于b o n f e r r o n i 方法的多重置换检验这样的多重检验是保守的。 2 基于h o l m 方法的多重置换检验及f w e r h o l m 对b o n f e r r o n i 方法进行了改进。b o n f e r r o n i 方法将m 个假设以同样的水 一1 6 第三章多维情形下均值的置换检验 平口m 来检验每一个假设。h o l i l l 根据m 个检验统计量标准化后的观测值大小的不同 用不同的水平检验假设。 h o l m 方法先将五,易,标准化后按由大到小排序,记为互】,丑2 】,丑m 】。 相应的假设为q l l 日【2 】,研m 】。下标 1 】, 2 】, m 】是1 ,2 ,m 的一个排列。例 如,m = 3 ,五,正,t 3 标准化后为2 4 ,3 1 ,1 3 ,那么 1 】_ 2 , 2 】- 1 , 3 】= 3 。h o l m 的想

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论