




已阅读5页,还剩58页未读, 继续免费阅读
(概率论与数理统计专业论文)基于排序集抽样的分位数符号检验.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 排序集抽样是一种提高抽样效率的有效方法,适用于那些对所研究的 变量进行测量十分麻烦而且耗费精力,但是在一个相对小的集合中,不通 过精确的测量,只通过观察就可以进行排序的场合,排序集抽样已经在农 业、经济以及医学方面得到了广泛的应用。 传统的符号统计量只能检验中位数,而在实际生活中环境评估、医疗 效果等经常用到检验分位数,据此文章提出检验总体分位数的基于排序集 抽样的符号统计量,主要研究了以下几方面的内容: 首先,提出基于简单随机抽样和均衡抽样的检验总体分位数的两个符 号统计量,讨论了它们的基本性质,并通过分析两个符号检验的p i t m a n 相 对效率,得出均衡抽样一致优于简单抽样。 其次,在最新的非均衡抽样下考虑符号检验,给出了统计量的期望和 方差,证明了其适应任意分布和渐近正态性,并讨论了相对于均衡抽样符 号检验的p i t m a n 效率。 再次,考虑了基于非均衡抽样的与次序有关的加权符号检验,分析证 明了具有较高p i t m a n 效率的适应任意分布的最优权数。根据最优权数性质 和其它一些理论证明,具体给出不同分位数的最优抽样,弥补了排序集抽 样在检验分位数上的不足。 最后,为了实际应用考虑了主观排序有误差的情形,给出了最优抽样 符号检验的p i t m a n 效率与误差因子的函数关系式,通过分析比较,所给出 的最优抽样在排序有误差时也有相当好的性质。并且针对不同分位数具体 给出误差函数图像,以便具体应用时参考。 关键词排序集抽样;符号检验;分位数;最优抽样;p i t m a n 相对效率 燕山大学理学硕士学位论文 a b s t r a c t r a n k e ds e ts a m p l i n gi sae f f i c i e n ts a m p l i n gm e t h o di nc e r t a i ns i t u a t i o n s w h e r et h em e a s u r e m e mo ft h ev a r i a b l eo fi n t e r e s ti sc o s t l yo rt i m ec o n s u m i n g b u tt h er a n k i n go fas e to fi t e m sc a nb ee a s i l yd o n eb yj u d g m e mw i t l l o ma c t u a l m e a s u r e m e m ,t h i sm e t h o dh a sb e e na p p l i e dw i d e l yi na g r i c u l t u r e ,e c o n o m ya n d m e d i c i n e 删i t i o m ls i g ns t a t i s t i co n l yc a l lt e s tm e d j a n , b u tq u a n t i l et e s t i n gh a s f r e q u e u ta p p l i c a t i o ni ne n v i r o n m e n t a la s s e s s m e m ,m e d i c a le f f e c ta n ds oo i ls i g n t e s tu n d e rr a n k e ds e ts a m p l i n gi sp r o p o s e df o rt e s t i n gh y p o t h e s e sc o n c e r n i n gt h e q u a n t i l e so f p o p u l a t i o nc h a r a c t e r i s t i c w ed i s c u s st h ef o l l o w i n gf o u rc o m e u t s f i r s t l y , w eg i v et w os i g nt e s t su n d e rs i m p l er a n d o ma n db a l a n c es a m p l i n g , a n dd i s c u s st h e i rb a s i cp r o p e r t y a c c o r d i n gc o m p a r i n gt h e i rp i t m a nr e l a t i v e e f f i c i e n c y , w eo b t a i nb a l a n c es a m p l i n gi sm o r et h a ns i m p l er a n d o ms a m p l i n g s e c o n d l y , w ep r o p o s es i g nt e s tu n d e ru n b a l a n c es a m p l i n gw h i c ht h el a t e s t g e n e r a lr a n k e ds e ts a m p l i n g , w eg i v et h es t a t i s t i cm e a na n dv a r i a n c e , p r o v ei t s d i s t r i b u t i o n - f r e ea n da s y m p t o t i cn o r m a ld i s t r i b u t i o n , a n dd i s c u s st h ep i t m a n r e l a t i v ee f f i c i e n c yt ob a l a n c es a m p l i n g 1 1 1 矾l y w ec o n s i d e rt h ew e i g h t e ds i g nt e s ta s s o c i a t e dw 让r a n ku n d e r u n b a l a n c es a m p l i n g ,a n dp r o v et h ed i s t r i b u t i o n - f r e eo p t i m a lw e i g h t st h a th a v e h i g h e rp i t m a ne 伍c i e n c y b a s e do nt h ep r o p e r t yo fo p t i m a lw e 适h ta n ds o n i c t h e o r i e s ,w eg i v eo v i m a ls a m p l i n gf o rq u a u t i l e ,w h i c hm a k e sr a n k e ds e t s a m p l i n gm o r ea t t r a c t i v ef o rt e s t so nq u a u t i l e s f i n a l l y , w ec o n s i d e ri m p e r f e c to f j u d g m e u to r d e rf o rp r a c t i c a la p p l i c a t i o n , a n dg i v i n gt h er e l a t i v ee x p r e s s i o no f e r r o rg e n ea n d p i t m a ne f f i c i e n c yo f o p t i m a l s a m p l i n g ,t h e nw eg i v ee r r o rf i g u r e so f q u a u t i l e sf o ra p p l i c a t i o n k e y w o r d sr a n k e ds e ts a m p l i n g ;s i g nt e s t ;q u a n t i l e ;o p t i m a ls a m p l i n g ;p i t m a n r e l a t i v ee 丘i c i e n c y 燕山大学硕士学位论文原创性声明 本人郑重声明:此处所提交的硕士学位论文基于排序集抽样的分位 数符号检验,是本人在导师指导下,在燕山大学攻读硕士学位期间独立进 行研究工作所取得的成果。据本人所知,论文中除已注明部分外不包含他 人已发表或撰写过的研究成果。对本文的研究工作做出重要贡献的个人和 集体,均已在文中以明确方式注明。本声明的法律结果将完全由本人承担。 作者签字蔓隽 日期:删年,f 月枷日 燕山大学硕士学位论文使用授权书 基于排序集抽样的分位数符号检验系本人在燕山大学攻读硕士学 位期间在导师指导下完成的硕士学位论文。本论文的研究成果归燕山大学 所有,本人如需发表将署名燕山大学为第一完成单位及相关人员。本人完 全了解燕山大学关于保存、使用学位论文的规定,同意学校保留并向有关 部门送交论文的复印件和电子版本,允许论文被查阅和借阅。本人授权燕 山大学,可以采用影印、缩印或其他复制手段保存论文,可以公布论文的 全部或部分内容。 保密口,在年解密后适用本授权书。 本学位论文属于, 不保密吼 ( 请在以上相应方框内打“”) 作者签名:蔓夥磅 日期:训年jj 月加日 导师签名: 日期:力磊,月易日 第1 章绪论 第1 章绪论 1 1 课题背景 排序集抽样( r s s ) 是一种经常用来提高抽样效率的方法,适用于样本易 于排序但是不易于数量化的场合。许多的抽样试验设计都对人口( 或总体) 进行事先分割之后采用简单随机抽样,在这样的条件下,排序集抽样可以 在抽样设计中代替简单随机抽样,这样有利于样本利用效率的提高,我们 举例来说明这个问题假设需要估计一个森林中树木木材含量的分布,若 这个森林可以认为是均匀的( 树木服从同样的分布) ,运用简单随机抽样方 法可以在森林中的这片区域中随机选取的一个集合中找一个最近的。如果 森林的同态性是不足信的,森林可能是分快不同的,树木可以从每个分块 小单元中随机的抽取,如果这片森林是被人为控制的,它们的成长就会是 分段的,有层次的,树龄相同的树木服从相同的分布,这时,依据其自然 的分层进行抽样是自然的选择,聚类分块和其它分块的抽样方法也值得考 虑,这些抽样设计的共同点是都在最后的最小的单位( 群体) 中进行简单随机 抽样。这个抽样的整体进行的设计细节不是我们考虑的对象,我们关心的 是在最终的单元中用排序集抽样的方法代替简单随机抽样。 排序集抽样的工作是制造一个人工的结构化样本,比方说:开始随机 地抽去两棵树,通过眼睛的观察,判断哪一棵含有较多的木材,将少的那 个做个记号,丢掉大的;接下来,再选另外两棵,从中选出一个含木材多 的,丢掉小的,为一轮。重复进行这样的过程,交替地选择两个中的较小 的和另外两个中的较大的,进行2 5 轮之后,已经随机选出的1 0 0 棵树中5 0 棵 被丢弃( 意思是没有砍倒,也没有造成经济上的损失) ,5 0 棵保留,这5 0 棵树 中,有2 5 棵是从整体上较小的群体中抽取的,2 5 棵是从整体上较大的群体 中抽取的,这5 0 棵保留的树就构成了排序集样本。 标准排序集抽样( 均衡抽样) 过程:设总体服从分布,( 工) ,一次从总体 中抽取大小为埘:的样本,分为m 组,每组m 个,每一组样本都经过一个视 燕山大学理学硕士学位论文 觉上的或是主观上的由小到大排序的过程,然后从第l 组中抽出次序为1 的 样本单元,从第2 组中抽出次序为2 的样本单元,依此类推,直至从第m 组 中抽出次序为m 的样本单元。此时的次序不一定是准确的,因为主观排序 无论是基于一个潜在的变量还是其它,总是有可能出现误差,所以将此时 所得的样本的次序称为准次序,记所得到的样本为 蜀1 】1 ,石【2 】l ,x t 肼】l z 的分布函数记为,【,j ) ,如果排序没有误差,则此时所得的排序集样 本实际上是相互独立的次序统计量,可以记为z ( r ) 一,( ,) ( 力,因为有误差的 存在,采用前述记号。一般地,上述的抽样过程重复_ i 次,则得到样本量为 胛= m k 的排序集样本,记为 x z ,1 ,f = 1 ,m ,j = 1 9 ) j9 _ j ( 1 - 1 ) 第一次使用排序集抽样的是1 9 5 2 年的m c l m y r e t l l ,他感兴趣的是草场的 平均产草量。然而每一块草地的产草量需要把草割下来,晒干再去称量干 草的重量,是非常消耗时间和劳动的过程,但是有经验的眼睛可以对一组 数目较少的几块草地进行相当精确的排序,而不需要进行准确的测量。迄 今为止,排序集抽样在农业方面得到了广泛的应用,同时,这个方法也可 以用于人类经济生活中难以测量的一些性质,比如消费者的消费调查,意 图是用收入去估计消费者的价格指数。需要细节的参与家务的记录和相当 长时间的对每个样本单元进行调查,在这种情况下,事先的观测排序可以 基于一个更为便利的电视采访进行。排序集抽样方法的广泛应用促进了基 于这种抽样方法的统计推断理论的发展。 1 2 国内外研究的现状和趋势 对排序集样本进行统计推断的理论上的第一个结果是t a k a h a s i 2 1 等 ( 1 9 6 8 ) 得出的,他们利用排序集样本去估计总体均值。设正= e r ,令 肛- - x 。x ;。x ( 1 - 2 ) 另设抽自总体的简单随机样本为 x l ,z 2 ,z 。( 1 3 ) 2 第1 章绪论 则简单样本均值为 叉= 还? x t 以t l 他们得到了,五口二p ,且有w ( f o 0 2 相对与s r s 的样本方差来说,精度不好,是渐近无偏的,只在m ,k 大的时 候才有一定的优良性。s t o c k e s 的结果表明,排序集抽样在估计总体散布度 时不像估计位置参数时精度有明显提高,如果事先的主观排序比较费力的 话,是不值得考虑这样的抽样方法,若是同时估计方差和期望,还是可以 考虑采用排序集抽样的。 1 9 8 8 年,s t o c k e s 和s a g e r 在文献【4 】中又进一步考虑了用基于排序集样本 的经验分布来估计总体的分布,若记 去善善l ( x 蛳r ) 烈0 2 去善舰g ) ( 1 - 4 ) 公式( 1 - 4 ) q ,儿) 是示性函数,则有结论 e ( p 。o ) ) = f ( f ) 燕山大学理学硕士学位论文 v a r ( p 。( f ) ) = i f 【i 】( 1 一f ) ( 1 - 5 ) v a r ( p 。( f ) ) = v a r ( p 。( f ) ) + 斯咕r 气】) ( 1 - 6 ) 成立,公式( 1 6 ) 中t = ( t ”,t 。) 为肌”次实验,p = ( 1 k ,1 , ) 的多项分布, 由公式( 1 5 ) 和公式( 1 - 6 ) 有 v a r ( p 。( f ”砌,( 户。o ) ) 意味着用来估计总体分布f ( x ) 时,精度更好。 1 9 9 2 年,b o l l n 和w o 蜘在文献【5 】中构造了r s s 版本l 拘m a n n - w h i t n e y = w i l c o x o n 统计量,检验两总体位置参数的差异,设x 【哪,f = 1 ,m , ,= 1 ,后和h ,p ,j = 1 ,p ,t = 1 ,q 分别为抽自总体和】,的排序集 样本,其中x 和】,只有位置上的差异。令 矿。s = ,( h ,p o ) 文献 3 4 1 和文献 3 5 1 在假设主观排序完美的情况下均有结论 , e g ) = q 2 彳耳s 解,s 黜) = j 彳= _ 一= 1 ( 1 - 8 ) 1 - 兰m 善( 蹦o ) - o 5 ) 2= 公式( 1 - 8 ) 中a 陋( ,) 是相对渐近效率,意味着用s 脚来检验中位数时,效率 更高。 1 9 9 9 年,p r e s n e l l 和b o h i l 在文献 3 6 1 q b 讨论主观排序存在误差下的符号 检验,有结论 删跽洛商2 罐两1 面 。匆 第1 章绪论 4 r e ( s s 艘, s 小一。 公式( 1 - 1 0 ) 慨 。篇2 煮娶 稚叫) = 历两面忑再e f f ( 顽s s r s ) 两五丙i 丽 ( 1 :1 2 ) 7 燕山大学理学硕士学位论文 1 3 选题意义及文章结构 关于符号检验的研究文献,主要针对检验中位数的传统的符号统计量, 而在现实生活中常常需要检验分位数,如环境评估、医疗效果等,因此我 们提出检验总体分位数的基于排序集抽样的符号统计量,并通过分析非均 衡抽样与均衡抽样的p i t m a n 相对效率,具体给出不同分位数的最优抽样,弥 补了排序集抽样在检验分位数上的不足,扩大了排序集抽样的应用空间。 文章的结构如下: 第l 章绪论。介绍排序集抽样的背景及国内外研究的现状和趋势。 第2 章预备知识。包括中心极限定理,计数统计量,p i t m a n 相对渐近功 效的定义和单调似然比等。 第3 章两个基本的符号。提出基于简单随机抽样和均衡抽样的检验总 体分位数的两个符号统计量,讨论了它们的基本性质,分析两个符号检验 的p i t m a n 相对效率。 第4 章基于非均衡抽样的符号检验。提出基于非均衡抽样的分位数符 号检验,考虑与次序有关的加权符号检验,并给出不同分位数的最优抽样。 第5 章主观排序有误差的情形。介绍误差的量化和处理,并针对不同 分位数具体给出误差函数图像。 第2 章预备知识 第2 章预备知识 2 1 中心极限定理 , 定理2 1 1 h 8 1 设善,毒2 ,是一列独立同分布的随机变量,且 彤t = a , = 盯2 ( o r 2 o ) ,k = l 2 “ f a n p 。一m 苎= l _ = 一 o ,使有 则对任意的工,有 万71 刍n 叫 t - 一口d “一。,疗一。 熙p ( 去喜c ;。一神? ) - 去二,凌 2 2 计数统计量 定义2 2 1 4 9 设x 是一个随机变量,对给定的实数0 。,定义随机变量 其中 1 ;f ,= ,( 一0 0 ) o ) 9 燕山大学理学硕士学位论文 m 堋= 然 随机变量l f ,称为z 按0 。分段的计数统计量。 定理2 2 1 4 9 设随机变量z 。x 2 ,x 。相互独立,x ,有分布f ( x ) ( f - 1 ,2 ,1 ) ,又对i = 1 ,2 ,h 均有f 。国o ) = p o ( 0 o ) ,即为x i ,z :,x 。中取正号的个 数,因此s 被称为符号统计量。在日。下,s 的分布是参数为以和0 5 的二项 分布b ( n ,0 5 ) ,可确定c 1 和c 2 使 p s f 1 a 2 ,p s c 2 ) a 2 否定域取为 o ,l ,c l u c 2 ,c :+ 1 ,盯) 。这一检验的真实水平为 。 a = p s f 1 + p s c 2 。 符号检验在实际工作中常用于对比试验,若z 是未加某一处理的记录, 而y 是施加某一处理的记录,要判断有无处理效应,常常研究随机变量 】,一x 。若无处理效应,x 和y 的地位是相同的,r x 与x 一】,有相同分 布,j ,一x 的分布关于0 点对称,因而有f ( 0 ) = 0 5 。以n z l 一,n x 。为 样本,检验h 。:f ( o ) = 0 5 ,可以用符号检验,若否定日。,则判断有处理 效应。 区间估计常可利用相应的假设检验的统计量来构造,利用符号统计量 可构造总体中位数的置信区间。 设随机变量z 。x 2 ,x 。相互独立同分布,分布函数f ( z ) 连续,中位 数记为0 ,则 第2 章预备知识 1 i f ,。= x c c x l o o ) 0 ) , i = l ,2 ,甩 是相互独立同分布的随机变量,s = z v ,服从二项分布b ( 挖,0 5 ) 可确定一 正整数c 0 刀) ,使 p s c ) l a 。 则p 的集合 口j s = 喜,c c x ,一口,二。,c ) 为p 的置信水平为1 - a 的单侧置信区间,上述集合可如下解得关于日得显示 融阶畛哪c ) _ ( 而一日,x i - 0e e 至少有栉一c 个为负值) = x ( ,。) 一0 0 ) = r ( 。) 日) 2 3 功效函数和p i t m a n 相对渐近效率 非参数检验问题的功效函数由于备择假设的范围很宽,具体求得功效 函数的精确表达式是困难的,绝大部分情况基本上是不可能。研究功效时, 常是将不同的检验作相对比较。比较的途径基本上有两条,一是对各种典 型的备择假设作统计模拟,另一是求它们的渐近相对效率, 为了建立备择假设,可以将非参数问题形式地参数化。如考虑一样本 问题:随机变量x l ,x :,x 。是来自连续分布总体f ( x p ) 的样本,函数 f ( f ) 关于0 点对称,检验假设 , 日o :日= 0 ,日i :p 0 则可确定形式参数考= ,即) ) ,参数空间为 q = ( 日,f c t ) ) o o ,f ( f ) 连续关于0 点对称) 日。所确定的空间为 = ( o ,f c t ) ) l f ( t ) 连续关于0 点对称) 一 日l 的空间为吖。 燕山大学理学硕士学位论文 以下定义和定理见文献 4 9 】。 定义2 3 1 对形式参数5 q 的有关的假设检验的功效函数,定义 羌( ) = 凡 h 。被拒绝 当 时,艽( ) 为第一类错误的概率,当善叫n ) 时,1 一茏( ) 为第二类错 误的概率。 定义2 3 2 假设形式参数 q ,原假设和备择假设为日。: , 日。:;纠,对功效函数为茏( ) 的一个检验,若 s u p x ( 1 a ” 则称检验是水平a 的;若对一 均有 茏心) = a 则称检验是精确地水平为a 的。 对假设检验问题 日o - 0 ,日1 :0 q 若有 s 。 , r 。 两列检验统计量,其中以为统计量使用的样本量。设俗。 ,仃。) 显著水平为a 的否定域分别为g 和d 。,对一切0 有 n s 。c 。) a 尸日 r 。d 。 口 比较此二列检验,通常比较它们的功效函数 1 3 s ) = 8 豳。) , q 卢r ( ( p o ) = p p 日 r 。c 。) ,0 d0 叫 对于特定的日q ,f l s ( o + ) ,p ( 日) 大者为优。一般使用的样本量越大, 功效函数的值会越高。因而也可规定功效的值,看达到此功效所需的样本量。 所需样本量少者为优。p i t m a n 相对渐近效率,就是在零假设的一个邻近区域 内,规定功效的值,比较所需的样本量。 定义2 3 3 对假设检验问题h o :0 = 0 0 ,h 1 :0 = 0 ,取一列特定的备 择假设0 = 日。( i = 1 ,2 ,”) ,0 i 0 0 r l i l n 0 。= d o 。s 。和丁。,是假设问题 第2 章预备知识 h o :0 = 0 0 ,h i :0 0 0 的检验统计量,胁和所,为对应的样本量,满足 t ,一i m 3 s j o o ) 2 觋卢k ( p o ) 2 a ,p _ a 熙卢s 。( 日) 2 姆卢r 。( 9 一) 1 若对一切满足上述条件的 p , ,- ( 玎, , m ) 存在相同的f a n 竺,则称此极 。f “n j 限值为 s 。) 相对 r 0 的p i t m a n 相对渐近效率,记为a r e ( s , t ) 。 关于相对渐近效率的计算,下面的n d e t l 财定理是最基本的。 定理2 3 1 对假设检验问题h o :0 = 0 0 ,h i :0 = 0 ,( f = l ,2 ,”) 且 l i m 0 。= 日。, s 。) 和 r 。 是两列检验统计量,若有与它们相联系的数列 姐。( 9 ) , p ,( 9 ) ) ,b ( 日) ,b k ( p ) ) 满足下面假设( 4 - ) 口o ) 等和号铲鼽纳鼽有相撇蝴及 相同的连续极限分布日( ) ; :) 当( 4 。) 中仉代之为0 0 时,有同样假设; ( 彳,) l i m 旦掣:l i m 哗;:1 ;。 、”仃s 。( 日o ) 。一仃r ( p 0 ) 。 + ( 彳面d “徊) 和啬l “徊) 奇在,粤在p = p 。的某一闭域内连续,导 数p :。( 9 0 ) ,p t ( p 。) 不为o ; ( l i m 掣:l i m 毕婴= 1 ; 、一p 5 ,伯o ) 【f k 国o ) 燕山大学理学硕士学位论文 ( 爿e ) l i m 珂v 仃s ;( 。0 ( 口, ) 。) 2 足s ,l i r a 胛j u 盯r ;( 。o ( p ) i 2 足r , 其中k 。和k ,为正的常数,则p i t m a n 相对渐近效率为 a r e ( s ,丁) = 【k s k r r 定义2 3 4 对假设检验问题h o :0 = 0 0 ,h l :0 = 0 。,上述定理中的 k s 2 l ,一i r a 竹u 仃 s 狮 ( o ) ) 2 称为s 。的效率因子,记为e 矿( s ) 。 2 4 单调似然比 定义2 4 1 5 0 】设 p ( 工;p ) :日d 是含有实参数p 的概率密度族,其中, 是实直钱上的一个区间。如果存在实值统计量丁( 功,使得对任意的0 , 0 2 , 都有 ( 1 ) 概率分布n 。p o :是不同的; ( 2 ) 似然比a ( 工) :;兰婴是r ( x ) 的非降函数( 或非增函数) ,则称概率 p t x ;0 9 ,。 密度族 p 日) :日毋关于t ( x ) 具有非降( 或非增) 单调似然比。单调似然比 简写为m l r ( m o n o t o n e l d l i h o o dr a t i o ) 。 定理2 4 1 【5 0 1 设概率密度族 p ( x ;日) :d 毋关于t ( x ) 具有非降m l r 。 若妒0 ) 是t 的一个非降函数,则e g p ( t ( x ) ) 是0 的一个非降函数。 推论2 4 1 1 5 0 1 若妒o ) 是t 的一个非增函数,则e g p ( t ( x ) ) 是0 的一个非 增函数。 推论2 4 2 1 5 0 l 如果概率密度族 p ( x ;日) :p j r 关于r ( 功具有非增 m l r ,那么它关于( 丁( 工) ) 具有非降m l r 。由于在妒( f ) 是t 的一个非降函数 时,妒o ) 是( o ) 的一个非增函数,所以e d p ( t ( x ) ) 是0 的一个非增函数;而 在妒是t 的一个非增函数时,e 印( r ( x ) ) 是0 的一个非降函数。 1 4 第2 章预备知识 在概率密度族 p 日) :日,) 关于t ( x ) 具有非降m l r 时,取妒( f ) = , 则在吼 t o 或t s “时,取妒o ) = o 或l 。 则在0 。 0 2 时,有 n 。叮( x ) o ) 】= 啦! 一g ( 0 ) 】( 3 - 3 ) 哳( s k ) = 似o ) 1 一g ( o ) 】= 三6 k ( 3 4 ) 公式( 3 4 ) q b 8 k = l 一4 g ( o ) 一0 5 】2 。 特别地,在原假设条件下, 。= 0 ,g ( 0 ) = f ( o ) = p ,这样由公式( 3 - 3 ) 和公式( 3 4 ) 知,日。成立时s k 适应任意分布。并且由x 。,x :,x 。的相互 独立性和定理2 1 1 知s k 具有以下渐近正态性。 定理3 1 1 当月_ 0 0 时,有 1 6 第3 章两个基本的符号检验 行_ 2 豳知一e 赫) 】;( 。:争 3 2 基于均衡抽样的符号检验 假设主观排序完美,不妨设置。:f = l ,:,m ,= 1 ,i 是样本量为 n = m k 的排序集样本,那么x ( ,v 为g 的第f 次序统计量的第_ ,次观察。令 b ( r ;口,6 ) = r “。( 1 一“) “饥,o f 1 ,x 【f ) j 的分布与,无关,坦应的密度 函数和分布函数为 g ( j ) 妒面瓦击而【g 】- i l l 瑚”即 ( 3 5 ) g m 蜘胁9 陟= 篙等兰害 公式( 3 - 5 ) 中b ( a , b ) = s ( b ,口) = b ( 1 ;a ,6 ) 考虑基于均衡抽样的检验总体分位数的符号统计量 、二 女* 。 s :, - - e j ( f ) j o ) = 九 ( 3 7 ) t - ij c i i i l t 公式( 3 7 ) 中a j = ,( z o h o ) 一b ( k ,i g ( j ) ( o ) ) i - i 为求出s 岛的期望和方差,先陈述一个重要的引理。 ,引理3 2 1 g ( x ) = 去善g “引 , 证明设彳u ) 为1 次s r s 样本x ,z 。中次序为的样本单元,则 x - g ( 功,令 1 7 燕山大学理学硕士学位论文 则 那么 形,= 骺z 其j o 5 磊【,。,:6 。k 时拒绝原假设,其中u 棚为标准 正态分布的上a 2 分位数。c 3 3p i t m a n 相对效率 若令 s 缸= e ( s 赫) ,仃s 2 缸= v a r ( s k ) p s ;= e ( s 岛) ,仃s 2 ;2 v a r ( s d 由定理3 1 1 和定理3 2 1 知s 品和s 蕊满足定理2 3 1 条件乜- ) 和乜2 ) ,由 公式( 3 q 和公式( 3 - 9 ) 可得定理2 3 1 条件o ,) 满足,由公式( 3 - 3 ) 和公式( 3 8 ) 可得 p 之( ,) = 乏( 善p ) = 一n g ( 0 ) ( 3 1 2 ) 从而可得定理2 3 1 条件乜4 ) 和“,) 满足。于是由公式( 3 - 1 2 ) 、n o e t h e r 定理的结论和定义2 3 4 ,可以得到s 赫莉s 岛的效率因子分别为 钡s 。= 西铿= ( 3 1 3 ) 燕山大学理学硕士学位论文 删= 鹄辔= l i r a 刀脚 - g ( 刚( o ) 2 = = 4 厂2 ( 啊i 一。 ( 3 1 4 ) 这样由公式( 3 1 3 ) 和公式( 3 1 4 ) 可得踮相对于s 瓠的渐近效率为 鼍部筇妒荔器啦( 1 刊6 扣l 表3 - 1 s 二相对于s 知的渐近效率 t a b l e3 - i a s y m p t o t i ce f f i c i e n c yo fs 二v e r s u ss 蠡 0 0 50 1 00 2 0o 5 00 8 0o 9 00 9 5 21 0 51 t o1 1 91 3 31 1 91 1 01 0 5 31 1 01 0 01 3 7 1 6 0 1 3 71 2 01 1 0 41 1 51 2 91 5 31 8 31 5 31 2 9i 1 5 51 2 0 1 3 s1 6 82 0 31 6 s1 3 81 2 0 31 3 41 6 42 0 82 5 52 0 8i 6 41 3 4 l o1 4 31 8 0 2 3 l2 8 4 2 3 l 1 8 0 1 4 3 1 51 6 52 1 5 2 8 03 4 62 8 02 1 5 1 6 5 2 01 8 52 4 53 2 l3 9 93 2 l2 4 51 8 5 表3 - 1 给出s 毛相对于s 赫的p i t n m 渐近效率,可以看出对于任意的p 和m ,s 品比s 氛的效率都高,当p 固定时,随着加的增大效率增加越明显; 当m 固定时,检验中位数时最高,但随着p 远离o 5 而减弱。这些结论提示 我们,从其它抽样方法中找出一个恰当的抽样方法会更加增强r s s 的效率, 以弥补r s s 在检验极端分位数上的不足。 2 0 第3 章两个基本的符号检验 3 4 本章小结 本章考虑基于简单随机抽样和均衡抽样的检验总体分位数的两个符号 统计量,讨论了它们的期望、方差、适应任意分布及渐近正态性。并通过 分析两个符号检验的p i t m a n 相对效率,得出均衡抽样一致优于简单抽样, 但检验极端分位数时效果不太理想 2 1 燕山大学理学硕士学位论文 第4 章基于非均衡抽样的符号检验 4 1 非均衡抽样下的符号统计量 为了弥补r s s 在检验极端分位数上的不足,我们考虑非均衡抽样,特 别地,当胛t 一一玎。= 后时为均衡抽样。假设主观排序完美,不妨设x ( 哪, 江1 ,m ,_ ,= 1 ,胁是样本量为栉= 二肝,的排序集样本,基于非均衡抽 样的检验总体分位数的符号统计量为 g , t n m 蹈= ,瓯哪 o ) = t 7 , o - d 一l 3 = 1 l i 公式( 4 1 ) q 6 r 产l ( x ( o o ) - b ( n 。1 - g ( j ) ( o ) ) j t l 由,7 l ,叩2 ,町。相互独立性可得 e g 岛) = e 研,) = 研,( z ( 哪 o ) 】- 1 - g ( o ) 】( 4 - 2 ) l l j = l j - l 陆( s 岛) = v a r ( q ,) = 喜卅州0 ) 】g ( “o ) - 三盔1 2 l 。 ( 4 3 ) 公式( 4 - 3 ) 中6 = l 一言胛l 【g ( f ) ( o ) 一0 5 】2 。 ,i l i 特别地,在原假设条件下,由公式( 3 - 1 0 ) 、公式( 3 1 1 ) 、公式( 4 - 2 ) 和公 式( 4 3 ) 知 2 2 第4 章基于非均衡抽样的符号检验 e ( s 名) = n ,【1 一凡( o ) 】= 、 t = l 争n , b ( i , m + l - i ) - b ( p ;i , m + l - i ) 智b ( i ,m + 1 - 0 v a r ( s 乞q ) = 了n o w 2i 。= 1 1,n,b(pim + l - i ) b ( im+l-i)-b(p;i,m+l-i) 鲁b 2 ( f m + 1 一d 。 所以胃。成立时s 适应任意分布,并且由町。,7 2 ,叩。的相互独立性和定理 2 1 2 可证出s 乞具有以下渐近正态性。 , 定理4 1 1 对于固定的m ,当n 专时,有 t 1 - 1 1 2 【s 岛一e ( s ) 】 n ( 0 , 6 4 ) 这样当l s :呵一e + 唧) l o 5 4 - :n u ,:6 毛l 一。时拒绝原假设,其中【,。,:为标 准正态分布的上a 2 分位数。并由定义2 3 4 和公式( 3 1 3 ) 得出 识s 乙) = 了n 。w 2 h 确。2 私永。桕胪l l i lj 厶翔隆b 一一i ) p o - v ) “_ p 疗。 4 行7 2 ( o ) l 玎,。1 + 1 _ “_ l 占盎i 疗。 l l 。lj 删岛蚴= 豸怒= 4 p o _ ,玎4 善疗。b 。1 c 聊+ 一。p 。1 0 一力”。 :茜i 一 l i - lj 对于固定的,我们的毒毒目的是从所有的抽样方法中找出使 4 兄e 岱麓,s 瓠) 达到最大的抽样向量( 协j 一,五,) 。为解决此问题,我们先 燕山大学理学硕士学位论文 考虑以下的加权符号检验。 4 2 加权符号检验 考虑到x ( m 相互独立但不同分布,我们给出以下与次序有关的加权符 号统计量 或= ,( f ) j o ) 公式( 4 - 4 ) 6 pt o 。是权数。 令p ,= 打,肛,为简便记g ( 。) ( o ) ,g ( ,) ( o ) 分别为毋和g r ,有 有 一= 篇= ( 4 - 4 ) 加刊够c ;胁些篙p 糍c o , g , u 些- g , ) 丛 , 己,t 1 , 一 定理4 2 i 对于固定的p ,适应任意分布的最优权数是 肛面雨嚣篇等鬟面两 证明对于任意权向量( ,) ,定义 肛怨山硇厩丽 ( 喜,p ,g , 2 = ( 善 ,七。) 2 ( 喜而; ( 喜g ; = 第4 章基于非均衡抽样的符号检验 由公式( 4 5 ) 知 f m pjg。2lislg i l c 二g :) 。1 喜p ,;g ,c - 一g j j l - 。l j e f t ( s :) p ,蜀2 劬- 1 0 - g ,) 。1 ,l i 定义一- 一 矿,= c g 。g i l c 一g 痧一= j 乏;j j i :j ! ;芒i j :i 辜;! 豸兰弓聂:;j 厕( 4 - , 公式( 4 7 ) 中e 二1 厂( o ) 不影响效率。 这样不等式( 4 - 6 ) 也可表示为 黠匆雠, 故权向量取为( 形,) 时效率最大7 证毕。 表4 _ 1 给出对应m 分别为2 、3 、4 、5 、8 、1 0 和p 分别为o 0 5 、o 1 : 0 2 、0 5 时最优权数形。,最优权数矾满足形 ) = w 。“,( 1 - p ) ,例如,当 m = 4 时,p = 0 8 的最优权向量为( 1 0 2 7 ,7 2 6 ,5 1 9 ,4 2 3 ) ,而p = o 2 为 ( 4 2 3 ,5 1 9 ,7 2 6 ,1 0 0 2 ) 。 特别地,对于均衡抽样,p 。= v m ,我们有 e f t ( s ;) = 善m 赢 2 = p 帅,矽c j 知痞面而高幕篙瓮而而 燕山大学理学硕士学位论文 表4 - 1 最优权向量如,) t a b l e4 - l o p t i m a lw e i g h tv e c t o r s ( c o ,) m p 1 c 0 23c 0 4 5c 0 60 3 780 3 9 1 0 20 ,0 51 0 8 02 0 0 5 一一一一一一一一 20 1 5 8 51 n 1 0一 一一一一一一一 20 2 3 4 75 2 1 20 5 2 6 72 6 7 30 0 51 1 0 71 9 8 03 0 ,0 0 一一一一一一一 3o 16 1 59 9 21 5 0 2 一一一一一一一 3o 23 8 45 1 57 5 6 一一一一一一一 30 53 4 33 0 03 4 3 40 0 51 1 3 5l9 - 5 9 2 9 6 2 4 0 0 0 一一一一一一 40 1 6 4 69 8 l1 4 6 52 0 0 0 4o 2 4 2 35 1 97 2 6l o ,0 2一一一一一一 40 5 4 2 73 4 93 4 94 2 7一一一一一一 50 0 5“6 31 9 4 l2 9 2 73 9 5 8 5 0 o o 一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年装饰材料行业当前发展现状及增长策略研究报告
- 2025年电子专用设备行业当前发展趋势与投资机遇洞察报告
- 收寄安全知识培训课件考试
- 试生产情况总结报告
- 攀爬围墙安全知识培训总结课件
- 2025年事业单位考试医学基础知识真题及答案
- 2025年二级建造师之二建建设工程法规及相关知识基础试题库和答案
- 危重病学组应知应会试题(附答案)
- 2024年山东省威海市医疗三严三基理论考试题库及答案
- 2025年幼儿园事业单位招聘工作人员考试《保教知识与能力》真题及答案
- 初中道德与法治教师培训
- 全过程工程造价咨询投标方案(技术方案)
- 数的开方、整式的乘除数学能力试题
- DB53∕T 1269-2024 改性磷石膏用于矿山废弃地生态修复回填技术规范
- 2024年安陆中小学教师招聘真题
- 卫生法规-卫生法律法规概论-基本医疗卫生与健康促进法律制度
- 2024年海南省财金集团有限公司招聘笔试冲刺题(带答案解析)
- 架线导地线各种弧垂的含义及计算方法(附计算表格)彻底弄懂弧垂
- 网络营销:推广与策划(第3版 慕课版)课件 项目一认知网络营销(知识基石)
- 精益管理课件
- 建筑防火基础知识
评论
0/150
提交评论