




已阅读5页,还剩30页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 在这篇文章中,主要论述了秩集抽样的基本理论,其中包括不完美的秩集抽样,通过给斜变量赋秩的 秩集抽样机制以及多元的秩集抽样理论等讨论了可将上述抽榉机制统起来的广义秩集抽样机制,这其中 包括了秩集抽样和几种特殊情况详细论述了在参数和非参情况下的广义秩集抽样理论在参数情形下, 理论结果表明;基于广义秩集样本的关于总体未知参数的f i s h e r 信息阵与基于简单随机样本的关于总体 未知参数的f i s h e r 信息阵的差总是正定的在非参的情况下,讨论了一类特殊的模型,即均值光滑函数模 型,并且理论结果表明基于广义秩集样本的对总体参数的矩估计与基于相同样本容量的简单随机样本对总 体参数的矩估计相比较,总有比较小的渐近方差文章详细论述了多元秩集抽样的一个例子,并且给出了 计算机的模拟结果同时一些值得进一步深入探讨的问题,比如基于广义秩集样本的最优设计问题也进行 丁简单的论述 关键词,渐近相对效;f i s h e r 信息;广义秩集抽样;均值光滑函数模型 i a b s t r a c t w ec o n s i d e ri nt h i sa r t i c l er a n k e d s e ts a m p l i n g ( r s s ) a n di t sr a m i f i c a t i o n si n c l u d i n gr s sw i t h i m p e r f e c tr a n k i n g ,r s sb yr a n k i n gac o n c o m i t a n tv a r i a b l ea n dr s sw i t hm u l t i v a r i a t es a m p l e s ,e t c w e d e a lw i t hau n i f i e ds a m p l i n gs c h e m ew h i c hi sr e f e r r e dt o g e n e r a l i z e dr j 函d s e ts a m p l i n g ( g r s s l a n dw h i c hi n c l u d e sr s sa n di t sr a m i f i c a t i o n sa ss p e c i a lc a s e s w ed e v e l o pag e n e r a lt h e o r yf o r g r s si nb o t hp a r a m e t r i ca n dn o n p a r a m a t r i es e t t i n g s i nap a r a m e t r i cs e t t i n g ,i ti ss h o w nt h a tt h e f i s h e ri n f o r m a t i o nm a t r i xa b o u tt h eu n k n o w np a r a m e t e r so f8g r s ss a m p l em i n u st h a t o fa ns r s s a m p l eo ft h es a i n es i z e , i sa l w a y sp o s i t i v ed e f i n i t e i nan o n p a r a m a t r i cs e t t i n g , ap a r t i c u l a rm o d e l t h e s m o o t h f u n c t i o n - o f - m e a n sm o d e l ,i sc o n s i d e r d ea n di ti sp r o v e dt h a tt h em e t h o d o f - m o m e n te s t i m a t e s o fp a r a m e t e r sb a s e do nag r s ss a m p l ew i l la l w a y sh a v es m a l l e ra s y m p t o t i cv a r i a n c et h a nt h o s e b a s e do na ns r ss a m p l eo ft h es a i n es i z e a ne x a m p l ef o rr s sw i t hm u l t i v a r i a t es a m p l e si st r e a t e di n d e t a i la n das i m u l a t i o ns t u d yi sr e p o r t e d s o m eo t h e ri s s u e sa n do p e np r o b l e m ss u c ha st h o s ei n v o l v i n g o p t i m a ld e s i g n sf o rt h eg r s sa r ea l s od i s c u s s e d x e yw o r d s :a s y m p t o t i cr e l a t i v ee f f i c i e n c y ;f i s h e ri n f o r m a t i o n ;g e n e r a l i z e dr a n k e d s e ts a m p l i n g ; s m o o t h - f u n c t i o n - o f - m e a n sr o o d e l i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究 成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经 发表或撰写过的研究成果,也不包含为获得东北师范大学或其他教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了 明确的说明并表示谢意。 学位论文作者签名:蕴! 选 学位论文版权使用授权书 本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东 北师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和磁盘,允许论 文被查阅和借阅。本人授权东北师范大学可以将学位论文的全部或部分内容编入有关 数据库进行检索,可以采用影印、缩印或其它复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) i 兰e 占a 学位论文作者签名:苎:! 匿一 指导教师签名: 薹| | 刭 日 期:三垒趔串日日期:垫q ? 垒目2 日 学位论文作者毕业后去向: 工作单位: 通讯地址: 电话: 邮编: l 引言 1 1 什么是秩集抽样? 秩集抽样的研究对象是无限的总体,并且总是假定来自总体的容量为k 的随机样本能够 通过相当经济的方法被赋予秩,而并不需要人们对这些感兴趣的变量进行实际的测量因为往 往在实际问题中,对这些感兴趣的变量进行实际意义上的测量是要耗费大量的财力和( 或) 时 间的上述假设也许初看起来显得有些严格,然而存在于现实世界中的很多实际问题都是满足 上述假设的敢为了说明这一点,在引言部分的最后列举出了一些实例 c 9 c e 1 鼍1 ) 1 1sx ( 2 ) l l x ( 3 m 辛丑1 ) l 盈1 ) 2 l 甄2 ) 2 l x ( 3 ) 2 1 号x ( 2 ) 1 x 0 ) s l x ( 2 ) s lsx ( 3 ) 3 1 净盈3 ) 1 c y c e2 鼍1 ) 1 2 x ( 2 ) 1 2 丑3 ) 1 2 辛盈1 ) 2 x ( 1 ) 2 - 2 x ( 2 ) 2 2sx ( s ) 2 2 辛x ( 2 ) 2 五1 ) 3 2 墨2 ) 3 2 x ( 3 ) 3 2 = j ) 2 c ! d e ” x ( 1 ) 1 m 置2 ) 1 ms 五3 ) l m = k 1 ) m 丑1 ) 2 m x ( 2 ) 2 ms 置3 ) 辛丑2 胁 - 甄1 ) 3 ms 盈2 ) 3 m x c s ) 3 m = x ( 3 ) m 图1 1 秩集抽样这一概念最初是由m c i n t y r e 提出的,他的这一抽样机制可做如下的描述第一 步,通过并不需要实际测量的方法,把来自总体的容量为k 的简单随机样本对人们感兴趣的变 量x 分别赋予秩而后被赋秩为1 的那个随机样本被人们识别并从k 个随机样本中取出进行 实际的测量,并把实际测量的值作为随机变量x 的一个观测值,同时丢弃掉剩余的k - 1 个随 机样本第二步,考虑另一组样本容量为k 的来自同一总体的简单随机样本,与第一步一样, 通过人为的判断对这k 个简单随机样本赋秩,并把被赋秩为2 的那个随机样本进行实际的测 量,并把测量值做为总体变量x 的又一观测值,同时丢弃掉剩余的k - 1 个随机样本重复上述 过程,直到来自总体的容量为k 的简单随机样本中,对被赋予秩为k 的那个随机样本进行实 际测量,并把实际观测值做为总体的一个观测值时,停止上述过程上述这过程称做一个循 环重复这一过程m 次,便产生了n = m k 个秩集样本图1 1 表示了当k = 3 时的抽样过程 从秩集抽样的概念上来看,和经典的分层抽样相类似虽然秩集抽样不同于分层抽样,但 是从抽样机制的效果上来看却是相同的这两种抽样机制都把无限的总体分成了若干个子总 体,使得位于同个子总体的个体在性质上都尽可能的相似事实上,我们并不是一定要通过 给每个随机样本赋予秩的方式来达到对总体分层的目的我们可以考虑任何一种对随机样本 分层的抽样机制,同时这些抽样机制不会导致简单随机样本的随机置换这些分层抽样机制和 上面论述的秩集抽样机制有相类似的抽样效果在第二章里面。论述了几个诸如此类的抽样机 制,以便把秩集抽样的概念扩展到更一般的情况 1 2 什么是广义秩集抽样? 在这一节中给出了秩集抽样过程的一般性的描述假设人们要对感兴趣的随机变量进行 测量,并从总体中随机抽取n 个随机样本首先从所要研究的总体中随机抽取n 个由k 个简 单随机样本构成的集合,然后通过一些方法把每一个集台中的简单随机样本赋予秩,而并不需 要对随机样本进行实际的测量最后,在每个集合中有且只有一个预先被赋予了秩的那个随 机样本是需要被人们实际测量的结果就产生了n 个兴趣变量的观测值,这n 个样本指的就 是秩集样本这里,正如上面提到的,所暗含的假设就是对兴趣变量的测量是要耗费大量的财 力和( 或) 时间的,但是对一个含有k 个简单随机样本的集合来说,对变量赋予秩是容易做到 的,并且花费是可以忽略的在这里应该指出,在秩集抽样过程中,在n k 个随机样本中,只 对其中的n 个随机样本进行了实际意义上的测量令嘶表示实际测量的秩为r 的样本个数, r = 1 ,使得脚= n 令x 盹表示秩为r 的第i 个样本的观测值则秩集样本可表示 为如下形式 x 1 1 1x 1 1 2 x 0 “t x n lx n 2 x 【狮2 x i k l l 确水x 嘲n - 如果m = 他= m ,则称秩集样本是平衡的如果n 1 ,n 2 t ;k 不全相等,则称秩集 样本是不平衡的在给集合中的随机样本赋予秩的时候,并不需要赋予随机样本的秩和他们的 潜在僮x 的顺序相一致如果被赋予的秩和数值x 的顺序相一致,则称赋秩是完美的。否则 则称为是不完美的在这里,我们用不同的记号来加以区分秩是完美的和不完美的两种情况 当赋秩是完美时,我们把秩放在圆括号中当秩赋是不完美时,我们把秩放在方括号中因此 在赋秩是完美和不完美的情况下,我们分别用置,) 和j 咱表示被赋予秩为r 的随机样本的观 测值 在实际中,只要人们能够发现秩集机制确实存在,使得通过这种秩集机制对随机样本赋予 2 秩是容易实现的,并且抽样和对随机样本进行实际测量相比,要经济得多,那么就可以在实际 应用中使用秩集抽样的方法在这里需要特别强调的是,在下面两种情况下,也可以应用秩集 抽样的方法:( 1 ) 在对集合中的随机样本赋予秩时,可以很容易的通过观察或者通过一些辅 助工具的帮助,对和我们关心的变量潜在值有关的变量赋予秩;( 2 ) 人们能够获得一些很容 易观测到的相关变量,虽然人们得到的这些相关变量不是兴趣变量,但却和兴趣变量有关上 述这两种情况存在于大量的实际问题当中 , 1 3 应用秩集抽样理论的实例 秩集抽样可应用于医学领域的研究例如,可以应用秩集抽样技术来判定一些医学指标的 正常范围,这通常需要花费大量的金钱和时间来进行实验室检测s a m a w i 想到了通过使用秩 集样本来判定新生儿血液中胆红索含量的正常范围为了测定这一范围,必须从随机抽取的新 生儿中获得血液样本,并且需对这些血液样本在实验室进行化验但是医生可以通过观察新生 儿的面部,胸部,下肢是否呈现出微黄色,从而给随机抽取的k 个新生儿赋予秩,这是因为如 果新生儿从头到脚都呈现出微黄色,那么该新生儿血液中的胆红素含量就比较高秩集抽样 机制在临床实验中也有应用通常来讲,对某个病人进行一次临床实验的花费是比较大的然 而,医生可以使用秩集抽样技术对病人进行合理的选择,比如依据诸如年龄,体重,身高,血 压和健康史等信息对病人进行选择,这过程的花费是可以忽略的 在进行统计推断时,使用秩集样( r s s ) 本比使用简单随机样本( s r s ) 更加的有效率这是 因为从人的直观感觉来看,在样本容量相等的情况下,秩集样本比简单随机样本包含更多酌信 息,因为秩集样本不仅仅包含了对随机样本测量值的信息,而且也包含了对随机样本赋予了秩 的信息在一些情况下,可以通过对非平衡的秩集抽样机制进行合理的设计,从而达到进步 提高统计效率的目的基于这一点会在随后的章节中论述由于秩集抽样理论在大量的实际问 题中有着广泛的应用,所以秩集抽样方法也就成为了一个重要的统计推断方法 1 4 秩集抽样理论的形成和发展 秩集抽样的概念最初是由m c i n t y r e 提出的,目的是想找到更加有效的方法来估计草场的 产量测量草场的产量,需要对干草进行切割并称其重量,这是需要耗费大量的时间的但是 一个经验丰富的人能够通过肉眼的观测从而相当准确的对数量不多的草场的产量人为的赋予 秩,而并不需对这些草场的产量进行实际的测量m c i n t y r e 采取了如下的抽样机制,每次,随 机抽取容量为k 的草场,并且通过肉眼对草场产量的观察对这个k 个草场赋予秩在这第一 个样本集中,被赋予了秩为1 的那块草场被抽出并进割草和称重在第二个样本容量为k 的样 本集合中,被赋予了秩为2 的那块草场被抽出并进行割草和称重直到对1 到k 的每个秩 都联系着个草场并进行割草和称重时,称为个循环,这一循环被重复m 次m c i n t y r e 通 过计算五个分布进而说明了秩集抽样获得的统计效率他注意到了在总体的分布密度函数呈 3 现对称分布或近似对称分布时,相对效率( 简单随机样本对均值估计的方差与秩集样本对均值 估计的方差的比) 与2 笋相差不大,并且渐近相对效率会随着总体分布密度函数不对称性的增 加而被削减,但总是大于1 的m y c i n t y r e 也讨论了高阶矩的估计除此之外,m y c i n t y r e 也 对基于不同的秩统计量的样本观测数量的最优分配问题,秩统计量的误差问题以及随机样本 之间的相关性等问题做了相关的论述虽然m e i n t y r e 在上述问题的论述中缺乏理论上的严格 性,但是m c i n t y r e 的工作是开创性的,奠基性的,因为许多关于秩集抽样理论以及应用方面的 进展已经包含在这篇论文当中 秩集抽样的这一想法似乎被搁置在文献中很长的一段时间,直到h a l l s 和d e l l 设计了个 实验,通过秩集抽样的方法对松树林的硬木的产量进行估计,从这之后,秩集抽样的理论与方 法才逐渐为人们所重视秩集抽样的这一术语也是由h a l l s 和d e l l 最早提出来的关于秩集抽 样的最早的理论结果是由t a k a h a s i 和w a k i m o t o 所获得的t a k a h a s i 和w a k i m o t o 证明了,当 秩集抽样机制是完美时,秩集样本的均值估计是总体均值的无偏估计,并且秩集样本均值的方 差总是比相同样本容量下的简单随机样本均值的方差要小随后d e l l 和c l u t t e r 在更一般的条 件下( 秩集样本并不一定是完美的) 得到了相同的结果d e l l ,c l u t t e r 以及d a v i d 和l e v i n e 是最先从理论方面来研究不完美的秩集抽样机制的s t o k e s 在秩集抽样机制中把斜变量这一 因素考虑进来在这期间,研究的焦点一直都是非参数情形下的总体均值的估计问题几年之 后,s t o k e s 考虑了基于秩集样本的总体的方差估计和二元正态总体的相关系数的估计 十世纪a - t - 年代中期,是秩集抽样理论迅猛发展的转折点从那以后,关于秩集抽样的 各式各样的统计过程,非参的和参数的一直都被研究,早期的秩集抽样的概念被发展了,基于 秩集抽样的更一般的理论基础被建立起来了 4 2 秩集抽样的机制 2 1 基本等式 在平衡秩集抽样中,基于每个秩的样本观测数量是相同的平衡秩集抽样机制产生了如 下的样本观测值 固1 1 lx 1 1 2 知1 l m x n lx n 2 x 【2 】 ,i x k lx n 2 + x n , n 图( 2 1 1 ) 图( 2 1 1 ) 中的e 4 随机变量x 都是相互独立的,位于同一行的x h 同分布分别用,r 和b 表示j 咱 的密度函数和分布函数分别用,和f 表示总体的密度函数和分布函数在 这一章中,对总体的分布形式不做任何的假设 在第一章,介绍了广义秩集抽样的过程这过程可以分为两步第一步;从总体中随机 抽取样本,并运用秩集机制给每个随机样本赋秩第二步;根据第一步得到的秩集信息,从秩 集样本中选取样本进行测量秩的判定和变量的潜在真实值有关 首先考虑由m c i n t y r e 最早提出的秩集抽样机制,即秩的顺序与随机样本的潜在真实值的 顺序一致,此时若对秩集样本进行观测,则得到的观测值实为次序统计量此时抽= , ,) ,其 中,( r 1 是来自于总体分布为,的容量为k 的简单随机样本的第r 个次序统计量的密度函数 则有如下等式成立; 胁) = f 褊f r 一圳1 一f ( 硼扣州z ) 很容易便证得下式对于所有的x 都成立; m ) = ;壹饰) 这个等式在秩集抽样理论中起着至观重要的作用正是从这个等式出发,才得到了有关秩 集抽样的许多优美性质,我们把这个等式叫做基本等式 若令f 是分布函数,b ,r = 1 ,k ,是k 个分布函数,使得, k 肚三昂 5 假设有来自于分布函数为耳的容量为脚的相互独立的随机样本,其中r = 1 ,k 这 个抽样机制产生了如下的数据结构: x 1 1 1 1x i 2 丑1 j n l x 2 1 1x ( 2 i :砀 x 【捌1x i k l 2 x 嘲m 图( 2 1 2 ) 图( 2 1 2 ) 中的观测数据相互独立,每行数据独立同分布如果图( 2 1 2 ) 中每行的数据个 数均相等,即n r = m ,r ;1 ,k ,则称图( 2 1 2 ) 中样本是平衡的若m ,r ;1 ,k 不全相等, 则称图( 2 1 2 ) 中数据为广义秩集样本 下面分类讨论几个满足基本等式的特殊抽样机制; ( 1 ) 不完美的秩集抽样机制如果秩集样本中的秩是不完美的,即对随机样本赋予的秩和 样本真实的秩不相等,那么耳便不能等同于矸d 令斯表示把数值顺序为s 的次序统计量 误判为秩r 的概率则 耳= f 斯b 所以我有: 三露2 薹斯只= f ( 2 ) 通过斜变量对随机样本赋予秩在现实的问题中会遇到这样的情况,随机变量x 很难 测量同时也很难对一组随机样本赋予秩,但是斜变量,y ,能够比较容易的测量秩集抽样 机制可以应用于类似的情况首先从总体中随机抽取个随机样本,这个随机样本彼此之 间独立同分布k 个随机样本的秩由斜变量y 的观测值而决定y 的次序诱导出了x 的次 序所以在每一个秩集中,变量x 根据被诱导出的次序进行测量令l ;表示y 的第r 个次序 统计量,x 【d 表示由y 诱导出的第r 个o t w - y e 计量令厶同( z ) 表示给定k r ) = y 时,x 的条件密度函数9 ( r ) ( ) 表示k ,) 的边际密度函数,则: ,【r 】( z ) = 奴l m ,) ( z ) 9 “) 西一 则下式显然成立: m ) = 三k 碑1 怕灿) 由= ;塞聃) 6 假设( x ,y ) 满足模型; x f r 】= ) + 5 州 令庐( 0 表示e 的密度函数则摊日的密度函数可由下式给出 , ,【d ( z ) = 也( 。一) 9 ( ,) ( p ) 妇 直接证明基本等式满足是显然的 ( 3 ) 通过判断其中一个变量的秩而得到的多元秩集样本不失一般性,考虑二元的情况 假设要对x 和l ,的联合分布进行统计推断,也可以应用秩集抽样的方法假设有来自于同一 总体的k 个独立同分布的随机样本,然后根据变量y 的值而给随机样本赋予秩我们用,( $ ,口) 表示x 和y 的联合密度函数,【r 】( 毛) 表示x r 】和珞】的联合密度函数则: 抽( 而们= 厶l k r ) ( z ) 吼r ) ( g ) 1 k m ,”) 。,【r 】( 训) 7 3 基于秩集样本的总体均值的估计 用 ( ) 表示的函数用m 表示函数h ( x ) 的期望,即肌= e h ( x ) 在这部分中讨论用秩 集样本对p 的估计问题 ( n ) 当 ( 。) 一时,( ! = l ,2 ,) ,相当于总体的矩估计 ( b ) 当h ( x ) = j 扛c ) 时,相当于分布函数的估计,其中h ) 表示示性函数 ( c ) 当 ( z ) 一 ( 警) 时,相当于对密度函数的估计其中是一给定的函数, a 是一 给定的常数 我们假设 扛) 存在有限的方差基于如下所示的广义平衡秩集样本: x 盈1 1 2 x 【l h x i 2 1 1x 1 2 1 2 。x 2 1 m x lx k 1 2 x 【卅m 用下面的等式定义p h 的矩估计, 觑2 去三蓦m x i r l t ) 我们首先来考察觑的统计性质,然后再来考察秩集样本相对于简单随机样本的均值估计 的相对效 ( 1 ) 砒,船s 是无偏的,即e 风r s $ = m ( 2 ) y n r ( 风) 象,其中靠表示 晖) 的方差,并且不等式严格成立,除非秩集机制完全随 机 ( 3 ) 当m o o ,v 石磊( 觑,耶s p h ) 一n ( o ,畦) 定义相对效如下: r e c 饥船s ,风s 船,= 罟:鲁:篡嚣 则 删妇鲋描昭) = 老卸一莲絮趟r 其中 8 酲册= e 靠 k = e ( e 陋( j ) 】2 一【e ( x 【r 】) 】2 ) 盘 k = 蓦e 【“( 确) 】2 一麻+ p :一 量 e ( x 【r 1 ) 1 2 = 磅一 ( f r 】一p ) 2 从上面的表达式可以看出,只要存在至少一个r ,使得肌r 1 p ,则相对效大于1 对于 个给定的总体分布和一个给定的函数h ,相对效便能够通过上面的表达式计算出来 下面详细讨论了当h ( x ) = 这特殊情形时的相对效t r d e l l 和z l c l u t t e r 在1 9 7 2 年 计算出了一些总体分布的相对效他们发现相对效受总体分布形式的影响,尤其是受总体偏度 和峰度的影响下面的表格是t r d e l l 和j l c l u t t e r 1 3 】中计算结果的一都分,其中符号p ,口2 一 和一分别表示期望,方差,偏度和峰度 d i s t r i b u t i o n p f 2 1 k234 u n i f o r m0 5 0 00 0 8 30 0 0 01 8 01 5 0 02 0 0 02 5 0 0 e x p o n e n t i a l 1 0 0 01 0 0 02 0 0 09 0 01 3 3 31 6 3 61 9 2 0 g a m m a ( 0 5 、 o 5 0 0o 5 0 02 8 2 81 5 o1 2 5 41 4 8 31 6 9 6 g a m m a ( 1 5 1 1 5 0 0l _ 5 0 01 6 3 37 0 01 3 7 01 7 1 02 0 3 0 g a m m a ( 2 0 ) 2 0 0 02 0 0 01 4 1 4 6 0 01 3 9 11 7 5 32 0 9 6 g a m m a ( 3 0 ) 3 0 0 03 0 ( ) 01 1 5 55 o o1 4 1 41 8 0 12 1 6 9 g a m m a ( 4 0 ) 4 0 0 04 0 ( ) 01 0 0 04 5 01 4 2 7l _ 8 2 72 2 1 0 g a m m a ( 5 0 ) 5 0 0 05 0 0 00 8 9 44 2 01 4 3 41 8 4 32 2 3 6 n o r m a l0 0 0 01 0 ( ) 0o 0 0 03 0 01 4 6 71 9 1 42 3 4 7 b e t a ( 4 ,4 ) 0 5 0 00 0 2 80 0 0 02 4 51 4 8 41 9 5 82 4 2 5 b e t a ( 7 ,4 ) 0 6 3 60 0 1 90 3 0 22 7 01 4 7 5 1 9 3 62 3 8 9 b e t a ( 1 3 ,4 ) 0 7 6 50 0 1 00 5 5 73 1 41 4 6 01 9 0 32 3 3 3 w e i b u n ( 4 0 、 0 9 0 60 0 6 50 0 8 72 7 51 4 7 41 9 3 2 2 3 8 0 w e i b u l l ( 5 0 1 0 9 1 80 0 4 40 2 5 42 8 81 4 6 91 9 2 12 3 6 1 w e i b u l l ( 6 0 1 0 9 1 80 0 3 2一o 3 7 33 0 41 4 6 41 9 0 92 3 4 1 w e i b u n ( 7 0 ) 0 9 3 5 0 0 2 50 4 6 33 1 91 4 5 91 8 9 82 3 2 4 w e i b u u ( 8 0 ) 0 9 4 20 0 1 90 5 3 43 3 31 4 5 61 8 9 02 3 0 9 w e i b u l l ( 8 0 ) 0 9 4 20 0 1 90 5 3 4 3 3 31 4 5 61 8 9 0 2 3 0 9 9 d i s t r i b u t i o n p c r 2 k2 3 4 x 2 ( 1 ) 0 ,7 8 90 3 6 30 9 9 53 8 71 4 3 01 1 8 4 1 2 2 3 9 t r i a n g u l a r 0 5 0 00 0 4 20 0 0 02 4 0 1 4 8 51 9 6 12 4 3 0 e x t r e m ev a l u e 0 5 7 71 6 4 51 3 0 05 4 01 4 1 31 7 9 32 1 5 3 基于对一些已知分布的计算,m c i n t y r e 1 】做出了如下的猜测:在对总体均值做估计时, 秩集样本相对于简单随机样本的相对效率界于1 和i ! 之间在总体分布形式呈对称分布的 条件下,相对效率与8 笋相差不大,但是随着总体分布密度函数不对称程度的加剧,相对效率 也随之下降k t a k a h a s i 和k w a k i m o t o 2 1 的结果表明:当秩集机制是完美时,关于k 的函 数 ,k :,磋f r l 将随着k 取值的增大,函数值随之减小,这表明,随着k 的增大,相对效也随 之增大如果把这一结果运用于实际当中,假设赋秩机制与兴趣变量的潜在真实值有关,在能 保证秩集机制精确的条件下,在抽取样本并且运用给定的秩集机制给样本赋秩的总花费是可 以忽略的条件下,秩集中样本容量应取得尽可能的大 1 0 4 基于秩集样本的方差估计 考虑总体方差的估计: 基于简单随机样本的方差估计为, 菇r s = 磊l - ( 一压船) 2 r 盅l = l 其中 凰础= 蕊1 ”8 暑笛 基于秩集样本的方差估计为: 知m 璐s 2 嘉薹( 确一硒妒 其中 y , a s s = 去确t “8 葛蔫“ s t o k e s 3 研究了s 船的统计性质与简单随机样本的方差估计不同的是,蹈卵是有偏 的其期望为, 历“+ 丽b 蓦( 芦( r 】卅 定义s 缸s 相对于罐船的相对效为, 彻( ,碍瑚) = 旦m s 盥e ( s 。r s s ) :! 竺! 璺签2 w a r ( s 妊s ) + 【而熹习笔l ( p 【r | 一p ) 2 1 2 由于 所以显然 李r = - , u 八矿 丑e ( s _ k s ,毋麟) g 脚 rr j s r s 厶g r 8 5 t 是正定的 此结论表明了这样一个事实,即广义秩集样本的渐近相对效相对于简单随机样本的渐近 相对效总是大于1 的 虽然均值光滑函数模型这一术语在之前的文献中没有被使用过,但是之前的文献中有专 门论述过基于广义秩集样本的均值光滑函数模型然而,这些早期的工作都把注意力集中在了 仅对总体均值和总体方差的统计推断上事实上,秩集抽样最出有m c i n t y r e ( 1 9 5 2 ) 最初提出, 其目的就是为了估计总体的均值t a k a h a s i ,w a k i m o t o ( 1 9 6 8 ) 和d e l l ,c l u t t e r ( 1 9 7 2 ) 把秩集样 本的算术平均值做为总体均值的估计,并与之和耜同样本容量的简单随机样本做比较他们得 出这样的结论:无论秩集机制是否完美,基于秩集样本的均值估计相对于基于简单随机样本的 均值估计的相对效大于或等于1 s t o k e s ( 1 9 8 0 a ) 首先想到了使用秩集样本进行方差估计,并 得出了相同的结果:即基于秩集样本的方差估计相对于基于简单随机样本的方差估计的渐近相 对效大于或等于1 定理5 1 是这些结果的一般情形,并且能够应用于更加广泛的有关估计问 题的统计推断中去 渐近相对效不仅受到总体分布的影响,同时也受到待估参数的影响在对总体均值进行 估计时,渐近相对效总是小于或等于毕,这一结果最初是由m c i n t y r e ( 1 9 5 2 ) 猜想,由d e l l 和 c l u t t e r ( 1 9 7 0 ) 加以证明当总体分布是均匀分布时,渐近相对效取得极大值 + 1 ) 在对总体 的方差进行估计时,s t o k e s ( 1 9 8 0 a ,b ) 计算出了几个分布的渐近相对效计算结果表明;对总体 方差估计的渐近相对效要比对总体均值估计的渐近相对效小得多本文将在下一章讨论有关其 他参数估计的相对效,而不仅仅局限于均值和方差的相对效 1 7 6 多元广义秩集抽样 不失般性。考虑总体分布形式是二元正态的情形在这部分中,推导出了基于广义秩集 样本在参数和非参情形下的渐近相对效率,并且列出了一些模拟结果来宣观说明理论结果假 设来自总体的七个随机样本( 置,m ) ,i = 1 ,k 根据k 的次序被赋予秩用p 。,脚,o z ,o t ,p 分 别表示二元正态分布的期望,标准差,和相关系数假设第r 个次序统计量有概率密度函数: ( 训) 2f 前南焉两皿( 却口,l 一矿) 旷1 ( 鲫一( r - 1 ( 口) 】k - 1 删 其中妒( t ,“严) 表示均值为p ,方差为矿的正态分布密度函数,庐( t ) 和圣( t ) 分别表示标准正态 分的密度函数和分布函数,= 扛一肷) 暇,口= 白一脚) 唧 首先讨论参数的情形通过直接推导便能得到经1 次循环得到的( 每次从总体中随机抽取 容量为的随机样本) 广义秩集样本的f i s h e r 信息阵是 其中 d 1 。 d 22 ( 去专去专, d 10 ) ( 去专 品+ 蠹,。)品+ 主斯( y ) 】2j 为+ 圭e h r ( y ) y + 1 1 。 k ( y ) = 姘一锗一y 上面矩阵中求和项元素中,第r 个次序统计量函数的期望值通过第r 个次序统计量的密 度函数计算其密度函数形式为: 鳙( y ) = 石= 了j ;l = 而垂p - 1 ) ( ) l l 一面( 鲥“( d 参数 p x ,甜,一。,o r ,p 的基于广义秩集样本的极大似然估计的渐近方差可通过上面的信 息阵算出,并与基于简单随机样本的极大似然估计的渐近方差做比较基于广义秩集样本的参 数的极大似然估计相对于基于简单随机样本的参数的极大似然估计的渐近相对效只与相关系 数p 有关,而与均值和方差无关对于p o 1 ( o 1 ) o 9 ,渐近相对效在表1 , 2 ,3 中给出从第1 行 、ilillil尚专辫一一馨南尚矽为专 r 丝; 一 一 到第9 行是对弘x ,吱,p 估计的渐近相对效。最后一行绘出了对埘,矿估计的渐近相对效( 其不 依赖于p 值) 。对于非参数的情况,出于讨论方便的考虑,只算出了标准二元正态分布的渐近 相对效,即零均值和单位标准差对于p = o 1 ( o 1 ) 0 9 ,渐近相对效在表4 , 5 ,6 中给出同样,从 第1 行到第9 行是对, u x ,砖,估计的渐进相对效最后一行给出了舸和一的渐近相对效 表6 1k = 3 时,来自二元正态总体的广义秩集样本的渐近相对效 表6 2 = 4 时,来自二元正态总体的广义秩集样本的渐近相对效 1 9 表6 3k = 5 时,来自二元正态总体的广义秩集样本的渐近相对效 表6 4k = 3 时,来自标准二元正态总体的非参广义秩集样本的渐近相对效 表6 5 = 4 时,来自标准二元正态总体的非参广义秩集样本的渐近相对效 表6 0 = 5 时,来自标准二元正态总体的非参广义秩集样本的渐近相对效 从上面的模拟结果可以看出:由于是根据y 的值对随机样本赋秩的,所以对l ,的参数的 估计和完美的秩集样本有相同的渐近相对效对x 的参数进行估计时,其估计的渐近相对效 总是大于1 ,并且随着p 的增加,渐近效率随之增大渐近效率也可通过广义秩集样对相关系 数进行估计而获得参数广义秩集样本比起非参广义秩集样本有较高的统计效率 上面模拟结果给出的相对效率有着渐近的性质在有限样本的情形下,特别是当样本量不 大的时候,相对效率可能达不到所以在下面的论述中,列举出了非参广义秩集样本的模拟结 果在模拟过程中,取k = 3 ,4 ,5 , n = 6 0 ,p = 0 3 ( 0 a ) o 7 表6 7 来自= 元正态总体的非参广义秩集样本的相对效( n = 6 0k = 3 ) ! 兰竺些兰兰坚兰些垒里塑立曼望1 0 31 0 5 21 9 0 91 0 2 2 1 0 3 9 1 0 2 0 表6 , 8 来自二元正态总体的非参广义秩集样本的相对效( n - - - - - 6 0k = 4 ! 兰堕坚兰婴些坚兰生兰竺丑曼些1 0 31 0 5 92 3 9 21 0 0 21 1 4 31 0 3 3 0 41 1 0 42 3 9 4 0 9 9 4 1 1 4 41 0 4 0 0 51 1 7 42 3 9 50 9 9 51 1 4 51 0 5 1 0 61 j 2 7 3 2 3 9 40 ,9 9 81 ,1 4 61 0 7 0 0 71 j 4 2 12 3 9 11 0 2 11 1 4 91 0 9 1 表6 9 来自二元正态总体的非参广义秩集样本的相对效( n - - - - 6 0k = 5 ) ! 兰兰坚里望丝里竺生里望立兰些 0 31 0 5 92 8 0 2 0 9 8 71 2 4 8 1 0 3 9 0 4 1 1 0 92 8 0 91 0 1 01 2 5 11 0 5 4 0 51 1 8 82 8 1 61 0 1 41 2 5 41 0 6 8 0 61 3 1 42 ,8 2 6 1 0 2 8l 2 5 91 0 7 4 0 71 _ 4 7 92 8 3 31 0 5 01 2 6 31 1 1 1 | 室薹 似蚴 1 i 1 1 1 蛳耋| 呲嘶 1 1 1 1 1 1咖啪嘶嘟 i l 叭暑| 詈| 詈| 1 1 1 1吼塌哪m 1 1 1 1 1 1 4 5 6 7 o 0 o 0 7 值得进一步讨论的问题 1 使用广义秩集样本进行统计推断 对于参数广义秩集样本,在约束条件下,如果弛h 口信息阵可逆,则参数的极大似然估计 有渐近正态的性质,就象是估计的渐近方差所具有的性质可利用这结果来构造逼近的置信 区间并对未知参数做近似的假设检验对于非参的广义秩集样本,第三章的l e m m a l 可以应用 到类似的统计推断中去为了进一步说明问题,考虑构造f 的置信区间 令 南= o g ( 开n l ,鸽) g 脚= 彘萎孙硌一圣( 去萎孙) ( 去善铂t ) r 一1 m 11 m 1 m 其中 侥l = 磊,z = 1 ,p z ( r h = ( 历( ,) i ,z ,) ) r 蟊和g 。船分别是的和g 觥的相合估计用舀和茎膦分别代替的和傩s , 仍满足渐近正态性因此f 的置信度为( 1 一a ) 的置信区间可按下式构造, 士z 矿g 脚
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电力设备控制系统设计方案
- 2025年新能源汽车充电桩布局与用户满意度提升报告
- 农业合作社运营与收益分配协议
- 品牌营销策划与推广合作协议签署报告书
- 2025至2030中国建筑和采矿行业发展研究与产业战略规划分析评估报告
- 2025至2030中国工业食品切割机行业项目调研及市场前景预测评估报告
- 销售合同范本及风险管控指南
- 2025至2030中国吊扇风机行业项目调研及市场前景预测评估报告
- 品牌市场推广与客户战略合作协议
- 酒厂车间施工组织与安全管理实施方案
- 固体物理实验方法课件
- 中医规培教学查房课件
- GB/T 3477-2023船用风雨密单扇钢质门
- 作文方格纸400字
- 幼儿园消防安全教育课件:《玩火很危险》
- 酒精性肝病诊疗指南
- 学习解读《调查研究的重要论述》专题PPT
- 福州市鼓西街道社区工作者考试真题2022
- 统一帕金森病评定量表-UPDRS
- 医学信息学课件
- 领导干部个人有关事项报告表(模板)
评论
0/150
提交评论