




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第九章 二阶与多阶抽样 二阶抽样与分层抽样、整群抽样的一个共同特点是:将总体分为假设干个群;所不同的是:分层抽样是每个群内都进展抽样,整群抽样是抽假设干个群再在群内普查,而二阶抽样那么是抽假设干个群再在群内抽样。因此,可将分层抽样与整群抽样看作是二阶抽样的特殊情况。 在整群抽样中,假设抽中的群内所含的次级单元个数相当地多,此时对该群作普查会感到“心有余而力缺乏。特别当群内的次级单元差别不大,即 比较大,这种情形下对群内一切的次级单元一一访问似乎完全没有必要,一个省时省钱又省力的念头会在调查者的头脑中油然而生,何不在抽到的群内再作一定方式的抽样呢?这种在选中的初级单元中再进展抽样的方法称为二阶抽
2、样。倘假设在抽取的次级单元中又包含许多更次一级的单元,在这些单元中继续抽样就自然地称为三阶抽样。.抽样方式第一阶段第二阶段分层抽样整群抽样二阶抽样抽全部抽部分抽全部抽部分抽部分抽部分二阶与多阶抽样的优点:1、它具有实施上的方便,比如在编制抽样框时那些没有被抽到的群或次一级群内的单元就没有必要也去编制抽样框。仅需对那些已抽中的单元才去预备下一级单元的抽样框,而且许多抽样调查经常采用行政系统及隶属单元,这给多阶抽样本身发明了有利的条件。. 另外,多阶抽样方法可以用到关于散料的抽样。所谓散料是指延续松散的不易区分为个体或抽样单元的资料。例如,煤、粮食、水泥、化肥等原料的质量检测,此时抽样单元经常需求
3、人为划分,普通取自然单位,诸如一公斤、一杯子等;而初级单元那么为包装袋、一卡车、一个车皮等。这种数量众多的散料的质量检测采用二阶或多阶抽样也许是最有效的手段。为方便,本章主要讨论二阶抽样。2、可以满足各级政府部门对抽样调查资料的需求。由于各级政府指点都关怀全国和本地域、本部门的社会经济开展状况,希望抽样调查能同时满足全国性和地方性的需求。因此采用二阶或多阶抽样,在一定程度上可以满足各级政府、部门对调查资料的需求。3、有利于减少抽样误差、提高抽样估计精度。这种抽样调查方法,可以使每个一阶样本单位分布比较均匀,具有很好的代表性;对于方差大的阶段多抽些样本单位以提高精度。. 先作一些根本假设: 1初
4、级单元中包含的次级单元个数同为 M,因此在抽中的初级单元中再抽取的次级单元个数也相等,记为 m。1 初级单元大小相等的二阶抽样 2两个阶段的抽样方法都是简单随机抽样。 3在抽中的假设干初级单元中作第二阶抽样是相互独立进展的。 再引进一些必要的记号:表示第 初级单元中第 个次级单元表示样本中第 初级单元中第 个次级单元的观测值.第 初级单元总和第 初级单元平均值总体平均值初级单元(群)内的方差总体中初级单元(群)间方差将 改为 ,N改为n,M改为m,那么为相应的样本目的值.第 i 群内次级单元间的方差记为:显然有 一切 的平均数。1、估计量及其方差 总体平均数 的估计是用样本平均数进展估计的容易
5、证明,这个估计量 是 的无偏估计。.其方差为:(9.1)其中 ,方差的无偏估计为:(9.2)总体总数 的估计为:方差的无偏估计为:总体平均数95的置信区间为总体总数95的置信区间为.例9.1:新华书店某柜台上月共用去发票70本,每本100张,现随机从中抽出10本,每本随机抽出15张发票,得到数据如下表:给出上月柜台营业总额的估计及其方差。i12345678910375.25408.30323.40502.50234.00387.75284.20256.60314.10280.5011280.2512115.998752.7617833.753953.0011302.506573.044822.
6、366921.015827.2525.0227.2221.5633.5015.6025.8518.9517.1120.9418.70.0271.58127.1671.4321.6197.3784.7530.7924.5541.56.解:N=70,n=10,M=100,m=15故上月柜台营业总额的估计为157108.00元.规范差为 元营业总额95的置信区间为.2、最优抽样比 假设初级单元或群之间的游览费用不占重要位置的话,常采用简单线性费用函数: 二阶抽样存在两次概率抽样,因此存在两个抽样比 因此我们面临的问题是:(1)在总费用给定的条件下,如何确定 与 而使 的方差到达最小;(2)在给定估计
7、量的精度 条件下,如何确定 与 以使总费用最小。其中 是根本费用, 是每调查一个初级单元与次级单元所破费的费用。(9.3)将方差表达成:(9.4). 于是,在固定C下极小化 或在固定 下极小化C均等价于使下式极小化:其中: 。但这里要求 。假设 ,阐明群内差别明显地大于群间的差别,因此对于抽到的群来说,最好作全面调查才干保证样本的代表性,此时总使mM。现思索(9.5).在(9.5)式中,由于 都是常数,为使(9.5)到达最小,只需(9.6)到达最小,这两个加项的乘积恰好为常数 ,因此只需这两项相等就可使Q到达最小,此时应取或者m的最优取值为:(9.7)普通地, 不是整数,记 为 的最小整数部分
8、,那么 为 的小数部分,且 。.假设 ,那么取假设 ,那么取易见,对于 的小数部分大于或等于0.5的情况,我们总取 ,这符合通常的“五入规那么,能否“四舍?当 时,就要看 的最小整数部分的大小了。 由 m 的选取,代入(9.3)或(9.4)立刻可以得到 n 的数值。3、分层二阶抽样 所谓分层二阶抽样就是将总体分为 k 个层,在每层内进行二阶抽样。比如,一所大学有 8 个系,每个系有假设干个班级,每班大约人数为40人,为了解学生的情况需求作一次抽样调查,在每个系都随机抽几个班,再在抽中的班级里抽取假设干人的简单随机抽样,这就构成二阶分层抽样。. 本节讨论的二阶分层抽样,假设在同一层内初级单元大小
9、相等,但不同层可以不相等。设第 h 层含 个初级单元,每个初级单元包含 个次级单元,于是总体中共含有个次级单元。又假设在第 h 层按照简单随机抽样方法抽取个初级单元,在每个被抽中的初级单元中再抽取容量为 的简单随机抽样。 设第 h 层中样本的(二阶抽样)平均数为 ,因此按照分层估计的技巧,总体的(按次级单元)平均数 的分层二阶估计量为:(9.8)其中 为第 h 层(按次级单元)的层权:.(9.9)(9.10)而由于各层的抽样相互独立,而由二阶抽样的有关讨论, 的方差及其方差估计是知的,因此:(9.11)(9.12)其中 分别为第 h 层中的两个抽样比。. 和 是第 h 层中的群间和群内方差,
10、与 是第 h 层中样本的群间和群内方差。显然,总体总和的分层二阶抽样估计为:(9.13)其方差及其方差估计为:在分层二阶抽样中当然也存在最优抽样比的问题,不过此时假定费用函数普通该当与“层有关系:(9.14).固定费用C而使方差到达最小或方差有一定精度要求下使费用到达最小,此时 的最优选择为:(9.15)其中总假设对一切的 h ,都有 。.2 初级单元大小不等的二阶抽样 在实际中,除少数情况外,初级单元的大小不一定相等当然理想一些的情况,我们在分群时就留意到先将单元按照大小分层,使得同一层中初级单元大小相等,然后利用上面所讲的分层二阶抽样的方法来做。只惋惜在实践操作中,分层分群经常有一些“自然
11、方式,例如从行政系统划分等。因此,我们只能面对初级单元大小不等的情形,由于初级单元大小不一样,合理的手段是对初级单元采用不等概率抽样。 先给出一些相关的记号:表示第 初级单元中第 个次级单元第 初级单元总和第 初级单元平均值.总体总和总体平均数(按次级单元)总体平均数(按初级单元)第 i 初级单元内方差1、只抽取一个初级单元情形n=1 先思索从 N 个初级单元中随机选取 1 个以推断总体.这种情形看起来似乎很特殊,但在生活中也不少见,例如在随机地选的一个班级中抽取几个人进展考试以测试全年级的教育质量。只选取 1 个单元,仍有等概率与不等概率之分.(1)等概率抽取初级单元 思索对总体平均数 的估
12、计.首先运用抽中的初级单元中的样本平均数 对 进展估计(9.16)对第 i 初级单元来讲,由盒子模型可知, 是 的无偏估计。由于第 i 个抽样单元是等概率抽取,相当于从盒子中等能够抽取一次,那么所得之数一定是这个盒子平均数的无偏估计,即而 ,那么 不是 的无偏估计,而是有偏估计!.因此,对 只能求均方误差:作为 的有偏估计, 的均方误差由三部分构成:一是由偏倚引起的平方和,这就是(9.17)式右边的第一项;二是按初级单元(此时初级单元的特征目的当然只能是其平均数)而计算的总体方差, (9.17)式右边的第二项恰好表达出这一点;最后一部分是初级单元中次级单元的方差平方和,这恰好是(9.17)式右
13、边的第三项。 从 的表达式可以看出,其第一项和第二项都与 的选择没有任何关系,倘假设要尽力减少误差,目的自然留意到第三项,然而第三部分是无法知道且也是无法估计的,由于既然我们只选取一个初级单元,又如何能估计一切的 呢?. 由于是二阶抽样,也不能够取 。在普通情况下,为了方便起见,常采用选取 常数,不论取到哪一个初级单元,总抽预先指定好的样本容量,要不,取 与 成一定的比例比较合理一些。 不是 的无偏估计这一缺陷是由“等能够抽取而引起的,这时候每一个 有着同等重要的位置而由于初级单元大小不同,在 的构造中显然 不是有着同等位置的,这个现实使我们找到了一个弥补“等能够所引起缺陷的方法,那就是在构造
14、估计量时思索被抽到的初级单元的大小作为“权:(9.18).其中 表示一切初级单元的平均大小。这个估计的意义很清楚,它的 乘以 成为第 i 个初级单元内总和的估计,再乘以 N 成为总体总和的估计,这个估计除以 作为 的估计量是合理的。“权 的作用是使初级单元的目的化为次级单元的有关目的。既然 是第 i 个初级单元的总和的无偏估计,由于第一阶抽样的“等能够性, 该当是总体总和的无偏估计,于是有: (9.19)(9.20)的方差为:. 该当指出, 对 弥补的只是“期望或“平均上的偏倚,至于在精度上能否获益那么很难定。例如,倘假设各个初级单元的平均数 比较稳定,而 相距较大,引起 前的系数 的差别较大
15、,这种场所下 比起 来变化范围显然大得多,效果就比较差。(2)不等概率抽取初级单元 用等概率方法抽取初级单元对于大小不等的初级单元情形显然不太合理,精度较差是可想而知的。普通地,我们采用的不等概率抽取法有如下几种: 按概率 抽取到第 i 个初级单元,此时构造的估计量为:(9.21). 与 外表上方式一样,只不过 取 的概率为而 取 的概率为(9.22)即 是 的无偏估计量。(9.23).抽取概率按预先指定的一组概率 来实施,构造估计量为:(9.24)(9.25)即 是 的无偏估计量。(9.26).显然,假设取 ,那么 。假设取 ,那么 。抽取方式与一样,但构造的关于 的估计量为:(9.27)此
16、时,每个 具有权 ,因此(9.28)普通地 ,因此 是有偏估计。其均方误差为:(9.29). Cochran构造了一个虚拟总体(N3)进展抽样以对上述五种方法进展比较:例9.2 Cochran(1977)N=3 初级单元(大小不等)的虚拟总体1230,11,2,2,33,3,4,4,5,524618240.5000.6670.8000.52.04.0.方法抽取各单元的概率 的估计量能否无偏单元间单元内总计无偏0 5.792 0.256 6.048无偏0 1.813 0.189 2.002无偏0 3.583 0.213 3.796有偏0.062 1.800 0.173 2.035有偏0.340
17、2.056 0.144 2.5410.340 2.056 0.183 2.579取唯 取. 上表中最后一列的MSE是比较优劣的关键, 虽然是无偏估计,但是效果最差。同样是无偏估计, 的效果最好。 这两个现实也阐明了“无偏性对于估计量的误差判别并非是决议性的,有时为了使均方误差小一些,人们宁可放弃无偏性, 作为有偏估计其效果几乎不亚于 。留意到、三种方法都是不等概率抽样,与除了 不同外其他均一样,由于 与 差别不大,因此的效果相对也就比较好。而对于 ,虽然 与 一样,但对其估计量“刻意要求无偏却引起了均方误差的很不理想!.2、抽取 个初级单元情形 两个以上的初级单元里进展第二阶抽样,合理的根本假
18、定是在不同的初级单元内的抽样过程相互之间独立。为方便起见,仍像以前一样假定第二阶抽样为简单随机抽样,在这一小段讨论中,我们主要思索总体总和的估计。1初级单元按多项抽样方法抽取 设初级单元以给定的一组概率 逐个放回地抽取 n 次,在每个被抽中的初级单元里实施容量为 的简单随机抽样:假假设第 i 个初级单元在第一阶抽样中被抽中二次或二次以上,那么在第 i 个初级单元中将独立地对全体次级单元进展二次或二次以上的容量为 的简单随机抽样。. 显然,对第 i 个初级单元的总和 可自然地找到无偏估计 ,以这些 替代 的话,那么整群抽样中的HansenHurwitz型估计无疑为 提供了无偏估计:(9.30)其
19、方差为:(9.31)其中.2初级单元按简单随机抽取方式抽取 由于二阶抽样都是采用简单随机抽样方式,于是可对总体总和采用一个最为简单的估计方式:(9.32)由于 与 是 与 的无偏估计,因此 也是 的无偏估计。其方差为:(9.33).方差 的无偏估计为:(9.34)其中 这类简单估计虽然方式简单,而且构造也容易为人们接受,同时又是总体的无偏估计,但是它的效果并不理想,方差显得较大。.3按不放回不等概率抽取初级单元 假设抽取到的第 i 个初级单元的总和估计为 (简单随机抽样下的无偏估计),那么由第六章第二节易知,总体总和的二阶估计可采用如下方式的HorvitzThompson估计量。 如今思索初级单元是按不放回不等概率抽取,而第二阶抽取仍为在抽取的初级单元中实行简单随机抽样。那么在第一阶抽样中就存在包含概率 。(9.35)由于 或 是 的无偏估计,又 是 的无偏估计,所以 是 的无偏估计。.其方差为:(9.38)其中方差 的无偏估计为:(9.39)其中.3 三阶及多阶抽样 将有关二阶抽样的一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025咨询服务合同范本模板
- 2025南京市汽车买卖中介合同范本
- 2025建筑工程设计合同(2)工程文档范本
- 海南省儋州市洋浦中学2025-2026学年高二上学期10月月考语文试题(含答案)
- 浮力实验题考试题及答案
- 反思会议考试题目及答案
- 对外汉语考试题及答案
- 东汉医圣考试题及答案
- 2025合同范本:广告位租赁合同样本
- 2025年中国煤制气项目商业计划书
- 2025年下半年四川省泸州市人力资源和社会保障局信息中心招聘3人重点基础提升(共500题)附带答案详解
- 新版苏教版四年级上册科学(全册教案及教学计划及进度表)
- R语言与数据可视化PPT完整全套教学课件
- HYSYS中文操作手册目录
- 产品质量分析报告
- 课件西安课件
- 大学生应征入伍学费补偿申请表-原
- GB/T 25179-2010生活垃圾填埋场稳定化场地利用技术要求
- GA 1016-2012枪支(弹药)库室风险等级划分与安全防范要求
- 海南省建筑工程竣工验收资料
- 脑干听觉诱发电位课件
评论
0/150
提交评论