免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章 不等概率抽样第一节 等概率抽样概述一、不等概率抽样的必要性在简单随机抽样中,总体(或层)中的每个单元入样的概率都相等。但是在许多实际问题中,我们还需要使用不等概率抽样。一种情况是调查的总体单元与抽样总体的单元可能不一致; 另一种需要用到不等概率抽样的情况是,抽样单元在总体中所占的地位不一致;第三种需用不等概率抽样的情况是为了改善估计量的特性。二、不等概率抽样的主要分类不等概率抽样可按多种原则进行分类。放回抽样与不放回抽样。对于不放回抽样,按其样本单元抽取方式的不同又可分为:逐个抽取法;重抽法;系统抽取法;全样本方法。三、不等概率抽样的特点不等概率抽样的主要优点是由于使用了辅助信息,提高了抽样策略的统计效率,与简单随机抽样甚至与分层抽样相比,能显著地减少抽样误差。不等概率抽样有以下的缺点:抽样框中的所有单元,都要有高质量的、能用作大小度量的辅助信息;抽样框的创建比简单随机抽样和系统抽样成本高,更复杂,因为需要度量和存储总体中每一个单元的大小;并非在任何情况下都能使用,因为并不是每一个总体都有稳定且与主要调查变量相关的有关大小或规模的度量;抽样及估计(特别对不放回抽样)相当复杂; 当单元大小度量不准确或不稳定时不适用,此时更好的办法是将单元按大小分组并使用分层抽样。第二节 放回不等概率抽样一、多项抽样多项抽样是一种最简单的不等概率抽样。它是从容量为N的总体中有放回地进行独立抽样,每次抽样中,使抽到第i个单元的概率为Zi,i=1,2,N,连续抽n次,从而抽到n个单元。若记为总体中第i个单元在n次抽样中被抽到的次数,显然对每个i都有:,且。作为随机变量(,),它的联合分布即是以下的多项分布:这就是多项抽样这个术语的来源。二、PPS抽样的涵义PPS抽样是与大小(或规模)成比例的概率抽样,是一种使用辅助信息从而使入样概率不相等的抽样技术。如果总体单元的大小或规模变化很大,且这些大小是已知的,这样的信息就可以用在抽样中,以提高统计效率。如果单元大小的度量是准确的,而且所研究的变量与单元的大小相关,PPS抽样能极大地提高精度。但如果大小的度量不大准确,最好按大小分组并使用分层抽样。PPS抽样的入样概率为第i个单元的入样概率,其中是总体中所有单元的“大小”之和,为第i个单元的大小。PPS抽样的一个很好的例子是商业调查,单元大小度量可用雇员数、年销售额、经营场所数等,但这些变量在不同年份发生变化的可能性要大一些。再如农产量调查中单元大小可以用面积进行度量,对于大多数农户,其土地面积在各个年份都是常量。三、多项抽样的实施方法1代码法设不太大,且(或)为第i单元大小的度量,且为整数,对总体中的每个单元计算累计大小,得到总体所有单元代码的累计和,对总体中每个单元确定与它相对应的代码范围;在1到总的累计大小范围内抽取一个随机数,该随机数相应的代码范围中的单元即为入样单元。重复上述步骤,直到抽得n个单元为止。抽样时,单元的代码如下表:单元单元的大小累计代 码2拉希里法令每次抽取一个范围内的随机数及范围内的随机数,若,则第单元入样;否则,重抽。此时,第i个单元的入样概率与成正比,从而。重复这一过程,直到抽够所需的个单元。3系统PPS抽样方法对总体中的每个单元,计算累计大小;对总体中每个单元确定与它相对应的代码范围;确定抽样间隔k=总累计大小/n;在1和k的范围内确定一个随机起点r;与代码r,r+k,r+2k,r+(n-1)k所在范围相对应的单元入样。4随机系统抽样法在这种方法中,名录在系统抽样前要进行随机排序。如果完全按原来的排序,会把一些可能的样本排除在外。在上面介绍的系统抽样的例子中,不可能把单元3很抽入同一个样本。把名录重新随机排列后会增加潜在的可能抽到的样本数量。四、汉森赫维茨估计量及其性质总体总和Y的无偏估计量如下:且若n1,则的无偏估计量为对于PPS抽样,所以有其中是第i个样本单元的观测值,是该单元的大小。第三节 放回不等概率抽样一、包含概率与PS抽样在不放回抽样中,每个单元被包含到样本的概率也即入样概率及任意两个单元都包含到样本的概率都起着十分重要的作用,它们通称为包含概率。对于固定的n包含概率满足以下性质:(1)(2)(3)与放回的PPS抽样类似,对于不放回不等概率抽样,我们最感兴趣的是与单元大小成比例的情形。若仍记,则由性质1有:以后我们将这种不放回的与单元大小成比例的概率抽样称为PS抽样。严格的PS抽样实施起来非常复杂。事实上,只有当n=2时,才有一些简单且实用的方法。二、霍维茨汤普森估计量及其性质对不放回的不等概率抽样,总体总和Y的估计采用霍维茨(Horvitz)与汤普森(Thompson)提出的以下估计量:霍维茨汤普森估计量具有如下性质:(1)若,则是Y的无偏估计,且它的方差为:当n固定时,又有(2)若,则是的无偏估计。三、n=2的严格PS抽样1布鲁尔(Brewer)方法该方法要求对每个i,都满足,即总体(层)中的最大单元必须小于全部单元大小总和的1/2(若不然可以将这个“特大”单元作为必调查的单元)。两个样本单元采用逐个抽取法抽取:第一个单元按与成比例的概率抽取;第二个单元则在剩下的N-1个单元中按与成比例的概率抽取。此时,则有且可以证明只要所有的,则从而恒为非负数。2德宾(Durbin)方法两个样本单元仍用逐个抽取法抽取。第一个样本单元以概率抽取,设抽到的是单元i;第二个样本单元则按与成比例的概率抽取。由于此时的,且与布鲁尔方法的相等,因此德宾方法与布鲁尔方法实际上是等价的。应用德宾方法也要求对每个i,都满足。四、n2的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大数据分析合同协议2025年合同三篇
- 2025年品牌经理助理招聘面试题库及参考答案
- 2025年客户服务专员招聘面试参考题库及答案
- 2025年网站后台开发工程师招聘面试参考题库及答案
- 2025年房地产市场专员招聘面试参考题库及答案
- 2025年市场营销经理人员招聘面试参考题库及答案
- 2025年网络营销经理招聘面试参考题库及答案
- 审计职称考试题库及答案
- 牙科护士笔试题库及答案
- 铁路押运考试题库及答案
- 2025年六西格玛绿带题库及答案
- 2025年河北石家庄市直事业单位公开选调工作人员173名考试笔试模拟试题及答案解析
- 公务接待礼仪及物资准备清单
- 2025年教育系统后备干部面试题及答案
- 2026年中国铁路郑州局集团有限公司招聘普通高等院校本科及以上学历毕业生584人(一)笔试考试参考试题及答案解析
- GB 11174-2025液化石油气
- 统编版九年级下册道德与法治 3.2与世界深度互动2025-课件
- 农村私宅转让协议书
- 2025秋期版国开电大本科《心理学》一平台形成性考核练习1至6在线形考试题及答案
- “巴渝工匠”杯第十三届青年职业技能大赛(全媒体运营师赛项)备赛试题库(含答案)
- AS9100D体系标准中文版
评论
0/150
提交评论