抽样调查不等概率抽样_第1页
抽样调查不等概率抽样_第2页
抽样调查不等概率抽样_第3页
抽样调查不等概率抽样_第4页
抽样调查不等概率抽样_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于抽样调查不等概率抽样§3.1PPS抽样PPS抽样:抽取概率正比于规模测度。——SamplingwithProbabilityProportionaltoSize第2页,共25页,2024年2月25日,星期天

不等概率抽样有放回不等概率抽样(PPS)无放回不等概率抽样()第3页,共25页,2024年2月25日,星期天一、实现方法(1)累积和法或代码法它适合于N不太大的情形。假定所有的为整数,倘若在实际中存在不是整数的话,则可以乘以一个倍数使其为整数。见下表。第4页,共25页,2024年2月25日,星期天单元单元大小代码数表3—1pps抽样时各单元的代码数每次抽样前,先在整数里面随机等可能的选取一个整数,设为m,若代码m属于第j个单元拥有的代码数,则第j个单元入样。整个过程重复n次,得到n个单元入样(当然存在重复的可能性)构成pps样本。第5页,共25页,2024年2月25日,星期天例3.1

设某总体共有N=8个单元,相应及代码如表所示123456782/51/22/34/38/53/52/311215204048182030累计12274787135153173203代码1~1213~2728~4748~8788~135136~153154~173174~203第6页,共25页,2024年2月25日,星期天假设第个单元在n次抽样中被抽中次,则是一个随机向量,其联合分布为:这是我们熟悉的多项分布,多项抽样其名正出于此。(3.1)多项分布(3.1)具有如下性质:倘若单元有一个数值度量其大小,诸如职工人数、工厂产值商店销售额等,或者感兴趣的调查指标在上一次普查时的数据也可以作为其单元大小的一种度量。记为第个单元的“大小”,并记第7页,共25页,2024年2月25日,星期天若取n=3,在1~203中随机有放回地产生3个随机整数,不妨设为45、89、101,则第3个单元入样一次,第5个单元入样2次。(2)最大规模法或Lahiri(拉希里)方法当N相当大时,累计的将很大,给代码法的实施带来很多不方便。Lahiri提出下列方法:令每次抽取1~N中一个随机整数及1~内一个随机整数,如果,则第个单元入样;若,则按前面步骤重抽,显然,第个单元的入样与否受到的影响,只有时它才入样,因此第个单元入样的概率与的大小成正比,此时m第8页,共25页,2024年2月25日,星期天定理3.1.1

在有放回PPS抽样下,二、估值法PPS抽样法的估值法的理论依据估计的均方偏差为:第9页,共25页,2024年2月25日,星期天证明

考虑随机变量Z,第10页,共25页,2024年2月25日,星期天定理3.1.2

在有放回PPS抽样下,注:第11页,共25页,2024年2月25日,星期天果园序号12345678规模测度X503065801404420100例

一村庄有8个果园,分别由果树50,30,65,80,140,44,20,100棵,要调查该村庄水果产量,以正比于果树棵树的概率取3个果园作样本.

如果实地调查得第5、第8、第3号三个果园的产量分别为15,12,7,求该村八个果园的总产量估计.解:这一估计的均方偏差的估计为第12页,共25页,2024年2月25日,星期天第13页,共25页,2024年2月25日,星期天2、Hansen-Hurwitz(汉森—赫维茨)估计量若是按为入样概率的多项抽样而得的样本数据,它们相应的值自然记为,则对总体总和,Hansen-Hurwitz给出了如下的估计量:且,即是总体总和的无偏估计。的无偏估计为第14页,共25页,2024年2月25日,星期天有放回不等概率抽样:从实施上还是从估计计算以及精度估计都显得十分方便。但一个单元被抽中两次以上总会使样本的代表性打折扣,从而引起抽样误差的增加。实际调查工作者一般倾向于使用不放回形式。问题:最简单的不放回不等概率抽样方式自然会想到逐一抽样这在第一次抽样时不会发生问题,但在抽第二个样本时面临的情况与有放回时大不相同,余下的(N-1)个单元以什么样的概率参与第二次抽样就是个问题;再在抽第三个样本时又面临新问题。一是抽样实施的复杂;二是估计量及其方差计算的复杂。在本节讨论:(1)n固定,尤其是n=2时的情形。(2)总体中每个单元的入样概率严格地与其“大小”成比例,即抽样。§3.2不等概抽样第15页,共25页,2024年2月25日,星期天几种严格的不放回抽样方法(1)Brewer(布鲁尔)抽样方法(1963)前面已经指出,所谓“严格不放回”是指样本容量n固定,严格不放回、的抽样。仅介绍n=2的情形。第16页,共25页,2024年2月25日,星期天1.对这种抽样,总体中个体单元i的入样概率为2.设计好第一次抽取的概率,第二次抽取的概率与成正比,使总的入样概率正比于.特点:第17页,共25页,2024年2月25日,星期天(2)Durbin(德宾)方法(1967)第18页,共25页,2024年2月25日,星期天1.对这种抽样,总体中个体单元i的入样概率为2.第一次抽取的概率与成正比,第二次抽取的概率使总的入样概率正比于.特点:Durbin方法中的与Brewer方法中的完全一样这表明两种不等概率抽样方法其实是等价的。第19页,共25页,2024年2月25日,星期天(3)Sen-Midzuno抽样方法第20页,共25页,2024年2月25日,星期天(4)Horvitz—Thompson(霍维茨—汤普森)HT估计量对于不放回不等概率抽样,常用HT估计。总体总数Y的无偏估计量为:该估计量的均方偏差为:第21页,共25页,2024年2月25日,星期天HT估计的均方偏差的两个无偏估计量为注:两估计量均有可能取负值,通过模拟比较,v2较稳定且较少取负值。第22页,共25页,2024年2月25日,星期天§3.3Rao-Hartley-Cochran随机分群抽样拉奥-哈特利-科克伦(1962)

第23页,共25页,2024年2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论