第六章 不等概率抽样_第1页
第六章 不等概率抽样_第2页
第六章 不等概率抽样_第3页
第六章 不等概率抽样_第4页
第六章 不等概率抽样_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章不等概率抽样§1概述一、不等概率抽样的定义和特点(一)定义:如果总体中每个单元进入样本的可能性是不相等的,则这种随机抽样方式就称为不等概率随机抽样,简称不等概率抽样。

(二)特点:将总体中每个单元的入样概率与其“规模”大小联系起来,使得“大单元”被抽到的概率大,“小单元”被抽到的概率小。二、不等概率抽样的优点和局限性(一)优点:能够大大提高抽样精度,减少抽样误差。

(二)局限性:必须具有能够说明单元规模大小的辅助变量来确定各个单元的入样概率或包含概率。三、不等概率的适用场合:总体单元之间的差异较大。四、不等概率抽样分类:我们最关心也是最重要的情形是抽样容量n固定时,单元入样的概率(不放回抽样)或每次抽样的概率(有放回抽样)与单元的大小严格成比例。这种情况下的有放回抽样称为抽样不放回抽样称为抽样。§2

放回的不等概率抽样1、多项抽样、抽样及其实施方法既然是不等概率抽样,那么就应该在抽样之前给总体中的每一个单元赋予一定的抽取概率,在放回抽样的每一次抽取中,设第个单元入样的概率为且,按此规定有放回地独立抽取n次,形成所谓的多项抽样。假设第个单元在n次抽样中被抽中次,则是一个随机向量,其联合分布为:这如是既我圆们捉熟但悉伤的多连项贫分格布,多伏项书抽贴样其娱名队正走出赶于汁此惭。(7.1)多劈燕项默分凯布死(暑7糟.弃1姑)顺具徒有骨如菠下称性队质歌:倘若单元有一个数值度量其大小,诸如职工人数、工厂产值商店销售额等,或者感兴趣的调查指标在上一次普查时的数据也可以作为其单元大小的一种度量。记为第个单元的“大小”,并记多本项敲抽吐样圆是芝最艺简擦单剖的有不功等些概窑率纹抽覆样剧,欲它膜的斜实乡丰施他方服法粪通讯常誓有火两牢种著,胆以p蚁p师s抽端样竿为晒例戚。则可取此扶时熔多药项僚抽绕样锦体宋现霜了桂每航次放抽银样酸时至单光元须的桌入茧样有概嗽率侄与僵单输元奏的腊大小足成世比开例它,号即萍为p轧p姿s抽摩样赵。

(1)代码法它适合于N不太大的情形。假定所有的为整数,倘若在实际中存在不是整数的话,则可以乘以一个倍数使一切为整数(对一般的多项抽样,也总可找到整数,使一切成为整数)。对于具整数的第个单元赋予一个与相等的代码数,见表7—1。单元单元大小代码数表7—1pps抽样时各单元的代码数每次抽样前,先在整数里面随机等可能的选取一个整数,设为m,若代码m属于第j个单元拥有的代码数,则第j个单元入样。整个过程重复n次,得到n个单元入样(当然存在重复的可能性)构成pps样本。例7.1设某总体共有N=8个单元,相应及代码如表所示123456782/51/22/34/38/53/52/311215204048182030累计12274787135153173203代码1~1213~2728~4748~8788~135136~153154~173174~203若盟取n贤=底3婚,在秘1口~猫2那0覆3栽中驻随领机闲有临放山回呈地效产柿生色3聋个招随曾机偏整散数蚊,友不妨脸设晕为微4世5筑、徒8样9施、栽1甜0斜1粥,满则兴第越3圾个眯单眨元蒜入办样疲一茅次旅,魔第沫5截个泥单元滔入贡样禁2混次惧。(像2膏)L未a快h视i瞎r珠i(脏拉推希酷里创)会方绞法当N相当大时,累计的将很大,给代码法的实施带来很多不方便。Lahiri提出下列方法:令每次抽取1~N中一个随机整数及1~内一个随机整数,如果,则第个单元入样;若,则按前面步骤重抽,显然,第个单元的入样与否受到的影响,只有时它才入样,因此第个单元入样的概率与的大小成正比,此时m2情、H滥a耐n敢s社e典n钟-冬H畅u播r牢w搅i待t角z(屑汉棚森—赫各维灶茨捞)系估秆计怖量若是按为入样概率的多项抽样而得的样本数据,它们相应的值自然记为,则对总体总和,Hansen-Hurwitz给出了如下的估计量:(7.4)且,即是总体总和的无偏估计。(7.6)的无偏估计为(7.7)§2不良放羊回看的暮不办等持概包率汇抽驶样上豪一柄节善讲童述俊了骗有仿放台回抗不廊等躬概才率舞抽姜样榜,址无必论梨从片实村施届上粪还乒是色从洪估奏计柜计狱算笋以街及损精森度家估驾计舟都益显晌得帅十方分躬方臂便母。六但馋是浸,进一性个悔单循元耐被秀抽买中用两兆次逗以汇上迟总浪会尿使古样度本浙的俗代育表仿性愉打卖折俭扣呼,狂从租而屯引窄起衫抽呈样努误葡差苦的庭增拦加元。通因著此先,班实例际勒调科查愉工未作斩者骡一葬般缴倾礼向刺于值使消用不佳放没回蠢形景式。最简单的不放回不等概率抽样方式自然会想到逐一抽样这在第一次抽样时不会发生问题,但在抽第二个样本时面临的情况与有放回时大不相同,余下的(N-1)个单元以什么样的概率参与第二次抽样就是个问题;再在抽第三个样本时又面临新问题,如此下去,一是抽样实施的复杂,二是估计量及其方差计算的复杂,因此,在本节仅讨论n固定,尤其是n=2时的情形。同时,我们只对使总体中每个单元的入样概率严格地与其“大小”成比例感兴趣,这就是所谓的抽样。1、包含概率不放回不等概率抽样中,总体中每个单元被包含到样本的概率,即入样概率是个重要的概念,而且任意两个单元包含到样本中去的概率也是个重要的概念,可以想象,估计量的方差等计算会与有着密切的关系既然表示第个单元在n个样本中出现的可能性,那么所有N个单元在样本中出现的可能性之和自然等于n,这就是的一个众所周知的性质:我们所考虑的严格抽样,既然与成比例,若n固定的话,显然有:(7.8)(7.9)对于,我们有(7.11)2、H门o哗r怎v伙i断t听z摩—尽T燃h零o待m眯p盛s裳o终n(晒霍湿维罗茨—汤尘普伙森野)昆估呼计瘦量(7.12)H—T估计量与H—H估计量是及其相似的。因为,它们在形式上似乎完全一样,但是H—H估计量中的可以互相重复,而H—T中的却是绝对地互不相同。对于不放回不等概率抽样,关于总体总和由Horvitz和Thompson提出如下的估计量:当n固功定遍时炼,H且—朗T估崖计项量宽的救方接差勿为关:(7.13)3、几种严格的不放回抽样方法前面已经指出,所谓“严格不放回”是指样本容量n固定,严格不放回、的抽样。仅介绍n=2的情形。(1)B并r颂e米w普e裙r(努布财鲁贸尔故)板方返法绑(1蓝9善6蜡3)假设对所有,均有,现抽取两个样本,最通常的方法是逐个选取。先以正比于的概率从N个单元中抽取1个样本,然后在余的N-1个单元中按与成正比的概率抽取第2样本这诸种投抽杆样胀方味法徐可援以熊保伪证顽每珍个春单忽元呼入践样险概况率削为绵:而(7.17)其中(2)D猾u道r宁b前i仓n(炼德膛宾炊)畏方竟法辉(1申9星6俱7)的概率抽取第二个样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论