




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章二阶及多阶抽样初级单元大小相等时的二阶抽样初级单元大小不等时的二阶抽样样本量的确定和多阶段抽样的问题8.1概述
一.什么是多阶段抽样
1.概念:设总体由N个初级单元组成,每个初级单元又由若干次级单元组成,若在总体中按一定方法抽取n个初级单元,对每个被抽中的初级单元再抽取若干次级单元进行调查,这种抽样称为二阶抽样,或二级抽样(two-stagesampling)。一些记号:
初级单元(PSU)----PrimarySamplingUnit二级单元(SSU)----Second-stageSamplingUnit三级单元(TSU)----Third-stageSamplingUnit最终单元(USU)----UltimateSamplingUnit2.实施步骤:(1)从总体中抽初级单元,称为第一阶抽样;(2)从每个被抽中的初级单元中抽二级单元,称为第二阶抽样,以此类推。3.与其他几种抽样方法的关系:
整群抽样可以看成是二阶抽样的特殊情形,即最后一阶抽样是100%的抽样;
分层抽样也可看作是多阶抽样的特例,每个初级单元即是层,第一阶抽样是100%抽样,而层内抽样则是第二阶抽样。二、多阶段抽样特点1.构造抽样框相对容易。分级准备抽样框,即每次只需要对被抽中的单元准备下一级抽样单元的抽样框;2.节省人力、物力。3.行政上便于组织。4.可用于散料的抽样。所谓“散料”,是指连续松散的、不易区分的个体或抽样单元的材料。例如一堆土,一车水泥和粮食等。对于散料,抽样单元可以人为划分,也可以取其自然的单位。进行散料抽样时,例:对土壤中有机磷的测定,一级单元是自然或人为划分的分装(例如10份土样),二级单元则是从分装中抽取一定数量(如一千克)的份样作调查。5.划分阶段不宜过多。例:某个新开发区拥有相同户型的15个单元的楼盘,居民已经陆续搬入新居,每个单元住有12户居民,为调查家庭装潢情况,准备利用二阶段抽样法,从180户居民户抽取20户进行调查。
初级单位有15个,每个初级单元拥有的二级单元为12个,先从初级单元简单随机抽5个单元,然后在每个单元中简单随机抽取4户。
(属于等概抽样?)编号单元房号1*A座12*3*4*5678910*11122B座1234567891011123C座1234567891011124D座1234567891011125E座1234567891011126*F座1*23456*789*1011*127G座1234567891011128H座1234567891011129*I座12345*67*8*910*111210J座12345678910111211K座12345678910111212*L座12345*67*8*91011*1213*M座1234*56*7*891011*1214N座12345678910111215H座123456789101112初级单元大小相等时的二阶抽样一、总体均值的估计量:
假定总体由N个初级单元组成,每个初级单元都含有M个次级单元,简称初级单元规模相等的两阶段抽样。否则称为初级单元规模不相等的两阶段抽样。现对第一种情况:从N个初级单元中按简单随机抽样抽取n个初级单元,再从每个被抽中的初级单元中按简单随机抽样抽取m个次级单元。二、常用符号总体样本初级单元(psu)个数Nn初级单元拥有的二级单元个数Mm第i个psu中的第j个二级单元值Yijyij第i个初级单元按二级单元的平均值按二级单元的平均值初级单元(psu)均值间的方差第i个psu内ssu间的方差第一阶段抽样比第二阶段性质l:对于两阶抽样,有式中,E2,V2为在固定初级单元时对第二阶抽样求均值和方差;E1,V1为对第一阶抽样求均值和方差。两阶段抽样估计量的均值和方差三、估计量及其性质(一)总体均值的估计:对于初级单元大小相等的二阶抽样,如果两个阶段都是简单随机抽样,且对每个初级单元,第二阶抽样是相互独立进行的,则对总体均值的无偏估计为:其方差为:的无偏估计为:类似的,可以构造三阶抽样的估计方差证明:例:某部门欲研究某农药在叶面上的残留量,第一步先从一块棉田1000株里简单随机抽取4株,然后从每株上简单随机抽取4片叶子(假定每株共200片叶子),数据如下表,试估计每片叶子农药的平均残留量,并计算抽样误差。植株各叶片上农药的残留量13.283.093.033.033.110.0140323.523.483.383.383.440.0050732.882.82.812.762.810.00249243.343.383.233.263.300.0048例:欲调查4月份100家企业的某项指标,首先从100家企业中抽取了一个含有5家样本企业的简单随机样本,由于填报一个月的数据需要每天填写流水账,为了减轻样本企业的负担,调查人员对这5家企业分别在调查月内随机抽取3天作为调查日,要求样本企业只填写这三天的流水帐。调查结果如下:2、总体比例的估计,,
无偏估计为:例:欲调查某个新小区居民户家庭装修聘请专业公司的比例。在15个单元中随机抽取了5个单元,在每个单元都是12户,从中分别抽取4户,对这20户的调查结果如下:样本单元第一户第二户第三户第四户1栋A座YYNN2栋C座NYNN3栋C座NNNY4栋C座NNNN5栋B座YNNN树苗有病的比例为:23.2%一、初级单元大小相等时,最优样本量m与n的确定:1.m的确定:线性费用函数:样本量的确定例(续前例)若c1/c2=10,=15,试确定最优m,n解:首先计算mopt,由上例已知进一步计算nopt因此在实际工作中,对于各级单元大小不相等时的多阶抽样,通常的做法是:除了最后一阶采用等概率抽样(放回的或不放回的均可),前几阶均采用PPS(samplingwithprobabilitiesproportionaltosizes,简称PPS抽样)抽样,具体放在不等概部分讲解。
初级单元大小不等时的二阶抽样
在实际的抽样中,初级单元的大小很少是相同的,针对大小不同的初级单元,在抽样方法上有等概率抽样和不等概率抽样,在估计方法上有简单估计和比估计。
1、等概抽样实现:设总体中初级单元数为N,从中等概抽取n个单元,其大小为Mi(i=1,2,…,n),第二阶段在抽中的初级单元中等比例抽取基本单元,即抽样比相同:
f2i=mi/Mi=f2
2、也可采用不等概抽样(以后再讲)
一、简单估计第一阶抽样按简单随机抽样从N个初级单元中抽取n个,第二阶抽样按简单随机抽样,在抽中的初级单元中分别独立抽取mi,i=1…n,个2级单元。(1)简单估计:例题:某居委会欲了解居民健身活动的情况,如果已知该居委会有500名居民,在所居住的10个单元中抽取了4个单元,然后在样本单元中分别抽出若干居民,两阶段的抽样都是简单随机抽样,调查了样本居民每天用于健身活动的时间(10分钟为一单位),估计居民平均每天用于锻炼的时间,并给出估计的标准差。初级Mimi时间yij13244,2,3,63.752.9224552,2,4,3,63.42.833643,2,5,84.5745464,3,6,2,4,64.172.2解:采用简单估计由此看出,二阶抽样抽样误差主要是由第一项决定,抽样时尽量多抽一些初级单元,少抽一些次级单元比较好。(2)比估计:例题:某居委会欲了解居民健身活动的情况,如果已知该居委会有500名居民,在所居住的10个单元中抽取了4个单元,然后在样本单元中分别抽出若干居民,两阶段的抽样都是简单随机抽样,调查了样本居民每天用于健身活动的时间(10分钟为一单位),估计居民平均每天用于锻炼的时间,并给出估计的标准差。初级Mimi时间yij13244,2,3,63.752.9224552,2,4,3,63.42.833643,2,5,84.5745464,3,6,2,4,64.172.2设表示第i个一阶单元的二阶样本单元中具有某特性的单元占的比例,则总体中具有该特性的单元占的比例的估计量在估计的公式中,令3、比例的估计
例:某省卫生部欲对城市饮食业的卫生状况做一次抽样调查,在全省32个城市中随机抽选了4个城市,在抽选的城市中抽25%的饮食店进行检查,在检查的各项指标的基础上进行卫生状况是否合格的评估,其评估结果如下,试估计这32个城市中饮食店卫生不合格店占总店数的比例,若样本比例近似正态分布,计算其95%的置信区间。样本城市饮食店数(Mi)样本数(mi)卫生不合格数比例1521340.308220510.200336940.444432820.250解:卫生不合格店占总店数的比例为:再计算:三、三阶抽样
设总体中含有N个一阶单元,每个一阶单元又含M个二阶单元,而每个二阶单元中又含有K个三阶单元,各阶样本大小分别为n,m和k。令yiju(u=1,2,…,K)为第i个一阶单元的第j个二阶单元中,第u个三阶单元的观测值,则若三阶抽样中,每阶抽样都是简单随机的,则总体均值的无偏估计量为
其方差为方差的无偏估计量为其中
分层二阶抽样设总体分成L层,第h层有Nh个一阶单元,每个一阶单元均含Mh个二阶单元。在第h层随机抽了nh个一阶单元,又从每个被抽中的一阶单元中随机抽了mh个二阶单元。则均值的估计量为
其中是按二阶单元的层权;为第h层的样本均值。其方差为方差估计量为
其中上式乘以则得的方差及其估计量。在分层二阶抽样中,若即总体中每个二阶单元入样的概率都相等,则样本是自加权的。
例:某县电视台欲对本台所制做的节目在本县的收视率情况进行调查,调查中分为城镇和农村两层,各进行二阶段分层抽样,城镇中第一阶段抽选街道,从10条街道中选4条街道,每条街道再抽取20%的住户进行调查;农村第一阶段从20个乡中抽取4个乡作为初级样本,再从每个乡中抽取10%的农户进行调查结果如下:若已知该县城镇和农村的人数比例为3:7,要求估计该节目在本县的收视比例,并计算抽样标准误。层Nhnhh
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年甘肃庆阳西峰数字服务就业中心招聘100人考前自测高频考点模拟试题及答案详解一套
- 2025北京邮电大学人工智能学院招聘1人(人才派遣)考前自测高频考点模拟试题及一套完整答案详解
- 公司租赁经营用房合同5篇
- 2024-2025学年河北省霸州市小学数学一年级期末通关提分题详细答案和解析
- 泗阳保安考试题库及答案
- 筑安全考试题库及答案
- 房产知识考试题库及答案
- 安全意识考试题库及答案
- 农业科技服务与项目承包合同
- 职教高考机械理论考试题及答案
- 部编人教版五年级上册道德与法治全册课件
- 高血压护理查房ppt
- 全关节镜下FiberTape治疗后交叉韧带胫骨止点撕脱骨折课件
- 有限元和有限差分法基础超详细版本
- 《临建布置方案》word版
- epsonlq590面板操作
- GB∕T 11416-2021 日用保温容器
- 疑似预防接种异常反应(AEFI)监测与处理PPT课件
- 存货计划成本法
- 某某某污水处理厂施工组织设计
- (完整)地面硬化施工合同
评论
0/150
提交评论