z-CH9多阶段抽样-第3、4节-简.ppt_第1页
z-CH9多阶段抽样-第3、4节-简.ppt_第2页
z-CH9多阶段抽样-第3、4节-简.ppt_第3页
z-CH9多阶段抽样-第3、4节-简.ppt_第4页
z-CH9多阶段抽样-第3、4节-简.ppt_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/9/20,统计学专业必修课3学分,1,9.3 PU大小不等的2S抽样,与群规模不等的CL对照着来理解本节的方法体系 自加权样本的构造模式及估计方法(计算的重点),2019/9/20,统计学专业必修课3学分,2,PU大小不等时解决问题的思路,思路一: PU大小不等的问题可以转化为PU大小相等来讨论,比如分层,将大小近似的PU分到一层,则层内的2S抽样就可以按PU大小相等的方法来处理 思路二: 如果做不到上述转化,PU大小不等的处理就要复杂得多,复杂性体现在两个方面: 抽样方法: PU的抽取是否考虑PU不等的因素 估计方法: 选择估计方法是否要考虑PU规模不等的因素,2019/9/20,统计学专业必修课3学分,3,9.3方法体系,类似于CL群规模不等的估计 (一)对PU进行srs 1、加权估计 2、比率估计 (二)对PU进行PPS抽样(WR) 1、H-H估计 2、构造自加权样本,2019/9/20,统计学专业必修课3学分,4,一、符号说明,两个抽样比 两个均值 两个方差,2019/9/20,统计学专业必修课3学分,5,讨论的前提,A个PU,a个PU,M1个BU,M2个BU,Ma个BU,m1个BU,m2个BU,ma个BU,每个PU相互独立地抽取相应的BU数,基本符号(Yij,i=1,2,A ; j=1,2,Mi) (yij ,i=1,2,a ; j=1,2,mi),不需要再进一步综合,2019/9/20,统计学专业必修课3学分,7,二、均值估计量及其性质,2019/9/20,统计学专业必修课3学分,8,(一)对PU进行srs,抽样方法的选择上没有考虑PU规模不等的因素 估计方法的选择是否考虑PU规模不等的因素呢?,2019/9/20,统计学专业必修课3学分,9,讨论的前提,A个PU,srs,a个PU,M1个BU,M2个BU,Ma个BU,srs,m1个BU,m2个BU,ma个BU,每个PU相互独立地抽取相应的BU数,2019/9/20,统计学专业必修课3学分,10,等概抽样的加权估计量(P198 9.28-9.31),适应性:一般用于Mi相差不大的情况 是个无偏估计,2019/9/20,统计学专业必修课3学分,11,(二)对PU进行放回的不等概抽样,抽样方法的选择上考虑了PU规模不等的因素 选择与之配套的估计方法:H-H估计,2019/9/20,统计学专业必修课3学分,12,1、抽选方法说明,A个PU,PPS,a个PU,M1个BU,M2个BU,Ma个BU,m1个BU,m2个BU,ma个BU,每个PU相互独立地抽取相应的BU数,PPS抽样结果有可能重复。如果某PU被重复抽到,比如被抽到2次,则分别独立的进行2次BU的抽取。对样本单元实施调查,相同的单元记录2次,?,2019/9/20,统计学专业必修课3学分,13,2、H-H估计量及其性质,由H-H估计量的性质可知,这是无偏估计量 方差,(P199 9.36),(P200 9.38),2019/9/20,统计学专业必修课3学分,14,说明,估计量方差的估计式仅与第一阶段有关,与第二阶段无关 所以,一般对第二阶段抽样方法不做特别的规定,2019/9/20,统计学专业必修课3学分,15,3、构造自加权估计量,理论上,要想构造自加权估计量,必须 将估计量形式表示成关于样本观测值之和的常数倍,2019/9/20,统计学专业必修课3学分,16,关于f0含义的理解,相当于总体中任一BU被抽中的概率 如果f0事先确定,则,2019/9/20,统计学专业必修课3学分,17,总结: 实践中自加权样本的构造模式,在2S中,自加权样本按如下模式构造: 第一阶段对PU实施与规模成比例的PPS抽样 第二阶段对BU按srs抽取,且mi=m 这时,总值的估计量及方差的估计为:,2019/9/20,统计学专业必修课3学分,18,补例,某小区拥有10座高层建筑,每座高层建筑拥有的楼层数如下表: 用二阶抽样方法抽出10个楼层进行调查,第一阶抽样为放回的、按与每座建筑拥有的楼层数成比例的PPS抽样抽取5座建筑,第二阶按srs对每座建筑抽取2个楼层。对10个楼层居民人数的调查结果如下表。估计小区的总居民数,并给出估计的精度。,y,2019/9/20,统计学专业必修课3学分,19,解答,2S自加权样本的模式构造: 第一阶段对PU实施与规模成比例的PPS抽样 第二阶段对BU按srs抽取,且mi=m 本例的做法:用2S方法抽出10个楼层进行调查,第一阶抽样为放回的、按与每座建筑拥有的楼层数成比例的PPS抽样抽取5座建筑,第二阶按srs对每座建筑抽取2个楼层 这时,总值的估计量及方差的估计为:,2019/9/20,统计学专业必修课3学分,20,解答,自加权的构造模式 a=5,m=2,M0=145,2019/9/20,统计学专业必修课3学分,21,补充习题,某公司欲了解职工上班交通所需时间,该公司共有5个部门,根据每个部门的人数采用PPS抽样抽出2个部门,并在2个部门中采用srs分别抽出5名职工,调查的结果如下: 试估计该公司职工上班交通平均所需时间,并给出估计的标准差。,9.3结束,2019/9/20,统计学专业必修课3学分,22,9.4其他问题,一、3S抽样 二、2S总样本量及最优样本量的配置,2019/9/20,统计学专业必修课3学分,23,一、3S及MS抽样,2019/9/20,统计学专业必修课3学分,24,(一)各阶单元大小相等的MS (以3S为例),1、含义 总体包含A个PU,每个PU含M个二级单元,每个二级单元含G个BU 分别srs抽取a个PU、m个二级单元、g个BU,A,a,PU,srs,M,m,二阶单元,srs,G,g,BU,srs,2019/9/20,统计学专业必修课3学分,25,2、估计量及其性质(P194 9.46-9.48),实践中,对于更高阶的情况,估计量的方差一般只需计算到第二或第三阶就可以了,这是误差的 主要组成部分,amg一定时,提高a而减少m、g会有效提高估计的精度,方差的 无偏估计,2019/9/20,统计学专业必修课3学分,26,(二)各阶单元大小不等的MS(不要求),以总值Y的估计为例来说明 通常有两种方法 1、各阶抽样采用PPS抽样 2、构造自加权样本 重点掌握:样本为自加权的条件,2019/9/20,统计学专业必修课3学分,27,构造自加权样本 (样本为自加权的条件),2019/9/20,统计学专业必修课3学分,28,抽样方法,前两个阶段PPS抽样,最后一个阶段srs 从第二阶开始,每一阶各下级样本单元数都相等 则,样本是自加权的,A,a,PU,PPS,Mi,m,二级单元,PPS,Gij,g,BU,srs,2019/9/20,统计学专业必修课3学分,29,估计量与方差估计,2019/9/20,统计学专业必修课3学分,30,3阶以上的MS自加权样本的构造,类似地,对于更高阶的情况,除了最后一阶采用srs(wor或wr都行),前几阶均采用PPS抽样;并且,从第二阶开始,每一阶的样本量都相同,则样本是自加权的 自加权样本的好处 估计量的形式及方差的估计都非常简单 抽样估计效果一般也不错,2019/9/20,统计学专业必修课3学分,31,二、2S总样本量及最优样本量的配置,讨论的前提:PU大小相等的2S 背景说明 每个PU均包含M个BU 两个阶段均采用srs Aa,Mm 各PU相互独立地抽取BU,2019/9/20,统计学专业必修课3学分,32,(一)(am)的确定,两种思路: 1、费用 2、n2S=nsrsDeff Deff的确定是关键 实践中,一般,MS的Deff在1.33之间,2019/9/20,统计学专业必修课3学分,33,(二)最优样本量的配置,前提: 1、PU大小相等 2、(am)一定的前提下,合理分配a和m的大小 相当于确定最优抽样比f1=a/A、f2=m/M,2019/9/20,统计学专业必修课3学分,34,1、基本思想,怎样算是最优配置 最优设计、最优分配 C一定的前提下,使估计精度最高 在一定精度的要求下,使C最省 2S费用函数形式: C=c0+c1a+c2am 实践中的基本原则,2019/9/20,统计学专业必修课3学分,35,实践中的基本原则,a尽量大一些,m尽量小一些 两个阶段方差的大小 如果:PU间的方差S12大,PU内BU间的方差S22小 则,a大一点,m小一点 如果:S12小,S22大 则,a小一点,m大一点 两个阶段单位调查费用 如果:PU的单位调查费用c1大,BU的单位调查费用c2小 则,a小一点,m大一点 如果:c1小,c2大 则a多一点,m小一点,2019/9/20,统计学专业必修课3学分,36,2、求a、m的最优分配法 (P202 9.56),结论:,其中:,将mopt代入V公式,可求得V给定的情况下, 使Cmin的aopt (9.58) 将mopt代入C公式,可求得C限定的情况下, 使Vmin的aopt (9.57),问题:如何确定aopt?,2019/9/20,统计学专业必修课3学分,37,来历,有两种方法可以确定以上m的最优分配公式 拉格朗日乘子法 柯西施瓦兹不等式 基本思想: 借助方差函数和费用函数构造损失函数,求使得损失函数达极小值的m,2019/9/20,统计学专业必修课3学分,38,构造损失函数,利用方差函数和费用函数构造损失函数 2S的方差函数为,最简单的费用函数形式:,2019/9/20,统计学专业必修课3学分,39,柯西施瓦兹不等式,求解使损失函数达到极小值的m 这一求解过程借助C-S不等式完成 C-S不等式的内容: 若a1、a2、b1、b2非负,则 (a12+a22)(b12+b22) (a1b1+a2b2)2,当且仅当a1/b1=a2/b2=k时,“=”成立 令,2019/9/20,统计学专业必修课3学分,40,需要说明的问题,实际计算时,Su、S2、c1、c2都是估计值 mopt往往非整,怎么办? 实践中常用卡梅伦规则来处理,2019/9/20,统计学专业必修课3学分,41,3、实用规则 卡梅伦(Cameron)规则(1951),解决mopt非整的问题 令m=mopt,则按以下规则取m值 当mopt2m(m+1),则取m=m+1 当mopt2m(m+1),则取m=m 当mopt2M或Su20,则取m=M,即CL 当M较小时,有可能出现第三种情况,9.4结束,2019/9/20,统计学专业必修课3学

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论