抽样调查-第9章二重抽样ppt课件_第1页
抽样调查-第9章二重抽样ppt课件_第2页
抽样调查-第9章二重抽样ppt课件_第3页
抽样调查-第9章二重抽样ppt课件_第4页
抽样调查-第9章二重抽样ppt课件_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、9.1 引言一、二重抽样的定义二重抽样double sampling),也称二相抽样,是指分两步抽取样本。先从总体N中抽样一个较大的样本 ,称为第一重样本,对其进展调查以获取总体的某些信息,为下一步的抽样估计提供条件;然后在第一重样本中再进展第二次抽样。这种抽样方法称为二重抽样。二、二重抽样与两阶段抽样的区别 1.两阶段抽样是先从总体N个单元中抽出n个样本单元,却并不对n个样本都进展调查,而是从中再抽出假设干个二级单元进展调查。.2。两阶段抽样的第二阶段抽样单元与第一阶段抽样单元往往是不同的。而二重抽样的第二重样本往往是第一重样本的子样本。三、二重抽样的作用一有利于挑选主调查对象二节约调查费用

2、三提高抽样效率四可用于研讨样本轮换中的某些问题五降低无回答偏倚.9.2 为分层的二重抽样 分层抽样是一种运用广泛的抽样方程,但进展分层抽样有一个前提,即需求将总体N个单元划分为L个互不重叠的层,而且需求知道各层的权重。假设事先无法知道总体的层权,可以采用二重抽样方法。一、符号阐明用下标h表示层数,总体第h层的单元数:总体单元数:第一重样本第h层的单元数:第一重样本单元数:.第二重样本第h层的单元数:第二重样本单元数:总体单元第h层的权重:第一重样本第h层的权重:第二重样本第h层的抽样比:第二重样本第h层j单元的观测值:第二重样本第h层样本单元的平均数:总体方差:,第h层的总体方差:.第一重样本

3、第h层方差:第二重样本第h层方差:二、抽样方法第一步: 利用简单随机抽样,从总体的N个单元中随机抽取第一重样本,样本单元数为 ;根据知的分层标志将第一重样本分层,令 ,那么 是总体层权 的无偏估计。第二步:利用分层随机抽样,从第一重样本中抽取出第二重样本,样本单元数为n ,第h层样本单元数为.三、估计量及其性质一均值估计量采用二重分层抽样,对总体均值 的估计量为:二均值估计量 的性质性质1 估计量 是 的无偏估计。即由于所以有.性质2 的方差为: 式中, 为总体方差; 为第h层的总体方差; 为第二重样本第h层的抽样比。性质3 的样本估计量为:式中, 为 的近似无偏估计; 为第二重样本第h层方差

4、。.【例9.1】某银行要调查其客户的资产情况,知该银行的客户数为8000,针对客户规模差别较大的特点,拟采用分层抽样。但由于缺乏现有的分层资料,决议采用二重分层抽样方法。第一重样本量 =1000,根据其自报的资产情况可分为4层:第一层为300万元以下;第二层为300万元1000万元;第三层为1000万元件2000万元;第四层为2000万元以上。然后在第一重样本分层的根底上,在各层分别抽取第二重样本。第二重样本量为,对这200个客户进展详细的调查,取得有关数据如下表,试估计该银行一切客户的资产总额及其抽样规范误差。.分 层第一重样 本第二重样 本样本均值300万元以下30010001000200

5、02000万元以上合计5403201004010008060402020027154040031009600451201.012.7115.38690.53解 根据上表可计算各层的权重:该银行客户的平均资产额估计为:百万元.该银行共有8000个客户,故全部客户资产总额为:百万元 的方差估计为:.因此,该银行客户资产总额的抽样规范误的估计:百万元四、二重分层抽样样本量的最优分配 二重分层抽样中有两次抽样,这两次抽样的样本量 即 和 ,直接影响估计的精度。第一重抽样 越大,对分层信息的了解和估计就越准确,从而可以减少估计量的误差;同样,第二重抽样 越大,估计量的方差越小。调查的经费是有限的,因此,

6、需求在给定费用的条件下,选择 和 ,使得估计量的方差 最小。. 假设第一重抽样的单元平均调查费用为 ,第二重抽样第 h 层的单元平均费用为 。忽略其他费用,那么费用函数可以表示为:由于 是随机变量,所以选择 和 的期望费用 为:而总体均值估计量的方差为:.要在一定的费用约束下使估计方差最小化,那么有由. 在实践运用中,要确定最优的 和 ,需求对总体事先有一定的了解,例如对 有一些粗略的估计。.9.3 为比率估计的二重抽样一、二重抽样比率估计的抽样方法第一步 从总体的N个单元中随机抽取第一重样本,样本单元数为 ;对于第一重样本,仅观测辅助变量信息,用辅助变量的样本均值 估计总体均值 。第二步 从

7、第一重样本中随机抽取出第二重样本,样本单元数为 ;对于第二重样本,观测目的变量与辅助变量,并用获得的 和 ,计算 ,构造比率估计。二、二重抽样的比率估计及其性质二重抽样对总体均值 的比率估计:. 式中, 分别为第二重样本目的变量与辅助变量的样本平均数; 为第一重样本辅助变量的平均数。性质4 与简单随机抽样下的比例估计一样, 是个有偏估计,其偏倚随着样本量的添加而减少。当第二重样本的样本量 足够大时, 是近似无偏的。即证明:记由于当第二重样本量n足够大时有.因此, 是 的近似无偏估计。性质5 二重抽样比率估计的方差为:.通常 可忽略,因此 式中, 分别为Y和X的总体方差和总体协方差,性质6 二重

8、抽样比率估计方差的样本估计:.【例9.2】 某住宅小区共有200个住户,现估计小区住户家庭月平均收入的平均程度。家庭收入的数据不易调查,而家庭支出的资料相对容易获取,而且家庭月平均收入与家庭月平均支出之间强相关,因此拟采用二重抽样比率估计方法。先从住户中随机抽取100个住户作为第一重样本,调查家庭月平均支出,结果家庭月平均支出的样本均值为1500元,然后从这100个住户中随机抽选 10户作为第二重样本,调查家庭月平均收入和家庭月平均支出,资料见下表。试估计该小区家庭月平均收入,并计算估计量规范差。.样本住户家庭月平均支出家庭月平均收入123456789101 5001 2002 0001 80

9、01 3003 000 8001 4001 6001 1002 0001 8002 8002 5001 9005 8001 3002 0002 3001 600某小区住户家庭收支的样本数据.解: 由题知 ,从上表计算得该小区住户的平均家庭月收入估计为: 的方差估计为:. 的规范差的估计为:三、二重抽样比率估计时样本量的最优分配问题:在给定的费用条件下,选择第一重样本量和第二重样本量 ,其中 为抽样比,使得估计量的方差 最小。费用函数:其中, 为第一重抽样的单元平均调查费用; 为第二重抽样的单元平均调查费用。.求最优值:因总体均值估计量的方差为由 及 得.9.4 为回归估计的二重抽样一、二重抽样

10、回归估计的抽样方法第一步: 从总体的N个单元中随机抽取第一重样本,样本单元数为 ;对于第一重样本,仅观测辅助变量信息 ,用辅助变量的样本均值 估计其总体均值第二步: 从第一重样本中随机抽取出第二重样本,样本单元数为 ;对于第二重样本,观测目的变量 与辅助变量 ,并计算 和回归系数 ,构造回归估计。.二、二重抽样的回归估计及其性质一二重抽样的回归估计二重抽样对总体均值 的回归估计: 式中 和 分别为第一重样本和第二重样本中辅助变量的平均值; 为根据第二重样本计算的目的变量的样本平均数, 为根据第二重样本计算的 对 的回归系数。二二重抽样回归估计的性质性质7 是个有偏估计,其偏倚随着样本量的增大而

11、縮小。当第二重样本的样本量 n 足够大时,.是近似无偏的。即证明:性质8 二重抽样回归估计的方差为:式中,.为第二重样本残差方差,其均值近似等于总体残差方差因此性质9 二重抽样回归估计方差的样本估计:. 式中是用第二重样本的方差 估计 ,用相关系数 估计 。【例9.3】以例9。2的数据,用二重抽样进展回归估计。试估计该小区家庭月平均收入,并计算估计量的规范差。解:由题知 由表可计算出该小区家庭月平均收入估计为:. 的方差估计为:的规范差的估计: 在实践运用中,二重抽样容量n较大条件下,才干有效消除用样本回归系数进展回归估计能够产生的偏倚。.三、二重抽样回归估计时样本量的最优分配 在给定的费用条件下,选择第一重样本量 和第二重样本量 , 其中 为抽样比,使得估计量的方差 最小。 假设第一重抽样的单元平均调查费用为 ,第二重抽样的单元平均调查费用为费用函数为:总体均值估计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论