抽样调查-第9章 二重抽样PPT课件_第1页
抽样调查-第9章 二重抽样PPT课件_第2页
抽样调查-第9章 二重抽样PPT课件_第3页
抽样调查-第9章 二重抽样PPT课件_第4页
抽样调查-第9章 二重抽样PPT课件_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

9 1引言 一 二重抽样的定义 二重抽样 doublesampling 也称二相抽样 是指分两步抽取样本 先从总体N中抽样一个较大的样本 称为第一重样本 对其进行调查以获取总体的某些信息 为下一步的抽样估计提供条件 然后在第一重样本中再进行第二次抽样 这种抽样方法称为二重抽样 二 二重抽样与两阶段抽样的区别 1 两阶段抽样是先从总体N个单元中抽出n个样本单元 却并不对n个样本都进行调查 而是从中再抽出若干个二级单元进行调查 2 两阶段抽样的第二阶段抽样单元与第一阶段抽样单元往往是不同的 而二重抽样的第二重样本往往是第一重样本的子样本 三 二重抽样的作用 一 有利于筛选主调查对象 二 节约调查费用 三 提高抽样效率 四 可用于研究样本轮换中的某些问题 五 降低无回答偏倚 9 2为分层的二重抽样 分层抽样是一种应用广泛的抽样方程 但进行分层抽样有一个前提 即需要将总体N个单元划分为L个互不重叠的层 而且需要知道各层的权重 如果事先无法知道总体的层权 可以采用二重抽样方法 一 符号说明 用下标h表示层数 总体第h层的单元数 总体单元数 第一重样本第h层的单元数 第一重样本单元数 第二重样本第h层的单元数 第二重样本单元数 总体单元第h层的权重 第一重样本第h层的权重 第二重样本第h层的抽样比 第二重样本第h层j单元的观测值 第二重样本第h层样本单元的平均数 总体方差 第h层的总体方差 第一重样本第h层方差 第二重样本第h层方差 二 抽样方法 第一步 利用简单随机抽样 从总体的N个单元中随机抽取第一重样本 样本单元数为 根据已知的分层标志将第一重样本分层 令 则是总体层权的无偏估计 第二步 利用分层随机抽样 从第一重样本中抽取出第二重样本 样本单元数为n 第h层样本单元数为 三 估计量及其性质 一 均值估计量 采用二重分层抽样 对总体均值的估计量为 二 均值估计量的性质 性质1估计量是的无偏估计 即 因为 所以有 性质2的方差为 式中 为总体方差 为第h层的总体方差 为第二重样本第h层的抽样比 性质3的样本估计量为 式中 为的近似无偏估计 为第二重样本第h层方差 例9 1 某银行要调查其客户的资产情况 已知该银行的客户数为8000 针对客户规模差异较大的特点 拟采用分层抽样 但由于缺乏现有的分层资料 决定采用二重分层抽样方法 第一重样本量 1000 根据其自报的资产情况可分为4层 第一层为300万元以下 第二层为300万元 1000万元 第三层为1000万元 件2000万元 第四层为2000万元以上 然后在第一重样本分层的基础上 在各层分别抽取第二重样本 第二重样本量为 对这200个客户进行详细的调查 取 得有关数据如下表 试估计该银行所有客户的资产总额及其抽样标准误差 解根据上表可计算各层的权重 该银行客户的平均资产额估计为 百万元 该银行共有8000个客户 故全部客户资产总额为 百万元 的方差估计为 因此 该银行客户资产总额的抽样标准误的估计 百万元 四 二重分层抽样样本量的最优分配 二重分层抽样中有两次抽样 这两次抽样的样本量即和 直接影响估计的精度 第一重抽样越大 对分层信息的了解和估计就越精确 从而可以减少估计量的误差 同样 第二重抽样越大 估计量的方差越小 调查的经费是有限的 因此 需要在给定费用的条件下 选择和 使得估计量的方差最小 假设第一重抽样的单元平均调查费用为 第二重抽样第h层的单元平均费用为 忽略其他费用 则费用函数可以表示为 由于是随机变量 所以选择和的期望费用为 而总体均值估计量的方差为 要在一定的费用约束下使估计方差最小化 则有 由 在实际应用中 要确定最优的和 需要对总体事先有一定的了解 例如对有一些粗略的估计 9 3为比率估计的二重抽样 一 二重抽样比率估计的抽样方法 第一步从总体的N个单元中随机抽取第一重样本 样本单元数为 对于第一重样本 仅观测辅助变量信息 用辅助变量的样本均值估计总体均值 第二步从第一重样本中随机抽取出第二重样本 样本单元数为 对于第二重样本 观测目标变量与辅助变量 并用获得的和 计算 构造比率估计 二 二重抽样的比率估计及其性质 二重抽样对总体均值的比率估计 式中 分别为第二重样本目标变量与辅助变量的样本平均数 为第一重样本辅助变量的平均数 性质4与简单随机抽样下的比例估计一样 是个有偏估计 其偏倚随着样本量的增加而缩小 当第二重样本的样本量足够大时 是近似无偏的 即 因此 是的近似无偏估计 性质5二重抽样比率估计的方差为 通常可忽略 因此 式中 分别为Y和X的总体方差和总体协方差 性质6二重抽样比率估计方差的样本估计 例9 2 某住宅小区共有200个住户 现估计小区住户家庭月平均收入的平均水平 家庭收入的数据不易调查 而家庭支出的资料相对容易获取 而且家庭月平均收入与家庭月平均支出之间强相关 因此拟采用二重抽样比率估计方法 先从住户中随机抽取100个住户作为第一重样本 调查家庭月平均支出 结果家庭月平均支出的样本均值为1500元 然后从这100个住户中随机抽选10户作为第二重样本 调查家庭月平均收入和家庭月平均支出 资料见下表 试估计该小区家庭月平均收入 并计算估计量标准差 某小区住户家庭收支的样本数据 解 由题知 从上表计算得 该小区住户的平均家庭月收入估计为 的方差估计为 的标准差的估计为 三 二重抽样比率估计时样本量的最优分配 问题 在给定的费用条件下 选择第一重样本量和第二重样本量 其中为抽样比 使得估计量的方差最小 费用函数 其中 为第一重抽样的单元平均调查费用 为第二重抽样的单元平均调查费用 求最优值 因总体均值估计量的方差为 由及得 9 4为回归估计的二重抽样 一 二重抽样回归估计的抽样方法 第一步 从总体的N个单元中随机抽取第一重样本 样本单元数为 对于第一重样本 仅观测辅助变量信息 用辅助变量的样本均值估计其总体均值 第二步 从第一重样本中随机抽取出第二重样本 样本单元数为 对于第二重样本 观测目标变量与辅助变量 并计算和回归系数 构造回归估计 二 二重抽样的回归估计及其性质 一 二重抽样的回归估计 二重抽样对总体均值的回归估计 式中和分别为第一重样本和第二重样本中辅助变量的平均值 为根据第二重样本计算的目标变量的样本平均数 为根据第二重样本计算的对的回归系数 二 二重抽样回归估计的性质 性质7是个有偏估计 其偏倚随着样本量的增大而縮小 当第二重样本的样本量n足够大时 是近似无偏的 即 证明 性质8二重抽样回归估计的方差为 式中 因此 性质9二重抽样回归估计方差的样本估计 式中是用第二重样本的方差估计 用相关系数估计 例9 3 以例9 2的数据 用二重抽样进行回归估计 试估计该小区家庭月平均收入 并计算估计量的标准差 解 由题知由表可计算出 该小区家庭月平均收入估计为 的方差估计为 的标准差的估计 在实际应用中 二重抽样容量n较大条件下 才能有效消除用样本回归系数进行回归估计可能产生的偏倚 三 二重抽样回归估计时样本量的最优分配 在给定的费用条件下 选择第一重样本量和第二重样本量 其中为抽样比 使得估计量的方差最小 假设第一重抽样的单元平均调查费用为 第二重抽样的单元平均调查费用为 费用函数为 总体均值估计量的方差为 要在一定的费用约束下令估计方差最小化 则有 由及得 本章小结 1 二重抽样的主要特点是分两步进行抽样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论