




已阅读5页,还剩62页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
当总体单元的数目大 分布广时 若采用简单随机抽样 则需要编制包含全部总体单元的抽样框 工作量相当大 若采用系统抽样 则需将全部总体单元按一定标志进行有序排列 实施起来仍然很麻烦 若采用分层抽样 则需掌握一定的辅助信息进行分层 而实际应用中并不一定能找到合适的辅助变量 若采用单级整群抽样 则必需掌握全部总体单元的有关资料后进行分群 并在入样群内进行全面调查 工作量也是极其庞大的 例如 欲做农户家计调查 我国约有两亿农户 如果按上述几种方式进行抽样 其工作量之大难以想象 此时若采用多阶段抽样 可以简化抽样框的编制 便于最终样本单元的抽取 使得组织工作容易进行 避免上述抽样设计过程中的麻烦 第一节概述 一 什么是多阶段抽样分多个阶段抽到最终接受调查的样本 初级单元 PSU PrimarySamplingUnit二级单元 SSU Second stageSamplingUnit三级单元 TSU Third stageSamplingUnit最终单元 SSU UltimateSamplingUnit 假设总体由个初级单元组成 每个初级单元又由若干个二级 次级 单元组成 若在总体中按一定方法抽取个初级单元 对每个抽中的初级单元再抽取若干二级单元进行调查 这种抽样方法称为二阶段抽样 two stagesampling 也称二阶抽样 二级抽样 在二阶段抽样中 全部抽样是分两步实施的 第一步是从总体中抽初级单元 称为第一阶段抽样 第一阶抽样 第二步是从每个被抽中的初级单元中抽二级单元 称为第二阶段抽样 第二阶抽样 如果每个二级单元又由更小的三级单元组成 那么在第二阶段抽样后 若在每个被抽中的二级单元中再进行三级单元的抽样 则是三阶段抽样 三阶抽样 同样的道理 还可以定义更高阶段抽样 对于二阶段以上的抽样 称为多阶段抽样 多阶抽样 以上述我国农户调查为例 可以定义全国的县为初级单元 乡镇为二级单元 自然村为三级单元 户为四级单元 在全国抽取若干样本县 在样本县中再抽若干样本乡镇 在样本乡镇中 抽取若干自然村 在自然村中抽取样本户 这是一个四阶段抽样 二 多阶段抽样特点 1 构造抽样框相对容易多阶段抽样的一优点是不需要编制所有小单元的抽样框 抽取初级单元时 只需编制初级单元的抽样框 对被抽中的初级单元 再去编制二级单元抽样框 依此类推 每阶段只需编制该阶段的抽样框 从而大大降低编制抽样框的工作量 实际中非常方便 即使是在某个城市范围内的居民调查 也不可能且没有必要编制全市的居民名单抽样框 多阶段抽样方法就可以解决这一问题 此外 对于有些调查问题 抽样框的变动非常频繁 待抽样框整理完毕后 可能与实际情况相去甚远 多阶段抽样也是解决这类问题的办法 2 节省人力 物力 发挥了抽样的效率多阶段抽样保持了整群抽样样本单元相对集中的特点 因此与简单随机抽样相比 实施方便 每个基本单元的调查费用较低 另一方面 它并不像整群抽样那样对入样群的所有单元进行调查 而是在中选的初级单元中抽取二级单元 避免了一阶整群抽样由于调查过多的小单元而造成人力 物力与财力的浪费 充分发挥了抽样的效率 因此 多阶段抽样既保持了样本相对集中的优点 又克服了样本信息相似重复 降低抽样效率的缺点 3 行政上便于组织 某些条件可满足各级需要全国范围内的调查一般都用到多阶段抽样技术 尤其是根据我国目前政治 经济体制的特点 各级党政机关为了宏观控制经济 都需要统计数字 而全国的抽样调查数字往往不能满足各级政府的需要 如果把多阶段抽样和各地的需要结合起来 可以利用现成的行政区划或组织系统来划分阶段 为抽样调查的组织工作提供方便 满足各级政府的数据需求 4 可用于散料的抽样所谓 散料 是指连续松散的 不易区分的个体或抽样单元的材料 例如一堆煤 一车水泥 储藏在一个仓库的粮食等 进行散料的抽样时 抽样单元可以人为划分 也可以取其自然的单位 例如 一级单元是自然或人为划分的分装 例如一袋水泥 二级单元则是从分装中抽取一定数量 如一千克 的份样作调查 5 划分阶段不宜过多 三 推断原理多阶段抽样属于分步抽样 对分步抽样 讨论估计量的均值及其方差要分步进行 性质1对于二步抽样 有式中 为在固定初级单元时对第二步抽样求均值和方差 为对第一步抽样求均值和方差 二阶段抽样的抽样是分两步进行的 所以具有上述性质 性质1可以推广到分多步抽样的情形 例如对于三阶段抽样 有 第二节初级单元大小相等时的二阶抽样 第个初级单元二级单元内的方差 由的表达式注意到是所有的平均值 即 同理有 估计量方差一般公式为 于是有 1 的无偏估计为 式中估计量的方差由两项组成 第一项源于第一阶段抽样 主要取决于第一阶段抽样的样本量与初级单元间的方差 第二项源于第二阶段抽样 主要取决于第二阶段抽样的总样本量与初级单元内的方差 一般而论 第一项占总方差的绝大部分 第二项的分母是第一项的倍 且要乘以小于1的因子 相对于第一项要小得多 因此在二级单元样本量固定的条件下 越大 越小 则方差越小 即提高 减小可以大大提高估计的精度 此外 可以证明 见附录 初级单元内样本方差仍是总体相应方差的无偏估计 但样本初级单元间的方差并不是总体相应方差的无偏估计 如果第一阶的抽样比可以忽略 则方差估计式可以简单为如下的结果 这个结果在实际工作中可以作为参考 因为当第二阶段采用等距抽样或某些复杂抽样时 方差的无偏估计很难得到 当可以忽略时 只需要初级单元的均值就可以得到方差近似估计 当然 从另一个方面看 可以忽略 意味着总体中初级单元很大而抽选出的却很小 结果是样本分布相对集中 势必增大抽样误差 因此应用时要多加斟酌 相应地 总体总量及方差的无偏估计量分别为 4 5 由上式看出 m与 成正比 与 成反比 求出m后 利用 4 5 式 即可求出n 一般说来 不为整数 而在实际应用时 要取整数 为此 Cameron 1951 给出了下面的取值规则 若令是的整数部分 即 则有 1 若 取 2 若 取 3 若或 则取 第三节初级单元大小不等时的二阶抽样 如果初级单元之间的规模差异不是很明显 并不能将其严格分层 仍然可以采用简单随机抽样抽取初级单元 若二阶抽样中每个阶段都采用简单随机抽样 并且每个初级单元中二级单元的抽样是相互独立的 当初级单元大小不等 且按初级单元的规模分层后 各层级初级单元的大小差别仍很大 或者合理的分层是按其他指标进行的 对初级单元抽样一般采用不等概抽样 这个过程可以通过放回不等概率抽样 PPS 或者不放回不等概率抽样 PS 实现 为常数 实际工作中 如果初级单元大小不相等 通常人们第一阶段采取PPS抽样 第二阶段采用简单随机抽样 且每个样本初级单元的样本量都相同 这样得到的样本是自加权的 估计量的形式非常简单 欲估计某幼儿园每个小孩每天平均吃糖果数 该幼儿园共有三个班 其人数如下表所示 该幼儿园各班人数信息 现采用PPS抽样方法抽选两个班 然后在抽中的每个班中抽选5孩子 假设抽中的班级为A班 B班 在A班中用简单随机抽样抽中5个小孩 他们平均吃糖果为4 6 4 4 3 在B班抽选的5个孩子吃糖果数为3 5 4 5 3 试估计全幼儿园平均每人每天吃糖果数并给出估计的标准差 第四节不等概抽样在多阶段抽样中的应用 二阶抽样效率分析 1 与简单随机抽样比较为方便比较 接下来的分析均建立在下面的前提下 假设总体很大 抽样比很小 计算方差时的有限总体修正系数均可忽略不计 二阶段抽样中第一阶段的总体方差可以看作是群间方差 第二阶段的方差可以看作是群内方差 因此总方差为两者之和 即 若二阶段抽样时 第一阶段抽取个初级单元 第二阶段在入样初级单元中抽取个基本单元 则其样本均值的方差为 若在简单随机抽样的情况下取相同的样本量 即总样本量为 则样本均值的方差为因此二阶段抽样的设计效果为 通常情况下 因此二阶段抽样设计的效果大于1 即 这意味着二阶段抽样效率低于简单随机抽样 但是结合费用问题后注意到 二阶段抽样的优点是样本的分布比简单随机抽样要集中 可以节省人力 物力和财力 因此从费用效益来说 二阶段抽样效率就不一定低于简单随机抽样 2 与分层抽样比较 在二阶段抽样中 如果把初级单元看作是分层抽样的层 那么分层抽样可以看作是一种特殊的二阶段抽样 它是在第一阶段进行100 的抽样 当样本量也同为时 第二阶段把这些样本单元分布在个初级单元之中 由于分层抽样的误差只受层内方差的影响 分层抽样在各层是全面调查 其抽样方差不受第一阶段方差的影响 因此 分层抽样样本均值的方差为 与二阶段抽样的方差相比较 由于 因此有 这说明二阶段抽样效率通常也低于分层抽样 但是通过上面的分析看出 在一定程度上运用二阶段抽样仍然起到节省成本的作用 3 与整群抽样比较 如果在二阶段抽样中把初级单元看作群 那么整群抽样也可以看作是一种特殊二阶段抽样 它相当于第二阶段的抽样比为100 故若要保持样本量为 就要少抽一些群 设群的大小为 则第一阶段所抽群数为 根据前面的介绍 整群抽样的误差主要来自第一阶段的群间方差 因此其方差可简化为 二阶段抽样的方差可以写成要比较二者方差的大小 只要比较与即与的大小关系 当时 整群抽样的效率优于二阶段抽样 当时 整群抽样的效率等同于二阶段抽样 当时 整群抽样的效率劣于二阶段抽样 所以 这两种抽样方法效率的高低 要视群间与群内方差的关系而定 以上多阶段抽样与其他抽样方法间效率比较 都是假设二阶段抽样中的第一阶段初级单
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论