已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
抽样调查 SamplingSurvey 1 第七章不等概率抽样 7 1概述 7 2放回不等概率抽样 7 3不放回不等概率抽样 2 7 1概述 一 不等概率抽样的提出与含义二 不等概率抽样的使用和优点三 不等概率抽样的分类 3 一 不等概率抽样的提出与含义 前述概率抽样方式 具有 等概率 的特点 简单随机抽样下总体中每一个单元的入样概率均相等 分层随机抽样下 层内每一个单元的入样概率均相等 特别地 按比例分配的分层随机抽样对于总体中每一个单元的入样概率均相等等概率抽样的基本出发点是将总体 或层 中的每一个单元看作是平等的 不 偏向 也不 疏远 某些特定的单元如果总体单元差异不大 这种方式既简单也合理 4 但是如果总体单元相差较大 等概率抽样效果不一定好 例如估计昆明市商业零售总额 大型商场 中型超市和小型商店的差别非常明显 平等对待显然不合理对这一情况 处理方式有多种 分层抽样 按规模分层 大型抽样比高 小型抽样比低 目录抽样 少数大单元普查而大多数小单元进行抽样 不等概率抽样 5 不等概率抽样 samplingwithunequalprobability 是指在抽取样本之前给总体中的每一个单元赋予一定的入样概率 从而保证大的 重要的 单元抽到的概率大 而小的 不重要的 的单元抽到的概率小 这里每个单元被赋予的入样概率通常与某个辅助变量有关 比如单元规模等 不等概率抽样是抽样理论发展的产物 代表性抽样 主观 有意识的抽样 等概率的随机抽样 每个单元平等 分层抽样 不同层不等概率 但层内等概率 不等概率抽样 单元具有不等地位 6 二 不等概率抽样的使用和优点 不等概率抽样通常用于以下三种情况 需要估计总体总量但总体单元规模相差很大的情况 抽样审计 在不能直接对基本的较小单元抽样的情形下 与其它抽样结合 完成对大的单元的抽样在上述情形下 不等概率抽样的主要优点是可以大大提高估计的精度 较少抽样误差 一个必要的约束条件是对总体的每一个单元 都要已知一个辅助变量用于确定其入样概率或两个单元同时入样的概率 7 三 不等概率抽样的分类 不等概率抽样有很多 布鲁尔与哈尼夫在1983年专著 不等概率抽样 中曾列举了50多种方法 不过真正常用的在10种左右这些方法按其实施方法或特性可以分成许多不同的类型 按抽样过程中被抽到的单元是否被放回总体而分为放回抽样和不放回抽样 常用的是放回抽样 按单元的入样概率是否严格地与单元大小成比例 还有最终杨本量n是固定还是随机的 不放回的抽样 按样本单元抽取方式还可以分为逐个抽取法 重抽法 系统抽取法等等 8 7 2放回不等概率抽样 一 多项抽样与PPS抽样二 PPS抽样的实施三 PPS抽样的估计 9 一 多项抽样与PPS抽样 设总体包含N个单元 对其进行放回抽样 设在每次抽样中 抽到第i个单元的概率为Zi i 1 2 N 独立进行n次这种抽样 共抽到n个单元 有可能重复 则称这种不等概率抽样为多项抽样 multinominalsampling 特别地 当总体中每个单元具有一个说明其 大小 或 规模 的度量Mi时 则可将每个单元的入样概率取为 此时每个单元在每次抽样中的入样概率与单元大小成比例 称这种特殊的多项抽样为与大小成比例的概率抽样 samplingwithprobabilityproportionaltosize 简称PPS抽样 10 二 PPS抽样的实施 1 代码法 累积总和法 汉森 赫维茨法 1943 设总体有N个单元 其规模度量为Mi 不妨设Mi为整数 否则可以乘以一个常数使其成为整数 记Mi之和为M0 则可以设置M0个代码 其中第i个单元相应的有Mi个代码 其代码的具体范围可以采用累积方法获得 具体而言 第1个单元拥有代码1 M1 第2个单元拥有代码M1 1 M1 M2 第i个单元拥有代码 每次抽样时在整数1 M0之间产生一个随机数m 则代码m所属的单元即为抽中单元 如此重复n次即可获得n个样本单元 若有的随机数相同或属于同一单元 则该单元被重复抽中 11 2 拉希里法 二次抽取法 Lahiri 印度 设总体单元数为N 单元规模为Mi 记 在1 N范围内产生一个随机数 设为j 在1 M 范围内的随机数m如果mMj 则第j个单元未被抽中 此时需要重复上述步骤 另行抽取一组 j m 直到抽满n个样本单元为止 12 三 PPS抽样的估计 对于放回不等概率抽样 对于总体总量Y 汉森 赫维茨提出如下估计量 Hansen Hurwitz 1943 特别地 对PPS抽样 有 13 意义 将Y理解为商店销售额 度量M理解为商店人数 则 第i个样本商店的人均销售额 所有样本商店的人均销售额的平均 所有商店的销售总额 14 估计量的性质汉森 赫维茨估计量是总体总和的无偏估计 汉森 赫维茨估计量的方差为 当n 1时 这一方差的无偏估计为 15 证明 设随机变量 且 则 是n次独立观测值yi zi的样本平均数 则由数理统计 放回简单随机抽样 有 16 而样本方差 是 的无偏估计 从而 例5 4 P169 例5 5 P171 17 总体均值的估计 基于汉森 赫维茨总和估计量基础上的总体均值的估计量为 方差估计 方差 18 7 3无放回不等概率抽样 一 包含概率与 PS抽样二 PS抽样的估计三 PS抽样的实施 19 一 包含概率与 PS抽样 放回不等概率抽样中 每个单元的入样概率Zi是关键不放回不等概率抽样中 每个单元被包含到样本的概率 i及任意两个单元都包含到样本的概率 ij都起着重要的作用 它们统称为包含概率 inclusionprobability 设总体容量为N 样本量n 固定 包含概率具有以下性质 所有N个单元的入样概率之和为n 即 如此可以保证在一次抽样中可以同时抽出容量为n的一个样本 20 固定第i个单元后 剩余的任意一个单元与其同时出现的概率之和为 总体中任意两个不同单元同时入样的概率之和为 21 与放回的PPS抽样类似 对于不放回不等概率抽样 最感兴趣的仍然是 i与单元大小Mi成比例的情形 即 i k Mi 记单元大小的一个相对度量为 Zi Mi M0 注意Zi在此处仅表示一个相对度量 不具有第2节 入样概率 的含义 则有 即 只要保证第i个单元的入样概率是其相对规模度量的n倍 则在不放回的情形下 这一抽样就是一个与单元大小成比例的不等概率抽样 称这种不放回的与单元大小成比例的概率抽样为 PS抽样 22 二 PS抽样的估计 对于不放回不等概率抽样 对于总体总量 霍维茨 汤普森 Horvitz Thompson 提出如下估计量 特别地 对于 PS抽样 有 这里yi不可重复 23 估计量的性质霍维茨 汤普森估计量是总体总和的无偏估计 霍维茨 汤普森估计量的方差为 当n固定时 这一方差为 24 霍维茨 汤普森估计量方差的无偏估计为 当n固定时 有耶茨 格伦迪 森估计 Yates Grundy Sen 也是上述方差的无偏估计 上述证明参见 抽样调查 倪加勋 P176 177 抽样调查理论与方法 冯士雍 P195 196 25 二 PS抽样的实施 不放回不等概率抽样的实施非常复杂 严格的 PS抽样仅讨论了n 2的情形 n 2时则多数属于非严格的 PS抽样 实际应用中 n 2并不是一个十分严重的限制 事实上 PS抽样常用于对总体分层 在每层中抽取两个样本单元的情况 注意前述证明中已经指出 只要保证每个单元的入样概率 i与其相对规模度量Zi成样本容量n倍 则抽样属于严格的 PS抽样 26 1 布鲁尔方法 Brewer 要求 n 2 每个单元的规模大小比例Zi 1 2 即总体中最大的单元规模必须小于全部单元规模的1 2 抽样方法 逐个抽取法 第一个单元按与 成比例的概率抽取 第二个单元在剩余N 1个单元中 按与Zj成比例的概率抽取 即第二个单元的抽取概率为 具体抽取中 每个单元的抽取可使用代码法完成 此时累计的 Mi 就是上述相应概率 例5 7 P179 27 2 德宾方法 Durbin 要求 n 2 每个单元的规模大小比例Zi 1 2 即总体中最大的单元规模必须小于全部单元规模的1 2 抽样方法 逐个抽取法 第一个单元按与 成比例的概率抽取 第二个单元在剩余N 1个单元中 按与成比例的概率抽取 具体抽取中 每个单元的抽取可使用代码法完成 此时累计的 Mi 就是上述相应概率 例5 9 P179 28 3 莫蒂方法 Murthy n 2时的一种非严格的 PS抽样方法 抽样方法 逐个抽取法 第一个单元按与 成比例的概率抽取 第二个单元在剩余N 1个单元中 按与成比例的概率抽取 第三个单元在剩余N 2个单元中 按与 每个样本单元均是按与当时未入样的单元单元大小成比例的概率抽取的 成比例的概率抽取 以此类推 29 4
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 辽宁省盘锦市二中2025年高二生物第一学期期末调研试题含解析
- 中国科学技术大学《固体制剂生产设备与工艺课程设计》2024-2025学年第一学期期末试卷
- 重庆资源与环境保护职业学院《吉他(二)》2024-2025学年第一学期期末试卷
- 2026届上海市市八中学数学高二上期末统考模拟试题含解析
- 职业规划与未来展望
- 肾内科慢性肾病骨病诊疗指南
- 消化内科胰腺炎护理指南
- 高校评估自检报告
- 结核病传染控制流程
- 精神科海姆立克急救法
- 能源管理安全培训课件
- 水工金属结构制造安装质量检验检测规程(2025版)
- 国家安全教育(中国人民公安大学)学习通网课章节测试答案
- 快消品销售数据分析与市场预测
- 第二单元+《时代乐章-线与色的造型》大单元教学设计-2025-2026学年初中美术七年级上册人教版2024
- 解析卷-海南省万宁市7年级上册期中测试卷单元测评试题
- JJF(石化)063-2023汽油辛烷值机(研究法)校准规范
- 奥密克戎防疫培训
- 社区体育考试题及答案
- UHPC裂缝控制技术-洞察及研究
- 思政课爱国主义课件
评论
0/150
提交评论