




已阅读5页,还剩37页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
抽样调查课 不等概抽样 单位 浙江财经学院数统学院课程 抽样调查课教师 张锐 一 不等概抽样简介二 放回不等概抽样三 不放回不等概抽样 目录 一 不等概抽样简介 1 等概率抽样回顾2 不等概率抽样介绍3 不等概抽样的应用4 不等概率抽样的优点和条件5 放回抽样和不放回抽样 迄今为止 我们所讨论的两种抽样方法 简单随机抽样和分层抽样具有一个共同的特点 总体或层中每个单元入样的可能性 概率 相等 等概率抽样 samplingwithequalprobabilities 等概率抽样的基本出发点是 将总体或层中每一个单元看作是平等的 不 偏向 也不 疏远 某些特定的单元如果总体单元的差异不大 这种处理方法既公正又方便 但在许多社会经济活动中并非所有单元的地位都相同或相近 即总体单元相差较大 也即总体方差大 这时等概率抽样的效果就不一定好 1 等概率抽样回顾 例如 为了估计一个城市的商业销售总额 对各商业网点进行调查 由于商业网点的规模差异极大 个别超大型商场年销售额可以超过亿元 甚至达到十几亿 它们是否景气对这个城市的商业销售总额起着至关重要的作用 而为数较多的大中型商场与商店年销售额是在几十万到几千万之间 至于数量更多的小型商店与摊位的年销售额仅数万元甚至不到一万元 在这种情况下 将特大型 大型商场与一般中小型市场或商店平等对待既不公允 又使抽样推断结果有较大可能发生大的偏倚 因此 在调查中 对大型商场应该处于更重要的位置 这个例子启示我们 当总体单元相差较大 用等概率抽样的方法不合理时 可在抽样中将总体中每个单元的入样概率与其规模大小联系起来 大 单元入样的概率大 小 单元入样的概率小 这就是不等概率抽样 samplingwithunequalprobabilities 出现总体单元差异特别大时 往往是牺牲 简单 来提高抽样效率 一种做法是将总体按规模分层 然后 对较大单元的层取的抽样比高些 抽样比可以是100 而较小单元的层抽样比定的小些 另一种就是赋予每个单元与其规模 或辅助变量 成比例的入样概率 这样 大单元入样概率大 小概率入样概率小 2 不等概率抽样介绍 不等概抽样中 总体中某类单元比其他单元出现在样本的机会大 这给人感觉这部分单元对推算影响大 使得推算偏向某一方 例如 大商场抽的多了 会不会造成推算的销售额偏大呢 实际上 某些单元的入样概率大 推算时 则赋予它较小的权 反之 入样概率小 推算时 就赋予它较大的权 这样就可以使推算结果仍然是公平的 3 不等概抽样的应用 1 抽样单元在总体中所占的地位不一致 如商场等调查等 2 调查的总体单元和抽样总体的单元不一致 比如调查者希望等概率的调查一单位职工的家庭情况 但由于有双职工的情况 因此 将双职工家庭的一个成员从调查框中拿掉或按每个职工的家庭成员在该单位的工作人数 然后对每名职工按与人数成反比的概率进行抽样 3 改善估计量 4 不等概抽样的优点和条件 优点 主要是大大提高估计精度 减少抽样误差 条件 必须要有说明每个单元的规模大小的辅助变量来确定每个单元的入样规模 这在抽样及推算中是必须的 有时比较容易获得 比如 管理部门在车船登记时 车船名和载重吨位是同时登记的 因此 载重吨位作为辅助变量 计算入样概率 不等概率抽样分为放回与不放回两种情况 我们最关心也是最重要的情形是抽样容量n固定时 单元的入样概率 不放回抽样 或每次抽样的概率 放回抽样 与单元的 大小 严格成比例情形 这种情形下的放回抽样称为pps抽样 不放回抽样称为抽样 放回不等概抽样 每次抽样过程都是从同一个总体中独立进行的 因此实施及推算过程相对简单一些 不放回不等概抽样 在抽取时效率要高些 5 放回抽样和不放回抽样 二 放回的不等概率抽样 1 多项抽样2 pps抽样及实施方法代码法拉希里法3 Hansen Hurwitz估计量及其性质 1 多项抽样 既然是不等概率抽样 那么在抽取之前就应当给总体中每一单元赋予一定的抽取概率 设总体包含N个单元 对其进行放回抽样 在每次抽样中 抽到第i个单元的概率为且按此规定 独立地抽取n次 共抽到n个单元 有可能重复 则称这种不等概率抽样为多项抽样 multinomialsampling 若记为总体中第i单元在n次抽样中被抽中的次数 显然对每个i都有 且则是一个随机向量 r v 其联合分布为 6 1 这正是我们熟悉的多项分布 多项抽样 其名正出于此 6 3 2 pps抽样及实施方法 倘若每个单元有一个数值度量其大小或规模 诸如职工人数 工厂产值 商店销售额等 我们记Mi为第i个单元的 大小 并记是总体中所有单元的 大小 之和 则可取 此时 每个单元在每次抽样中的入样概率与单元的大小成正比例 称这种特殊的多项抽样为 放回的 与大小成比例的概率抽样 samplingwithprobabilityproportionaltosize 简称pps抽样 多项抽样是最简单的不等概率抽样 它的实施方法通常有两种 以pps抽样为例 注意 抽样是放回的 因此某个单元出现在样本的次数有可能多次 在调查时 只需要调查一次 这样节省经费 但在计算的时候 按抽中几次计算几次的原则 1 代码法 也称汉森 赫维茨 Hansen Hurwitz 法 它适合于N不太大的情形 假定所有Mi为整数 若不然也可以乘以一个倍数M0 使一切Mi M0Zi成为整数 对于具有整数Mi的第i个单元赋予一个与Mi相等的代码数 每次抽样前 先在整数1 2 M0里面随机等可能地选取一个整数 设为m 若代码m属于第j个单元拥有的代码数 则第j个单元入样 这个过程重复n次 得到n个单元入样 当然存在重复的可能 构成了pps样本 表5 1 1pps抽样时各单元的代码数 设Mi皆为整数 例1设某个总体有N 10个单元 欲用多项抽样从中抽取n 5个单元 给定的入样概 Zi 如下表所示 在 1 100 范围内产生5个随机数 设分别为04 73 25 49 82 则第1 第6 第3 第5及第8个单元入样 如再增加一个样本单元 产生的随机数为58 则又对应第5个单元 这个单元即为抽中两次 由于单元愈大 被赋予的代码数就愈多 因此每个单元入样的概率与其大小Mi成正比 2 拉希里 Lahiri 法 也称为二次抽取法 当N相当大时 累计的将很大 给代码法的实施带来不便 Lahiri提出下列方法 对上述的Mi 令即所有Mi中的最大值 每次抽取一个 1 N 范围内的随机数i及 1 M 范围内的随机数m 若则第i个单元入样 否则重抽一组 i m 例如 在例1中 N 10 M 24 设 1 10 中的一个随机数为4 1 24 中的一个随机数为9 由于M4 68 故第二个单元入样 如此重复 直到抽到n个单元 允许重复 为止 拉希里法适用于N很大的情况 因为它不需要列出如上表这样的表 3 汉森 赫维茨 Hansen Hurwitz 估计量 若y1 y2 yn是按Zi为入样概率的多项抽样而得的样本数据 它们相应的Zi值自然地记为小写的z1 z2 zn 则对总体总和 Hansen Hurwitz给出了如下估计量 以盒子模型来描述 我们的盒子里有N张签 分别标上但如何去实施每个单元的不同概率抽取呢 我们适当地将盒子进行扩充 具体方法如下 不失一般性 设Zi Mi M0 i 1 2 N 其中且各Mi均为整数 扩充了的盒子使原盒内标有Yi Zi的一张签增加到Mi张签 不等概率抽样 简单随机抽样 因此 恰为的无偏估计 这样从新盒中随机地抽取Yi Zi就相当于原盒中Yi Zi以Zi Mi M0的概率被抽取 因此样本均值的期望就相当于新盒子的均值 由于n次抽取是独立进行的 放回抽样的特点 根据概率论的基本知识 的方差就等于新盒子的方差的1 n倍 即 因为为新盒子的方差 利用数理统计基本知识 样本方差为该方差的无偏估计 于是我们得到了的无偏估计 汉森 赫维茨 Hansen Hurwitz 估计量 总量估计 例子 某部门要了解所属8500家生产企业当月完成的利润 该部门手头已有一份上年各企业完成产量的报告 将其汇总得到所属企业上年完成的产量为3676万吨 考虑时间紧 准备采用抽样调查来推算当月完成的利润 根据经验 企业的产量和利润相关性很强 且企业的特点是规模和管理水平的差异比较大 通常大企业的管理水平较高 因此采用与上年产量成比例的pps抽样 从所属企业中抽出一个样本量为30的样本 调查结果如下表 请根据以上调查结果估计该部门所属企业的当月完成利润 并给出95 的置信度下的相对误差 如果相同条件下相对误差达到20 所需的样本容量应该是多少 解 补充 在实际工作中 可以依照过去对同类问题的经验调查来估计 比如 对同类问题已经获得过一个样本量为n o的简单样本 并且已知在一定置信度下 该调查对总体均值或总量的估计的相对误差为r o 在同样置信度下 如果希望本次调查的相对误差达到r 则在抽样比可以忽略的的情况下 可以近似的计算本次调查所需的样本量 三 不放回的不等概率抽样 1 包含概率与抽样2 统计量3 几种常用的不等概率抽样方法 总体中每个单位被包含到样本的概率 即入样概率起着关键的作用 总体中任意两个单位被包含到样本中的概率 一阶包含概率二阶包含概率 1 包含概率与抽样 如果抽样设计有固定的样本量 则包含概率有如下性质 1 2 3 如果我们事先对总体中的每一个单位都有一个度量其规模大小的指标值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 娱乐产业艺人劳动合同及商业活动管理协议
- 物业管理法律法规培训与物业管理规范执行协议
- 离婚协议书模板:包含养老金分割与社保权益处理
- 《离婚协议书范本:离婚后房产买卖及分割》
- 离婚补充协议:孩子抚养费及生活费用调整方案合同
- 离婚涉及上市公司股权处置及收益分配协议书
- 特种作战战例课件
- 化妆培训学校课程
- 农林技术技能测试题及答案
- 初中信息技术vb试题及答案
- 涉密文件日常管理办法
- 微信社交礼仪见面扫一扫时代25课件
- 药品批发企业《药品经营质量管理规范》
- 协议过户转让协议书模板
- 2025贵州黔西南州兴义市招聘事业单位教师40人备考试题及答案解析
- 2025甘肃省省直文博单位招聘事业编制工作人员26人笔试备考试题及答案解析
- 2025四川省公安厅警务辅助人员招聘(448人)笔试备考试题及答案解析
- 认识社会生活(教案)2025-2026学年统编版《道德与法治》八年级上册
- 一例跌倒护理不良事件分析
- 2025年社区网格员笔试考试题库及答案
- (2025年标准)返聘协议退休返聘协议书
评论
0/150
提交评论