版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、关于抽样调查不等概率抽样第一张,PPT共二十五页,创作于2022年6月3.1 PPS 抽 样 PPS抽样:抽取概率正比于规模测度。Sampling with Probability Proportional to Size第二张,PPT共二十五页,创作于2022年6月 不等概率 抽样有放回不等概率抽样 (PPS)无放回不等概率抽样 ( )第三张,PPT共二十五页,创作于2022年6月一、实现方法(1)累积和法 或 代码法 它适合于 N 不太大的情形。假定所有的 为整数,倘若在实际中存在 不是整数的话,则可以乘以一个倍数使其为整数。见下表。第四张,PPT共二十五页,创作于2022年6月单元单元大
2、小代码数表31 pps 抽样时各单元的代码数每次抽样前,先在整数 里面随机等可能的选取一个整数,设为m ,若代码 m 属于第 j个单元拥有的代码数,则第 j个单元入样。整个过程重复 n次,得到 n个单元入样(当然存在重复的可能性)构成 pps 样本。第五张,PPT共二十五页,创作于2022年6月例3.1 设某总体共有N=8个单元,相应 及代码如表所示123456782/51/22/34/38/53/52/3 11215204048182030累计12274787135153173203代码11213272847488788135136153154173174203第六张,PPT共二十五页,创作
3、于2022年6月 假设第 个单元在 n次抽样中被抽中 次,则是一个随机向量,其联合分布为:这是我们熟悉的多项分布,多项抽样其名正出于此。(3.1) 多项分布(3.1)具有如下性质:倘若单元有一个数值度量其大小,诸如职工人数、工厂产值商店销售额等,或者感兴趣的调查指标在上一次普查时的数据也可以作为其单元大小的一种度量。记 为第 个单元的“大小”,并记第七张,PPT共二十五页,创作于2022年6月若取 n=3,在1203中随机有放回地产生3个随机整数,不妨设为45、89、101,则第 3 个单元入样一次,第 5 个单元入样 2 次。(2)最大规模法 或 Lahiri(拉希里)方法 当 N 相当大时
4、,累计的 将很大,给代码法的实施带来很多不方便。Lahiri提出下列方法:令每次抽取 1N 中一个随机整数 及 1 内一个随机整数 ,如果 ,则第 个单元入样;若 ,则按前面步骤重抽 ,显然,第 个单元的入样与否受到 的影响,只有 时它才入样,因此第 个单元入样的概率与 的大小成正比,此时m第八张,PPT共二十五页,创作于2022年6月定理3.1.1 在有放回PPS抽样下,二、估 值 法PPS抽样法的估值法的理论依据估计的均方偏差为:第九张,PPT共二十五页,创作于2022年6月证明 考虑随机变量Z,第十张,PPT共二十五页,创作于2022年6月定理3.1.2 在有放回PPS抽样下,注:第十一
5、张,PPT共二十五页,创作于2022年6月果园序号12345678规模测度X503065801404420100例 一村庄有8个果园,分别由果树50, 30, 65, 80, 140, 44, 20, 100棵,要调查该村庄水果产量,以正比于果树棵树的概率取3个果园作样本. 如果实地调查得第5、第8、第3号三个果园的产量分别为15,12,7,求该村八个果园的总产量估计.解:这一估计的均方偏差的估计为第十二张,PPT共二十五页,创作于2022年6月第十三张,PPT共二十五页,创作于2022年6月2、Hansen-Hurwitz (汉森赫维茨)估计量 若 是按 为入样概率的多项抽样而得的样本数据,
6、它们相应的 值自然记为 ,则对总体总和, Hansen-Hurwitz 给出了如下的估计量:且 ,即 是总体总和 的无偏估计。的无偏估计为第十四张,PPT共二十五页,创作于2022年6月有放回不等概率抽样:从实施上还是从估计计算以及精度估计都显得十分方便。但一个单元被抽中两次以上总会使样本的代表性打折扣,从而引起抽样误差的增加。实际调查工作者一般倾向于使用不放回形式。问题:最简单的不放回不等概率抽样方式自然会想到逐一抽样这在第一次抽样时不会发生问题,但在抽第二个样本时面临的情况与有放回时大不相同,余下的 ( N-1 ) 个单元以什么样的概率参与第二次抽样就是个问题;再在抽第三个样本时又面临新问
7、题。一是抽样实施的复杂;二是估计量及其方差计算的复杂。在本节讨论:(1) n 固定,尤其是n=2时的情形。(2)总体中每个单元的入样概率严格地与其“大小”成比例,即 抽样。3.2 不等概 抽样 第十五张,PPT共二十五页,创作于2022年6月几种严格的不放回 抽样方法(1)Brewer(布鲁尔)抽样方法(1963) 前面已经指出,所谓“严格不放回 ”是指样本容量n 固定,严格不放回、 的抽样。仅介绍n=2的情形。第十六张,PPT共二十五页,创作于2022年6月1. 对这种抽样,总体中个体单元i 的入样概率为2. 设计好第一次抽取的概率,第二次抽取的概率与 成正比,使总的入样概率正比于 .特点:
8、第十七张,PPT共二十五页,创作于2022年6月(2)Durbin(德宾)方法(1967)第十八张,PPT共二十五页,创作于2022年6月1. 对这种抽样,总体中个体单元i 的入样概率为2. 第一次抽取的概率与 成正比,第二次抽取的概率使总的入样概率正比于 .特点:Durbin方法中的 与Brewer方法中的 完全一样这表明两种不等概率抽样方法其实是等价的。第十九张,PPT共二十五页,创作于2022年6月(3)Sen-Midzuno抽样方法第二十张,PPT共二十五页,创作于2022年6月(4) HorvitzThompson(霍维茨汤普森)HT估计量对于不放回不等概率抽样, 常用HT估计。总体总数Y的无偏估计量为:该估计量的均方偏差为:第二十一张,PPT共二十五页,创作于2022年6月HT估计的均方偏差的两个无偏估计量为注:两估计量均有可能取负值,通过模拟比较,v2较稳定且 较少取负值。第二十二张,PPT共二十五页,创作于2022年6月3.3 Rao-Hartley-Cochran随机分群抽样 拉奥-哈特利-科克伦(1962) 第二十三张,PP
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国药科大学《电路分析基础》2025-2026学年期末试卷
- 中国矿业大学徐海学院《中药制剂检测技术》2025-2026学年期末试卷
- 中国矿业大学徐海学院《中国历史文献学》2025-2026学年期末试卷
- 盐城工学院《临床医学概论》2025-2026学年期末试卷
- 2024年全国公用设备工程师之专业基础知识(暖通空调+动力)考试黑金试卷
- 2024年成人高考成考(专升本)英语试卷及答案
- 2024年高考物理一轮复习考点43热力学定律与能量守恒定律练习含解析
- 2024年全国公用设备工程师之专业案例(暖通空调专业)考试重点黑金模拟题(详细参考解析)
- 2024年中考生物学仿真模拟试卷3(含答案解析)
- 2024年鲁教版五四制七年级上册数学期中综合检测试卷及答案
- 智研咨询发布:2026年中国生活垃圾转运站行业竞争格局及发展前景研究报告
- 2025-2030港口码头运营服务行业供求状况研究投资项目规划
- 《危险化学品安全法》与《危化品安全管理条例》条款对照表
- 【新教材】人教版小学三年级音乐下册4.3《紧缩与放大》《珠峰脚下乐声扬》教学课件
- 应用心理学专业-《变态心理学》-2024版教学大纲
- 企业HSE绩效考核指标体系
- 慢性顽固性疼痛的护理课件
- 2026年江苏航空职业技术学院单招职业技能考试题库附答案
- 蜜雪冰城成本管理
- 2025年赛事运营经理招聘面试参考题库及答案
- 2025年美术对口招生真题及答案
评论
0/150
提交评论