已阅读5页,还剩13页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一 简单随机抽样 simplerandomsampling 或纯随机抽样 是随机抽样技术中最简单的一种 它对调查母体不做任何分组 排队 完全凭偶然的机会从中抽取样本 第四章抽样设计技术 三 随机抽样 randomsampling 或概率抽样 probabilitysampling 不依主观判断 而是随机选择样本 母体中每一个样本单位均有相同地位 各样本单位被抽中的概率完全相等 能用统计概率理论分析 区别于随便 1 适用情况 样本单位差异不大 样本单位不多 且有完备名册 2 具体方法 抽签法和乱数表法 1 抽签法 先将母体中每一个样本单位按顺序编号 然后将号码写在卡片上搅拌均匀 任意从中抽取 抽到一个号码就确定一个对应样本单位 直到抽足预先确定的样本数 也可以利用摇码机 摇码机号码为0 9 对于母体单位数不足两位数的 一次只需摇一个号码 对于母体单位数为两位数的 则一次要连续摇两个号码 第一个号码作为十位数 第二个号码为个位数 其它情况依次类推 第四章抽样设计技术 2 乱数表法 乱数表是将0 9的10个自然数 按编码位数的要求 两位 三位 甚至十位等 利用特制摇码器 电子计算机 自动地逐个摇出一定数目的号码编成表 以备查用 表内任何一个号码出现 都具有同等可能性 两位数乱数表 三位数乱数表 第四章抽样设计技术 使用乱数表 A 先要把调查母体样本单位加以编号 根据编号位数确定在乱数表中应该抽查的号码位数 例如 母体样本单位编号数为100以下 则在乱数表中按照一定顺序一次抽选连续两位数作为一个样本 在上述两个表中 如从表中第一个数开始 从左到右不间断地选择5个样本号码 则按左表得5个号码为41 11 17 53 71 按右表得5个号码为00 31 11 04 50 09 又如 母体样本单位数为6位数以下 则从左表第一个数字开始 从左到右不间断地选择5个样本号码为41111 75371 57245 50688 77047 当然 如果母体单位数为两位数 则一般使用两位数的乱数表 如果母体单位数为三位数 则一般使用三位数的乱数表 其他情况类推 第四章抽样设计技术 使用乱数表 B 抽取第一个号码没有任何限制 可以随机指定一个 然后按照随机设定的顺序 如上下左右顺序或按一定间隔顺序抽取样本 C 碰到超出母体样本单位数的号码应该舍弃 如果不是重复抽样 碰到重复号码应舍弃 例1 从94家上市公司中抽取不同的12家作为样本 先对94家公司编号从1到94 由于94为两位数 所以在乱数表中每连续的两个数字为一个样本号码 本例假设从下表第二行第5个号码开始 按从左到右顺序抽取样本号码为 59 16 55 67 19 10 50 71 75 33 21 86 第四章抽样设计技术 3 优缺点 1 优点 A 母体有限且不大时 样本抽取方便 方法简单 B 由样本推断母体简单 2 缺点 A 不易取得完整母体名册 或成本太大 B 母体样本单位数过多时 抽样不方便 C 样本分散 增加调查行政作业上的困难 D 样本差异过大时 样本代表性不足 二 分层随机抽样 stratifiedrandomsampling 将母体按照某种属性分成若干不重叠的组群 层 再在各层中按某种方式抽取样本 要求 层与层之间有明显差异 而层内单位之间应尽量保持一致性 分层数目不宜太多 了解各层单位数以及其占母体单位数的比例 1 适用情况 母体内样本单位差异较大 但分层后 层间差异变大 层内差异变小 总体具有非常明显的分层特性 2 具体方法 均等配置 等比例分层抽样和分层最佳抽样 第四章抽样设计技术 例2 某地共有居民20000户 按收入高低分层为 高收入居民为4000户 占总体20 中等收入居民为12000户 占总体的60 低收入居民围4000户 占总体的20 从中抽取200户进行购买力调查 则各层应抽取的样本数分别为 高收入层样本数目为200 20 40 户 中等收入层样本数目为200 60 120 户 低收入层样本数目为200 20 40 户 1 等比例分层抽样 按照各个层次样本单位数占母体单位数的比例分配各层应该抽取的样本数量 然后按照纯随机抽样方法或系统抽样方法抽取样本 2 分层最佳抽样或非等比例分层抽样 不是按照各个层次样本单位数占母体单位数的比例分配各层应该抽取的样本数量 而是根据其它因素 各层平均数或成数标准差的大小 抽样费用大小 抽样工作量多少 调整各层的样本单位数 如按标准差大小调整各层样本单位数 则其计算公式为 第四章抽样设计技术 其中 ni 各层应该抽取的样本单位数 n 样本单位总数 Ni 第i层单位总数 Si 第i层单位平均数或成数的标准差 仍以例2为例 假定估计的各层样本标准差见下表 用样本标准差代替各层单位总数标准差 按公式计算的各层应抽取样本数分别为 高收入层为200 1200000 4000000 60 中收入层为200 2400000 4000000 120 低收入层为200 400000 4000000 20 如果考虑最佳成本 则公式为 3 多次分层抽样 第四章抽样设计技术 3 分层抽样特点 1 优点 A 分层后 样本分布比较均匀 可提高估计准确度 B 各层可以根据具体情况采取不同的抽样方法 C 如果调查母体规模很大 则可在各层设立管理单位 以便调查 2 限制性 A 分层特性的选择很关键 B 分层不能有重叠现象 C 相对简单随机抽样 资料整理与估计要复杂 三 分群随机抽样或集群抽样 clustersampling 将母体区分为不同的群体 然后用纯随机抽样方法选定其中若干群 并对选中的群内每一个样本单位进行普查或再次分群或抽样 多段分群 第四章抽样设计技术 分层示意图 分群示意图 优点 抽样工作简单 集中缺点 样本分布在特定群中 不能均匀分布在总体单位中 如果群与群之间差异较大 则误差较大 四 等距抽样或系统抽样 systematicsampling 将母体的每一个单位按照一定标志编号排序 计算抽样间隔 母体大小 N 样本大小 n 然后从1 N n号码中随机选择一个号码作为起始号码 然后按照相等的间距抽选下去 系统抽样方法简单 适用于大规模抽样 局限性 如果第一个号码不是随机抽取 则系统抽样为非概率抽样 无关标志与有关标志 第四章抽样设计技术 例3 某地有居民户880户 计划试用系统抽样法抽取80户作样本 第一步 对母体单位编号从1 880 第二步 确定抽样间隔为880 80 11 第三步 确定第一个号码 采用随机抽样 非随机抽样 确定第一个号码为10 第四步 确定所有样本号码 10 21 32 43 54 65 879 五 多阶段抽样 对于一些大规模调查 运用一次抽样可能达不到提高估计准确度或减低成本之目的 或效果不明显 还需要采取第二次或多次抽样 例如 要对某省农村家庭固定电话拥有量进行调查 第一阶段先抽取县市 第二阶段抽取乡镇 第三阶段再抽取村组或直接抽取家庭 多阶段抽样中 每一样本单位没抽中的概率是一样的 假定某省共有家庭20000户 包括县市10个 从中抽取1000户作为样本进行调查 各县市家庭户数见下表 若不能整除 四舍五入取整数 第四章抽样设计技术 第一阶段先从10县市中抽出4个 如抽取的县市为1 3 6 8 表 第二阶段从抽取的4个县市中抽取同样数量的样本250户 对于每个县市 可以视情况采取不同的抽样方法直接抽取家庭户 前面已了解的方法 或者 从每个县市中再抽取若干乡镇 第三阶段 再从抽取的乡镇中直接抽取家庭户 抽样方法除了上述介绍的随机和非随机抽样方法外 还有些由这些方法结合在一起的较为复杂的方法 第四章抽样设计技术 四 抽样方法的选择 选择那种抽样方法主要考虑以下三个因素 一 对抽样误差大小的要求 在抽样单位数相等条件下 根据有关经验 一般来说抽样误差由小到大排列为 按有关标志排队的系统抽样 分层抽样 按无关标志排列的系统抽样 简单随机抽样 集群抽样 另外 重复抽样误差大于非重复抽样 二 调查对象本身的特点 如对调查对象母体及其每一个个体是否有全面详细的资料 调查对象个体的差异化程度 三 人力 物力 经费和时间约束 在具体实际调查中 往往不是运用单一方法 而是多种方法的结合 或者是运用多阶段抽样 第四章抽样设计技术 五 推断调查母体 一 抽样误差 1 误差有关概念 调查结果和客观实际情况的出入和差数 由于抄写 记录 计算的过错而引起的误差 由于选取调查个体对总体的代表性不足而产生的调查误差 违背抽样随机原则 人为选择偏高或偏低个体进行调查而产生的误差 不违背抽样随机原则下 因为个体与母体的差异必然要出现的误差 平均抽样误差 在抽样调查中 从同一母体中可以抽取很多不同的样本组合 不同样本组合的样本容量可以相同或不同 而每一样本组合的平均数可能不同 从而其离差平方和不同 抽样误差差不同 所有样本组合的抽样误差的平均数就是平均抽样误差 列如要从有20个样本单位的母体中抽取5个样本 随机抽样的结果可能是2 5 9 13 18 也可能是1 7 9 12 18 等等组合 不同的组合的标准差是不同的 二 影响抽样误差大小的因素 1 个体标志值之间差异程度 2 样本大小 3 抽样技术与方法 思考题 一 某市区居民家庭共12万户 于本年12月底抽取2400户进行洗衣机未来购买调研 样本调查结果如下 本年初洗衣机保存量为288台 本年实际够入洗衣机为96台 下年度打算购买洗衣机为120台 已知该年洗衣机社会零售量为6100台 其中集团购买200台 根据上述资料 测算该市下年度洗衣机居民家庭需求量和社会零售量 要求 1 计算出样本年初与年末洗衣机家庭普及率以及下年度样本每百户预计购买洗衣机多少台 2 按样本下年度每百户预计购买量推断该市下年度居民家庭洗衣机需求量 并运用简单随机重复抽样公式计算抽样误差 估计需求量置信区间值 F 95 45 3 假设全年居民家庭户数不变 下年度集团洗衣机预计购买量保持上年水平 试利用样本下年度洗衣机预计购买量比上年实际购买量的增长率 估算出下年度洗衣机的社会零售量 某学院共有2000名学生 按年终考核成绩分层 考核成绩优异的是200名 占总体
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 市场营销经理岗位职责与绩效考核方案
- 混凝土砌块施工技术及质量控制方案
- 物业管理日常运营记录模板
- 城市人行道施工安全及工艺方案
- 工程项目预算编制及控制方法总结
- 2025年安全培训试卷及答案:班组长带班领导矿井防中毒伤害知识考核
- 2025年煤矿应急演练评估安全培训试卷及答案-应急演练培训反馈机制测试
- 2025年安全培训转岗调任员工三级安全培训试卷及答案
- 2025年安全培训试卷及答案:矿山电工电气安全操作篇
- 洁净管道焊缝检测标准及操作手册
- 汽车租赁合同协议书模板
- 汽车运输有限公司双体系资料之加油站风险分级管控体系实施手册
- 一般进口报关流程
- 人教版(2025版)七年级下册数学第7~12章共6套单元检测试卷汇编(含答案)
- 居家养老室内空间适老化设计
- 针刺伤预防与处理(中华护理学会团体标准)
- 储能项目施工组织设计
- 2.1模型符号的建立与作用(讲义)(原卷版)
- 非遗糖画艺术创新工坊56
- 【MOOC】数据结构与算法-北京大学 中国大学慕课MOOC答案
- 中国脑出血诊治指南
评论
0/150
提交评论