第六章 抽样调查.ppt_第1页
第六章 抽样调查.ppt_第2页
第六章 抽样调查.ppt_第3页
第六章 抽样调查.ppt_第4页
第六章 抽样调查.ppt_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章抽样调查 第一节抽样调查概述第二节抽样误差第三节抽样估计的方法第四节抽样调查的组织形式 第一节抽样调查概述 是按照随机原则从被调查的总体中抽取一部分单位进行观察 并以样本指标对总体相应指标作出具有一定可靠性的估计和推断 从而达到对调查总体认识的一种统计调查方法 又称抽样估计 抽样推断 一 抽样调查的概念 1 是专门组织的一次性的非全面调查2 抽选样本单位遵循随机原则3 用样本指标数值去推断总体指标数值 与重点调查的区别 4 抽样误差可计算并控制在一定范围内 与典型调查的区别 二 抽样调查的特点 三 抽样调查的几个基本概念 一 全及总体和抽样总体 指研究对象的全体 其单位数用N表示 全及总体 总体 按其各单位标志性质不同分为 指从总体中随机抽取出来的部分单位所组成的整体 其单位数用n表示 抽样总体 样本 二 参数和统计量 参数 研究总体中的数量标志 总体平均数 总体方差 研究总体中的品质标志 总体成数 成数方差 根据全及总体各单位标志值计算的综合指标 全及指标 总体参数 研究数量标志 样本平均数 样本标准差 研究品质标志 样本成数 成数标准差 根据样本总体各单位标志值或标志特征计算的综合指标 抽样指标 统计量 三 样本容量和样本个数 样本容量 一个样本包含的单位数 用 n 表示 一般要求n 30 样本个数 又称样本可能数目 是指从一个全及总体中可能抽取的样本数目 与样本容量和抽样方法有关 四 抽样方法 重复抽样 又称回置抽样 不重复抽样 又称不回置抽样 可能组成的样本数目 可能组成的样本数目 四 抽样推断的基本原理 样本指标 1 理论基础 大数定律 独立同分布大数定律贝努力大数定律 2 抽样估计的基本要求 无偏性 有效性 一致性 总体指标 中心极限定理 独立同分布中心极限定理德莫佛 拉普拉斯中心极限定理 一 抽样误差的含义 由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构 而引起抽样指标和全及指标之间的绝对离差 二 影响抽样误差大小的因素 1 总体各单位标志值的差异程度 2 样本的单位数 3 抽样方法 4 抽样调查的组织形式 第二节抽样误差 1 概念 抽样平均误差是抽样平均数或抽样成数的标准差 反映了抽样平均数与总体平均数 抽样成数与总体成数的平均误差程度 2 计算方法 抽样平均数的平均误差 抽样成数平均误差 以上两个公式实际上就是第三章讲的标准差 但反映的是样本指标与总体指标的平均离差程度 三 抽样平均误差 采用重复抽样 此公式说明 抽样平均误差与总体标准差成正比 与样本容量成反比 当总体标准差未知时 可用样本标准差代替 教材P259例题可加以验证 通过例题可说明以下几点 样本平均数的平均数等于总体平均数 抽样平均数的标准差仅为总体标准差的 可通过调整样本单位数来控制抽样平均误差 抽样平均数平均误差的计算公式 例 假定抽样单位数增加2倍 0 5倍时 抽样平均误差怎样变化 解 抽样单位数增加2倍 即为原来的3倍 则 抽样单位数增加0 5倍 即为原来的1 5倍 则 即 当样本单位数增加2倍时 抽样平均误差为原来的0 577倍 即 当样本单位数增加0 5倍时 抽样平均误差为原来的0 8165倍 采用不重复抽样 公式表明 抽样平均误差不仅与总体变异程度 样本容量有关 而且与总体单位数的多少有关 例 随机抽选某校学生100人 调查他们的体重 得到他们的平均体重为58公斤 标准差为10公斤 问抽样推断的平均误差是多少 解 即 当根据样本学生的平均体重估计全部学生的平均体重时 抽样平均误差为1公斤 已知 则 解 计算结果表明 根据部分产品推断全部产品的平均使用寿命时 采用不重复抽样比重复抽样的平均误差要小 已知 则 例 某厂生产一种新型灯泡共2000只 随机抽出400只作耐用时间试验 测试结果平均使用寿命为4800小时 样本标准差为300小时 求抽样推断的平均误差 采用重复抽样 采用不重复抽样 抽样成数平均误差的计算公式 解 已知 则 样本成数 即 根据样本资料推断全部学生中戴眼镜的学生所占的比重时 推断的平均误差为2 某校随机抽选400名学生 发现戴眼镜的学生有80人 根据样本资料推断全部学生中戴眼镜的学生所占比重时 抽样误差为多大 例 解 已知 则 样本合格率 一批食品罐头共60000桶 随机抽查300桶 发现有6桶不合格 求合格品率的抽样平均误差 例 第三节抽样估计的方法 一 点估计 指直接以样本指标来估计总体指标 也叫定值估计 含义 指在进行抽样估计时 根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围 计算方法 它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值 抽样平均数极限误差 抽样成数极限误差 二 区间估计 一 抽样极限误差 允许误差 含义 抽样误差的概率度是测量抽样估计可靠程度的一个参数 用符号 t 表示 公式表示 t是极限误差与抽样平均误差的比值 极限误差是t倍的抽样平均误差 上式可变形为 二 抽样误差的概率度 指根据样本指标和抽样极限误差以一定的可靠程度推断总体指标的可能范围 其中 被推断的总体指标的下限与上限所包括的区间称为置信区间 估计的可靠程度也称为置信度 概率保证程度 三 区间估计 区间估计三要素 区间估计原理 0 6827 落在范围内的概率为68 27 区间估计原理 0 9545 落在范围内的概率为95 45 样本抽样分布曲线 原总体分布曲线 区间估计原理 0 9973 落在范围内的概率为99 73 样本抽样分布曲线 总体分布曲线 表达式 其中 为极限误差 总体平均数的区间估计 总体平均数的区间估计步骤 计算样本平均数 搜集总体方差的经验数据 或计算样本标准差 即 计算抽样平均误差 重复抽样时 不重复抽样时 计算抽样极限误差 确定总体平均数的置信区间 例A 某企业生产某种产品的工人有1000人 某日采用不重复抽样从中随机抽取100人调查他们的当日产量 要求在95 的概率保证程度下 估计该厂全部工人的日平均产量和日总产量 100名工人的日产量分组资料 解 则该企业工人人均产量及日总产量的置信区间为 即该企业工人人均产量在124 797至127 203件之间 其日总产量在124797至127303件之间 估计的可靠程度为95 表达式 其中 为极限误差 总体成数的区间估计 计算样本成数 搜集总体方差的经验数据 计算抽样平均误差 重复抽样条件下 不重复抽样条件下 总体成数的区间估计步骤 计算抽样极限误差 确定总体成数的置信区间 例B 若例A中工人日产量在118件以上者为完成生产定额任务 要求在95 的概率保证程度下 估计该厂全部工人中完成定额的工人比重及完成定额的工人总数 100名工人的日产量分组资料 完成定额的人数 解 则该企业全部工人中完成定额的工人比重及完成定额的工人总数的置信区间为 即该企业工人中完成定额的工人比重在0 8432至0 9568之间 完成定额的工人总数在843 2至956 8人之间 估计的可靠程度为95 一 简单随机抽样 第四节抽样调查的组织形式 对总体单位不作任何分类 排队 而直接从总体中随机抽取一部分单位来组成样本的抽样组织方式 又称为纯随机抽样 它适用于总体单位数不多 总体单位标志值的差异不很大 或对抽样推断的要求又不高的情况下采用 适用范围 样本抽取方法 先对总体各单位按主要标志加以分组 然后再从各组中按随机原则抽选一定单位构成样本 或称分类抽样 分层抽样 3 不等比例类型抽样法 类型适宜抽样法 2 等比例类型抽样法 类型比例抽样法 1 等数分配类型抽样法 样本抽取方法 二 类型抽样 在类型比例抽样中 首先要对总体作分类 组 再从每类 组 中随机抽取样本 所以不存在组间误差 抽样平均误差取决于各组内方差的平均水平 先按某一标志对总体各单位进行排队 然后依一定顺序和间隔来抽取样本单位的一种组织形式 又称机械抽样或系统抽样 1 按无关标志排队 2 按有关标志排队 三 等距抽样 样本抽取方法 如果按无关标志排队 其抽样误差就十分接近简单随机抽样的误差 因此可采用简单随机抽样平均误差的计算公式来近似地反映 若按有关标志排队 其抽样平均误差可采用类型抽样平均误差的公式计算其近似值 但在实践上 由于各组的方差是未知的 而且各间隔又只抽一个单位 因而也无法由抽样资料求得 一般仍按纯随机抽样误差公式进行计算 将总体各单位划分成许多群 然后从其中随机抽取部分群 对中选群的所有单位进行全面调查的抽样组织形式 又称区域抽样或分群抽样 四 整群抽样 在影响抽样误差大小的其他因素相同的情况下 类型抽样和机械抽样比简单随机抽样的误差要小 单个抽样比整群抽样误差要小 整群抽样对被抽中群体的所有单位都作调查 因此抽样平均误差不再受群内方差的影响 而受群间方差和抽样数目的影响 整群抽样采用不重复抽样方法抽取样本 五 必要抽样单位数的确定 通过抽样极限误差公式计算必要的样本单位数 在保证抽样推断所达到预期的可靠程度和精确程度的要求下 确定一个恰当的抽样单位数目 抽样单位数确定的原则 必要抽样单位数的计算方法 1 重复抽样的样本容量 1 平均数的样本容量 2 成数的样本容量 因 因 下面以简单随机抽样组织方式研究其计算公式 2 不重复抽样的样本容量 1 平均数的样本容量 2 成数的样本容量 因 因 解 已知 60天 20天 F t 0 9011 则t 1 65 N 1000 1 用重复抽样公式 例 某制鞋厂对某种鞋子进行耐穿时间的抽查检验 过去经验 已知其标准差为60天 在抽样估计误差不超过20天 其概率保证程度为90 11 的条件下 至少应抽多少双鞋 若该批鞋子总数为1000双 2 用不重复抽样公式 在90 11 的概率保证程度下 至少应抽25双 或24双 解 已知F t 0 9545 则t 2 在95 45 的概率保证程度下 至少应抽98块砖 例 某砖厂对产品质量进行抽样调查 已知过去抽样不合格的产品的百分比p 1 24 允许误差不超过2 24 在95 45 的概率保证程度下至少应抽多少块砖 某农场进行小麦产量抽样调查 小麦播种总面积为1万亩 采用不重复简单随机抽样 从中抽选了100亩作为样本进行实割实测 测得样本平均亩产400斤 方差144斤 2 若概率保证程度不变 要求抽样允许误差不超过1斤 问至少应抽多少亩作为样本 1 以95 45 的可靠性推断该农场小麦平均亩产可能在多少斤之间 计算 综合练习1 1 已知 N 10000n 100 解 计算抽样平均误差 计算抽样极限误差 计算总体平均数的置信区间 上限 下限 即 以95 45 的可靠性估计该农场小麦平均亩产量在397 62斤至402 38斤之间 2 已知 则样本单位数 即 当 至少应抽544 6亩作为样本 为调查农民生活状况 在某地区5000户农民中 按不重复简单随机抽样法 抽取400户进行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论