抽样调查概述(ppt 1).ppt_第1页
抽样调查概述(ppt 1).ppt_第2页
抽样调查概述(ppt 1).ppt_第3页
抽样调查概述(ppt 1).ppt_第4页
抽样调查概述(ppt 1).ppt_第5页
已阅读5页,还剩105页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章抽样调查 第一节抽样调查的基本概念与组织形式 一 抽样调查的意义 一般所讲的抽样调查 即指狭义的抽样调查 随机抽样 按照随机原则从总体中抽取一部分单位进行观察 并运用数理统计的原理 以被抽取的那部分单位的数量特征为代表 对总体作出数量上的推断分析 二 抽样调查的适用范围 抽样调查方法是市场经济国家在调查方法上的必然选择 和普查相比 它具有准确度高 成本低 速度快 应用面广等优点 1 实际工作不可能进行全面调查观察 而又需要了解其全面资料的事物 2 虽可进行全面调查观察 但比较困难或并不必要 3 对普查或全面调查统计资料的质量进行检查和修正 4 抽样方法适用于对大量现象的观察 即组成事物总体的单位数量较多的情况 5 利用抽样推断的方法 可以对于某种总体的假设进行检验 判断这种假设的真伪 以决定取舍 一般适用于以下范围 三 抽样调查的基本概念 一 全及总体和抽样总体 总体和样本 全及总体 所要调查观察的全部事物 总体单位数用N表示 抽样总体 抽取出来调查观察的单位 抽样总体的单位数用n表示 n 30大样本n 30小样本 二 全及指标和抽样指标 总体指标和样本指标 全及指标 全及总体的那些指标 抽样指标 抽样总体的那些指标 抽样框 即总体单位的名单 是指对可以选择作为样本的总体单位列出名册或顺序编号 以确定总体的抽样范围和结构 样本数 指从总体中可能抽取的样本的数量 样本容量 指一个样本所包括的单位数 通常有以下四种组织形式 四 抽样调查的组织形式 简单随机抽样 类型抽样 机械抽样 整群抽样 一 简单随机抽样 纯随机抽样 即从总体单位中不加任何分组 排队 完全随机地抽取调查单位 随机抽选可有各种不同的具体做法 如 1 直接抽选法 2 抽签法 3 随机数码表法 二 类型抽样 分类抽样 先对总体各单位按一定标志加以分类 层 然后再从各类 层 中按随机原则抽取样本 组成一个总的样本 类型的划分 一是必须有清楚的划类界限 二是必须知道各类中的单位数目和比例 三是分类型的数目不宜太多 类型抽样的好处是 样本代表性高 抽样误差小 抽样调查成本较低 如果抽样误差的要求相同的话则抽样数目可以减少 两种类型 1 等比例类型抽样 类型比例抽样 2 不等比例类型抽样 类型适宜抽样 三 机械抽样 等距抽样 先将全及总体的所有单位按某一标志顺序排队 然后按相等的距离抽取样本单位 排列次序用的标志有两种 1 选择标志与抽样调查所研究内容无关 称无关标志排队 2 选择标志与抽样调查所研究的内容有关 称有关标志排队 机械抽样按样本单位抽选的方法不同 可分为三种 1 随机起点等距抽样 2 半距起点等距抽样 kkk k k为抽取间隔 示意图 3 对称等距抽样 示意图 kkk 2k a2k a4k a4k a a k k为抽取间隔 机械抽样的好处 1 可以使抽样过程大大简化 减轻抽样的工作量 2 如果用有关标志排队 还可以缩小抽样误差 提高抽样推断效果 机械抽样 实际上是一种特殊的类型抽样 因为 如果在类型抽样中 把总体划分为若干相等部分 每个部分只抽一个样本 在这种情况下 则类型抽样就成了机械抽样 四 整群抽样 整群抽样即从全及总体中成群地抽取样本单位 对抽中的群内的所有单位都进行观察 整群抽样的好处 组织工作比较简单方便 适用于一些特殊的研究对象 其不足之处是 一般比其它抽样方式的抽样误差大 五 多阶段抽样 即把抽样本单位的过程分为两个或几个阶段来进行 如果一次就直接抽选出具体样本单位 这叫单阶段抽样 具体讲 先抽大单位 可以用类型抽样或机械抽样 再在大单位中抽小单位 可用整群抽样或简单随机抽样 小单位中再抽更小的单位 而不是一次就直接抽取基层的调查单位 六 重复抽样和不重复抽样 以上每一种组织方式又有不同的抽取样本方法 机械抽样和整群抽样没有重复抽样 重复抽样 又称有放回抽样 不重复抽样 又称不放回抽样 第二节抽样平均误差 一 抽样误差的概念及其影响因素 在统计调查中 调查资料与实际情况不一致 两者的偏离称为统计误差 统计误差 抽样误差即指随机误差 这种误差是抽样调查固有的误差 是无法避免的 抽样误差的影响因素 1 全及总体标志变异程度 正比关系2 抽样单位数目的多少 反比关系3 不同的抽样方式 4 不同的抽样组织形式 抽样误差的作用 1 在于说明样本指标的代表性大小 误差大 则样本指标代表性低 误差小 则样本指标代表性高 误差等于0 则样本指标和总体指标一样大 2 说明样本指标和总体指标相差的一般范围 二 抽样平均误差 抽样平均误差实际上是样本指标的标准差 通常用 表示 在N中抽出n样本 从排列组合中可以有各种各样的样本组 1 如果是重复抽样 2 如果是不重复抽样 考虑顺序的不重复抽样 不考虑顺序的不重复抽样 一 简单随机抽样的抽样平均误差 1 平均数的抽样平均误差 1 重复抽样 取得 的途径有 用过去全面调查或抽样调查的资料 若同时有n个 的资料 应选用数值较大的那个 2 用样本标准差S代替全及标准差 3 在大规模调查前 先搞个小规模的试验性的调查来确定S 代替 4 用估计的方法 某灯泡企业从一天所生产的产品10 000个中抽取100个检查其寿命 得平均寿命为2000小时 一般为重复抽样 根据以往资料 20小时 根据以往资料 产品质量不太稳定 若 200小时 2 不重复抽样 2 成数的抽样平均误差 已证明得 成数的方差为p 1 p 某玻璃器皿公司某日生产15000只印花玻璃杯 现按重复抽样方式从中抽取150只进行质量检验 结果有147只合格 其余3只为不合格品 试求这批印花玻璃杯合格率 成数 的抽样平均误差 若按不重复抽样方式 二 类型抽样的抽样平均误差 在重复抽样情况下 不重复抽样 在成数情况下 重复抽样 某农场种小麦12000公顷 其中平原3600公顷 丘陵6000公顷 山地2400公顷 现用类型抽样法调查1200公顷 以各种麦田占全农场面积的比重分配抽样面积数量 麦田类型抽样的平均误差计算表 高产麦田比重的平均误差计算表 三 机械抽样 等距抽样 的抽样平均误差 1 若按无关标志排队 一般采用简单随机抽样不重复抽样公式 2 若按有关标志排队 一般用类型抽样重复抽样的公式 四 整群抽样的抽样平均误差 整群抽样的抽样平均误差受三个因素影响 1 抽出的群数 r 多少 反比关系 2 群间方差 正比关系 一般计算方法如下 3 抽样方法 当R的数目较大 假如某一机器大量生产某一种零件 现每隔一小时抽取5分钟产品进行检验 用以检查产品的合格率 检查结果如下 五 多阶段抽样的抽样平均误差 以两阶段抽样为例 设总体分R组 每组包含个单位 若各组相等 则 在抽样第一阶段 从R组中抽出r组 则 在重复抽样下 在不重复抽样下 设某大学在学期初对学生进行体重抽样调查 假设全校各班均为40人 先从全校80个班以不重复抽样方法随机抽取8个班 然后再从抽取的班中再分别抽取10个人作为第二阶段抽样单位 计算所得的抽样平均体重为60 5千克 抽样各班内方差平均数为50 各班之间体重方差为22 要求计算该校学生体重的抽样平均误差 已知 解 第三节全及指标的推断 一 点估计和区间估计 一 点估计 二 区间估计 是根据样本指标和抽样误差去推断全及指标的可能范围 它能说清楚估计的准确程度和把握程度 根据中心极限定理 得知当n足够大时 抽样总体为正态分布 根据正态分布规律可知 样本指标是以一定的概率落在某一特定的区间内 统计上把这个给定的区间叫抽样极限误差 也称置信区间 即在概率F t 的保证下 抽样极限误差 t t为概率度 可见 抽样极限误差 即扩大或缩小了以后的抽样误差范围 抽样误差范围的实际意义是要求被估计的全及指标或P落在抽样指标一定范围内 即落在 或 的范围内 二 全及平均数和全及成数的推断 在概率F t 的保证下 即 全及平均数 成数 抽样平均数 成数 某农场进行小麦产量的抽样调查 该农场小麦播种面积为10000亩 采用不重复的简单随机抽样从中选100亩作为样本 进行实割实测 得到样本的平均亩产量为400千克 样本标准差为12千克 则 某机械企业日产某种产品8000件 现采用纯随机不重复抽样方式 按重复抽样公式计算 从中抽取400件进行观察 其中有380件为一级品 试以概率95 45 的可靠程度推断全部产品的一级品率 则 抽样一级品率 三 全及总体总量指标的推断 一 直接换算法 抽样平均数 成数 总体单位数 总体标志总量 1 如果采用点估计方法 上例1中 400 10000 400 万千克 如果用区间估计方法 上例1中该农场小麦总产量的范围为 t 2 397 62 402 38 10000 397 62 402 38 万千克 t 3 396 43 403 57 10000 396 43 403 57 万千克 2 上例2中 全部一级品数量的范围为 92 82 97 18 8000 7425 6 7774 4 件 二 修正分数法 就是用抽样所得的调查结果同有关资料对比的分数来修正全面统计资料时采用的一种方法 某乡6000农户 2009年年末统计养猪头数 从下往上报的是9000头 现抽10 600户 的农户再复查一下 发现有漏报 也有重报 按600户 原来数字是890头 实际复查为935头 故总的来说 是少报 第四节必要抽样单位数的确定 一 影响必要抽样单位数的因素 一 简单随机抽样 二 必要抽样单位数的计算公式 二 类型抽样 重复抽样 不重复抽样 三 机械抽样 在有总体差异程度和比重的全面资料时 可采用类型抽样的公式 没有总体的全面资料时 可采用简单随机抽样的公式 四 整群抽样 第五节假设检验 一 假设检验的意义 所谓假设检验 就是对某一总体参数先作出假设的数值 然后搜集样本资料 用这些样本资料确定假设数值与样本数值之间的差异 最后 进一步判断两者差异是否显著 若两者差异很小 则假设的参数是可信的 作出 接受 的结论 若两者的差异很大 则假设的参数准确的可能性很小 作出 拒绝 的结论 二 假设检验的程序 一 提出原假设和替代假设 原假设 又称虚无假设 是接受检验的假设 记作H0 替代假设 又称备选假设 是当原假设被否定时的另一种可成立的假设 记作H1 H0与H1两者是对立的 如H0真实 则H1不真实 如H0不真实 则H1为真实 H0和H1在统计学中称为统计假设 关于总体平均数的假设有三种情况 1 H0 0H1 0 2 H0 0H1 0 以上三种类型 对第一种类型的检验 称双边检验 因为 0 包含 0和 0 而对第二 三种类型的检验 称单边检验 二 选定检验统计量及其分布 三 选择显著性水平 当原假设H0为真时 却因为样本指标的差异而被否定 这种否定真实的原假设的概率就是显著性水平 用 表示 在假设检验中 要分析样本数值与参数假设值之间的差异 若两者差异越小 假设值真实的可能性则越大 反之 假设值真实的可能性越小 因此 要分析两者差异是否显著 如两者差异是显著的 就要否定原假设 因此 假设检验又称显著性检验 四 确定临界值 要根据显著性水平 的值确定接受域 拒绝域的临界值 五 计算检验统计量 在计算检验统计量时 要注意是双边检验还是单边检验 六 根据样本指标计算的检验统计量的数值作出决策 如果检验统计量的数值落在拒绝域内 包括临界值 就说明原假设H0与样本描述的情况有显著差异 应该否定原假设 如果该数值落在接受域内 就说明原假设H0与样本描述的情况无显著差异 则应接受原假设 三 假设检验的基本方法 一 总体均值的假设检验 1 一个总体均值的假设检验 正态分布 方差已知情况 双边检验H0 0H1 0 某种产品的直径为6cm时 产品为合格 现随机抽取100件作为样本进行检查 得知样本平均值为6 1cm 现假设标准差为0 2cm 令 0 05 检验这批产品是否合格 解 方法1 选择检验统计量 方法2 单边检验 根据过去学校的记录 学生的统计学考试的平均分数为65分 标准差为16分 现在学校改革了教学方法 经抽取64名学生作调查 得平均分数为69分 问平均分数有无显著提高 0 05 解 某企业生产瓶装1千克的某饮料 标准差为0 02千克 现随机抽取36瓶进行检验 得平均重量为0 9962千克 问能否相信该企业生产的饮料每瓶重量为1千克 0 05 解 对于正态分布 方差未知的情况 大样本时依然可采用Z统计量进行假设检验 未知的总体方差以样本方差代替 其观察值用计算公式 见书P316例 2 两个总体均值之差的假设检验 如果从两个总体抽取的样本容量均超过30 可采用Z检验统计量 假设A企业生产的灯泡的使用寿命 B企业生产的灯泡寿命 现在从两企业产品中各抽取100只和75只 测得灯泡的平均寿命分别为1180小时和1220小时 问在显著性水平下 这两个企业生产的灯泡的平均寿命有无显著性差异 该题意即为检验两企业灯泡的平均寿命是否相等 这是一个双边检验的问题 可作如下假设 根据已知条件 计算检验统计量 二 总体成数的假设检验 1 一个总体成数的假设检验 检验统计量 某质量管理部门从一企业抽查了准备出厂的产品180件作为样本进行检查 发现其中有168件为合格品 问该企业全部产品的合格率是否达到95 判定合格率达到95 某市全部职工家庭中 订阅某种报纸的占20 最近 从订阅情况来看似乎出现减少的迹象 为了检验订阅率是否存在变化 任选100户职工家庭进行调查 获得其样本订阅率p为0 16 问该种报纸的订阅率是否显著地降低了 并没有显著降低 2 两个总体成数之差的假设检验 如果两个样本抽自独立的两个总体 可选择Z检验统计量 1 两个总体成数是否相等的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论