抽样调查概述.ppt_第1页
抽样调查概述.ppt_第2页
抽样调查概述.ppt_第3页
抽样调查概述.ppt_第4页
抽样调查概述.ppt_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章抽样调查 6 1抽样调查的意义及基本概念6 2抽样调查的组织形式6 3抽样平均误差6 4全及指标的推断6 5必要抽样单位数的确定 第6章抽样调查 狭义的抽样调查 随机抽样 按照随机原则从总体中抽取一部分单位进行观察 并运用数理统计的原理 以被抽取的那部分单位的数量特征为代表 对总体作出数量上的推断分析 6 1 抽样调查的意义及基本概念 一 抽样调查的意义 抽样调查方法是市场经济国家在调查方法上的必然选择 和普查相比 它具有准确度高 成本低 速度快 应用面广等优点 6 1 抽样调查的意义及基本概念 二 抽样调查的适用范围 1 实际工作不可能进行全面调查观察 而又需要了解其全面资料的事物 2 虽可进行全面调查观察 但比较困难或并不必要 3 对普查或全面调查统计资料的质量进行检查和修正 4 抽样方法适用于对大量现象的观察 即组成事物总体的单位数量较多的情况 5 利用抽样推断的方法 可以对于某种总体的假设进行检验 判断这种假设的真伪 以决定取舍 抽样调查的适用范围 一 全及总体和抽样总体 总体和样本 全及总体 所要调查观察的全部事物 总体单位数用N表示 抽样总体 抽取出来调查观察的单位 抽样总体的单位数用n表示 n 30大样本n 30小样本 抽样调查的基本概念 二 全及指标和抽样指标 总体指标和样本指标 全及指标 全及总体的那些指标 抽样指标 抽样总体的那些指标 抽样调查的基本概念 抽样框 即总体单位的名单 是指对可以选择作为样本的总体单位列出名册或顺序编号 以确定总体的抽样范围和结构 样本数 指从总体中可能抽取的样本的数量 样本容量 指一个样本所包括的单位数 抽样调查的基本概念 6 2 抽样调查的基本概念及理论依据 全及总体 抽样总体 总体均值和成数 未分组数据 组距分组数据 总体均值的计算公式 成数的计算公式 总体方差和标准差 populationvarianceandstandarddeviation 未分组数据 组距分组数据 未分组数据 组距分组数据 方差的计算公式 标准差的计算公式 样本方差和标准差 samplevarianceandstandarddeviation 未分组数据 组距分组数据 未分组数据 组距分组数据 方差的计算公式 标准差的计算公式 重复抽样 又称有放回抽样 不重复抽样 又称不放回抽样 重复抽样和不重复抽样 一 简单随机抽样 纯随机抽样 二 类型抽样 分类抽样 三 机械抽样 等距抽样 四 整群抽样 抽样方案设计 概率抽样 probabilitysampling 也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的 或是可以计算出来的当用样本对总体目标量进行估计时 要考虑到每个样本单位被抽中的概率 简单随机抽样 simplerandomsampling 从总体N个单位中随机地抽取n个单位作为样本 每个单位入抽样本的概率是相等的最基本的抽样方法 是其它抽样方法的基础特点简单 直观 在抽样框完整时 可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时 不易构造抽样框抽出的单位很分散 给实施调查增加了困难没有利用其它辅助信息以提高估计的效率 简单随机抽样 纯随机抽样 随机抽选可有各种不同的具体做法 如 1 直接抽选法 2 抽签法 3 随机数码表法 分层抽样 stratifiedsampling 将抽样单位按某种特征或某种规则划分为不同的层 然后从不同的层中独立 随机地抽取样本优点保证样本的结构与总体的结构比较相近 从而提高估计的精度组织实施调查方便既可以对总体参数进行估计 也可以对各层的目标量进行估计 类型的划分 一是必须有清楚的划类界限 二是必须知道各类中的单位数目和比例 三是分类型的数目不宜太多 类型抽样 分类抽样 两种类型 2 不等比例类型抽样 类型适宜抽样 1 等比例类型抽样 类型比例抽样 系统抽样 systematicsampling 将总体中的所有单位 抽样单位 按一定顺序排列 在规定的范围内随机地抽取一个单位作为初始单位 然后按事先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位 以后依次取r k r 2k 等单位优点 操作简便 可提高估计的精度缺点 对估计量方差的估计比较困难 机械抽样 等距抽样 操作步骤 先将全及总体的所有单位按某一标志顺序排队 然后按相等的距离抽取样本单位 排列次序用的标志有两种 1 选择标志与抽样调查所研究内容无关 无关标志排队 例 研究工人的平均收入水平时 按工号排队 2 选择标志与抽样调查所研究的内容有关 称有关标志排队 例 研究工人的生活水平 按工人月工资额高低排队 机械抽样 等距抽样 1 随机起点等距抽样 机械抽样 等距抽样 机械抽样按样本单位抽选方法不同 分为 2 半距起点等距抽样 kkk k k为抽取间隔 示意图 机械抽样 等距抽样 整群抽样 clustersampling 将总体中若干个单位合并为组 群 抽样时直接抽取群 然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框 可简化工作量调查的地点相对集中 节省调查费用 方便调查的实施缺点是估计的精度较差 即把抽样本单位的过程分为两个或几个阶段来进行 如果一次就直接抽选出具体样本单位 这叫单阶段抽样 具体讲 先抽大单位 可以用类型抽样或机械抽样 再在大单位中抽小单位 可用整群抽样或简单随机抽样 小单位中再抽更小的单位 而不是一次就直接抽取基层的调查单位 多阶段抽样 第三节抽样平均误差 一 抽样误差的概念及其影响程度 在统计调查中 调查资料与实际情况不一致 两者的偏离称为统计误差 抽样误差即指随机误差 这种误差是抽样调查固有的误差 是无法避免的 抽样误差 抽样误差的影响因素 1 全及总体标志变异程度 正比关系2 抽样单位数目的多少 反比关系3 不同的抽样方式 4 不同的抽样组织形式 抽样误差 抽样误差的作用 1 在于说明样本指标的代表性大小 误差大 则样本指标代表性低 误差小 则样本指标代表性高 误差等于0 则样本指标和总体指标一样大 2 说明样本指标和总体指标相差的一般范围 抽样误差 抽样平均误差 抽样平均误差实际上是样本指标的标准差 通常用 表示 在N中抽出n样本 从排列组合中可以有各种各样的样本组 纯随机抽样的抽样平均误差 一 平均数的抽样平均误差 1 重复抽样 取得 的途径有 用过去全面调查或抽样调查的资料 若同时有n个 的资料 应选用数值较大的那个 2 用样本标准差S代替全及标准差 3 在大规模调查前 先搞个小规模的试验性的调查来确定S 代替 4 用估计的方法 纯随机抽样的抽样平均误差 某灯泡厂从一天所生产的产品10 000个中抽取100个检查其寿命 得平均寿命为2000小时 一般为重复抽样 根据以往资料 20小时 根据以往资料 产品质量不太稳定 若 200小时 纯随机抽样的抽样平均误差 2 不重复抽样 纯随机抽样的抽样平均误差 成数的抽样平均误差 已证明得 成数的方差为p 1 p 成数的抽样平均误差 某玻璃器皿厂某日生产15000只印花玻璃杯 现按重复抽样方式从中抽取150只进行质量检验 结果有147只合格 其余3只为不合格品 试求这批印花玻璃杯合格率 成数 的抽样平均误差 6 4全及指标的推断 评价估计量的标准估计量与估计值点估计与区间估计 估计量与估计值 估计量 用于估计总体参数的随机变量如样本均值 样本比例 样本方差等例如 样本均值就是总体均值 的一个估计量参数用 表示 估计量用表示估计值 估计参数时计算出来的统计量的具体值如果样本均值 x 80 则80就是 的估计值 估计量与估计值 estimator estimatedvalue 点估计与区间估计 参数估计的方法 估计方法 点估计 区间估计 点估计 pointestimate 用样本的估计量直接作为总体参数的估计值例如 用样本均值直接作为总体均值的估计2 没有给出估计值接近总体参数程度的信息点估计的方法有矩估计法 顺序统计量法 最大似然法 最小二乘法等 区间估计 intervalestimate 在点估计的基础上 给出总体参数估计的一个区间范围 该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如 某班级平均分数在75 85之间 置信水平是95 总体均值的区间估计 区间估计的基本原理正态总体或大样本的估计正态总体小样本的估计 将构造置信区间的步骤重复很多次 置信区间包含总体参数真值的次数所占的比例称为置信水平表示为 1 为是总体参数未在区间内的比例 常用的置信水平值有99 95 90 相应的 为0 01 0 05 0 10 置信水平 由样本统计量所构造的总体参数的估计区间称为置信区间统计学家在某种程度上确信这个区间会包含真正的总体参数 所以给它取名为置信区间 置信区间 confidenceinterval 总体均值的区间估计 正态总体 已知 或非正态总体 大样本 总体均值的区间估计 假定条件总体服从正态分布 方差 已知如果不是正态分布 可由正态分布来近似 n 30 总体均值 在1 置信水平下的置信区间为 重复抽样 不重复抽样 总体均值的区间估计 例题分析 例 某种零件的长度服从正态分布 从某天生产一批零件中按重复抽样方法随机抽取9个 测得其平均长度为21 4cm 已知总体标准差为 0 15cm 试估计该批零件平均长度的置信区间 置信水平为95 解 已知 N 0 152 n 9 1 95 z 2 1 96总体均值 在1 置信水平下的置信区间为 该批零件平均长度的置信区间在21 302cm 21 498cm之间 总体均值的区间估计 例题分析 例 在某天生产的500袋食品中 按不重复抽样方法随机抽取25袋进行检查 测得平均每袋的重量为996g 已知该种袋装食品的重量服从正态分布 且标准差为20g 试估计该种食品平均重量的置信区间 置信水平为95 解 已知 N 202 n 25 1 95 z 2 1 96总体均值 在1 置信水平下的置信区间为 该种食品平均重量的置信区间为988 35g 1003 65g之间 总体比例的区间估计 大样本重复抽样时的估计方法大样本不重复抽样时的估计方法 总体比例的区间估计 重复抽样 1 假定条件总体服从二项分布可以由正态分布来近似使用正态分布统计量 3 总体比例 在1 置信水平下的置信区间为 总体比例的区间估计 不重复抽样 1 假定条件总体服从二项分布可以由正态分布来近似使用正态分布统计量 3 总体比例 在1 置信水平下的置信区间为 总体比例的区间估计 例题分析 例 某城市想要估计下岗职工中女性所占的比例 随机抽取了100个下岗职工 其中65人为女性职工 试以95 的置信水平估计该城市下岗职工中女性比例的置信区间 解 已知n 100 p 65 z 2 1 96 该城市下岗职工中女性比例的置信区间为55 65 74 35 总体比例的区间估计 例题分析 例 某企业共有职工1000人 企业准备实行一项改革 在职工中征求意见 采取不重复抽样方法随机抽取200人作为样本 调查结果显示 有150人表示赞成该项改革 50人表示反对 试以95 的概率确定赞成改革的人数比例的置信区间 解 已知n 100 p 75 z 2 1 96 该企业职工中赞成改革的人数比例的置信区间为69 63 80 37 之间 6 6样本容量的确定 估计总体均值时样本容量的确定估计总体比例时样本容量的确定 估计总体均值时样本容量的确定 估计总体均值时样本容量n为重复抽样不重复抽样样本容量n与总体方差成正比 与边际误差成反比 与可靠性系数成正比 估计总体均值时样本容量的确定 其中 估计总体均值时样本容量的确定 例题分析 例 拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元 假定想要估计年薪95 的置信区间 希望边际误差为400元 应抽取多大的样本容量 估计总体均值时样本容量的确定 例题分析 解 已知 2000

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论