第6章 抽样调查.ppt_第1页
第6章 抽样调查.ppt_第2页
第6章 抽样调查.ppt_第3页
第6章 抽样调查.ppt_第4页
第6章 抽样调查.ppt_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章抽样推断 一 抽样推断的概念和特点 1 概念 抽样推断是按随机原则从全部研究对象中抽取部分单位进行观察 并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断 第一节抽样推断的意义及基本概念 2 特点 它是由部分推断整体的一种认识方法 抽样推断建立在随机取样的基础上 抽样推断运用概率估计的方法 抽样推断的误差可以事先计算并加以控制 二 抽样推断的作用 抽样调查方法是市场经济国家在调查方法上的必然选择 和普查相比 它具有准确度高 成本低 速度快 应用面广等优点 1 实际工作不可能进行全面调查观察 而又需要了解其全面资料的事物 2 虽可进行全面调查观察 但比较困难或并不必要 3 对普查或全面调查统计资料的质量进行检查和修正 4 抽样方法适用于对大量现象的观察 即组成事物总体的单位数量较多的情况 5 利用抽样推断的方法 可以对于某种总体的假设进行检验 判断这种假设的真伪 以决定取舍 一般适用于以下范围 三 抽样推断中的基本概念 一 全及总体和抽样总体 总体和样本 全及总体 也称总体 指所要认识的研究对象全体 总体单位总数用 N 表示 抽样总体 是从全及总体中随机抽取出来 作为代表这一总体的那部分单位组成的集合体 抽样总体的单位数用n表示 n 30大样本n 30小样本 二 参数和统计量 参数 指反映总体数量特征的综合指标 参数 研究总体中的数量标志 总体平均数 总体方差 研究总体中的品质标志 总体成数 成数方差 统计量 根据样本数据计算的综合指标 研究数量标志 样本平均数 样本方差 研究品质标志 样本成数 成数方差 三 样本容量和样本个数 样本容量 一个样本包含的单位数 用 n 表示 一般要求n 30 样本个数 从一个全及总体中可能抽取的样本数目 四 重复抽样和不重复抽样重复抽样和不重复抽样会产生三个差别 抽取的样本数目不同抽样误差的计算公式不同抽样误差的大小不同 第二节抽样误差 一 抽样误差的概念及其影响程度 由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构 而引起抽样指标和全及指标之间的绝对离差 抽样误差即指随机误差 这种误差是抽样调查固有的误差 是无法避免的 抽样误差的影响因素 1 全及总体标志变异程度 正比关系2 抽样单位数目的多少 反比关系3 不同的抽样方式 4 不同的抽样组织形式 二 抽样实际误差 抽样实际误差是指每一个样本指标与总体被估计的真实指标之间的离差 有多少种可能的样本就有多少种可能的实际抽样误差 在现实中 实际抽样误差是不可能得到的 三 抽样平均误差 抽样平均误差 是抽样平均数或抽样成数的标准差 反映了抽样平均数与总体平均数 抽样成数与总体成数的平均误差程度 纯随机抽样的抽样平均误差 一 平均数的抽样平均误差 1 重复抽样 某灯泡厂从一天所生产的产品10 000个中抽取100个检查其寿命 得平均寿命为2000小时 一般为重复抽样 根据以往资料 20小时 根据以往资料 产品质量不太稳定 若 200小时 2 不重复抽样 二 成数的抽样平均误差 已证明得 成数的方差为p 1 p 某玻璃器皿厂某日生产15000只印花玻璃杯 现按重复抽样方式从中抽取150只进行质量检验 结果有147只合格 其余3只为不合格品 试求这批印花玻璃杯合格率 成数 的抽样平均误差 例 假定抽样单位数增加2倍 0 5倍时 采用重复抽样 抽样平均误差怎样变化 解 抽样单位数增加2倍 即为原来的3倍 则 抽样单位数增加0 5倍 即为原来的1 5倍 则 即 当样本单位数增加2倍时 抽样平均误差为原来的0 577倍 即 当样本单位数增加0 5倍时 抽样平均误差为原来的0 8165倍 练一 随机抽选某校学生100人 调查他们的体重 得到他们的平均体重为58公斤 标准差为10公斤 问抽样推断的平均误差是多少 练二 某厂生产一种新型灯泡共2000只 随机抽出400只作耐用时间试验 测试结果平均使用寿命为4800小时 样本标准差为300小时 求抽样推断的平均误差 练一解 即 当根据样本学生的平均体重估计全部学生的平均体重时 抽样平均误差为1公斤 练二解 计算结果表明 根据部分产品推断全部产品的平均使用寿命时 采用不重复抽样比重复抽样的平均误差要小 已知 则 已知 则 练三 某校随机抽选400名学生 发现戴眼镜的学生有80人 根据样本资料推断全部学生中戴眼镜的学生所占比重时 抽样误差为多大 练四 一批食品罐头共60000桶 随机抽查300桶 发现有6桶不合格 求合格品率的抽样平均误差 练三解 已知 则 样本成数 即 根据样本资料推断全部学生中戴眼镜的学生所占的比重时 推断的平均误差为2 练四解 已知 则 样本合格率 计算结果表明 不重复抽样的平均误差小于重复抽样 但是 N 的数值越大 则两种方法计算的抽样平均误差就越接近 四 抽样极限误差 含义 抽样极限误差指在进行抽样估计时 根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围 计算方法 它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值 抽样平均数极限误差 抽样成数极限误差 抽样极限误差 t t为概率度 当F t 68 27 时 抽样极限误差等于抽样平均误差的1倍 t 1 当F t 95 45 时 抽样极限误差等于抽样平均误差的2倍 t 2 当F t 99 73 时 抽样极限误差等于抽样平均误差的3倍 t 3 可见 抽样极限误差 即扩大或缩小了以后的抽样误差范围 总体参数优良估计的标准 无偏性 一致性 有效性 第三节抽样估计和推算 一 统计量选择的标准 二 抽样估计的方法 一 点估计 二 区间估计 是根据样本指标和抽样误差去推断全及指标的可能范围 它能说清楚估计的准确程度和把握程度 由于区间估计所表示的是一个可能的范围 而不是一个绝对可靠的范围 就是说 推断全及指标在这个范围内只有一定的把握程度 用数学的语言讲 就是有一定的概率 根据中心极限定理 得知当n足够大时 抽样总体为正态分布 根据正态分布规律可知 样本指标是以一定的概率落在某一特定的区间内 统计上把这个给定的区间叫抽样极限误差 也称置信区间 即在概率F t 的保证下 抽样极限误差 t t为概率度 1 全及平均数和全及成数的推断 某农场进行小麦产量的抽样调查 该农场小麦播种面积为10000亩 采用不重复的简单随机抽样从中选100亩作为样本 进行实割实测 得到样本的平均亩产量为400千克 样本标准差为12千克 则 某机械厂日产某种产品8000件 现采用纯随机重复抽样方式 从中抽取400件进行观察 其中有380件为一级品 试以概率95 45 的可靠程度推断全部产品的一级品率及一级品数量的范围 则 抽样一级品率 2 全及总体总量指标的推断 一 直接推断法 抽样平均数 成数 总体单位数 总体标志总量 1 如果采用点估计方法 上例1中 400 10000 400 万千克 如果用区间估计方法 上例1中该农场小麦总产量的范围为 t 2 397 62 402 38 10000 397 62 402 38 万千克 t 3 396 43 403 57 10000 396 43 403 57 万千克 2 上例2中 全部一级品数量的范围为 92 82 97 18 8000 7425 6 7774 4 件 二 修正系数法 就是用抽样所得的调查结果同有关资料对比的系数来修正全面统计资料时采用的一种方法 某村6000农户 2001年年末统计养猪头数 从下往上报的是9000头 现抽10 600户 的农户再复查一下 发现有漏报 也有重报 按600户 原来数字是890头 实际复查为935头 故总的来说 是少报 某市房地局 年报工资总额3218 1万元 现抽查14个单位 年报 415 03万元多报 0 44万元少报 1 47万元抵冲后1 47 0 44 1 03 万元 第四节抽样设计与组织实施 一 抽样组织方式 一 简单随机抽样 纯随机抽样 即从总体单位中不加任何分组 排队 完全随机地抽取调查单位 随机抽选可有各种不同的具体做法 如 1 直接抽选法 2 抽签法 3 随机数码表法 二 类型抽样 分类抽样 先对总体各单位按一定标志加以分类 层 然后再从各类 层 中按随机原则抽取样本 组成一个总的样本 类型的划分 一是必须有清楚的划类界限 二是必须知道各类中的单位数目和比例 三是分类型的数目不宜太多 类型抽样的好处是 样本代表性高 抽样误差小 抽样调查成本较低 如果抽样误差的要求相同的话则抽样数目可以减少 两种类型 1 等比例类型抽样 类型比例抽样 2 不等比例类型抽样 类型适宜抽样 类型抽样的抽样平均误差 某农场种小麦12000公顷 其中平原3600公顷 丘陵6000公顷 山地2400公顷 现用类型抽样法调查1200公顷 以各种麦田占全农场面积的比重分配抽样面积数量 麦田类型抽样的平均误差计算表 高产麦田比重的平均误差计算表 三 机械抽样 等距抽样 先将全及总体的所有单位按某一标志顺序排队 然后按相等的距离抽取样本单位 排列次序用的标志有两种 1 选择标志与抽样调查所研究内容无关 称无关标志排队 2 选择标志与抽样调查所研究的内容有关 称有关标志排队 机械抽样按样本单位抽选的方法不同 可分为三种 1 随机起点等距抽样 2 半距起点等距抽样 kkk k k为抽取间隔 示意图 3 对称等距抽样 示意图 kkk 2k a2k a4k a4k a a k k为抽取间隔 机械抽样的好处 1 可以使抽样过程大大简化 减轻抽样的工作量 2 如果用有关标志排队 还可以缩小抽样误差 提高抽样推断效果 机械抽样 实际上是一种特殊的类型抽样 因为 如果在类型抽样中 把总体划分为若干相等部分 每个部分只抽一个样本 在这种情况下 则类型抽样就成了机械抽样 六 机械抽样 等距抽样 的抽样平均误差 1 若按无关标志排队 公式用以上纯随机抽样的公式 一般采用不重复抽样公式 2 若按有关标志排队 公式用类型抽样的公式 四 整群抽样 整群抽样即从全及总体中成群地抽取样本单位 对抽中的群内的所有单位都进行观察 整群抽样的好处 组织工作比较简单方便 适用于一些特殊的研究对象 其不足之处是 一般比其它抽样方式的抽样误差大 整群抽样的抽样平均误差 整群抽样的抽样平均误差受三个因素影响 1 抽出的群数 r 多少 反比关系 2 群间方差 正比关系 计算方法如下 3 抽样方法 假如某一机器大量生产某一种零件 现每隔一小时抽取5分钟产品进行检验 用以检查产品的合格率 检查结果如下 五 多阶段抽样 即把抽样本单位的过程分为两个或几个阶段来进行 如果一次就直接抽选出具体样本单位 这叫单阶段抽样 具体讲 先抽大单位 可以用类型抽样或机械抽样 再在大单位中抽小单位 可用整群抽样或简单随机抽样 小单位中再抽更小的单位 而不是一次就直接抽取基层的调查单位 二 必要抽样数目的确定 一 影响必要抽样数目的因素 二 必要抽样数目的计算公式 建筑工地打土方工人4000人 需测定平均每人工作量 要求误差范围不超过0 2M3 并需有99 73 保证程度 根据过去资料 1 5 求样本数目应是多少 某金笔厂月产10000支金笔 以前多次抽样调查一等品率为90 现在要求误差范围在2 之内 可靠程度达95 45 问必须抽取多少单位数 练习题1 抽样推断中 如果获取的样本数据准确 那么 由此推断的总体指标也一定准确 2 允许误差越大 则抽样估计的可靠性就越小 3 在抽样调查中 抽样误差 A 可以避免B 可以避免也可以控制C 不可避免也无法控制D 不可避免但可以控制 4 反映抽样指标与总体指标之间抽样误差的可能范围是 A 抽样平均误差B 抽样极限误差C 概率度D 概率5 在重复的简单随机抽样中 当概率保证程度从68 27 提高到95 45 时 其他条

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论