抽样调查意义及方法PPT课件.ppt_第1页
抽样调查意义及方法PPT课件.ppt_第2页
抽样调查意义及方法PPT课件.ppt_第3页
抽样调查意义及方法PPT课件.ppt_第4页
抽样调查意义及方法PPT课件.ppt_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样调查 2020 3 19 1 知识点回顾 2020 3 19 2 最常用的是 抽样调查 民意调查 美国总统选举市场调查 企业新开发产品市场调查收视率调查 港台节目收视xx点农产量 贸易 住户调查 劳动力 工业企业抽样调查 2020 3 19 3 在这一章 我们将学习 什么是抽样调查 如何用抽样调查的样本数据推断总体 抽样调查的组织方式有哪些 2020 3 19 4 第一节抽样调查与抽样推断的相关概念 一 抽样调查与抽样推断 抽样调查 是一种科学的非全面调查 它是按照随机原则从调查对象的总体中抽取部分单位进行调查 并根据这部分单位的调查结果推断总体的数量特征 2020 3 19 5 抽样推断 广义上的抽样调查其实已包含了抽样推断 它是在按照随机原则从调查对象的总体中抽取部分单位进行抽样调查的基础上 根据这部分单位的调查结果推断总体的数量特征的一种由局部推导全局的统计分析方法 2020 3 19 6 全及总体TotalPopulation 就是统计总体 是为了与样本相区别而提出的 全及总体的容量 单位数 用N表示 全及总体也称为母体 抽样总体 简称样本 SamplingPopulation 又称样本总体 是抽取出来的子样组成的总体 抽样总体的单位数用n表示 二 全及总体和抽样总体 总体和样本 2020 3 19 7 三 总体指标和样本指标 参数和统计量 总体指标 全及总体的那些指标 也称总体参数或母体参数 其值唯一 总体指标有 2020 3 19 8 样本指标 抽样总体的那些指标 也称样本统计量 为随机变量 样本指标有 2020 3 19 9 四 重复抽样和不重复抽样 重置抽样和不重置抽样 重复抽样 也称为重置抽样 是指按照随机原则 抽取一个登记后 放回去再按随机原则再抽的抽样方法 不重复抽样 也称为不重置抽样 是指抽取出总体单位后 不再放回去 对剩下的总体单位继续按随机原则进行抽样的方法 以抽取号码球为例 1 2 3 4 5 6号球 放在暗箱里面作随机抽取 2020 3 19 10 五 有序抽样和无序抽样 有序抽样 指每次抽样的先后要进行排序的抽样方法 有有序重复抽样和有序不重复抽样 无序抽样 指每次抽样的先后不进行排序的抽样方法 有无序重复抽样和无序不重复抽样 以抽取号码球为例 1 2 3 4 5 6号球 放在暗箱里面作随机抽取 2020 3 19 11 六 样本容量和样本个数 样本容量 是指一个样本所包含的单位数 用n表示 n 30大样本n 30小样本 样本个数 是指一个总体可能抽取的样本个数 根据抽样方法的不同 同样的总体所可能抽取的样本个数是不同的 2020 3 19 12 最为出名 盖洛普民意调查以其准确性和权威性在世界各地享有极高的声誉盖洛普民调 奥巴马50 对42 的支持率领先麦凯恩CNN民调 奥巴马50 对43 的支持率领先麦凯恩 案例1 民意调查 2020 3 19 13 出口民调 出口民调 是私营调查机构在投票站出口处对刚刚走出投票站的选民进行的一项调查 通过直接询问选民投给谁来预估选举结果 2020 3 19 14 收视率是指 收视人数除以整个市场电视人口数的百分比 如 收视率2 意味着100个人中有2个人收看 收视率影响广告商愿意花多少钱来买某节目的广告 以及该节目播不播下去 案例2 电视收视率调查 2020 3 19 15 收视率在中国 央视 索福瑞公司AGB尼尔森公司 2020 3 19 16 尼尔森公司2008春晚收视率调查 总体 4 24亿收视人群样本 全国14省市14 000户家庭 装有个人收视记录仪 标志 某一时段是否在看春晚节目指标 全国家庭收视率71 8 央视 索福瑞调查结果春晚收视率为96 5 2020 3 19 17 央视 索福瑞CSM公司 CSM在全国建立了9个省网 67个单独城市调查站 样本总规模达到18 500户2008年春晚播出时 对全国406个区县进行了3个多小时的电话调查 共访问成功2063个家庭 其中1899个家庭收看了春晚 推算出全国有96 5 的家庭收看了央视春晚 2020 3 19 18 北京奥运会开幕式收视率 央视 索福瑞 68 8 家庭AGB尼尔森 86 8 家庭 2020 3 19 19 第二节抽样误差 一 抽样误差 抽样误差即指随机误差 是抽样中由于随机的原因 使样本各单位结构不足以代表总体各单位的结构 而引起抽样指标和全及指标之间的绝对离差 这种误差是抽样调查固有的误差 是无法避免的 但是可以控制的 2020 3 19 20 样本结构不足以代表总体各单位的结构产生误差的案例 对1000名大学生的年龄分别进行抽样调查 随机抽取50名学生作为样本 可抽取无数个样本 我们以样本一和样本二作为代表来进行分析 2020 3 19 21 分析 从上例可以看出 1 总体的平均数 年龄 为18 3岁 2 样本一的结构与总体结构完全一致 故样本一的平均数 年龄 也为18 3岁 3 样本二的结构与总体结构相差很大 所以平均数 年龄 的差异也很大 为18 26岁 结论 在大多数情况下 由于随机原则 样本结构不可能与总体结构一致 因此存在误差是必然的 不可能消灭 但可以控制 2020 3 19 22 二 影响抽样误差的因素 1 母体 总体 各标志值的变异程度 两者成正比 如果母体 总体 标准值没有差异 则也就没有抽样误差 2 样本容量n 反比关系 样本越大 误差越小3 不同的抽样方法 重复抽样 不重复抽样 4 不同的抽样组织形式 是等距抽样还是整群抽样 还是分层抽样或其它形式都会有影响 2020 3 19 23 三 抽样平均误差 计算抽样平均误差的意义 由于抽样是随机的 因此样本也是随机的 因此样本指标的计算结果也是随机的 唯一确定的是母体参数值 而母体参数值我们往往是不知道的 因此只能用样本指标来估计 但没有任何一个样本的指标代表的是总体的真实参数 所以只能把所有的样本的指标平均来近似反映 这就产生了抽样平均误差的概念 2020 3 19 24 三 抽样平均误差 抽样平均误差的定义 是反映各样本的抽样误差一般水平的指标 实质上是抽样指标 平均数或成数 的标准差 抽样平均误差计算的理论公式 M是样本个数 一般使用计算软件计算 2020 3 19 25 注 1 抽样误差实质上就是抽样指标的标准差 2 一般情况下 除非特别指明 抽样误差就是指的抽样平均误差 3 上面这些公式只是定义的理论公式 我们实际计算中一般不用这些公式 2020 3 19 26 三 随机抽样的具体方法 所谓随机抽样又叫概率抽样 是指以概率原理为基础 按随机原则抽取样本的抽样方法 随机抽样的具体方法 主要有下列几种 一 简单随机抽样 有直接抽样 抽签法或抓阄法 随机数表法 二 等距随机抽样 三 类型随机抽样 四 整群随机抽样 五 多段随机抽样 2020 3 19 27 三 随机抽样的具体方法 一 简单随机抽样 又称纯随机抽样 即对总体单位不进行任何组合 仅按随机原则直接抽取样本 1 直接抽样法2 抽签法或抓阄法3 随机数字表法 2020 3 19 28 图1简单随机抽样 2020 3 19 29 三 随机抽样的具体方法 一 简单随机抽样简单随机抽样的优 缺点 优点 在抽样中完全排除了主观因素的干扰 最符合随机原则 众多抽样方法中最简单 操作方法最容易理解缺点 1 简单随机抽样需要把总体中每一个体编上号码 如果总体很大 这种编号几乎是不可能的 故它只适用于单位数量不多的调查对象 2 这种抽样方法常常忽略总体已有的信息 降低了样本的代表性 如 对某一地区的学生进行抽样 测试该地区学生的智力水平 重点学校与一般学校的学生是有差异的 如果不考虑这个因素 则所抽取的样本很可能重点学校的学生多些 或根本没有重点学校的学生 这样样本的代表性是不理想的 若充分考虑并利用重点与一般存在差异这一已有信息 可以设计出更好的抽样方法 见后面的分层随机抽样 3 抽取的样本可能比较分散或过分集中 这将给实际调查工作带来许多困难 2020 3 19 30 三 随机抽样的具体方法 二 等距随机抽样 也叫机械随机抽样或系统随机抽样 随机 等距 它是先将总体各单位按一定标志顺序排列 编上号 然后用总体单位数除以样本单位数 求得抽样间隔 并在第一个抽样间隔内随机抽取一个单位作为第一个样本单位 最后按抽样间隔做等距抽样 直到抽取最后一个样本单位为止 例 2020 3 19 31 图2随机起始的等距抽样 2020 3 19 32 三 随机抽样的具体方法 二 等距随机抽样优点 样本在总体中的分布比较均匀 具有较高的代表性 抽样误差小于简单随机抽样 而且比较简单易行 只要确定了第一个样本单位 整个样本也就确定了 更适合大样本的使用 样本分布比较分散缺点 调查总体的单位不能太多 而且要有完整的登记注册 否则难以进行 但是 如果总体具有某一种周期性变化 则等距抽样的代表性远不如简单随机抽样 另外 等距抽样同简单抽样一样也容易忽略已有信息 2020 3 19 33 三 随机抽样的具体方法 三 类型随机抽样 又称分层随机抽样 具体做法是按照总体已有的基本特征 将总体分成几个不同的部分 每一部分叫一层 然后 根据各类型 或层次 所包含的抽样单位数与总体单位数的比例 确定从各类型中抽取样本单位的数量 最后 再分别在每一部分中随机抽样例 要了解某市800个私营企业的生产经营情况 决定分类抽取100个作为样本进行调查 首先分类 第一产业80个 占10 第二产业320个 占40 第三产业400个 占50 2020 3 19 34 三 随机抽样的具体方法 三 类型随机抽样需要分层的情况 总体的不同部分 层 之间有明显差异时 调查结果中要求有各个子总体的各自结果时 总体中大部分的差异不大 但极个别的局部与其它部分差异很大时 将这个别的局部单独作为一个层 2020 3 19 35 三 随机抽样的具体方法 类型随机抽样的评价 优点 比简单随机抽样更精确适用于总体单位数量较多 单位之间差异较大的调查对象便于管理与实施控制缺点 必须对总体各单位的情况有较多的了解 否则无法科学分类 抽样难度加大 选择正确的分层标准很重要 2020 3 19 36 三 随机抽样的具体方法 四 整群随机抽样又叫聚类随机抽样或集体随机抽样 先将总体各单位按一定标准分成许多群体 并将每一个群体看作一个抽样单位 然后 按照随机原则从这些群体中抽出若干群体作为样本 最后对样本群体中的每个单位逐个进行调查 例 某中学有1200个学生 分为6个年级24个班 采取整群随机抽样方法调查该校学生健康状况 随机抽六个班调查 2020 3 19 37 三 随机抽样的具体方法 四 整群随机抽样优点 样本单位比较集中 调查动作比较方便 可以节省人力 物力 财力和时间 缺点 样本分布不均匀 代表性差 与上述几种抽样方法相比较 在样本数量相同的情况下抽样误差较大 2020 3 19 38 三 随机抽样的具体方法 四 整群随机抽样 2020 3 19 39 三 随机抽样的具体方法 五 多段随机抽样又称多级随机抽样或分段随机抽样 就是把从总体中抽取样本的过程分成两个或两个以上阶段进行的抽样方法 方法第一步 先将总体各单位按一定标志分成若干群体 作为抽样的第1级单位 然后将第1级单位又分成若干小群体 作为抽样的第2级单位 以此类推 还可以分为第3级 第4级单位 第二步 依随机原则 先在第1级单位中抽出若干群体作为第1级样本 然后再在第1级样本中抽出第2级样本 以此类推 还可以抽出第3级样本 第4级样本 第三步 对最后抽出的样本单位逐个进行调查 例 见书 2020 3 19 40 三 随机抽样的具体方法 五 多段随机抽样例 假定某县有 个乡镇 平均每个乡镇有 个行政村 每个行政村有 个自然村 每个自然村有 户 这样全县共有 个行政村 个自然村 万户 现在决定采用随机抽样方法对该县计划生育状况按户做 的抽样调查 共抽取样本 户 2020 3 19 41 三 随机抽样的具体方法 五 多段随机抽样首先 确定抽样单位 根据该县社会组织的 个层次 即乡镇 行政村 自然村 和户 应采取 段随机抽样方法抽取样本 并确定乡镇为第一级单位 行政村为第二级单位 自然村为第三级单位 户为第四级单位 然后采取不同的抽样方法 分四阶段逐步抽取样本 2020 3 19 42 三 随机抽样的具体方法 五 多段随机抽样一段抽样 从县抽乡镇 个乡镇经济发展较好的 个 一般的 个 较差的 个 确定样本数量 一级单位抽 的单位即 个乡镇 较好 个一般的 个较差的 个 2020 3 19 43 三 随机抽样的具体方法 五 多段随机抽样二段抽样 从乡镇抽行政村 采用等距 个乡镇 个行政村 抽 即 个行政村 2020 3 19 44 三 随机抽样的具体方法 五 多段随机抽样三段抽样 从行政村到自然村 整

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论