




免费预览已结束,剩余66页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章抽样调查 知识点1 抽样及其相关概念 2 抽样的类型 3 概率抽样的基本原理 4 抽样的一般程序 5 简单随机抽样 系统抽样 分层抽样 整群抽样 多段抽样 PPS抽样 户内抽样的含义与特点 6 偶遇抽样 判断抽样 定额抽样 雪球抽样的含义与特点 7 样本规模的确定方法 8 影响抽样误差的因素 9 样本规模与抽样误差的关系 第四章抽样调查 抽样使我们能从总体具有代表性的部分样本中获取数据 从而可以得到关于整个总体的有效结论 英 托尼 普罗科特 第一节抽样的意义与作用 一 抽样调查的概念抽样调查就是从研究对象的总体中选择一部分代表加以调查研究 然后用所得的结果推论总体特征 从总体中选取部分代表的过程就是抽样 所选取的这一部分代表就称为样本 第一节抽样的意义与作用 二 抽样调查的特点抽样调查与普查相比具有如下特点 调查费用较低 速度快 应用范围广 可获得内容丰富的资料 准确性高 第一节抽样的意义与作用 三 抽样调查的理论依据抽样调查数据之所以能用来代表和推算总体 主要是因为抽样调查本身具有其它非全面调查所不具备的特点 主要是 1 调查样本是按随机的原则抽取的 在总体中每一个单位被抽取的机会是均等的 因此 能够保证被抽中的单位在总体中的均匀分布 不致出现倾向性误差 代表性强 2 是以抽取的全部样本单位作为一个 代表团 用整个 代表团 来代表总体 而不是用随意挑选的个别单位代表总体 第一节抽样的意义与作用 3 所抽选的调查样本数量 是根据调查误差的要求 经过科学的计算确定的 在调查样本的数量上有可靠的保证 4 抽样调查的误差 是在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算 并控制在允许范围以内 调查结果的准确程度较高 基于以上特点 抽样调查被公认为是非全面调查方法中用来推算和代表总体的最完善 最有科学根据的调查方法 第一节抽样的意义与作用 四 误差 与其它调查一样 抽样调查也会遇到调查的误差和偏误问题 通常抽样调查的误差有两种 一种是工作误差 也称登记误差或调查误差 一种是代表性误差 也称抽样误差 但是 抽样调查可以通过抽样设计 通过计算并采用一系列科学的方法 把代表性误差控制在允许的范围之内 另外 由于调查单位少 代表性强 所需调查人员少 工作误差比全面调查要小 特别是在总体包括的调查单位较多的情况下 抽样调查结果的准确性一般高于全面调查 第一节抽样的意义与作用 五 抽样的作用提供由部分认识总体的途径和手段例子 一勺汤 一滴血民意测验 1984美国总统选举P 59 第一节抽样的意义与作用 第二节概率抽样的原理与程序 一 抽样的基本术语总体 population 总体通常与构成它的元素 element 共同定义 总体是构成它的所有元素的集合 而元素则是构成总体的最基本单位 样本 Sample 样本就是从总体中按一定方式抽取出的一部分元素的集合 抽样 Sampling 指从组成某个总体的所有元素的集合中 按一定的方式选择或抽取一部分元素的过程 或者说抽样是从总体中按一定方式选择或抽取样本的过程 第二节概率抽样的原理与程序 抽样的基本术语抽样单位 SamplingUnit 就是一次直接的抽样所使用的基本单位 抽样框 SamplingFrame 也叫抽样范围是指一次抽样时总体中所有抽样单位的名单 参数值 Parameter 也称总体值 是关于总体中某一变量的综合描述 或者说是总体中所有元素的某种特征的综合数量表现 第二节概率抽样的原理与程序 抽样框就是所有总体单位的集合 是总体的数据目录或全部总体单位的名单 理想的完整抽样框应具备以下几个条件 1 包含尽可能多的样本单位 而且总体是清晰的 易确定的 2 所有样本单位出现在这一集合中的概率相等 3 有时可以按照一定原则方法进行人为的假定 第二节概率抽样的原理与程序 统计值 Statistic 也称为样本值 它是关于样本中某一变量的综合描述 统计值是从样本中计算出来的 它是相应的参数值的估计量 置信度 Confidencelevel 与置信区间 ConfidenceInterval 置信度也称为置信水平 它是指总体参数值 落在样本统计值某一区间内的概率 或者说是总体参数值落在样本统计值某一区间中的把握性程度 它反映的是抽样的可靠性程度 例子 P64 置信区间指的是样本统计值与总体参数值之间的误差范围 置信区间反映的是抽样的精确性程度 例如 设样本粮食平均亩产量为350公斤 又知抽样平均误差为6 25公斤 求总体粮食平均亩产量在345 355公斤之间的估计置信度是多少 根据公式 查 正态概率表 当t 0 8时 估计置信度 t 0 5662 即总体平均亩产量在345 355公斤之间的把握程度为56 62 现在将允许误差扩大到10公斤 即总体平均数在340 360公斤之间 则概率度为 查 正态概率表 当t 1 6时 估计置信度t 0 8904时即总体平均亩产量在340 360公斤之间的把握程度为89 04 如上例粮食平均亩产 也可以作如下区间估计 即以89 04 的概率保证 总体平均亩产在340 360公斤之间 估计置信度 89 04 显著水平 1 89 04 10 96 它表示总体平均亩产落在340 360公斤区间内有89 04 的把握程度 概率 而不落在这个区间内的概率为10 96 因此作上述区间估计就必须冒不超过10 96 概率的失败风险 显著水平正是判别估计可信不可信的一个标准 当你不愿意冒这样大的风险时 可以缩小显著水平 扩大置信区间 但是估计的准确程度降低了 由此可见 总体参数的区间估计必须同时具备估计值 抽样误差范围和概率保证程度三个要素 抽样误差范围决定估计的准确性 而概率保证程度中决定估计的可靠性 第二节概率抽样的原理与程序 第二节概率抽样的原理与程序 二 抽样类型抽样方法 1 概率抽样 简单随机抽样 系统抽样 分层抽样 整群抽样 多段抽样2 非概率抽样 偶遇抽样 判断抽样 定额抽样 雪球抽样 第二节概率抽样的原理与程序 三 抽样原理根据总体各个单位标志值计算出来的综合指标称为总体指标 用X表示 它是我们想知道的对象特征的数量反映 常用的指标主要用平均数 X 和成数 P 来表示 第二节概率抽样的原理与程序 或 P为成数 并且分别为两种表现的总体单位数 并且 第二节概率抽样的原理与程序 总体方差和均方差总体方差和均方差是用来说明总体指标变异程度的指标 方差与均方差的关系是平方和开平方的关系 可分别计算平均数与成数的方差和标准差 总体平均数方差和均方差的计算公式为 第二节概率抽样的原理与程序 例子 第二节概率抽样的原理与程序 三 抽样的基本程序界定总体 确定抽样框 设计和选取样本 对样本进行评估等步骤P65界定总体的重要性 例如 1936年总统选举 文摘杂志确定总体1000万份 回收200万份 依此预测共和党人兰登领先15 胜出 结果却是 民主党人罗斯福胜出 超20 原因 没有确立好总体 而是求方便用的是电话号码簿上的人作调查对象 那些没有电话号码的人被排除在外了 第二节概率抽样的原理与程序 确定抽样框 确立总体后 收集总体中全部抽样单位的名单 有两种确立方法 一是全选法 一个不能漏 如大学生社会实习调查 选定总体为全日制大学在校本科生与研究生 就要从各院系花名册中统一编号 另一种是分层次的样本框 如调查一个城市小学生的学习状况 全市500小学 选10所 再从10所中每个学校选3个班 最后每个班选10名学生 第二节概率抽样的原理与程序 决定抽样方案 第三节概率抽样的方法 一 简单概率抽样又称为纯随机抽样 它是最基本的概率抽样 对总体中的所有个体按完全符合随机原则的特定方法抽取样本 即抽样时不进行任何分组 排列 总体中每个个体都同样有被抽取的平等机会 二 等距抽样将总体中的所有个体按一定顺序排列起来 计算抽样距离 用完全随机的办法抽取个体 三 分层随机抽样四 整群随机抽样 第三节概率抽样的方法 第三节概率抽样的方法 简单随机抽样就是总体中的第一个单位在抽取时都有相同的被抽中机会 其概率公式为 抽样概率 样本单位数n 总体单位数N一般应用于调查总体中各个体之间差异程度较小 或者调查总体数量不太多的情况 第三节概率抽样的方法 1 简单随机抽样方法常用的有 1 抽签法 先将调查总体的每个个体编上号码 然后将号码写在卡片上搅拌均匀 任意从中选取 抽到一个号码 就对上一个个体 直到抽足预先规定的样本数目为止 此方法适用于调查总体中的个体数目较少的情况 2 随机数表法 随机数表法也称为乱数表法 是指含有一系列级别的随机数字的表格 一般利用特制的摇码设备摇出随机数字 也可以用电子设备自动产生随机数字 第三节概率抽样的方法 2 分层抽样 资料整理一章介绍 将总体按期属性不同划分为若干层次 或类型 然后在个层次 或类型 中随机抽取样本的技术 例如 常见分析标志为年龄 收入 职业等 其实质是科学分组与抽样原理的结合 按学生人数分组按工资分组50 59400 50060 69500 60070 79600 70080 89700 800分层抽样的方式一般有等比例抽样与非等比例抽样两种 分层抽样优点 数量一定的情况下保持同质性 减少误差 便于了解不同层次 如城乡妇女社会调查 第三节概率抽样的方法 等比例分层抽样 等比例分层抽样是按各层 或各类型 中的个体数量占总体数量的比例分配各层的样本数量 其表达式为 或 非等比例分层抽样是根据其它因素 如各层平均数或成数均方差的大小 抽取样本的工作量和费用大小 第三节概率抽样的方法 3 整群抽样技术也称为分群抽样技术 它是指当总体所在基本单位自然组合为或被划分为若干个群后 从中随机抽取部分群的方法 分群抽样的特点 A 以群为单位进行抽取 对样本的均匀性有较大影响 B 与其他随机抽样技术相比 抽样误差较大 代表性较低 常通过多抽取样本来弥补不足 整群抽样例子 大学有100个班 每班30人 现在抽300人 怎么抽样 抽10个班 某城市10万户 要抽取1000户 怎么办 社区200个 社区户数500 选2个社区 第三节概率抽样的方法 4 系统抽样也称为等距离抽样 常作为简单随机抽样的补充方法使用 先按一定标志把总体中的个体顺序排列 确定一个抽样间隔 其公式如下 抽样间隔 总体单位数 样本单位数按计算得到的抽样间隔继续抽取以后的个体 直至到规定的样本容量数 系统抽样例子 某校3000名新生中抽取100名样本 3000 100 30每隔30人取1名 起始值是2号 下一个就是32号 依次类推 5 多段抽样 按隶属关系分多个阶段抽样 如企业青年生活状况调查 要1000个青年样本 找20个企业每个50个青年 6 PPS抽样P79 7 户内抽样 kish法 每户抽取一个成年人 或者2个 第四节非概率抽样方法 采用非随机抽样的条件 受客观条件的限制 无法进行严格的随机抽样 为了快速得到调查的结果 调查对象不确定或其总体规模无法确定 调查人员比较熟悉调查对象 且有较丰富的经验 据此快速推断 做到快 准 省 一 偶遇抽样二 主观抽样三 定额抽样四 滚雪球抽样 第四节非概率抽样方法 1 偶遇抽样 是根据调查者的方便与否来抽取样本的一种抽样方法 也称为方便抽样 偶遇抽样的优点是 对于调查条件要求低 难度小 简便易行 接受访问的成功率较高 容易得到受访者的配合 省时省力 且对访问的进度容易控制 偶遇抽样的不足之处 没有概率论作为理论基础 所以无法推断总体 且代表性差 偶然性强 第四节非概率抽样方法 2 主观抽样判断抽样也称为目的抽样 主要凭借调查者的主观意愿 经验和知识 从总体中选取具有代表性的个体样本作为调查对象的抽样方法 要求调查者对总体的有关特征有相当程度的了解 用于 典型调查 选择最能代表普遍情况的调查对象 常以 平均型 和 多数型 为标准 如了解一国的民风 应该入乡随俗 和当地最普通的人生活一段时间 重点调查 对那些占被调查总体内较重要的个体进行抽取调查 如调查消费者满意度时 对大客户或在贵宾进行调查 第四节非概率抽样方法 3 定额抽样所谓配额就是指对划分出来的各种类型的子总体分配一定数量的样本 从而组成调查样本 独立控制配额抽样 根据调查总体的特性对某个特性调查样本单独分配额 交叉控制配额抽样 任何一个配额者会受到两个以上的控制属性的影响 定额抽样例子2000名大学生 男生60 女生40 文理科各50 年级比例 40 30 20 10 要抽一个100人样本 怎么抽样 男生60人 女生40人 第四节非概率抽样方法 4 滚雪球抽样也称推荐抽样 是一种在总体单位数不多且分布分散的总体中抽样的方法 例如在参加某次会的成员中抽样 不科学的抽样例子 第五节样本规模与抽样误差 一 抽样误差抽样误差就是用样本值去估计总体值时所出现的误差在抽样调查中 误差的来源有多种主要可分为两类 调查误差 代表性误差 1 影响抽样误差的因素主要有 样本单位数 总体各单位之间的差异程度 抽样方式 第五节样本规模与抽样误差 2 抽样误差的计算简单随机抽样误差的计算抽样误差就是按照随机原则抽样时 抽得的样本指标与总体指标的实际差数 如 样本平均值与总体平均值之差 或样本成数与总体成数之差 抽样误差越大 样本代表性越低 因此 应该尽量降低抽样误差 第五节样本规模与抽样误差 3 样本规模样本规模也称为样本容量 它指的是样本中所含个案的多少 确定样本规模也是每一项具体的社会研究所必须解决的问题之一 1 重复抽样条件下 计算公式为 其中 为极限抽样误差 t为概率度 p88 例子 某企业对一批产品进行质量检验 这批产品的总数为5000件 过去几次同类调查所得的产品合格率为93 95 和96 为了使合格率的允许误差不超过3 在99 73 的概率下应抽查多少件产品 P 93 p 1 p 0 93 1 0 93 0 0651 第五节样本规模与抽样误差 3 3 不重复抽样条件下的计算公式为 其中 为极限抽样误差 t为概率度 例子 工厂生产一种新型灯泡5000只 随机抽取100只作耐用时间试验 测试结果 平均寿命为4500小时 标准差为300小时 试在90 的概率保证下 估计该新式灯泡平均寿命的区间 假定概率保证程度提高到95 允许误差缩小一半 试问应抽取多少只灯泡进行测试 抽样估计常用参数对照表 重复抽样和不重复抽样重复抽样也称回置抽样 它是指每次抽取一个样本登记后在放回总体中参加下一次抽取 也就是说每一个样本单位都有被重复抽取的可能 从总体N个单位中 用重复抽样的方法 随机n个单位构成一个样本则共可抽取Nn个样本 例如 总体有A B C D四个单位 要从中以重复抽样的方法抽取两个单位构成样本 先从四个单位中取1个 有四种取法 结果登记后再放回 然后再从四个单位中取1个 也有四种取法 前后取两个构成样本 全部可能抽取的样本数目为4 4 16个 不重复抽样也称不回置抽样 它是指每次抽取一个样本登记后不放回总体中参加下一次抽取 也就是说每一个样本单位只有一次被抽取的可能 从总体N个单位中 用不重复抽样的方法 随机抽取n个单位构成一个样本则共可抽取N N 1 N 2 N N 1 个样本 例如 总体有A B C D四个单位 要从中以不重复抽样的方法抽取两个单位构成样本 先从四个单位中取1个 有四种取法 然后再从三个单位中取1个 有3种取法 前后取两个构成样本 全部可能抽取的样本为4 3 12个 第五节样本规模与抽样误差 抽样平均误差 抽样平均误差是映抽样误差一般水平的指标 抽样平均误差是抽样平均数或抽样成数的标准差 抽样平均数 或成数 的标准差是按抽样平均数 或成数 与其全及总体平均数 或成数 离差平方和计算的 但是由于抽样平均数的平均数等于总体平均数 而抽样成数的平均数等于总体成数 抽样指标的标准差恰好反映了抽样指标和总体指标的平均离差程度 抽样平均数的平均误差 一 在重复抽样条件下 抽样平均误差和总体的变异程度以及样本容量大小两个因素有关 它们的具体关系如下 从这一公式可以看出 抽样平均误差的大小和总体标准差成正比变化 和样本单位数的平方根成反比 二 在不重复抽样的条件下 抽样平均数的平均误差不但和总体变异程度 样本容量有关 而且还要考虑总体单位数的多少 它们的关系如下 已知总体方差为1000元 总体单位数为4个 样本单位数为2个 用不重复抽样的方法计算抽样平均误差 二 抽样成数的平均误差 抽样成数的平均误差表明各样本成数和总体成数绝对离差的一般水平 由于总体成数可以表现为总体是非标志的 0 1 分布的平均数 而且它的方差也可以从总体成数推算出来 即 P与P 1 P 因此容易从抽样平均数的抽样平均误差和总体标准差的关系推算出来 一 在重复抽样条件下 二 在不重复抽样条件下 要估计某地区10000名儿童的入学率 随机抽取400名 检查有320名儿童入学 求抽样入学率的平均误差 根据已知条件 1 在重复抽样条件下 2 在不重复抽样条件下 抽样极限误差 抽样极限误差 抽样允许误差 是从另一个角度考虑抽样误差问题 以样本的抽样指标来估计总体指标 要达到完全准确毫无误差 这几乎是不可能的 所以 在估计总体指标的同时就必须考虑估计误差的大小 我们不希望误差太大 误差愈大样本的价值愈小 但也不是误差愈小愈好 因为在一定限度之后减少抽样误差势必增加很多费用 所以 在作抽样估计时 应该根据所研究的变异程度和分析任务的要求确定可允许误差的范围 在这个范围内的数字都算是有效的 我们把可允许的误差范围称为抽样极限误差 它等于样本指标可允许变动的上限与下限与总体指标之差的绝对值 设 X P分别表示抽样平均数极限误差和抽样成数极限误差 则有 上式都表示样本平均数和样本成数可允许的上限或下限数值 容易将上面的等式变换为下列等价的不等式
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年乡镇环保工作成效评价与考核标准
- 2025年互联网大厂产品经理面试秘籍面试预测题与实战指南
- 抢救车内管理课件
- 2025年旅行社服务合作协议书
- 2025年旋挖钻机项目合作计划书
- 2025年飞机维修船坞项目建议书
- 2025年低噪声对旋式局部通风机项目建议书
- 抗癫痫与抗惊厥药课件
- 抗生素使用相关课件
- 2023年山东省滨州市经开区中考语文三模试卷(含答案)
- 《高一数学开学第一课:学好高中数学》课件
- 五年级美术 《感受漫画造型》 公开课比赛一等奖
- 管理学基础(第3版)全套教学课件
- 红帽认证管理员RHCSA(习题卷1)
- 2021地质灾害治理工程施工质量验收规范
- 煤矿重大危险源的辨识与控制课件
- 劳务服务施工组织方案
- 08878动漫产业概论模拟试题答案
- 电子水准仪二等水准测量记录表
- 《水声学原理》8.1.1噪声和混响背景下信号的检测 - 噪声和混响背景下信号的检测
- 郭锡良《古代汉语》课件
评论
0/150
提交评论