




已阅读5页,还剩87页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章抽样调查 本章介绍在一定的概率保证程度下 从数量上用样本指标推断总体指标的统计方法 重点掌握简单随机抽样方式下 抽样平均误差计算 抽样单位数目确定和区间估计的方法 教学目的与要求 第一节抽样调查的基本问题 一 抽样调查的概念1 定义 广义 即非全面调查 指从研究的总体中按一定的原则抽取部分单位作为样本 进行观察研究 以认识总体的一种统计调查方法 狭义 指从研究的总体中按随机原则抽取部分单位作为样本 进行观察研究 并根据这部分单位的调查结果去推断总体 以达到认识总体的一种统计调查方法 特点 它是由部分推断总体的一种认识方法 抽样推断建立在随机取样的基础上 用样本的指标数值推断总体的指标数值 抽样推断的误差可以事先计算并加以控制 二 抽样调查的特点 三 抽样调查的作用1 可用于不可能进行全面调查的总体数量特征的推断 主要有三种情况 1 无限总体 不能进行全面调查 2 理论上可以进行全面调查实际上办不到 3 没有必要进行全面调查2 可以验证和补充全面调查资料3 可用于工业生产过程中质量的检查和控制 四 抽样推断的有关概念 一 全及总体和抽样总体1 全及总体 总体N 所要认识对象的全体 1 有限总体 2 无限总体2 抽样总体 样本n 所抽取的一部分单位 1 大样本 n 30 2 小样本 n 30 二 全极指标和样本指标 全及指标 指反映总体数量特征的综合指标 即参数 参数 研究总体中的数量标志 总体平均数 总体方差 研究总体中的品质标志 成数平均数 成数方差 样本指标 根据样本数据计算的综合指标 即统计量 研究数量标志 样本平均数 样本标准差 研究品质标质 成数平均数 成数标准差 五 抽样方法 一 按抽取样本单位的方法不同1 重复抽样2 不重复抽样 二 根据对样本的要求不同1 考虑顺序的抽样AB BA2 不考虑顺序的抽样AB BA 三 样本可能数目的确定指从一个总体中可能抽取的样本个数 1 考虑顺序的不重复抽样2 考虑顺序的重复抽样3 不考虑顺序的不重复抽样4 不考虑顺序的重复抽样 例 盒子里装有编号为 的三个球 随机抽取两个球 则样本可能数目为 1 考虑顺序的不重复抽样为 2 考虑顺序的重复抽样 3 不考虑顺序的不重复抽样 4 不考虑顺序的重复抽样 六 抽样调查的理论基础 是以概率论为基础的 其中最主要的理论基础是概率分布理论 1 总体均值的推断 统计推断是以正态分布为基础的 1 若总体方差已知 其统计推断以正态分布为基础的 2 若总体方差未知 在大样本条件下 其统计推断以正态分布为基础的 在小样本条件下 其统计推断以t分布为基础的 2 总体方差的推断 当总体均值未知时 统计推断是以分布为理论基础3 两个总体均值差的推断 以正态分布为基础4 两个总体方差比的推断 以F分布为基础5 成数的推断 以正态分布为基础 第二节抽样误差 统计误差包括 工作误差和代表性误差系统性误差 没有按随机原则而形成随机性误差 不可避免的 代表性误差 抽样误差 指按随机原则抽样时 在没有登记误差和系统性误差的条件下 单纯由于不同的随机样本指标代表全及指标而产生的误差 一 抽样实际误差 指一次抽样中 由随机因素引起的样本指标与全及指标之间的离差 二 抽样平均误差 一 定义 所有抽样实际误差的平均数 即样本平均数 或样本成数 的标准差 它反映了所有抽样结果所得的样本指标与全及指标的平均离差 二 计算 1 理论公式 根据定义可得 用公式表示 M表示样本可能数目 注意 这个公式反映了抽样平均误差的实质 但无法实际运用 原因是 1 全及平均数未知 公式无法计算 2 每次抽样不可能将全部可能样本抽出来调查 想一想 为什么 1 简单随机抽样 1 概念 是对总体单位不作任何分类或排队 完全按随机原则逐个地抽取样本单位 2 抽样平均误差的计算公式 平均数的抽样平均误差 重复 不重复 当总体单位数N很大时 公式中的N 1可以用N代替 在不重复抽样的条件下 2 实际运用公式 成数的抽样平均误差计算公式 公式中总体方差为未知的 可用下列方法解决 用样本方差代替总体方差 用过去的资料代替 若有几个不同的方差资料 应选用数值较大者 若成数方差未知可取p 0 5 此时其方差最大 或选最接近0 5的 注意 解 即当根据样本学生的平均体重估计全部学生的平均体重时 抽样平均误差为1公斤 已知 则 例题 1 随机重复抽选某校学生100人 调查他们的体重得到平均体重为58公斤 标准差为10公斤 问抽样推断的平均误差是多少 解 已知 则 2 某厂生产一种新型灯泡共20000只 随机抽出400只作耐用时间试验 测试结果平均使用寿命为4800小时 样本标准差为300小时 求抽样推断的平均误差 解 已知 则 样本成数 3 某校随机抽选400名学生 发现戴眼镜的学生有80人 根据样本资料推断全部学生中戴眼镜的学生所占比重时 抽样平均误差为多大 练习 某冷库厂从一批冻鸡中抽取样本 测得平均每只重1200克 标准差70克 如果重复随机抽取100只和200只 分别计算抽样平均误差 本次抽样测得冻鸡合格率为97 如果重复随机抽取100只和200只 分别计算抽样平均误差 抽样平均误差的影响因素 1 总体差异程度的大小 总体差异程度越大 抽样平均误差也大 2 样本容量的大小 在其他条件相同的情况下 n越大 抽样平均误差越小 反之则越为大 3 抽样方法的不同 4 抽样的组织形式 例题 假定抽样单位数增加2倍 抽样平均误差怎样变化 解 抽样单位数增加2倍 即为原来的3倍 则 即 当样本单位数增加2倍时 抽样平均误差为原来的0 577倍 练习 假定抽样单位数增加3倍和减少一半 问纯随机抽样误差如何变化 练习32 解 计算列表如下 样本平均数 97000 100 970 小时 样本方差 1360000 100 13600 小时 平均数抽样平均误差 11 66 小时 2 样本合格率 p 15 35 25 15 100 90 成数抽样平均误差 0 03 三 抽样极限误差 含义 指在进行抽样估计时 样本指标与总体指标之间可允许的最大误差范围 抽样平均数极限误差 抽样成数极限误差 基于理论上的要求 抽样极限误差需要用抽样平均误差为标准单位来衡量 抽样极限误差也可以表示为抽样平均误差的若干倍 于是有计算公式 四 置信度与置信区间 把极限误差 x或 p相应除以或 得出相对的误差程度t倍 t称为抽样误差的概率度 即 和 一般地 在抽样平均误差为一定的条件下 当概率度t的值越大 则抽样误差范围 越大 估计总体平均数或成数包含在相应的区间范围内的概率越大 从而抽样估计的可靠程度也就越高 反之亦然 如果把可靠程度即概率用p表示 概率度t的大小决定p的大小 即p是t的函数 为了方便计算 在实际工作中 按不同的t值和相应的概率编成正态分布概率表供查用 常用的有 置信度F t 指总体指标落在某个区间的概率保证程度 概率度和置信度的函数关系 置信区间 以一定的概率保证程度确定总体指标所在的区间 分为置信下限和置信上限 置信区间为 第三节抽样估计 一 估计量的优良标准二 抽样估计的方法 一 点估计 二 区间估计1 平均数的区间估计2 成数的区间估计三 抽样调查的组织方式 一 估计量的优良标准 一 无偏性1 概念 如果样本统计量的期望值等于该统计量所估计的总体参数 这个估计量叫无偏估计量 2 结论 样本平均数是总体平均数的无偏估计量样本成数是总体成数的无偏估计量样本方差是总体方差的有偏估计量 二 有效性 有两个无偏估计量 如果哪个估计量与总体参数间的平均离差小 这个估计量更有效 三 一致性 随着样本容量的增大 估计量与被估参数的偏差越来越小 二 抽样估计的方法 一 点估计 利用样本指标值直接作为总体参数的估计值 二 区间估计1 概念 根据抽样指标和抽样误差结合一定的可靠程度推断总体指标所在的范围 2 区间估计的必备要素 1 抽样样本指标 估计值 2 抽样误差 3 置信概率 置信度 3 区间估计的步骤 1 计算样本资料求出样本指标 2 计算抽样平均误差 3 根据F t 查表确定t 4 计算极限误差 5 确定置信区间 三 抽样调查的组织方式 一 简单随机抽样 纯随机抽样 1 概述 1 定义 根据随机原则直接从总体中抽取样本单位的一种抽样方法 2 特点 调查前没进行任何形式的处理 仅遵守随机原则 缺点 误差较大 组织实施较繁琐 一般适用于总体单位数不多且差异不大的总体 3 抽样方法 重复抽样和不重复抽样 4 取样方法 直接抽选法 抽签法 随机数字表法 例 某公司某部门97名职员组成总体 假定从中抽取7名职员进行采访 其抽样过程为 1 可按姓氏笔画或职员工龄 身份证号码等方式将97名职员进行编号 2 由于指定给某职员的最大编号为2位数 因此随机数字表看作2位数即从00到99来处理 假设以随机数字表中第七排第四个位置的53作为起点 就会得到下列2位数集合 53 31 67 24 55 06 88等 因此抽取编号为53 31 67 24 55 06 88的职员作为采访对象 1 总体方差未知时 n为大样本时 即n 30 总体均值的区间估计 当样本容量相当大时 即使总体分布形式未知或总体为非正态分布 此时样本均值近似服从正态分布 例7 1 某大学从该校学生中随机抽取100人 调查到他们平均每天参加体育锻炼的时间为26分钟 样本方差为36 试以95 的置信水平估计该大学全体学生平均每天参加体育锻炼的时间 2 总体参数的区间估计 已知 n 100F t 0 95S 6因此 全校学生平均每天参加体育锻炼时间在24 824 27 176之间 2 总体方差未知时 n为小样本时 即n 30 总体均值的区间估计 根据抽样分布定理 小样本条件下 总体标准差未知而需要用样本标准S来代替 则随机变量 t n 1 给定置信度 查t分布表可得t值 构造总体均值的置信度为的置信区间为 例 见教材 例7 2 某商场从一批袋装食品中重复随机抽取10袋 测得每袋重量 单位 克 分别为789 780 794 762 802 813 770 785 810 806 要求以95 的把握程度 估计这批食品的平均每袋重量的区间范围 解 样本均值 789 780 794 762 802 813 770 785 810 806 10 791 1 克 样本标准差 已知 查表得 抽样极限误差所求的置信区间为 791 1 12 26 791 1 12 26即 778 84 803 36克 例7 3 为了估计一分钟广告的平均费用 抽出15个电视台组成样本 得样本均值10000元 标准差2000元 总体近似服从正态分布 在置信水平为95 的条件下建立广告平均费用的置信区间 查表可得电视台一分钟广告的平均费用在8894 11106之间 例7 4 某厂对一产品的质量进行抽样检验 采用重复抽样抽取样品200只 样本优质品率为85 试计算当把握程度为90 时优质品率的区间范围 已知 n 200p 0 85F t 0 9t 1 645因此 优质品率得置信区间为80 85 89 15 3 总体成数的区间估计 在的置信水平下 总体比例P的置信区间为 例7 5 某企业在一项关于职工流动原因的研究中 从原职工中随机抽取了200人访问 有140人离开的原因是工资太低 以95 的置信水平对总体这种原因离开的人员比例进行区间估计 该企业由于工资低离开的职工比例为63 6 76 4 之间 F t 0 95 练习 对一批灯泡抽取1 进行质量检验 结果为平均寿命1010小时 抽样平均误差5 6小时 合格率92 抽样平均误差2 4 要求在95 的可靠程度下 对该批灯泡的平均寿命和合格率进行区间估计 据题意 p 92 在95 可高程度下 该批灯泡的平均寿命区间为999 024 1020976小时 合格率区间为87 3 96 7 练习32 解 计算列表如下 样本平均数 97000 100 970 小时 样本方差 1360000 100 13600 小时 平均数抽样平均误差 11 66 小时 因此 该批灯泡的平均耐用时间区间为935 02 1004 98小时 2 样本合格率 p 15 35 25 15 100 90 成数抽样平均误差 因此 该批灯泡的合格率区间为 0 8412 0 9588即84 12 95 88 0 03 1 某学校进行一次英语测验 为了解学生的考试情况 随机抽选部分学生进行调查 所得资料如下 试以95 45 的可靠性估计该校学生英语考试的平均成绩的范围及该校学生成绩在80分以上的学生所占的比重的范围 练习 解 列表计算如下 1 该校学生英语考试的平均成绩的范围 该校学生考试的平均成绩的区间范围是 76 6 2 2754 76 6 2 2754即74 32 78 89 2 该校学生成绩在80分以上的学生所占的比重的范围 p p 2 0 04996 0 09992 在95 45 概率保证程度下 该校学生成绩在80分以上的学生所占的比重的范围在38 01 57 99 之间 0 3801 0 5799 p p 0 48 0 09992 80分以上学生所占的比重的范围 2 从某年级学生中按简单随机抽样方式抽取40名学生 对公共理论课的考试成绩进行检查 得知其平均分数为78 75分 样本标准差为12 13分 试以95 45 的概率保证程度推断全年级学生考试成绩的区间范围 如果其它条件不变 将允许误差缩小一半 应抽取多少名学生 解 40 78 56 12 13t 2 全年级学生考试成绩的区间范围是 78 56 3 84 78 56 3 84即74 91 82 59 将误差缩小一半 应抽取的学生数为 3 抽样单位数目的计算 1 计算公式 1 平均数 2 成数 2 例题 1 某类产品根据以往资料的估计 总体方差5 456千克 现对一批进行简单随机抽样以推断该批产品的平均重量 要求可靠程度达到99 73 误差范围不超过0 9千克 需要抽多少样本单位 解 按题意 由F t 99 73 查表可得t 3因此 2 根据以往资料的估计 该类产品的一等品率为90 可靠程度仍为99 73 误差范围不超过5 推断该批产品的一等品率 需要抽多少样本单位 解 按题意因此 3 影响抽样单位数目的因素 1 总体各单位的变异程度 2 抽样推断的准确程度 3 抽样推断的可靠程度t 4 抽样的组织形式 5 抽样的方法 二 类型抽样 分层抽样 1 概述 1 定义 对总体各单位先按某主要标志加以分类 然后再从各类中按随机原则抽选一定单构成样本的抽样组织形式 2 适用 总体情况比较复杂 差异较大 单位数多 3 样本单位数在各类型组中的分配方式 等额分配 在各类型组中分配同等单位数 等比例分配 按各类型组在总体中所占比例分配样本单位数 即 最优分配 2 总体参数的区间估计 1 抽样平均误差的计算1 平均数抽样平均误差 计算公式 其中 2 成数的抽样平均误差 例题 某地区欲调查小麦的产量 小麦种植地形有丘陵和平原两种 现采用类型抽样方式按5 的比例从总体中抽了12块小麦地 每块1亩 6块处于丘陵地带 亩产量 公斤 分别为 300 330 330 340 370 370 6块处于平原地带 亩产量 公斤 分别为 420 420 450 460 490 520 计算平均亩产量的抽样平均误差 设亩产在370以上的为高产田 计算高产田比重的抽样平均误差 丘陵 平原 例题 类型抽样的抽样平均误差为 计算过程 若亩产量在370以上为高产 高产田比重的抽样平均误差为 2 区间估计 基本步骤 1 计算样本资料求出样本指标2 计算抽样平均误差 3 根据F t 查表确定t4 计算极限误差5 确定置信区间 例题 设某地粮食播种面积为10000亩 其中旱地1500亩 水田8500亩 现等比例随机不重复抽取500亩 测得有关资料如下 试以95 45 的概率保证程度对粮食平均亩产量进行区间估计 旱地抽样资料水田抽样资料 思路 计算各组平均数计算各组方差平均组内方差抽样平均误差区间估计 3 抽样单位数目的确定平均指标 成数指标 例题 某工厂早 中 晚生产罐头10000瓶 根据以往资料的估计平均重量的类型平均方差为0 549克 合格率的类型平均方差为0 02787 要求可靠程度为95 平均重量的允许误差为0 11克 合格率的允许误差为0 025 用类型抽样推断10000瓶罐头的平均重量和合格率 需要抽多少样本单位 据题意t 1 96 三 等距抽样 机械抽样 1 定义 将总体全部单位按某一标志排队 然后按固定的顺序和间隔来抽选样本单位的抽样组织形式 标志分为 有关标志和无关标志 2 取样方法 随机等距 对称等距 中点等距 例 要从100000户居民中抽取1000户 则可先按姓氏笔划把10万户居民家庭的户主排列 然后分成1000个相等的部分 每个部分包含100户 100000 1000 若从1至100中随机抽中的序号为6 则在每个部分中抽出排第6的那一户 即排号为6 106 206 306 的户为中选户 若采用对称等距则在第一个100户中抽排第6的那一户 在第二个则是排第195 2 100 6 1 的那一户 依次为6 195 206 395 等距抽样的计算 1 按无关标志排队时 等距抽样与简单随机不重复抽样没有什么差别 因此按简单随机不重复抽样方法计算 例题 P212例7 27 2 按有关标志排队时 等距抽样视为类型抽样的特殊形式 因此 可按类型抽样的方法计算 等距抽样抽样数目的确定 计算公式 1 按有关标志排队 2 按无关标志排队 同简单随机不重复抽样 四 整群抽样 将总体各单位分为若干群 然后以群为单位从中随机抽取一些群 对抽中群的所有单位进行调查的抽样组织方式 优点 设计和组织抽样比较方便 节省人财物力和时间缺点 单位较为集中 会降低样本的代表性 整群抽样的计算 1 等群抽样平均误差的计算公式 例题 例 某水泥厂一昼夜的产量为14400袋 现每隔144分钟抽取1分钟的水泥 10袋 检查平均每袋重量和一级品率 样本资料如下 计算抽样平均误差 解释 一昼夜有1440分钟 24 60 即把总体分为1440群 R 1440 r 10 五 多阶段抽样 把抽取样本单位分为n个步骤进行 即先从总体中抽取一级单位 然后再从抽中的一级单位中抽取二级单位 直到抽取最终单位 课堂练习 一 判断题 1 从全部总体单位中按照随机原则抽取部分单位组成样本 只可能组成一个样本 2 在抽样推断中 全及指标值是确定的 唯一的 而样本指标值是一个随机变量 3 抽样成数的特点是 样本成数越大 则抽样平均误差越大 4 抽样平均误差总是小于抽样极限误差 5 在抽样推断中 抽样误差的概率度越大 则抽样极限误差就越大于抽样平均误差 1 抽样平均误差是 A 抽样指标的标准差B 总体参数的标准差C 样本变量的函
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年智能仓储机器人任务分配策略创新推动仓储智能化发展
- 第四节 跨学科实践:平面镜成像在生活中的应用教学设计-2023-2024学年初中物理八年级全一册(2024)北师大版(2024·李春密)
- 高中生物 第3章 第1节 细胞膜-系统的边界说课稿 新人教版必修1
- 幼儿园教学教案设计:超市小老板货币认知与简单计算
- 第八课 我们之间的距离教学设计-2025-2026学年小学心理健康长春版六年级上册-长春版
- 专题2.1 创新改变生活-2019-2020学年九年级道德与法治上册同步说课稿(部编版)
- 整流电路教学设计-2025-2026学年中职专业课-电子技术基础与技能-机电技术应用-装备制造大类
- 燃气储运工职业考核试卷及答案
- 影视设备数字化改造案例对比分析报告
- 架线工程资源节约措施分析报告
- 【MOOC】PLC技术及应用(三菱FX系列)-职教MOOC建设委员会 中国大学慕课MOOC答案
- 无人机航拍及影像处理服务合同
- 《膳食营养讲座》课件
- 无人机组装与调试 课件 项目一无人机组装调试基础 04.项目一任务四无人机焊接技术
- 《中国香文化》课件
- 机电一体化领域创新创业方案
- 白天与夜晚课件
- 3DMine-矿业工程软件-帮助手册说明书
- 江苏省徐州市2024-2025学年高二化学上学期期中试题选修
- 学前教育普及普惠督导评估内容和标准量化评分表
- DL-T5503-2015直流换流站施工图设计内容深度规定
评论
0/150
提交评论