已阅读5页,还剩55页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2020 2 9 扬州大学管理学院 1 第七章抽样推断 第一节抽样推断的意义第二节抽样误差第三节抽样推断的方法第四节抽样调查的组织方式 2020 2 9 扬州大学管理学院 2 一 抽样推断的概念和特点 1 概念 抽样推断是按随机原则从全部研究对象中抽取部分单位 样本 进行观察 并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断 第一节抽样推断的意义 2020 2 9 扬州大学管理学院 3 2 意义 1 有些现象是无法进行全面调查的 为了测算全面资料 必须采用抽样调查的方法 例如 对无限总体不能采用全面调查 另外 有些产品的质量检查具有破坏性 不可能进行全面调查 只能采用抽样调查 第一节抽样推断的意义 2 从理论上讲 有些现象虽然可以进行全面调查 但实际上没有必要或很难办到 也要采用抽样调查 2020 2 9 扬州大学管理学院 4 3 抽样调查的结果可以对全面调查的结果进行检查和修正 第一节抽样推断的意义 5 利用抽样调查原理 可以对某些总体的假设进行检验 来判别这种假设的真伪 依决定行动的取舍 4 抽样调查可以用于工业生产过程的质量控制 2020 2 9 扬州大学管理学院 5 3 特点 1 它是由部分推断整体的一种认识方法 2 抽样推断建立在随机取样的基础上 3 抽样推断运用概率估计的方法 4 抽样推断的抽样误差是不可避免的 但可以事先计算并加以控制 第一节抽样推断的意义 2020 2 9 扬州大学管理学院 6 二 统计推断内容 1 统计学 描述统计学 研究如何全面收集被研究客观事物的数据资料并进行简缩处理 描述其群体特征和数量规律性 推断统计学 研究如何有效地收集和使用被研究客观事物的不完整并且带有随机干扰的数据资料 以对其群体特征和数量规律性给出尽可能精确 可靠的推断性结论 2020 2 9 扬州大学管理学院 7 2 推断统计参数估计 由对部分进行观测取得的数据对研究对象整体的数量特征取值给出估计方法 假设检验 由对部分进行观测取得的数据对研究对象的数量规律性是否具有某种指定特征进行检验 2020 2 9 扬州大学管理学院 8 统计推断的过程 2020 2 9 扬州大学管理学院 9 一 全及总体和样本总体 全及总体 Population 是所要研究的对象 又称母体 简称总体 它是指所要认识的 具有某种共同性质的许多单位的集合体 全及总体单位数 N 一般很大 三 有关抽样的基本概念 2020 2 9 扬州大学管理学院 10 又称子样 是从全及总体中随机抽取出来的 做为代表这一总体的部分单位组成的集合体 样本单位总数用 n 表示 样本选取的基本原则 代表性 样本的每个分量都与总体有相同的分布独立性 样本的每个分量都是相互独立的 样本 Sample 2020 2 9 扬州大学管理学院 11 随着样本容量的增大 样本对总体的代表性越来越高 并且当样本单位数足够多时 样本平均数愈接近总体平均数 对于一次抽样调查 全及总体是唯一确定的 样本总体不是这样 样本是不确定的 一个全及总体可能抽出很多个样本总体 样本的个数和样本的容量有关 也和抽样的方法有关 2020 2 9 扬州大学管理学院 12 二 参数和统计量 参数 指反映总体数量特征的综合指标 参数 研究总体中的数量标志 总体平均数 总体方差 研究总体中的品质标志 总体成数 成数方差 2020 2 9 扬州大学管理学院 13 统计量 根据样本数据计算的综合指标 研究数量标志 样本平均数 样本标准差 研究品质标志 样本成数 成数标准差 2020 2 9 扬州大学管理学院 14 三 样本容量和样本个数 样本容量 一个样本包含的单位数 用 n 表示 一般要求n 30大样本 样本个数 从一个全及总体中可能抽取的样本数目 四 重复抽样和不重复抽样 重复抽样 又称回置抽样 不重复抽样 又称不回置抽样 考虑顺序时 可能组成的样本数目 不考虑顺序时 可能组成的样本数目 考虑顺序时 可能组成的样本数目 不考虑顺序时 可能组成的样本数目 2020 2 9 扬州大学管理学院 15 抽样方法 不重复抽样 考虑顺序 不考虑顺序 4 3 2 是否考虑顺序 1 1考虑顺序的重复抽样 2不考虑顺序的重复抽样 3考虑顺序的不重复抽样 4不考虑顺序的不重复抽样 重复抽样 2020 2 9 扬州大学管理学院 16 2020 2 9 扬州大学管理学院 17 四 抽样推断的理论基础1 抽样推断的理论基础 大数 定律 法则大数定律即关于大量的随机现象具有稳定性质的法则 它说明如果被研究的总体是由大量的相互独立的随机因素所构成 而且因素对总体的影响都相对地小 那么对这些大量因素加以综合平均的结果 因素的个别影响将相互抵消 而呈现出它们共同作用的倾向 使总体具有稳定的性质 2020 2 9 扬州大学管理学院 18 大数定律证明 如果随机变量总体存在着有限的平均数和方差 则对于充分大的抽样单位为n 可以以几乎趋近于1的概率 来期望平均数与总体平均数的绝对离差为任意小 即对于任意的正数a有 式中 为抽样平均数 为总体平均数 n为抽样单位数 2020 2 9 扬州大学管理学院 19 2 抽样推断的理论基础 中心极限定理人们已经知道 在自然界和生产实践中遇到的大量随机变量都服从或近似服从正态分布 正因如此 正态分布占有特别重要的地位 那么 如何判断一个随机变量服从正态分布显得尤为重要 如经过长期的观测 人们已经知道 很多工程测量中产生的误差X都是服从正态分布的随机变量 在什么条件下 这是十八世纪以来概率论研究的中心课题 因而 从二十世纪二十年代开始 习惯上把研究随机变量和的分布收敛到正态分布的这类定理称为中心极限定理 CentralLimitTheorems 2020 2 9 扬州大学管理学院 20 林德伯格 莱维 Lindeberg L vy 中心极限定理 设是一相互独立同分布随机变量序列 则对任意的实数 总有 2020 2 9 扬州大学管理学院 21 本定理的证明在20世纪20年代由林德伯格和莱维给出 因证明较复杂 在此从略 由定理可知 当n充分大时 由于它对的分布形式没有要求 因而得到广泛使用 2020 2 9 扬州大学管理学院 22 第二节抽样误差一 抽样误差二 抽样平均误差三 抽样极限误差四 抽样误差的概率度 2020 2 9 扬州大学管理学院 23 第二节抽样误差 一 抽样误差的含义 一 统计误差有两种 1 登记性误差 由于调查整理过程中登记错误和计算不准而产生的 2 代表性误差 由于用样本资料代表总体资料而产生的 全面调查中不存在这种误差 其中由于不按照随机原则抽样造成的误差为系统性误差 由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构 而引起抽样指标和全及指标之间的绝对离差为抽样误差 2020 2 9 扬州大学管理学院 24 二 影响抽样误差大小的因素 1 总体各单位标志值的变异程度 2 样本的单位数 3 抽样方法 4 抽样推断的组织形式 2020 2 9 扬州大学管理学院 25 二 抽样平均误差 1 概念 抽样平均误差是抽样平均数或抽样成数的标准差 反映了抽样平均数与总体平均数抽样成数与总体成数的平均误差程度 2 计算方法 抽样平均数的平均误差 抽样成数平均误差 以上两个公式实际上就是第四章讲的标准差 但反映的是样本指标与总体指标的平均离差程度 2020 2 9 扬州大学管理学院 26 抽样平均数平均误差的计算公式 采用重复抽样 此公式说明 抽样平均误差与总体标准差成正比 与样本容量开方成反比 当总体标准差未知时 可用样本标准差代替 通过计算可说明以下几点 样本平均数的平均数等于总体平均数 抽样平均数的标准差仅为总体标准差的 可通过调整样本单位数来控制抽样平均误差 2020 2 9 扬州大学管理学院 27 例题 假定抽样单位数增加2倍 0 5倍时 抽样平均误差怎样变化 解 抽样单位数增加2倍 即为原来的3倍 则 抽样单位数增加0 5倍 即为原来的1 5倍 则 即 当样本单位数增加2倍时 抽样平均误差为原来的0 577倍 即 当样本单位数增加0 5倍时 抽样平均误差为原来的0 8165倍 2020 2 9 扬州大学管理学院 28 采用不重复抽样 公式表明 抽样平均误差不仅与总体变异程度 样本容量有关 而且与抽样方法有关 例题一 随机抽选某校学生100人 调查他们的体重 得到他们的平均体重为58公斤 标准差为10公斤 问抽样推断的平均误差是多少 例题二 某厂生产一种新型灯泡共2000只 随机抽出400只作耐用时间试验 测试结果平均使用寿命为4800小时 样本标准差为300小时 求抽样推断的平均误差 2020 2 9 扬州大学管理学院 29 例题一解 即 当根据样本学生的平均体重估计全部学生的平均体重时 抽样平均误差为1公斤 例题二解 计算结果表明 根据部分产品推断全部产品的平均使用寿命时 采用不重复抽样比重复抽样的平均误差要小 已知 则 已知 则 2020 2 9 扬州大学管理学院 30 抽样成数平均误差的计算公式 采用重复抽样 采用不重复抽样 例题三 某校随机抽选400名学生 发现戴眼镜的学生有80人 根据样本资料推断全部学生中戴眼镜的学生所占比重时 抽样误差为多大 例题四 一批食品罐头共60000桶 随机抽查300桶 发现有6桶不合格 求合格品率的抽样平均误差 2020 2 9 扬州大学管理学院 31 例题三解 已知 则 样本成数 即 根据样本资料推断全部学生中戴眼镜的学生所占的比重时 推断的平均误差为2 2020 2 9 扬州大学管理学院 32 例题四解 已知 则 样本合格率 计算结果表明 不重复抽样的平均误差小于重复抽样 但是 N 的数值越大 则两种方法计算的抽样平均误差就越接近 2020 2 9 扬州大学管理学院 33 三 抽样极限误差 含义 抽样极限误差指在进行抽样估计时 根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围 计算方法 它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值 抽样平均数极限误差 抽样成数极限误差 2020 2 9 扬州大学管理学院 34 四 抽样误差的概率度 含义 抽样误差的概率度是测量抽样估计可靠程度的一个参数 用符号 t 表示 公式表示 t是极限误差与抽样平均误差的比值 极限误差是t倍的抽样平均误差 上式可变形为 2020 2 9 扬州大学管理学院 35 第三节抽样估计的方法 一 作为优良估计量的条件 总体参数优良估计的标准 无偏性 一致性 有效性 2020 2 9 扬州大学管理学院 36 无偏性 unbiasedness 设 是未知参数 的一个点估计量 若 满足 则称 是 的无偏估计量 否则称为有偏估计量 2020 2 9 扬州大学管理学院 37 一致性 consistency 一致性 随着样本容量的增大 估计量的值越来越接近被估计的总体参数 2020 2 9 扬州大学管理学院 38 有效性 efficiency 有效性 对同一总体参数的两个无偏点估计量 有更小标准差的估计量更有效 2020 2 9 扬州大学管理学院 39 第三节抽样估计的方法 二 总体参数的点估计 总体参数点估计的特点 直接使样本指标等于总体指标 即令 2020 2 9 扬州大学管理学院 40 三 总体参数的区间估计 一 总体参数区间估计的特点 第三节抽样估计的方法 区间估计三要素 估计值 抽样误差范围 概率保证程度 2020 2 9 扬州大学管理学院 41 1 根据给定的概率F t 推算抽样极限误差及总体参数的可能范围 分析步骤 1 抽取样本 计算样本指标 2 根据给定的F t 查表求得概率度t 3 根据概率度和抽样平均误差计算抽样极限误差 4 计算被估计值的上 下限 对总体参数作出区间估计 二 总体参数区间估计的方法 2020 2 9 扬州大学管理学院 42 2 根据给定的抽样误差范围 求概率保证程度 分析步骤 1 抽取样本 计算抽样指标 2 根据给定的极限误差范围估计总体参数的上限和下限 3 计算概率度 4 查表求出概率F t 并对总体参数作出区间估计 2020 2 9 扬州大学管理学院 43 某农场进行小麦产量抽样调查 小麦播种总面积为1万亩 采用不重复简单随机抽样 从中抽选了100亩作为样本进行实割实测 测得样本平均亩产400斤 方差144斤 1 以95 45 的可靠性推断该农场小麦平均亩产可能在多少斤之间 要求计算 例题一 2 以99 73 的可靠性推断该农场小麦平均亩产可能在多少斤之间 2020 2 9 扬州大学管理学院 44 例题一解题过程 已知 N 10000n 100 问题一解 1 计算抽样平均误差 2 计算抽样极限误差 3 计算总体平均数的置信区间 上限 下限 即 以95 45 的可靠性估计该农场小麦平均亩产量在397 62斤至402 38斤之间 2020 2 9 扬州大学管理学院 45 同上解题过程 已知 N 10000n 100 问题二解 1 计算抽样平均误差 2 计算抽样极限误差 3 计算总体平均数的置信区间 上限 下限 即 以99 73 的可靠性估计该农场小麦平均亩产量在396 43斤至403 57斤之间 2020 2 9 扬州大学管理学院 46 例题二 某纱厂某时期内生产了10万个单位的纱 按纯随机抽样方式抽取2000个单位检验 检验结果合格率为95 废品率为5 试以95 的把握程度 估计全部纱合格品率的区间范围及合格品数量的区间范围 已知 区间下限 区间上限 2020 2 9 扬州大学管理学院 47 例题三 为调查农民生活状况 在某地区5000户农民中 按不重复简单随机抽样法 抽取400户进行调查 得知这400户中拥有彩色电视机的农户为87户 要求计算 1 以95 的把握程度估计该地区全部农户中拥有彩色电视机的农户在多大比例之间 2020 2 9 扬州大学管理学院 48 例题三的问题一解 已知 N 5000 n 400 1 计算样本成数 2 计算抽样平均误差 3 计算抽样极限误差 4 计算总体P的置信区间 下限 上限 即 以95 的把握程度估计该地区农户中拥有彩电的农户在17 87 至25 63 之间 2020 2 9 扬州大学管理学院 49 三 样本单位数的计算方法 通过抽样极限误差公式计算必要的样本单位数 重复抽样 不重复抽样 抽样平均数 抽样成数 2020 2 9 扬州大学管理学院 50 某农场进行小麦产量抽样调查 小麦播种总面积为1万亩 采用不重复简单随机抽样 从中抽选了100亩作为样本进行实割实测 测得样本平均亩产400斤 方差144斤 要求计算 3 若概率保证程度为95 45 不变 要求抽样允许误差不超过1斤 问至少应抽多少亩作为样本 接例题一 2020 2 9 扬州大学管理学院 51 问题三解 已知 则样本单位数 即 当 至少应抽544 6亩作为样本 2020 2 9 扬州大学管理学院 52 接例题三 为调查农民生活状况 在某地区5000户农民中 按不重复简单随机抽样法 抽取400户进行调查 得知这400户中拥有彩色电视机的农户为87户 以95 的把握程度 要求计算 2 抽样允许误差不超过0 02 其它条件不变 问应抽多少户作为样本 2020 2 9 扬州大学管理学院 53 解 当 其他条件不变时 1635 户 2020 2 9 扬州大学管理学院 54 一 简单随机抽样 simplerandomsampling 从总体N个单位中随机地抽取n个单位作为样本 使得每一个容量为样本都有相同的机会 概率 被抽中抽取元素的具体方法有重复抽样和不重复抽样特点简单 直观 在抽样框完整时 可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时 不易构造抽样框抽出的单位很分散 给实施调查增加了困难没有利用其他辅助信息以提高估计的效率 第四节抽样的组织形式 2020 2 9 扬州大学管理学院 55 二 分层抽样 stratifiedsampling 将抽样单位按某种特征或某种规则划分为不同的层 然后从不同的层中独立 随机地抽取样本优点保证样本的结构与总体的结构比较相近 从而提高估计的精度组织实施调查方便既可以对总体参数进行估计 也可以对各层的目标量进行估计 2020 2 9
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年湘潭辅警协警招聘考试真题附答案详解(轻巧夺冠)
- 2025年渭南辅警招聘考试题库含答案详解ab卷
- 2025年葫芦岛辅警协警招聘考试真题附答案详解(精练)
- 2025年濮阳辅警招聘考试题库含答案详解(典型题)
- 2025年菏泽辅警协警招聘考试备考题库及一套参考答案详解
- 2025年盘锦辅警协警招聘考试备考题库含答案详解(综合题)
- 2025年甘孜藏族自治州辅警协警招聘考试真题附答案详解(巩固)
- 2025年郴州辅警协警招聘考试真题附答案详解(精练)
- 2025年阿拉善盟辅警招聘考试题库(含答案详解)
- 2025年湖州辅警招聘考试题库含答案详解ab卷
- 2025西南有色昆明勘测设计(院)股份有限公司专业技术人员招聘(9人)考试笔试备考试题及答案解析
- 2025中国航空工业集团陕飞校园招聘笔试历年参考题库附带答案详解
- 2025年公务员(国考)试题预测试卷附参考答案详解AB卷
- 2025-2026学年苏科版七年级数学上册期中模拟测试卷(1-4章)(含答案)
- 人工智能通识教程 课件 第10章-AIGC技术
- 2025年国家电网招聘之电工类考试题库及答案历年真题
- 关键句子课件
- 2025-2030中国光纤网络共建共享模式创新与效益分析报告
- 2025中国中煤华东分公司所属宝山公司第三批社会招聘63人笔试题库历年考点版附带答案详解
- 2025年度济南市工会社会工作专业人才联合招聘(47人)笔试参考题库附答案解析
- 【必背】三级政务服务办事员备考题库宝典-2025核心题版
评论
0/150
提交评论