第八章-抽样推断.ppt_第1页
第八章-抽样推断.ppt_第2页
第八章-抽样推断.ppt_第3页
第八章-抽样推断.ppt_第4页
第八章-抽样推断.ppt_第5页
免费预览已结束,剩余83页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章抽样推断 教学目的与要求 通过本章的学习 要理解和掌握抽样估计的概念 特点 抽样误差的含义 计算方法 抽样估计的置信度 推断总体参数的方法 能结合实际资料进行抽样估计 抽样推断的一般问题 抽样误差 抽样估计的方法 抽样组织设计 本章主要内容 一 抽样推断的概念和特点 概念 抽样推断是按随机原则从全部研究对象中抽取部分单位进行观察 并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断 特点 它是由部分推断整体的一种认识方法 抽样推断建立在随机取样的基础上 抽样推断运用概率估计的方法 抽样推断的误差可以事先计算并加以控制 第一节抽样推断的一般问题 参数估计参数估计是依据所获得的样本观察资料 对所研究现象总体的水平 结构 规模等数量特征进行估计 假设检验假设检验是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法 二 抽样推断的内容 一 总体和样本 总体 又称全及总体 指所要认识的研究对象全体 总体单位总数用 N 表示 样本 又称子样 是从全及总体中随机抽取出来 作为代表这一总体的那部分单位组成的集合体 样本单位总数用 n 表示 三 有关抽样的基本概念 1 参数 反映总体数量特征的全及指标 参数 研究总体中的数量标志 总体平均数 总体方差 研究总体中的品质标志 总体成数 成数方差 只有两种表现 二 参数和统计量 根据样本数据计算的综合指标 研究数量标志 样本平均数 样本标准差 研究品质标志 样本成数 成数标准差 2 统计量 三 样本容量和样本个数 样本容量 一个样本包含的单位数 用 n 表示 一般要求n 30 样本个数 从一个全及总体中可能抽取的样本数目 四 重复抽样和不重复抽样 重复抽样 又称回置抽样 不重复抽样 又称不回置抽样 可能组成的样本数目 N N 1 N 2 N n 1 可能组成的样本数目 从A B C D四个单位中 抽出两个单位构成一个样本 问可能组成的样本数目是多少 重复抽样 A A AC AD B A BB BC BD AB C A CB CC CD D A DB DC DD N n 42 16 个样本 不重复抽样 N N 1 N 2 4 3 12 个样本 例 一 抽样误差的含义 由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构 而引起抽样指标和全及指标之间的绝对离差 第二节抽样误差 1 总体各单位标志值的差异程度 2 样本的单位数 3 抽样方法 4 抽样调查的组织形式 二 影响抽样误差大小的因素 抽样平均误差是抽样平均数或抽样成数的标准差 反映了抽样指标与总体指标的平均误差程度 三 抽样平均误差 假设总体包含1 2 3 4 5 五个数字 则 总体平均数为 x 1 2 3 4 5 5 3 现在 采用重复抽样从中抽出两个 组成一个样本 可能组成的样本数目 25个 如 1 3 2 2 1 4 2 2 5 2 4 2 3 3 5 2 4 多数样本指标与总体指标都有误差 误差有大 有小 有正 有负 抽样平均误差就是将所有的误差综合起来 再求其平均数 所以抽样平均误差是反映抽样误差一般水平的指标 抽样平均数的平均误差 抽样成数平均误差 以上两个公式实际上就是第三章讲的标准差 但反映的是样本指标与总体指标的平均离差程度 实际上 利用上述两个公式是计算不出抽样平均误差的 想一想 为什么 抽样平均误差的计算公式 采用重复抽样 此公式说明 抽样平均误差与总体标准差成正比 与样本容量成反比 当总体标准差未知时 可用样本标准差代替 通过例题可说明以下几点 样本平均数的平均数等于总体平均数 抽样平均数的标准差仅为总体标准差的 可通过调整样本单位数来控制抽样平均误差 抽样平均数平均误差的计算方法 假定抽样单位数增加2倍 0 5倍时 抽样平均误差怎样变化 解 抽样单位数增加2倍 即为原来的3倍 则 抽样单位数增加0 5倍 即为原来的1 5倍 则 即 当样本单位数增加2倍时 抽样平均误差为原来的0 577倍 即 当样本单位数增加0 5倍时 抽样平均误差为原来的0 8165倍 例题 采用不重复抽样 公式表明 抽样平均误差不仅与总体变异程度 样本容量有关 而且与总体单位数的多少有关 例题一 随机抽选某校学生100人 调查他们的体重 得到他们的平均体重为58公斤 标准差为10公斤 问抽样推断的平均误差是多少 例题二 某厂生产一种新型灯泡共2000只 随机抽出400只作耐用时间试验 测试结果平均使用寿命为4800小时 样本标准差为300小时 求抽样推断的平均误差 例题一解 即 当根据样本学生的平均体重估计全部学生的平均体重时 抽样平均误差为1公斤 例题二解 计算结果表明 根据部分产品推断全部产品的平均使用寿命时 采用不重复抽样比重复抽样的平均误差要小 已知 则 已知 则 n 100 10 x 58 N 2000 n 400 300 x 4800 采用重复抽样 采用不重复抽样 例题三 某校随机抽选400名学生 发现戴眼镜的学生有80人 根据样本资料推断全部学生中戴眼镜的学生所占比重时 抽样误差为多大 例题四 一批食品罐头共60000桶 随机抽查300桶 发现有6桶不合格 求合格品率的抽样平均误差 抽样成数平均误差的计算方法 例题三解 已知 则 样本成数 即 根据样本资料推断全部学生中戴眼镜的学生所占的比重时 推断的平均误差为2 例题四解 已知 则 样本合格率 计算结果表明 不重复抽样的平均误差小于重复抽样 但是 N 的数值越大 则两种方法计算的抽样平均误差就越接近 含义 抽样极限误差指在进行抽样估计时 根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围 计算方法 它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值 抽样平均数极限误差 抽样成数极限误差 四 抽样极限误差 含义 抽样误差的概率度是测量抽样估计可靠程度的一个参数 用符号 t 表示 公式表示 t是极限误差与抽样平均误差的比值 极限误差是t倍的抽样平均误差 上式可变形为 五 抽样误差的概率度 一 总体参数的点估计 就是根据抽样所搜集到的资料来计算样本指标 直接用样本指标数值来作为本应总体指标的估计值 总体参数优良估计的标准 无偏性 一致性 有效性 第三节抽样估计的方法 区间估计三要素 估计值 抽样误差范围 抽样估计的置信度 就是根据样本指标计算出总体指标的上下限 即估计区间 以及这种估计的把握程度 二 总体参数的区间估计 抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度 符号表示 P x X x 抽样估计的置信度 理论已经证明 在大样本的情况下 抽样平均数的分布接近于正态分布 分布特点是 抽样平均数以总体平均数为中心 两边完全对称分布 即抽样平均数的正误差与负误差的可能性是完全相等的 且抽样平均数愈接近总体平均数 出现的可能性愈大 概率愈大 反之 抽样平均数愈离开总体平均数 出现的可能性愈小 概率愈小 趋于0 见下图 正态概率分布图 X x 1 x 1 68 27 x 2 x 2 95 45 由此可知 误差范围愈大 抽样估计的置信度愈高 但抽样估计的精确度愈低 反之 误差范围愈小 则抽样估计的置信度愈低 但抽样估计的精确度愈高 因为扩大或缩小以后的平均误差 就是极限误差 t 所以 抽样平均误差的系数就是概率度t 数理统计已经证明 抽样误差的概率就是概率度的函数 二者对应的函数关系已编成 正态分布概率表 P485 一 根据给定的抽样误差范围 求概率保证程度 分析步骤 1 抽取样本 计算抽样指标 2 根据给定的极限误差范围估计总体参数的上限和下限 3 计算概率度 4 查表求出概率F t 并对总体参数作出区间估计 三 总体参数区间估计的方法 分析步骤 1 抽取样本 计算样本指标 2 根据给定的F t 查表求得概率度t 3 根据概率度和抽样平均误差计算极限误差 4 计算被估计值的上 下限 对总体参数作出区间估计 二 根据给定的概率F t 推算抽样极限误差的可能范围 某农场进行小麦产量抽样调查 小麦播种总面积为1万亩 采用不重复简单随机抽样 从中抽选了100亩作为样本进行实割实测 测得样本平均亩产400斤 方差144斤 1 以95 45 的可靠性推断该农场小麦平均亩产可能在多少斤之间 若概率保证程度不变 要求抽样允许误差不超过1斤 问至少应抽多少亩作为样本 例题一 已知 N 10000n 100 问题一解 1 计算抽样平均误差 2 计算抽样极限误差 3 计算总体平均数的置信区间 上限 下限 即 以95 45 的可靠性估计该农场小麦平均亩产量在397 62斤至402 38斤之间 解 问题二解 已知 则样本单位数 即 当 至少应抽544 6亩作为样本 某纱厂某时期内生产了10万个单位的纱 按纯随机抽样方式抽取2000个单位检验 检验结果合格率为95 废品率为5 试以95 的把握程度 估计全部纱合格品率的区间范围及合格品数量的区间范围 已知 区间下限 区间上限 例题二 为调查农民生活状况 在某地区5000户农民中 按不重复简单随机抽样法 抽取400户进行调查 得知这400户中拥有彩色电视机的农户为87户 要求计算 1 以95 的把握程度估计该地区全部农户中拥有彩色电视机的农户在多大比例之间 2 若要求抽样允许误差不超过0 02 其它条件不变 问应抽多少户作为样本 例题三 问题一解 已知 N 5000 N 400 1 计算样本成数 2 计算抽样平均误差 即 以95 的把握程度估计该地区农户中拥有彩电的农户在17 87 至25 63 之间 4 计算总体P的置信区间 下限 上限 3 计算抽样极限误差 问题二解 当 其他条件不变时 一 简单随机抽样 1 含义 按随机原则直接从总体N个单位中抽取n个单位作为样本 2 样本单位数的计算方法 通过抽样极限误差公式计算必要的样本单位数 重复抽样 不重复抽样 抽样平均数 抽样成数 第四节抽样组织设计 二 类型抽样 三 等距抽样 四 整群抽样 先对总体各单位按主要标志加以分组 然后再从各组中按随机的原则抽选一定单位构成样本 先按某一标志对总体各单位进行排队 然后依一定顺序和间隔来抽取样本单位的一种组织形式 将总体各单位划分成许多群 然后从其中随机抽取部分群 对中选群的所有单位进行全面调查的抽样组织形式 本章作业 一 判断题1 从全部总体单位中按照随机原则抽取部分单位组成样本 只可能组成一个样本 2 在抽样推断中 全及指标值是确定的 唯一的 而样本指标值是一个随机变量 3 抽样成数的特点是 样本成数越大 则抽样平均误差越大 4 抽样平均误差总是小于抽样极限误差 5 在其它条件不变的情况下 提高抽样估计的可靠程度 则降低了抽样估计的精确程度 6 从全部总体单位中抽取部分单位构成样本 在样本变量相同的情况下 重复抽样构成的样本个数大于不重复抽样构成的样本个数 7 抽样平均误差反映抽样误差的一般水平 每次抽样的误差可能大于抽样平均误差 也可能小于抽样平均误差 8 在抽样推断中 抽样误差的概率度越大 则抽样极限误差就越大于抽样平均误差 9 抽样估计的优良标准有三个 无偏性 可靠性和一致性 10 样本单位数的多少与总体各单位标志值的变异程度成反比 与抽样极限误差范围的大小成正比 11 抽样推断的目的是 通过对部分单位的调查 来取得样本的各项指标 12 用来测量估计可靠程度的指标是抽样误差的概率度 13 总体参数区间估计必须具备三个要素即 估计值 抽样误差范围和抽样误差的概率度 二 单项选择题部分1 抽样平均误差是 A 抽增指标的标准差B 总体参数的标准差C 样本变量的函数D 总体变量的函数 A 2 抽样调查所必须遵循的基本原则是 A 准确性原则B 随机性原则C 可靠性原则D 灵活性原则 B 3 在简单随机重复抽样条件下 当抽样平均误差缩小为原来的1 2时 则样本单位数为原来的 A 2倍B 3倍C 4倍D 1 4倍 C 4 按随机原则直接从总体N个单位中抽取n个单位作为样本 这种抽样组织形式是 A 简单随机抽样B 类型抽样C 等距抽样D 整群抽样 A 5 事先将总体各单位按某一标志排列 然后依排列顺序和按相同的间隔来抽选调查单位的抽样称为 A 简单随机抽样B 类型抽样C 等距抽样D 整群抽样 C 6 在一定的抽样平均误差条件下 A 扩大极限误差范围 可以提高推断的可靠程度B 扩大极限误差范围 会降低推断的可靠程度C 缩小极限误差范围 可以提高推断的可靠程度D 缩小极限误差范围 不改变推断的可靠程度 A 8 反映样本指标与总体指标之间的平均误差程度的指标是 A 平均数离差B 概率度C 抽样平均误差D 抽样极限误差 C 9 以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身 这一标准称为 A 无偏性B 一致性C 有效性D 准确性 A 10 在其它条件不变的情况下 提高估计的概率保证程度 其估计的精确程度 A 随之扩大B 随之缩小C 保持不变D 无法确定 B 11 对某种连续生产的产品进行质量检验 要求每隔一小时抽出10分钟的产品进行检验 这种抽查方式是 A 简单随机抽样B 类型抽样C 等距抽样D 整群抽样 D 12 抽样误差是指 A 调查中所产生的登记性误差B 调查中所产生的系统性误差C 随机的代表性误差D 计算过程中产生的误差 C 14 为了了解某工厂职工家庭收支情况 按该厂职工名册依次每50人抽取1人 对其家庭进行调查 这种调查属于 A 简单随机抽样B 等距抽样C 类型抽样D 整群抽样 B 15 抽样极限误差和抽样平均误差的数值之间的关系为 A 抽样极限误差可以大于或小于抽样平均误差B 抽样极限误差一定大于抽样平均误差C 抽样极限误差一定小于抽样平均误差D 抽样极限误差一定等于抽样平均误差 A 三 多项选择题1 抽样推断的特点是 由推算认识总体的一种认识方法 按随机原则抽取样板单位 运用概率估计的方法 可以计算 但不能控制抽样误差 可以计算并控制抽样误差 ABCE 2 抽样估计中的抽样误差 是不可避免要产生的 是可以通过改进调查方式来消除的 是可以事先计算出来的 只能在调查结束后才能计算的 其大小是可能控制的 ACE 3 从总体中抽取样本单位的具体方法有 简单随机抽样 重复抽样 不重复抽样 等距抽样 非概率抽样 BC 4 抽样推断中 样本容量的多少取决于 总体标准差的大小 允许误差的大小 抽样估计的把握程度 总体参数的大小 抽样方法和组织形式 ABCE 5 总体参数区间估计必须具备的三个要素是 样本单位数 样本指标 全及指标 抽样误差范围 抽样估计的置信度 BDE 6 用抽样指标估计总体指标 所谓优良估计的标准有 客观性B 无偏性C 一致性D 有效性E 优良性 BCD 7 在抽样平均误差一定的条件下 扩大极限误差 可以提高推断的可靠程度 缩小极限误差 可以提高推断的可靠程度 扩大极限误差 只能降低推断的可靠程度 缩小极限误差 只能降低推断的可靠程度 扩大或缩小极限误差与推断的可靠程度无关 AD 四 填空题部分1 抽样推断的主要内容有 参数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论