已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1 统计学统计学 授课题目 第 6 章 抽样推断 课次 第 8 9 次 授课方式 讲授 课时安排第 8 教学周 第 9 教学周 共 4 课时 教学目的 通过本章的学习 要求掌握利用样本统计资料来推断总体数量特征的原理及方法 深刻理解 抽样推断的概念及特点 了解抽样误差产生的原因 并对抽样误差 抽样平均误差 抽样极限误 差加以区别 掌握抽样平均误差 抽样极限误差的计算 掌握点估计和区间估计的方法 掌握必 要样本单位数的确定方法 教学重点及难点提示 重点 区间估计 难点 抽样平均误差的计算 案例导入 案例导入 大学生消费调查 一个月你花多少 第一节第一节 抽样推断概述抽样推断概述 一 抽样推断的概念及特点一 抽样推断的概念及特点 一 概念 按随机原则从总体中抽取部分单位 根据这部分单位的信息对总体的数量特征进行 科学估计与推断的方法 包括抽样调查和统计推断 抽样调查 一种非全面调查 按随机原则从总体中抽取部分单位进行调查以获得相 关资料 以推断总体 统计推断 根据抽样调查所获得的信息 对总体的数量特征作出具有一定程度的估 计和推断 二 特点 1 按随机原则 等可能性原则 抽取调查单位 随机抽样的目的是为了排除人的主 教法提示 多媒体教学 案例教学 列举法 2 观影响 使每个样本都有系统的可能性被抽中 使样本对总体具有充分的代表性 随机 性原则是保证抽样推断正确性的一个重要前提条件 随机抽样不是随便抽样 2 根据部分推断总体的数量特征 3 抽样推断的结果具有一定的可靠性和准确性 抽样误差可以事先计算和控制 其他特点有经济性 时效性 准确性 灵活性等 三 抽样推断的应用 1 不可能进行全面调查时 2 不必要进行全面调查时 3 检查生产过程正常与否 4 对全面调查资料进行补充修正时 二 抽样的几个基本概念二 抽样的几个基本概念 1 1 样本容量与样本个数样本容量与样本个数 1 样本容量 样本是从总体中抽出的部分单位的集合 这个集合的大小称为样本 容量 一般用 n 表示 它表明一个样本中所包含的单位数 一般地 样本单位数大于 30 个的样本称为大样本 不超过 30 个的样本称为小样本 2 样本个数 又称样本可能数目 它是指从一个总体中可能抽取多少个样本 样本个数的多少与抽样方法有关 2 2 总体参数与样本统计量总体参数与样本统计量 1 总体参数 总体分布的数量特征就是总体参数 也是抽样统计推断的对象 常见的总 体参数有 总体的平均数指标 总体成数 比重 指标 总体分布的方差 标准差等等 2 样本统计量 与总体参数对应的是样本统计量 设 是总体容量为 n 的样本 若样本函数 12 n XXX X TT 12 n XXX 中不含任何未知参数 则称为一个统计量 T 3 例如 1 1 n i i XX n 就是一个统计量 称为样本均值 Sample mean 22 1 1 n i i SXX n 也是统计量 称为样本方差 Sample variance 3 3 重复抽样与不重复抽样重复抽样与不重复抽样 1 重复抽样 是指从总体中抽出一个样本单位 记录其标志值后 又将其放回总 体中继续参加下一次样本单位的抽取 2 不重复抽样 即每次从总体中抽取一个单位 登记后不放回原总体 不参加 下一次抽样 第二节第二节 抽样推断的方法抽样推断的方法 一 点估计一 点估计 一 点估计的概念及特点 参数估计 以样本统计量对总体参数进行估计 有点估计和区间估计两种 参数估计 以样本统计量对总体参数进行估计 有点估计和区间估计两种 点估计 直接以样本统计量作为相应的总体参数的估计量 优点 直接给出了总体参数的具体数值 缺点 未能反映误差的大小 参数点估计有 参数点估计有 1 样本均值估计总体均值 2 样本成数估计总体成数 x pP 4 3 样本方差估计总体方差 二 估计的评价标准 二 估计的评价标准 1 无偏性 设 T 12 n XXX 是未知参数 的一个点估计量 若 满足 E 即估计量的数学期望等于被估计参数则称 是 的无偏估计量 否则称为有偏估计量 需要注意的是 由于估计量 是样本 12 n XXX 的函数 样本量是n维随机变 量 所以对 求平均是按样本 12 n XXX 的概率分布求平均 无偏性是我们衡量点估计量好坏的一个评价标准 这个评价标准的直观意义如下 由于样本的出现带有随机性 所以基于一次具体抽样所得的参数估计值未必等于参数真 值 这是由样本的随机性造成的 我们希望当大量使用这个估计量对参数进行估计时 一系列估计值的平均值应该与待估参数真值相等 这就从平均效果上对估计量的优劣给 出一个评价标准 2 有效性 设 11 T 12 n XXX 22 T 12 n XXX 均为未知参数 的无偏估计 量 如果对参数 的一切可能取值有 则称无偏估计量 1 比 2 有效 2 2 1 2 一个无偏估计量并不意味着他就非常接近被估计的参数 他还必须与总体参数的离 散程度比较小 对同一总体参数的两个无偏点估计量 方差小者更有效 3 一致性 指随着样本单位数 n 的增大 样本估计量将在概率意义下越来越接近于总体真实 值 若对于任意 0 有 22 S 1 lim P n 5 二 区间估计法二 区间估计法 在参数估计中 虽然点估计可以给出未知参数的一个估计 但不能给出估计的精度 为此人们希望利用样本给出一个范围 要求它以足够大的概率包含待估参数真值 这就 是导致区间估计问题 所谓区间估计 就是估计总体参数的区间范围 并要求给出区间估计成立的概率值 设是未知参数 是来自总体的样本 构造两个统计量 12 n XXX 11 T 对于给定的 0 1 若 12 n XXX 22 T 12 n XXX 1 满足 2 1 P 2 1 则称随机区间 是参数的置信水平为的置信区间 称为 1 2 1 1 的置信度 称为置信限 1 2 1 2 这里有几点需要说明 1 区间 的端点 及长度 都是样本的函数 从而都是随 1 2 1 2 2 1 机变量 因此 是一个随机区间 1 2 2 是说随机区间 以的概率包含未知 1 P 2 1 1 2 1 参数真值 区间长度 描述估计的精度 置信水平描述了估计的可靠度 2 1 1 3 因为未知参数是非随机变量 所以不能说落入区间 的概率是 1 2 而应是随机区间 包含的概率是 1 1 2 1 通俗地说 在点估计的基础上 给出总体参数的一个范围称为区间估计 二 总体均值的区间估计 二 总体均值的区间估计 1 正态总体且方差已知 或非正态总体 方差未知 大样本情况下 6 在这种情况下 样本均值的抽样分布呈正态分布 其数学期望为总体均值 方差 为 则称为总体均值在置信水平下的置信区间 2 n 2 XZ n 1 区间估计步骤 区间估计步骤 1 1 计算样本统计量计算样本统计量 2 2 计算抽样平均误差计算抽样平均误差 3 3 计算极限误差计算极限误差 4 4 确定置信区间确定置信区间 5 5 估计总量指标估计总量指标 注意抽样方法的不同注意抽样方法的不同 例 例 保险公司从投保人中随机抽取 36 人 计算得 36 人的平均年龄岁 39 5X 已知投保人平均年龄近似服从正态分布 标准差为 7 2 岁 试求全体投保人平均年龄的 置信水平为 99 的置信区间 解 查表得10 99 0 01 0 1 N 2 2 575Z 2 7 2 39 52 57536 41 36 XZ n px n pp n p x 1 pp xx 22 pp xx ppxx NPXN 7 2 7 2 39 52 57542 59 36 XZ n 故全体投保人平均年龄的置信水平为 99 的置信区间为 36 41 42 59 若总体方差未知 可用样本方差 S2代替 2 即 39 5 2 13 37 37 41 63 投保人平均年龄在 90 的置信水平下的置信区间 为 37 37 岁 41 63 岁 2 正态总体 方差未知 小样本情况下 如果总体服从正态分布 无论样本容量大小 样本均值的抽样分布都服从正态分布 只要总体方差已知 即使在小样本情况下 也可以计算总体均值的置信区间 如果总体 方差未知 需用样本方差 S2代替 在小样本情况下 应用 分布来建立总体均值的 2 t 置信区间 分布是类似正态分布的一种对称分布 他通常要比正态分布平坦和分散 随着自t 由度的增大 分布逐渐趋于正态分布 t 正态总体 方差未知 小样本情况下 总体均值在置信水平下的置信区间为 1 重复抽样条件下 6 186 18 2 s Xt n 不重复抽样条件下 6 196 19 2 1 sNn Xt Nn 其中为 t 分布临界值 可以查 t 分布临界值表得到 2 1 tn 三 成数的区间估计 三 成数的区间估计 在大样本 一般经验规则 条件下 样本比例的抽样分布5 1 5npnp 和 可用正态分布近似 在这种情况下 数理统计已经证明如下结论 置信水平为的置信区间为 1 8 重复抽样 2 1 pp pZ n 不重复抽样 2 1 1 ppNn pZ nN 例 例 某城市想要估计下岗职工中女性所占的比例 采取重复抽样方法随机抽取了 100 名下岗职工 其中 65 人为女性 试以 95 的置信水平估计该城市下岗职工中女性 所占比例的置信区间 解 已知 100n 2 1 96z 65 65 100 p 根据公式得 2 1 65 1 65 65 1 96 100 pp pZ n 即 65 9 35 55 65 74 35 95 的置信水平下估计该城市下岗职工中女性 所占比例的置信区间为 55 65 74 35 例 例 某企业共有职工 1000 人 企业准备实行一项改革 在职工中征求意见 采 用不重复抽样方法 随机抽取 200 人作为样本 调查结果显示 由 150 人表示赞成这项 改革 有 50 人表示反对 试以 95 的置信水平确定赞成改革的人数比例的置信区间 解 已知 200n 2 1 96z 150 75 200 p 根据公式得 2 1 1 ppNn pZ nN 75 1 75 1000200 75 1 96 2001000 1 即 75 5 37 69 63 80 37 95 的置信水平下估计赞成改革的人数比例的 置信区间为 69 63 80 37 三 样本容量的确定三 样本容量的确定 一 影响样本容量的意义 一 影响样本容量的意义 9 在抽取样本时样本容量应多大是一个很实际的问题 样本容量取得比较大 收集的 信息就比较多 从而估计精度比较高 但进行观测所投入的费用 人力及时间就比较多 样本容量取得比较小 则投入的费用 人力及时间就比较少 但收集的信息也比较少 从而估计精度比较低 这说明精度和费用对样本量的影响是矛盾的 不存在既使精度最 高又使费用最省的样本量 一个常用的准则是在使精度得到保证的前提下寻求使费用最 省的样本量 由于费用通常是样本量的正向线性函数 故使费用最省的样本量也就是使 精度得到保证的最小样本量 二 估计总体均值时样本容量的确定 二 估计总体均值时样本容量的确定 重复抽样条件下 2 22 2 z n 在简单随机不重复抽样条件下 2 2 22 222 Nz n Nz 或或 S S 通常未知 一般按以下方法确定其估计值 通常未知 一般按以下方法确定其估计值 过去的经验数据 过去的经验数据 试验调查样本的试验调查样本的 S S 例例 在某企业中采用简单随机抽样调查职工月平均奖金额 设职工月奖金额服从标 准差为 10 元的正态分布 要求估计的绝对误差为 3 元 可靠度为 95 试问应抽多少职 工 解 已知则 2 10310 951 96z 2 22 22 22 1 9610 42 6843 3 z n 即需抽取 43 名职工作为样本进行调查 三 估计成数时样本大小的确定 三 估计成数时样本大小的确定 在简单随机重复抽样条件下 得到样本容量 重复抽样条件下 2 2 2 1 P Z PP n 在简单随机不重复抽样条件下 我们可以得出估计总体比例时样本容量的计算公式为 10 不重复抽样条件下 2 2 2 22 1 1 P NZ PP n NZ PP 例例 根据以往的生产统计 某种产品的合格率为 90 现要求绝对误差为 5 在置信水 平为 95 的置信区间时 应抽取多少个产品作为样本 已知 90 P 5 P 2 1 96Z 则 2 2 2 1 P Z PP n 2 2 1 960 9 1 0 9 139 0 05 必要样本容量的影响因素必要样本容量的影响因素 1 总体方差的大小 2 允许误差范围的大小 3 概率保证程度 4 抽样方法 5 抽样的组织方式 第三节第三节 抽样的组织形式抽样的组织形式 抽样的组织形式有纯随机抽样 机械抽样 类型抽样 整群抽样和多阶段抽样 一 纯随机抽样一 纯随机抽样 1 含义 对总体单位逐一编号 然后按随机原则直接从总体中抽出若干单位构成样本 2 特点 最符合抽样调查的随机原则 是基本形式 简便易行 3 范围 仅适用于单位数不多 标志变异较小 分布较均匀的总体 二 类型抽样二 类型抽样 1 含义 先将全及总体中的所有单位按某一主要标志分组 然后在各组中采用纯随机抽 样或机械抽样方式 抽取一定数目的调查单位构成所需的样本 又叫分层抽样或分类抽 样 11 2 方法 A 比例分配法 ni n Ni N B 最佳分配法 根据各层单位的变异程度的大小来
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年度全方位OA系统建设协议
- 2026年保险运营设备租赁协议
- 大地测量员技巧评优考核试卷含答案
- 2025年遵义市中医院医护人员招聘考试试题及答案详解
- 木门窗工变革管理模拟考核试卷含答案
- 2025-2026学年真假和尚教学设计
- 2026年彬县妇幼保健站医护人员招聘笔试备考题库及答案详解
- 2026年重庆大江车辆总厂平山车桥分厂职工医院医护人员招聘笔试模拟试题及答案详解
- 2025-2026学年坐下拍球教学设计
- 2026年惠州市中医医院(东江新城院区)医护人员招聘笔试参考试题及答案详解
- GB/T 10801.2-2025绝热用挤塑聚苯乙烯泡沫塑料(XPS)
- 2025年博物馆展览管理与维护规范
- 河南周口介绍
- 国家事业单位招聘2024中国人民银行数字货币研究所招聘6人笔试历年参考题库典型考点附带答案详解(3卷合一)试卷2套
- 《应有格物致知精神》课文精讲
- 雨课堂学堂在线学堂云《信息检索与科技写作( 理大)》单元测试考核答案
- 新手教师职业成长问题及解决对策
- 《追忆似水年华》课件
- 2025及未来5年高氯酸钾项目投资价值分析报告
- 危重患者血压的管理
- 危大工程巡视检查记录表(模版)
评论
0/150
提交评论