(05)第5章+参数估计.ppt_第1页
(05)第5章+参数估计.ppt_第2页
(05)第5章+参数估计.ppt_第3页
(05)第5章+参数估计.ppt_第4页
(05)第5章+参数估计.ppt_第5页
已阅读5页,还剩109页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章参数估计 5 1参数估计的一般问题5 2一个总体参数的区间估计5 3两个总体参数的区间估计5 4样本容量的确定本章小结 学习目标 估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准一个总体参数的区间估计方法样本容量的确定方法 参数估计在统计方法中的地位 统计推断的过程 5 1参数估计的一般问题 一 估计量与估计值二 点估计与区间估计三 评价估计量的标准 估计量与估计值 为什么要进行参数估计 如果掌握了所研究总体的全部数据 容易得到总体的全部统计特征 但实际情况中往往不可能对总体的每个单位都进行测定 测定是破坏性的 如生产造飞机用的铆钉等当总体的单位数很多时这时就需要从总体中抽取一部分单位进行调查 进而利用样本提供的信息来推断总体的数量特征 参数估计 参数估计 用样本统计量去估计总体的参数用样本均值估计总体均值 用样本方差s2去估计总体方差 2用样本比率p估计总体比率 估计量与估计值 estimator estimatedvalue 估计量 用于估计总体参数的统计量例如 样本均值 样本比率 样本方差等总体参数用 表示 估计量用表示估计值 估计参数时计算出来的统计量的具体数值如果样本均值 x 80 则80就是估计量总体均值 的一个估计值 点估计与区间估计 参数估计的方法 点估计 pointestimate 点估计 用样本的估计量的值直接作为总体参数 的估计值 例如 用样本均值直接作为总体均值的估计用两个样本均值之差直接作为总体均值之差的估计点估计的方法 矩估计法 顺序统计量法 最大似然法 最小二乘法等缺点 没有给出估计值接近总体参数程度的信息 区间估计 intervalestimate 区间估计 在点估计的基础上 给出总体参数估计的一个区间范围 该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量某班级平均分数在75 85之间 置信水平是95 总体区间的区间估计 由样本均值的抽样分布可知 在重复抽样或无限总体抽样的情况下 大样本 样本均值服从数学期望为 标准差为的正态分布 即 样本均值的分布 大样本 总体均值的估计 可以求出样本均值落在总体均值 两侧任何一个抽样标准差值范围内的概率但实际估计时 样本均值是已知的 而 是未知的 由于与 的位置是对称的 如果某个样本的平均值落在 的两个标准误差的范围之内 反过来 也被包括在以为中心左右两个标准误差的范围之内 区间估计的图示 置信区间 confidenceinterval 由样本统计量所构造的总体参数的估计区间称为置信区间 其中区间的最小值称为置信下界 最大值称为置信上界统计学家在某种程度上确信这个区间会包含真正的总体参数 所以给它取名为置信区间 置信水平 将构造置信区间的步骤重复很多次 置信区间包含总体参数真值的次数所占的比率称为置信水平表示为 1 为是总体参数未在区间内的比率常用的置信水平值有99 95 90 相应的 为0 01 0 05 0 10 常用置信水平 在构造置信区间时 一般用所希望的值作为置信水平 比较常用的置信水平及标准正态分布曲线下右侧面积为 2时的z值 z 2 置信区间的理解 总体参数是固定的 未知的 而用样本构造的区间是不固定的所以对由一个具体的样本所构造的一个特定区间 我们无法知道该区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个 但它也可能是少数几个不包含参数真值的区间中的一个 置信区间的理解 续 置信区间是一个随机区间 它会因样本的不同而不同 而且不是所有的区间都包含总体参数的真值置信水平不是用来描述某个特定的区间包含总体参数真值的可能性的 一个特定区间 总是包含 或 绝对不包含 参数的真值 不存在 可能包含 或 可能不包含 的问题 置信区间 95 的置信区间 重复构造出 的20个置信区间 点估计值 置信区间与置信水平 影响区间宽度的因素 总体数据的离散程度 用 来测度样本容量 当置信水平固定时 置信区间随着样本容量的增大而减小 即较大样本所提供的有关总体的信息要比较小的样本多置信水平 1 影响z的大小 当样本容量确定时 置信区间随着置信水平的增大而增大 评价估计量的标准 无偏性 unbiasedness 无偏性 估计量抽样分布的数学期望等于被估计的总体参数 无偏性 续 设总体参数为 所选估计量为 如果 则将称为 的无偏估计量样本均值 样本比率p 样本方差s2分别是总体均值 总体比率 总体方差 2的无偏估计 有效性 efficiency 有效性 对同一总体参数的两个无偏点估计量 有更小标准差的估计量更有效 相合性 consistency 相合性 随着样本容量的增大 估计量的值越来越接近被估计总体的参数 5 2一个总体参数的区间估计 一 总体均值的区间估计二 总体比率的区间估计三 总体方差的区间估计 一个总体参数的区间估计 总体均值的区间估计 大样本 总体均值的区间估计 大样本 假定条件总体服从正态分布 且方差 已知如果不是正态分布 可由正态分布来近似 n 30 使用正态分布统计量z 总体均值 在1 置信水平下的置信区间为 总体均值的区间估计 例题分析 例 一家食品生产企业以生产袋装食品为主 为对产量质量进行监测 企业质检部门经常要进行抽检 以分析每袋重量是否符合要求 现从某天生产的一批食品中随机抽取了25袋 测得每袋重量如下表所示 已知产品重量的分布服从正态分布 且总体标准差为10g 试估计该批产品平均重量的置信区间 置信水平为95 总体均值的区间估计 例题分析 正态性评估 食品重量的正态概率图 总体均值的区间估计 例题分析 解 已知 N 102 n 25 1 95 z 2 1 96根据样本数据计算得 总体均值 在1 置信水平下的置信区间为 该食品平均重量95 的置信区间为101 44g 109 28g 总体均值的区间估计 例题分析 例 一家保险公司收集到由36投保个人组成的随机样本 得到每个投保人的年龄 周岁 数据如下表 试建立投保人年龄90 的置信区间 总体均值的区间估计 例题分析 解 已知n 36 1 90 z 2 1 645根据样本数据计算得 总体均值 在1 置信水平下的置信区间为 投保人平均年龄的置信区间为37 37岁 41 63岁 练习题 习题 把在许多社区大学的学生群体看作 通勤 走读 学生总体 学生活动办公室想回答这样的问题 社区大学学生每天乘上下班交通车到大学平均有多远 单程 识别100名通勤学生的一组随机样本 得到每名学生的单程距离 所产生的样本平均距离是10 22英里 估计全部通勤生的平均单程距离 使用 a 点估计 b 95 的置信区间 假设 6英里 总体均值的区间估计 小样本 总体均值的区间估计 小样本 假定条件总体服从正态分布 且方差 未知小样本 n 30 使用t分布统计量 总体均值 在1 置信水平下的置信区间为 t分布 t分布是类似正态分布的一种对称分布 它通常要比正态分布平坦和分散一个特定的分布依赖于称之为自由度的参数 随着自由度的增大 分布也逐渐趋于正态分布 t分布的定义 设总体随机变量X N 2 x1 x2 xn为取自该总体的n个随机样本 当 2未知时 以样本方差s2替代 则是自由度为n 1的t分配 记为t n 1 t分布的概率密度 t n 1 的概率密度函数为其中 为伽玛函数 t分布的统计特性 t n 1 分布具有对称性 且以t 0为对称轴 其随机变量取值范围为 t n 1 分布期望值为0 方差为 n 1 n 3 即 t分布的统计特性 续 t n 1 分布的形状类似标准正态分布 但由于t n 1 的方差大于1 当n 3时 n 1 n 3 1 所以t n 1 分布比标准正态分布更分散 即t n 1 的概率密度函数是中央部分较标准正态分布低 而两尾部分则较标准正态分布高 t分布的统计特性 续 当抽样数目n增大时 t n 1 的方差越来越接近1 同时t n 1 分布的形状也越来越接近标准正态分布 理论上 当n 时t n 1 与标准正态分布完全一致 一般认为n 30就说t n 1 与标准正态分布非常接近 t分布的 分为点 对于给定的 0 1 称满足条件的点t n 为t分布上的 分为点由t分布概率密度函数的对称性有 t分布 分为点的求法 t分布 分为点的求法 对于n 45的 分为点可查表求得 当n充分大 n 45 时 近似地有其中u 为标准正态分布上的 分为点 例题分析 n 9 0 05 求t0 05 9 n 9 0 95 求t0 95 9 n 18 求t0 025 18 及t0 975 18 使得P t0 975 18 t t0 025 18 0 95n 50 0 05 求t0 05 50 总体均值的区间估计 例题分析 例 已知某种灯泡的寿命服从正态分布 现从一批灯泡中随机抽取16只 测得其使用寿命 小时 如下 建立该批灯泡平均使用寿命95 的置信区间 总体均值的区间估计 例题分析 正态性评估 灯泡寿命的正态概率图 总体均值的区间估计 例题分析 解 已知X N 2 n 16 1 95 t 2 2 131根据样本数据计算得 总体均值 在1 置信水平下的置信区间为 该种灯泡平均使用寿命的置信区间为1476 8小时 1503 2小时 总体均值的区间估计 汇总 总体比率的区间估计 总体比率的区间估计 假定条件 只谈论大样本的情况 总体服从二项分布可以由正态分布来近似使用正态分布统计量z 总体比率 在1 置信水平下的置信区间为 大样本的判定 对于总体比率的估计 确定样本容量是否 足够大 的一般经验规则是 区间中不包含0或1 或者要求np 5和n 1 p 5 总体比率的区间估计 例题分析 例 某城市想要估计下岗职工中女性所占的比率 随机地抽取了100名下岗职工 其中65人为女性职工 试以95 的置信水平估计该城市下岗职工中女性比率的置信区间 解 已知n 100 p 65 1 95 z 2 1 96 该城市下岗职工中女性比率的置信区间为55 65 74 35 总体方差的区间估计 总体方差的区间估计 估计一个总体的方差或标准差假设总体服从正态分布总体方差 2的点估计量为s2 且 总体方差在1 置信水平下的置信区间为 总体方差的区间估计 图示 2 21 2 总体方差1 的置信区间 自由度为n 1的 2分布 总体方差的区间估计 例题分析 例 一家食品生产企业以生产袋装食品为主 现从某天生产的一批食品中随机抽取了25袋 测得每袋重量如下表所示 已知产品重量的分布服从正态分布 以95 的置信水平建立该种食品重量方差的置信区间 总体方差的区间估计 例题分析 解 已知n 25 1 95 根据样本数据计算得s2 93 21 2置信度为95 的置信区间为 该企业生产的食品总体重量标准差的的置信区间为7 54g 13 43g 一个总体参数的区间估计 小结 5 3两个总体参数的区间估计 一 两个总体均值之差的区间估计二 两个总体比率之差的区间估计三 两个总体方差比的区间估计 两个总体参数的区间估计 两个总体均值之差的区间估计 独立大样本 两个总体均值之差的估计 大样本 假定条件两个总体都服从正态分布 1 2 已知若不是正态分布 可以用正态分布来近似 n1 30和n2 30 两个样本是独立的随机样本使用正态分布统计量z 两个总体均值之差的估计 大样本 1 2 已知时 两个总体均值之差 1 2在1 置信水平下的置信区间为 1 2 未知时 两个总体均值之差 1 2在1 置信水平下的置信区间为 两个总体均值之差的估计 例题分析 例 某地区教育委员会想估计两所中学的学生高考时的英语平均分数之差 为此在两所中学独立抽取两个随机样本 有关数据如右表 建立两所中学高考英语平均分数之差95 的置信区间 两个总体均值之差的估计 例题分析 解 两个总体均值之差在1 置信水平下的置信区间为 两所中学高考英语平均分数之差的置信区间为5 03分 10 97分 两个总体均值之差的区间估计 独立小样本 两个总体均值之差的估计 小样本 12 22 假定条件两个总体都服从正态分布两个总体方差未知但相等 1 2 两个独立的小样本 n1 30和n2 30 总体方差的合并估计量 估计量 x1 x2的抽样标准差 两个总体均值之差的估计 小样本 12 22 两个样本均值之差的标准化 两个总体均值之差 1 2在1 置信水平下的置信区间为 两个总体均值之差的估计 例题分析 例 为估计两种方法组装产品所需时间的差异 分别对两种不同的组装方法各随机安排12名工人 每个工人组装一件产品所需的时间 分钟 下如表 假定两种方法组装产品的时间服从正态分布 且方差相等 试以95 的置信水平建立两种方法组装产品所需平均时间差值的置信区间 两个总体均值之差的估计 例题分析 解 根据样本数据计算得合并估计量为 两种方法组装产品所需平均时间之差的置信区间为0 14分钟 7 26分钟 两个总体均值之差的估计 小样本 12 22 假定条件两个总体都服从正态分布两个总体方差未知且不相等 1 2 两个独立的小样本 n1 30和n2 30 使用统计量 两个总体均值之差的估计 小样本 12 22 两个总体均值之差 1 2在1 置信水平下的置信区间为 两个总体均值之差的估计 例题分析 例 沿用前例 假定第一种方法随机安排12名工人 第二种方法随机安排名工人 即n1 12 n2 8 所得的有关数据如表 假定两种方法组装产品的时间服从正态分布 且方差不相等 以95 的置信水平建立两种方法组装产品所需平均时间差值的置信区间 两个总体均值之差的估计 例题分析 解 根据样本数据计算得自由度为 两种方法组装产品所需平均时间之差的置信区间为0 192分钟 9 058分钟 两个总体均值之差的区间估计 匹配样本 两个总体均值之差的估计 匹配大样本 假定条件两个匹配的大样本 n1 30和n2 30 两个总体各观察值的配对差服从正态分布两个总体均值之差 d 1 2在1 置信水平下的置信区间为 两个总体均值之差的估计 匹配小样本 假定条件两个匹配的大样本 n1 30和n2 30 两个总体各观察值的配对差服从正态分布两个总体均值之差 d 1 2在1 置信水平下的置信区间为 两个总体均值之差的估计 例题分析 例 由10名学生组成一个随机样本 让他们分别采用A和B两套试卷进行测试 结果如下表 试建立两种试卷分数之差 d 1 295 的置信区间 两个总体均值之差的估计 例题分析 解 根据样本数据计算得 两种试卷所产生的分数之差的置信区间为6 33分 15 67分 两个总体比率之差的区间估计 假定条件两个总体服从二项分布可以用正态分布来近似两个样本是独立的两个总体比率之差 1 2在1 置信水平下的置信区间为 两个总体比率之差的区间估计 两个总体比率之差的估计 例题分析 例 在某个电视节目的收视率调查中 农村随机调查了400人 有32 的人收看了该节目 城市随机调查了500人 有45 的人收看了该节目 试以90 的置信水平估计城市与农村收视率差别的置信区间 两个总体比率之差的估计 例题分析 解 已知n1 500 n2 400 p1 45 p2 32 1 95 z 2 1 96 1 2置信度为95 的置信区间为 城市与农村收视率差值的置信区间为6 68 19 32 两个总体方差比的区间估计 两个总体方差比的区间估计 比较两个总体的方差比用两个样本的方差比来判断如果S12 S22接近于1 说明两个总体方差很接近如果S12 S22远离1 说明两个总体方差之间存在差异总体方差比在1 置信水平下的置信区间为 两个总体方差比的区间估计 图示 两个总体方差比的区间估计 例题分析 例 为了研究男女学生在生活费支出 元 上的差异 在某大学各随机抽取25名男学生和25名女学生 得到下面的结果 男学生 女学生 试以90 置信水平估计男女学生生活费支出方差比的置信区间 两个总体方差比的区间估计 例题分析 解 根据自由度n1 25 1 24 n2 25 1 24 查得F 2 24 1 98 F1 2 24 1 1 98 0 505 12 22置信度为90 的置信区间为 男女学生生活费支出方差比的置信区间为0 47 1 84 5 4样本容量的确定 一 估计总体均值时样本容量的确定二 估计总体比率时样本容量的确定三 估计总体均值之差时样本容量的确定四 估计总体比率之差时样本容量的确定 估计总体均值时样本容量的确定 估计总体均值时样本容量的确定 估计总体均值时样本容量为其中E为在给定的置信水平下使用者可以接受的允许误差若 的值未知 可用类似样本的标准差来代替 也可用实验调查的办法 选择一个初始样本 以该样本的标准差作为 的估计值通常样本容量取所计算值的上整数 估计总体均值时样本容量的确定 样本容量n与总体方差 2 允许误差E 可靠性系数Z或t之间的关系为与总体方差成正比与允许误差成反比与可靠性系数成正比 估计总体均值时样本容量的确定 例题分析 例 拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元 假定想要估计年薪95 的置信区间 希望允许误差为400元 应抽取多大的样本容量 估计总体均值时样本容量的确定 例题分析 解 已知 2000 E 400 1 95 z 2 1 96应抽取的样本容量为 即应抽取97人作为样本 估计总体比率时样本容量的确定 估计总体比率时样本容量的确定 根据比率区间估计公式可得样本容量为其中E为给定的置信水平下使用者可以接受的允许误差 一般小于0 1若 的值未知 可用类似的样本比率来代替 也可用实验调查的办法 选择一个初始样本 以该样本的比率作为 的估计值若 的值无法知道时 可取最大值0 5 估计总体比率时样本容量的确定 例题分析 例 根据以往的生产统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论