第七讲参数估计-685304785解析.ppt_第1页
第七讲参数估计-685304785解析.ppt_第2页
第七讲参数估计-685304785解析.ppt_第3页
第七讲参数估计-685304785解析.ppt_第4页
第七讲参数估计-685304785解析.ppt_第5页
免费预览已结束,剩余30页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七讲参数估计 一 什么是参数估计 参数估计就是用样本统计量对总体的未知参数进行估计 简称参数估计 以样本的统计值来估计总体的参数值 有两类做法 一类是点估计 另一类是区间估计 1 点估计是以一个最适当的样本统计值来代表总体的参数值 合适的样本统计量作为参数估计量 如下 2 区间估计就是以两个数值之间的间距来估计参数值 区间估计要包括两个要素 一是要有合理的允许误差范围 指样本统计量与被估计总体参数离差的绝对值可允许变动的上限或下限 二是要有一个可接受的置信度 置信度又称推断的概率保证程度 这是估计的可靠性问题 二 点估计的估计方法 点估计 以一个最适当的样本统计值代表总体的参数值 评价估计量优劣的三个标准 1 无偏性 即样本统计量的期望值 平均值 等于被估计的总体参数 虽然每一次抽样的统计量取值和总体参数的真值可能有误差 但在多次反复抽样中 所有样本统计量取值的平均数应该等于总体参数本身 2 一致性 即当样本的单位数充分大时 样本统计量充分靠近总体参数 有效性 即作为优良估计量的方差比其他估计量的方差小 用样本均值作为总体均值的点估计 用样本方差作为总体方差的点估计 对于是定类变量 X取值为 1 0 可以用样本成数作为总体成数估计值 例1 工会为了解春游期间需租用几辆公共汽车 在全厂10000名职工中随机抽取100人进行调查 结果显示 其中有20名愿意外出旅游 设每辆车可载乘客50名 问估计要预租多少辆公共汽车 解 P 20 100 0 2可以用P作为愿意外出春游总体成数的点估计 因此全厂估计将有 10000 0 2 2000 人 参加春游 又因为每辆公共汽车可容乘客50人 因此有 2000 50 40 辆 三 区间估计的估计方法1 置信区间置信区间是用来估计参数取值范围的 是根据给定的置信度要求 指出总体参数被估计的上限和下限 2 置信度与显著性水平对于总体被估计参数 找出样本的两个估计量 1和 2 1 2 使被估计参数落在区间 1 2 内的概率为1 其中 为介于0 1之间的已知数 即P 1 2 1 称区间 1 2 为总体参数的估计区间 1为估计下限 2为估计上限 1 为估计置信度 表示用置信区间估计的可靠性 为显著性水平 表示用置信区间估计不可靠的程度 3 置信区间与置信度的关系置信区间指被估计参数的可能范围 置信度为对参数落在这一范围内给定的概率保证程度 参数的可能范围是估计的准确性问题 而相应的概率保证程度 置信度 是估计的可靠性问题 在作估计时我们常常希望准确性尽可能提高 而且可能性也不能小 但这两个要求是矛盾的 在样本容量不变的条件下 要缩小估计区间 提高估计的准确性 势必减少置信度 降低估计的可靠性 例2 用有放回抽样的方法 从5人中间抽取2个构成样本 求样本日平均工资 并推算总体的工资水平置信区间 1 计算样本日平均平均数和方差为42和33 2 根据以上分布资料可以写出样本日平均工资落在各种区间的概率p 例如 P 40 44 4 25 5 25 4 25 13 25P 38 46 3 25 4 25 5 25 4 25 3 25 19 25P 34 50 1 25 2 25 19 25 2 25 1 25 1 在重复抽样中 样本日平均工资与总体日平均工资的绝对离差不超过2元的概率为13 25 即有52 的概率保证总体日平均工资落在40 44元之间 绝对离差不超过4元的概率为19 25 76 抽样误差不超过8元的概率为100 抽样误差范围和估计置信度是密不可分的 抽样误差愈小 估计准确度愈高 但置信度愈小 置信度与准确性的关系 当均值为0 标准差为1时 正态分布为标准化正态分布 4 抽样误差范围的计算假定我们以Z表示置信度 S表示样本的标准差 SE 表示抽样平均误差 抽样标准误 n是样本的大小 为抽样误差范围 Z 例3 经抽样调查计算样本亩产粮食600公斤 并求得抽样平均误差为3公斤 现在给定抽样误差范围为6公斤 求总体平均亩产落在估计区间的概率 已知 X 600公斤 SE 3公斤 6公斤 则 估计区间是为 600 6 600 6 594 606 Z SE 6 3 2查正态概率表 落在估计区间内的概率为F Z F 2 95 45 例4 麦当劳餐馆在7星期内抽查49位顾客的消费额 元 如下 求在概率90 的保证下 顾客平均消费额的估计区间 第一步 根据样本计算样本平均数和标准差 32 s 9 45 9 45 7 1 35第二步 根据给定的置信度F Z 90 查概率表得Z 1 64第三步 计算 Z SE 1 64 1 35 2 2元据此估计总体平均消费额下限 32 2 2 29 8元 估计总体平均消费额上限 32 2 2 34 2元点估计 麦当劳餐馆总体顾客平均消费额为32元 区间估计 以90 的概率保证 麦当劳餐馆顾客消费额在29 8 34 2之间 例5 麦当劳抽查49位顾客的消费额如下表 抽样误差范围不超过2 2元 试估计顾客平均消费额的置信区间 并计算其置信度 第一步 抽取样本 计算样本平均数和标准差 32 9 45 9 45 7 1 35第二步 根据给定的 2 2 计算总体平均消费额的上限和下限 总体平均消费额下限 32 2 2 29 8元 估计总体平均消费额上限 32 2 2 34 2元第三步 根据Z SE 2 2 1 35 1 63 查概率表得F Z 90 计算结果表明以90 的概率保证麦当劳顾客平均消费的置信区间为29 8 34 2之间 四 总体成数 比例 百分比 的估计例6 在一项新广告活动的跟踪调查中 被调查的400人中有240人能记起广告的标语 试求能记起广告标语占总体比率的95 置信度的估计区间 第一步 根据样本资料计算 P n1 n2 240 400 60 SE 0 0245 第二步 根据给定的置信度要求F Z 0 95 查概率表求Z值 得Z 1 96第三步 根据 p Z SE 1 96 2 45 4 8 则总体比率的上下限为 下限 P p 60 4 8 55 2 上限 P p 60 4 8 64 8 区间估计 以概率95 的保证程度 估计会记起广告标语的人数占总体比率在55 2 64 8 之间 例7 估计某市居民住户拥有冰箱的普及率 随机抽取900户居民户 其中有675户居民有冰箱 在抽样极限误差不超过2 8 的情形下 试对该市居民住户冰箱普及率进行估计 第一步 计算成数 标准差 并推算抽样平均误差SE P 675 900 75 s 0 43SE 1 4 第二步 根据给定的 p 2 8 计算总体成数估计区间的下限和上限 估计区间下限 P p 75 2 8 72 2 估计区间上限 P p 75 2 8 77 8 第三步 根据Z p SE 2 8 1 4 2 查概率表得F 2 95 45 点估计 估计该市居民冰箱普及率为75 区间估计 以概率95 45 的保证程度 估计该市居民冰箱普及率在72 2 77 8 之间 五 样本的确定 理论上讲 样本越大越有代表性 但样本大 所需要的研究费用也越大 因此在调查前需要结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论