版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、二战中的点估计 德军有多少辆坦克,二战期间,盟军非常想知道德军总共制造了多少辆坦克。德国人在制造坦克时是墨守成规的,他们把坦克从1开始进行了连续编号。在战争过程中,盟军缴获了一些敌军坦克,并记录了它们的生产编号。那么怎样利用这些号码来估计坦克总数呢?在这个问题中,总体参数是未知的坦克总数N,而缴获坦克的编号则是样本。 假设我们是盟军手下负责解决这个问题的统计人员。制造出来的坦克总数肯定大于等于记录的最大编号。为了找到它比最大编号大多少,我们先找到被缴获坦克编号的平均值,并认为这个值是全部编号的中点。因此样本均值乘以2就是总数的一个估计;当然要特别假设缴获的坦克代表了所有坦克的一个随机样本。这种
2、估计N的公式的缺点是:不能保证均值的2倍一定大于记录中的最大编号,二战中的点估计 德军有多少辆坦克,N的另一个点估计公式是:用观测到的最大编号乘以因子1+1/n,其中 n 是被俘虏坦克个数。假如你俘虏了10 辆坦克,其中最大编号是50,那么坦克总数的一个估计是(1+1/10)50=55。此处我们认为坦克的实际数略大于最大编号。 从战后发现的德军记录来看,盟军的估计值非常接近所生产的坦克的真实值。记录仍然表明统计估计比通常通过其他情报方式作出估计要大大接近于真实数目。统计学家们做得比间谍们更漂亮,资料来源:GUDMUND R.IVERSEN和MARY GERGRN著,吴喜之等译:统计学基本概念和
3、方法,高等教育出版社,施普林格出版社,2000,参数估计,参数估计的基本概念,用来推断总体参数的统计量称为估计量(estimator), 其取值称为估计值(estimate) 。 同一个参数可以有多个不同的估计量。参数是唯一的,但估计量(统计量)是随机变量,取值是不确定的,本章的学习目的,抽样与抽样分布是推断统计的基础。 统计推断就是根据样本的信息,对总体的特征作出推断,包括参数估计和假设检验。 参数估计是在抽样及抽样分布的基础上,根据样本的统计量来推断总体参数。 一个总体参数的估计,两个总体参数的估计,样本容量的确定,统计方法,统计描述,统计推断,参数估计,假设检验,点估计,区间估计,基本概
4、念,常用的估计量,样本平均数、样本方差、样本比率。 点估计:用一个点(数)估计未知参数。 例如:用样本均值作为总体未知均值的估计值。 点估计没有给出估计值接近总体未知参数程度的信息 优点:简单,能够明确的估计总体参数。 缺点:其误差与可靠性不得而知。 点估计的方法:特征数法、矩估计法、顺序统计量法、最大似然法、最小二乘法。 区间估计:用一个区间估计未知数,把未知参数估计在某两界限之间。样本统计量加减抽样误差,譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数 N 的极大似然估计为1000条,若我们能给出一个区间,在此区间内我们合理地相信 N 的真值位于其中. 这样对鱼数的估计就有把
5、握了,实际上,N的真值可能大于1000条,也可能小于1000条,参数的区间估计,也就是说,我们希望确定一个区间,使我们能以比较高的可靠程度相信它包含真参数值,湖中鱼数的真值,这里所说的“可靠程度”是用概率来度量的 , 称为置信度或置信水平,区间估计,根据事先确定的置信度1 - 给出总体参数的一个估计范围。 置信度1 - 的含义是:在同样的方法得到的所有置信区间中,有 (1- )% 的区间包含总体参数。 抽样分布是区间估计的理论基础,区间估计: 根据样本统计量以一定的可靠程度去估计总体参数值所在的范围或区间,是抽样估计的主要方法,区间估计,抽样估计的置信度与精确度 1.置信度:表示区间估计的可靠
6、程度或把握程度,也 即所估计的区间包含总体参数真实值的可能性大小,一般以1- 表示。其中 表示显著性水平,即参数不落在区间内的概率。 置信度通常采用三个标准: (1)显著性水平=0.05, 即1- =0.95 (2)显著性水平=0.01, 即1- =0.99 (3)显著性水平=0.001,即1- =0.999,12,2.抽样估计的精确度: 用置信区间的大小即抽样极限/允许误差来表示。 3.抽样估计的置信度与区间大小关系: 在样本容量和其他条件一定的情况下,区间估计,若希望抽样估计有较高的可靠度,则必须扩大置信区间,即:抽样估计要求的把握度越高,则抽样允许误差越大,精确度越低;反之则相反,68.
7、27,95.45,99.73,区间与置信水平,假定条件 总体服从正态分布,且方差() 已知 如果不是正态分布,可由正态分布来近似 (n 30,总体均值 在1-置信水平下的置信区间为,使用正态分布统计量,1,2,3,总体均值的区间估计(大样本,得到,从而,影响因素 标准差 样本容量 n 置信水平 (1a,已知n=40, =15; 计算得到样本均值 由1-=0.95,查标准正态分布概率表得: 于是在95%的置信水平下的置信区间为: 即(40.83,50.13)。结果表明:在95%的置信水平下,二手房交易价格的置信区间为40.83万元50.13万元,沿用前例,假定房地产中介公司从上季度的二手房交易记
8、录中得到以下信息:交易价格的标准差为15万元,于是我们假定总体标准差 =15。试在95%的置信水平下估计二手房平均价格的置信区间,解答,假定条件 总体服从正态分布,且方差() 未知 小样本 n 30,总体均值 在1-置信水平下的置信区间为,使用正态分布统计量,1,2,3,总体均值的区间估计(小样本,t 分布,分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布,沿用前例,假定该房地产公司在某日随机抽取16位二手房购买者,得到二手房交易价格如下表所示(万元,根据以往交易情况得知:二手房交易价格服从正态分布
9、,总体方差225。试在95%的置信水平下估计二手房交易平均价格的置信区间,计算得到样本均值,计算得到样本均值 ; 由1 =0.95,查表得: 于是在95%的置信水平下的置信区间为: 即(36.12,50.82)。 结果表明:在95%的置信水平下,二手房价格的置信区间为36.12万元50.82万元;即该公司可以有95%的把握认为,二手房交易价格介于36.12万元到50.82万元之间,解答,沿用前例,假定该房地产公司在某日随机抽取16位二手房购买者,得到二手房交易价格如下表所示(万元,根据以往交易情况得知:二手房交易价格服从正态分布,但总体方差未知。试在95%的置信水平下估计二手房交易平均价格的置
10、信区间,已知n=16;计算得到样本均值 ; 样本标准差s=14.175,已知n=16;计算得到样本均值 ; 样本标准差s=14.175; 由1 =0.95,查表得: 于是在95%的置信水平下的置信区间为: 即(35.923,51.027)。 结果表明:在95%的置信水平下,二手房价格的置信区间为35.923万元51.027万元;即该公司可以有95%的把握认为,二手房交易价格介于35.923万元到51.027万元之间,解答,单一总体均值的区间估计总结,假定条件 总体服从二项分布 可以用正态分布近似估计 n p 5 且 n (1 - p) 5,置信区间估计,1,2,单一总体比例的区间估计,根据前例
11、的数据,整理得出2006年第一季度交易价格在43万元以上的二手房交易数量及所占比例,试在95%置信水平下估计交易价格在43万元以上的二手房交易所占比例置信区间。整理数据如下,示例,已知 在95%置信水平下的置信区间为: 即(61.76,77.12%)。 结果表明:有95%的把握认为,这一时期价格在43万元以上的二手房交易所占比例的置信区间介于61.76到77.12%之间,解答,假定E (Error)是在一定置信水平下允许的误差范围, 又称边际误差,于是有,估计总体比例时,估计总体均值时,1,2,样本容量的确定,已知: 样本容量: 即应抽取35个交易作为样本,沿用引例,假定房地产中介公司想要估计
12、2005年第四季度二房的平均交易价格。按照历史经验,总体标准差为15万手元。试问:在95%的置信水平下,使二手房平均交易价格的误差范围小于5万元,样本容量应定为多少,1:一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示,样本均值为105.36。已知产品重量的分布服从正态分布,且总体标准差为10克。试估计该批产品平均重量的置信区间,置信水平为95%。 2: 一家保险公司收集到由36投保个人组成的随机样本,得到每个投保人的年龄(周岁)数据如下表,样本均值39.5,方差为
13、60.37。试建立投保人年龄90%的置信区间 3:已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下,样本均值1490,方差613.6。建立该批灯泡平均使用寿命95%的置信区间,例】一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10克。试估计该批产品平均重量的置信区间,置信水平为95,练习,解:已知N(,102),n=25, 1- = 95%,z/2=1.96。 根据样本数据计算
14、得: 总体均值在1-置信水平下的置信区间为,该食品平均重量的置信区间为101.44克109.28克之间,总体均值的区间估计,例】一家保险公司收集到由36投保个人组成的随机样本,得到每个投保人的年龄(周岁)数据如下表。试建立投保人年龄90%的置信区间,总体均值的区间估计 (练习,总体均值的区间估计(例题分析,解:已知n=36, 1- = 90%,z/2=1.645。根据样本数据计算得: , 总体均值在1-置信水平下的置信区间为,投保人平均年龄的置信区间为37.37岁41.63岁,总体均值的区间估计(例题分析,例】未知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)
15、如下。建立该批灯泡平均使用寿命95%的置信区间,总体均值的区间估计(例题分析,解:n-1=15, 1- = 95%,t/2=2.131根据样本数据计算得: , 总体均值在1-置信水平下的置信区间为,该种灯泡平均使用寿命的置信区间为1476.8小时1503.2小时,1:某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间 2:拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望边际误差为400元,应抽取多大的样本量,总体比例的区间估计(例题分析,例】某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间,解:已知 n=100,p65% , 1-= 95%,z/2=1.96,该城市下岗职工中女性比例的置信区间为55.65%74.35,总体方差的区间估计(例题分析,例】一家食品生产企业以生产袋装食品为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026福建泉州市晋江市医院医共体单位编外人员招聘8人备考题库(一)含答案详解(新)
- 2026广西南宁上林县粤桂协作办公室招聘1人备考题库含答案详解(培优)
- 2026年青山湖区住房和城乡建设局下属事业单位面向社会公开招聘工作人员备考题库及答案详解(名校卷)
- 2026航天科工集团数字技术有限公司部分岗位招聘11人备考题库含答案详解(培优b卷)
- 2026湖北省长江新材有限公司社会招聘9人备考题库附答案详解(考试直接用)
- 2026福建厦门工学院人工智能学院教师招聘13人备考题库附答案详解(基础题)
- 2026江西省农业科学院园艺研究所编外招聘1人备考题库附答案详解(巩固)
- 2026广西南宁市邕宁区中医医院招聘脑病科1人备考题库含答案详解(预热题)
- 2026广东中山大学招聘网络与信息中心专业技术人员1人备考题库及参考答案详解
- 2026浙江嘉兴市秀洲区招聘社区工作者33人备考题库附答案详解(典型题)
- 2026浙江杭州萧山水务有限公司春季招聘10人笔试备考试题及答案详解
- 2026浙江省担保集团社会招聘3人笔试备考试题及答案解析
- 2026年及未来5年市场数据中国酒精行业发展运行现状及发展趋势预测报告
- (广东二模)广东省2026年4月高三高考模拟测试(二)地理试卷(含答案)
- 2026年智慧树答案【人工智能原理与技术】智慧树网课章节考前冲刺练习题附参考答案详解(夺分金卷)
- 高考物理押计算大题《力学三大观点的综合应用计算题》含答案
- 10.2《在马克思墓前的讲话》教学课件2025-2026学年统编版高中语文必修下册
- 2025年河北联考音乐真题及答案
- 【真题】人教版六年级下册期中综合素养评价测试数学试卷(含解析)2024-2025学年广东省香洲区
- 男朋友打游戏申请表
- 军人申请病退评残医学鉴定审查表
评论
0/150
提交评论