统计学第5章参数估计_第1页
统计学第5章参数估计_第2页
统计学第5章参数估计_第3页
统计学第5章参数估计_第4页
统计学第5章参数估计_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第第5 5章章 参数估计参数估计学习目标学习目标v知识目标知识目标 1.1.了解无偏性、一致性、有效性是评价估计量好了解无偏性、一致性、有效性是评价估计量好坏的标准坏的标准 2.2.理解置信区间的概念和含义理解置信区间的概念和含义 3.3.熟练掌握总体均值和总体成数的区间估计方法熟练掌握总体均值和总体成数的区间估计方法 4.4.掌握必要抽样数目的确定方法掌握必要抽样数目的确定方法v能力目标能力目标 能够熟练掌握用能够熟练掌握用ExcelExcel进行总体均值和总体进行总体均值和总体成数的区间估计,解决社会经济的实际问题。成数的区间估计,解决社会经济的实际问题。导入案例导入案例“科学创造最佳年

2、龄区科学创造最佳年龄区” 杰出科学家做出重大贡献的最佳年龄区在杰出科学家做出重大贡献的最佳年龄区在2545岁之间,其最佳峰值年龄和首次贡献的最佳成名岁之间,其最佳峰值年龄和首次贡献的最佳成名年龄随着时代的变化而逐渐增大。伟大的科学发现年龄随着时代的变化而逐渐增大。伟大的科学发现很多是由富于创造力的年轻人所提出的。(见表很多是由富于创造力的年轻人所提出的。(见表5-1)根据表中资料,得到)根据表中资料,得到16世纪中叶至世纪中叶至20世纪有重世纪有重大科学突破时科学家平均年龄约为大科学突破时科学家平均年龄约为35.92岁,标准岁,标准差为差为7.69岁,而且通过检验得出结论,即有重大突岁,而且通

3、过检验得出结论,即有重大突破时科学家的年龄服从正态分布,由此得到有重大破时科学家的年龄服从正态分布,由此得到有重大科学突破时科学家的平均年龄在科学突破时科学家的平均年龄在29.9141.93岁之岁之间,估计的可信程度为间,估计的可信程度为95%。 5.1 5.4 5.25.5 5.3 5.1.1 5.1.1 参数估计的相关概念参数估计的相关概念 1.1.参数估计参数估计 2.2.估计量与估计值估计量与估计值 3.3.点估计与区间估计点估计与区间估计 统计推断的过程统计推断的过程样本统计量样本统计量例如:样本均值、比例、方差总体均值、比总体均值、比例、方差等例、方差等统计推断统计推断参数(未知量

4、)参数(未知量)统计量(已知量)统计量(已知量)(1)估计量:用于估计总体参数的随机变量)估计量:用于估计总体参数的随机变量如样本均值,样本比例、样本方差等如样本均值,样本比例、样本方差等例如例如: 样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量(2)参数用)参数用 表示,估计量表示,估计量用用 表示表示(3)估计值:估计参数时计算出来的统计量)估计值:估计参数时计算出来的统计量的具体值的具体值如果样本均值如果样本均值 x =80,则,则80就是就是 的估计值的估计值2.估计量与估计值估计量与估计值3.3.参数估计的方法参数估计的方法估估 计计 方方 法法点点 估估 计计区

5、间估计区间估计点估计点估计v用样本的估计量直接作为总体参数的估计用样本的估计量直接作为总体参数的估计值值例如:用样本均值直接作为总体均值的估计例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均例如:用两个样本均值之差直接作为总体均值之差的估计值之差的估计v2.没有给出估计值接近总体参数程度的信没有给出估计值接近总体参数程度的信息息v点估计的方法有矩估计法、顺序统计量法点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等、最大似然法、最小二乘法等区间估计区间估计v在点估计的基础上,给出总体参数估计的一个区间在点估计的基础上,给出总体参数估计的一个区间范围,该区

6、间由样本统计量加减抽样误差而得到的范围,该区间由样本统计量加减抽样误差而得到的v根据样本统计量的抽样分布能够对样本统计量与总根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量体参数的接近程度给出一个概率度量比如,某班级平均分数在比如,某班级平均分数在7585之间,置信水平是之间,置信水平是95% 区间估计的图示区间估计的图示XXzX2nX 5.1.2 5.1.2 参数估计的相关理论参数估计的相关理论 1.1.大数定律与中心极限定理大数定律与中心极限定理 2.2.置信水平与置信区间置信水平与置信区间 3.3.抽样极限误差抽样极限误差 3. 3.抽样极限误差抽样极限误差(

7、1 1)概念)概念(2 2)影响因素)影响因素v抽样单位数的多少。抽样单位数的多少。 v总体各单位标志值的差异程度。总体各单位标志值的差异程度。 v抽样方法。抽样方法。 v抽样的组织形式。抽样的组织形式。(3)抽样平均误差抽样平均误差v样本平均数的平均误差样本平均数的平均误差 v抽样成数的平均误差抽样成数的平均误差 v(4)抽样极限误差xxpPv1.无偏性无偏性v2.有效性有效性v3.一致性一致性无偏性无偏性v无偏性:无偏性:估计量抽样分布的数学期望等于被估计的总体参数 无偏无偏有效性有效性一致性一致性v一致性:一致性:随着样本容量的增大,估计量的v 值越来越接近被估计的总体参数总体参数总体参

8、数符号表示符号表示样本统计量样本统计量均值比例方差2XP2S 5.2.1 5.2.1 总体平均数的区间估计总体平均数的区间估计1.1.大样本条件下的区间估计大样本条件下的区间估计2 2. .小样本条件下的区间估计小样本条件下的区间估计总体均值的区间估计总体均值的区间估计(大样本大样本)1.假定条件假定条件总体服从正态分布总体服从正态分布, ,且方差且方差( ) 已知已知如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布来近似 (n 30)2.使用正态分布统计量使用正态分布统计量)1 , 0( NnXZ)(22未知或nSzXnzX总体均值的区间估计总体均值的区间估计 (小样本小样

9、本)1.假定条件假定条件总体服从正态分布总体服从正态分布, ,且方差且方差( ) 未知未知小样本小样本 (n 30)2.使用使用 t 分布统计量分布统计量) 1(ntnSXtnStXt t 分布分布5.2.2总体比率的区间估计总体比率的区间估计1. 假定条件假定条件总体服从二项分布总体服从二项分布可以由正态分布来近似可以由正态分布来近似2.使用正态分布统计量使用正态分布统计量)1 ,0()1(NnPZ)()- 1 ()1 (22未知时或nPPzPnzP总体参数总体参数符号表示符号表示样本统计量样本统计量均值之差比例之差方差比2121222121XX 21PP 2221SS 5.3.1两个总体平

10、均数差异的区间估计两个总体平均数差异的区间估计v1.独立样本独立样本v(1) 1、 2已知时,已知时,两个总体均值之差两个总体均值之差 1- 2在在1- 置信水平下的置信区间为置信水平下的置信区间为 222121221)(nnzXX21(2)两个两个总体都服从正态分布;总体都服从正态分布;两个总体方差未知但两个总体方差未知但相等:相等: 1= 2 的的 置信区间为:置信区间为:221221221)2()(nsnsnntxxpp2) 1() 1(212222112nnsnsnsp)1(3)两个两个总体都服从正态分布;总体都服从正态分布;两个总体两个总体方差未知但相等:方差未知但相等: 1 2 的

11、的 置信区间为:置信区间为:21)1 (222121221)()(nsnsftxxf表示自由度, 1)(1)()(222121221)(nSnSzXX2.配对样本配对样本(1)(匹配大样本匹配大样本)假定条件:假定条件:两个匹配的大样本两个匹配的大样本(n1 30和和n2 30)两个总体均值之差两个总体均值之差 d= 1- 2在在1- 置信水平置信水平的置信区间为:的置信区间为:nzdd2) 1(两个总体均值之差的估计两个总体均值之差的估计(2)匹配小样本匹配小样本假定条件假定条件:两个匹配的小样本两个匹配的小样本(n1 30和和n2 30)两个总体各观察值的配对差服从正态分布两个总体各观察值

12、的配对差服从正态分布 两个总体均值之差两个总体均值之差 d= 1- 2在在1- 置信水平置信水平的置信区间为的置信区间为nsntdd)1(v5.3.2 两个总体比率两个总体比率(成数成数)差异的区间估计差异的区间估计v1.假定条件假定条件两个两个总体服从二项分布总体服从二项分布可以用正态分布来近似可以用正态分布来近似两个样本是独立的两个样本是独立的v2.两个总体比例之差两个总体比例之差 1- 2在在1- 置信水平下的置信水平下的置信区间为置信区间为222111221)1 ()1 (nPPnPPzPPv1.假定条件假定条件两个两个总体服从二项分布总体服从二项分布可以用正态分布来近似可以用正态分布

13、来近似两个样本是独立的两个样本是独立的v2.两个总体比例之差两个总体比例之差 1- 2在在1- 置信水平置信水平下的置信区间为下的置信区间为两个总体比例之差的区间估计两个总体比例之差的区间估计5.4 5.4 样本容量的确定样本容量的确定v5.4.1影响样本容量的因素影响样本容量的因素1.总体的变异程度总体的变异程度2.允许误差的大小允许误差的大小3.置信度的大小置信度的大小4.抽样方法不同抽样方法不同5.4 5.4 样本容量的确定样本容量的确定v5.4.2总体平均数估计时样本容量的确定总体平均数估计时样本容量的确定1.无限总体或重复抽样无限总体或重复抽样2.有限总体不重复抽样有限总体不重复抽样

14、2222)(xzn2222222)(ZNNZ5.4 5.4 样本容量的确定样本容量的确定v 3.关于关于 的确定方法的确定方法(1)根据历史数据,若曾有若干个方差,应该选择最大的,以保证抽样估计的精确度(2)已知正态总体,且 、 已知,则: (3)进行做一次随机调查,用调查所得的样本方差来替代总体的方差。即用s代替 (以s的上限确定)。minXmaxX6minmaxXX5.4 5.4 样本容量的确定样本容量的确定v 5.4.3总体比率估计时样本容量的确定总体比率估计时样本容量的确定1.无限总体或重复抽样时无限总体或重复抽样时2.有限总体不重复抽样有限总体不重复抽样222)1(pPPZn)1 (

15、)()1 (22222PPZNPPZ5.4 5.4 样本容量的确定样本容量的确定 3.关于的确定方法关于的确定方法(1)可先进行小规模的试调查求得样本的成)可先进行小规模的试调查求得样本的成数来代替。数来代替。(2)可用历史的资料,如果有若干个成数可)可用历史的资料,如果有若干个成数可供选择,则应选择最靠近供选择,则应选择最靠近50%的成数,使的成数,使样本成数的方差最大,以保证估计的精确样本成数的方差最大,以保证估计的精确度。度。(3)选择)选择0.5代入。代入。5.5.15.5.1利用正态分布计算平均数的置信区间利用正态分布计算平均数的置信区间5.5.25.5.2利用利用t t分布计算平均

16、数的置信区间分布计算平均数的置信区间5.5.35.5.3比例的区间估计比例的区间估计5.5.45.5.4样本容量的确定样本容量的确定本章小结本章小结 1.总体参数估计就是用样本统计量去估计未知的总体参数估计就是用样本统计量去估计未知的总体参数,有点估计和区间估计两种方法。参数估总体参数,有点估计和区间估计两种方法。参数估计的优良标准是无偏性、有效性和一致性。计的优良标准是无偏性、有效性和一致性。2.点估计又称定值估计,它是直接用样本统计量点估计又称定值估计,它是直接用样本统计量来估计总体参数值。来估计总体参数值。3.区间估计是指在用样本统计量值来估计总体未区间估计是指在用样本统计量值来估计总体

17、未知参数值的时候,其误差的区间范围有多大并给出知参数值的时候,其误差的区间范围有多大并给出可靠程度的估计概率,分为总体平均数的区间估计可靠程度的估计概率,分为总体平均数的区间估计和总体成数的区间估计两种。和总体成数的区间估计两种。4.样本容量的确定就是在已知估计的置信概率、样本容量的确定就是在已知估计的置信概率、允许的误差区间及样本标准差的情况下,计算出必允许的误差区间及样本标准差的情况下,计算出必要的样本容量。要的样本容量。 5.利用利用Excel统计函数功能进行区间估计。统计函数功能进行区间估计。本章关键术语本章关键术语v统计推断统计推断 v参数估计参数估计 v点估计点估计 v区间估计区间

18、估计 v置信水平置信水平 v置信区间置信区间 v极限误差极限误差一、简答题一、简答题1.参数估计的优良标准是什么?参数估计的优良标准是什么?2.点估计和区间估计的区别是什么?点估计和区间估计的区别是什么?3.影响抽样误差的因素有哪些?影响抽样误差的因素有哪些?4.影响样本容量的因素是什么?影响样本容量的因素是什么?二、二、实验题实验题v某大学为了解学生每天上网的时间,在全校某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽名学生中采取不重复抽样方法随机抽取取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):求该校大学生人,调查他们每天上网的时间,得到下面的数据(单位:小时):求该校大学生平均上网时间的置信区间,置信水平分别为平均上网时间的置信区间,置信水平分别为90%、95%和和99%。 36名学生每天上网时间名学生每天上网时间 (单位:小时)(单位:小时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论