PowerPoint Presentation - 西南民族大学_第1页
PowerPoint Presentation - 西南民族大学_第2页
PowerPoint Presentation - 西南民族大学_第3页
PowerPoint Presentation - 西南民族大学_第4页
PowerPoint Presentation - 西南民族大学_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第7章 参数估计27.17.1参数估计的一般问题参数估计的一般问题一、估计量与估计值一、估计量与估计值1. 参数估计参数估计(parameter estimation) 用样本统计量去估计总体的参数。2将总体参数用 表示,并用 表示由样本得到的估计量估计量;3称 的具体值为估计值估计值(estimated value) 。3二、点估计与区间估计二、点估计与区间估计1.点估计点估计(point estimate) 用样本估计量 作为总体参数的估计值:(1)用s2作为总体方差2的估计值;(2)用部分同学的某次考试分数的平均值作为该次考试的总体分数的平均值的估计值;(3)中央电视台每周的质量检查报

2、告中给出的某种产品的抽样合格率 p=85% 作为该类产品的整体合格率的估计值;4点估计的优良性准则点估计的优良性准则(一一) 无偏性无偏性(unbiasedness) 若估计量 的数学期望等于未知参数的真实值, 即则称 为 的无偏估计量。 无偏性的实质无偏性的实质: 对一个估计量,多次变更数据反复求估计值时,估计值的平均值与真实值一致,即尽管 有时比大, 有时比 小,但总的来看,它的”平均值”就是 。)(E5无偏估计量)(E)(E偏差有偏估计量的抽样分布的抽样分布6例例7.1 证明: (1)样本均值 是总体均值的无偏估计量,(2)样本方差s2是总体方差2的无偏估计量.注注: 总体方差的估计量除

3、了s2外,还有一种:XniinxxnS122)(17证明证明: 由于X1, X2, Xn表示次观察结果的n个独立随机变量, 且这n个独立随机变量来自于同一总体, 因而具有相同的分布律,即有相同的期望值和方差: E(X1)=E(X2)=E(Xn)=, D(X1)=D(X2)=D(Xn)=2。因此,nnXEXEXEnXXXnEXEnn)()()(1)(1)(21218.11)()(2)(1)()(2)(1)()(1)(1)(2222212211212122nnnnnnXnEXnEXEnXnEXXXEnXXEnXXnESEniiniiniiniiniin9.,111)(11)(,.)(2222212

4、22222的无偏估计量是但是的无偏估计量不是snnnnSnnEXXnEsESSEnniinn10(二二)有效性有效性(efficiency) 无偏性无偏性只考虑估计值的平均结果是否等于待估计参数的真值, 而不考虑每个估计值与待估参数真值之间偏差的大小和散布程度。 均方误差均方误差(mean square error )MSE.)()(:. 2);()(:. 12EMSEEB均方误差的偏差11222222()()() ()0( )()()()2()()()()( )( )EEEEEEMSEEEEEEEEEEEEEDB12.),()(,. 3).(,).()(, 0)(,.)()()(212121

5、2有效的估计值是比则若的两个无偏估计值是设寻找极小方差无偏估计因此则的无偏估计时是当即DDEstimateUnbiasedVarianceMinimumMVUEDMSEBBDMSE13两个无偏估计量的抽样分布的抽样分布1的抽样分布2143.3.一致性一致性(consistency)(consistency). 0)|(|lim1)|(|lim.,的一致估计是则称或即按概率收敛于若时当的估计值是未知参数若PPnnn15两个不同样本容量统计量的抽样分布的抽样分布的较大样本容量的抽样分布的较小样本容量162. 区间估计区间估计(interval estimate)点估计的不足点估计的不足: 即使 是

6、 的无偏有效估计值量,但由于一次只能随机抽取一个样本,因样本的变化,估计值也会有很大的差异.即由一次只随机抽样一个样本所得的点估计值不能恰当地代表所要估计的总体参数。 点估计的主要不足是没有解决参数估计的没有解决参数估计的精度和可靠性问题精度和可靠性问题。 17区间估计区间估计 Jerzy Neyman 在20世纪30年代建立了一种区间估计方法: 在一定的概率基础上, 用一个区间去估计未知参数,即将未知参数值估计在某个界限之间, 从而提高了参数估计的精度与可靠性.18区间估计的原理区间估计的原理:111211121,( : ), 01,(,)(,), (,)(,)11;nnnnnxxf xxx

7、xxPxxxx 设是来自于概率密度的样本 对给定的如果找到两个统计量及使得则称为置信度或置信概率191121(); (,),(,)1.nnsignificance levelxxxx: 显著性水平是置信度为的置信区间20区间估计的理解区间估计的理解: :有些区间包含真不完全相同则区间计算区间去每次都由样本中抽样只要反复从的置信区间是置信度为如果.,),(),(,);(,95. 0),(),(. 12121221121212211nnnnnxxxxxxxxxxfxxxxxx21真值 ,有些区间不包含真值 .不过包含真值 的区间的频率应该在0.95左右.2.置信区间表达了区间估计的精确性,置信概率

8、则表明了区间估计的可靠性它是区间估计的可靠概率;显著性水平表明了区间估计的不可靠的概率。223.置信概率是区间估计中事前按一定 的要求指定的标准,常用的有三种: 1- =0.95 即 =0.05 或 1- =0.99 即 =0.01 或 1- =0.999 即 =0.001.4.区间估计中精确性与可靠性是相互 矛盾的.237.2 一个总体参数的区间估计1. 对于一个总体的参数进行估计时,主要的 估计对象是总体均值、总体方差2、总体比例。2. 在进行区间估计时, 必须要考虑到样本的容量大小, 并针对不同容量的样本构造不同的区间估计。24一、总体均值的区间估计一、总体均值的区间估计1. 1. 正态

9、总体正态总体, ,方差方差 2已知已知, 当XN(, 2)时,抽自该总体的简单随机样本X1, X2,Xn 的样本均值服从数学期望为 ,方差为 2/n的正态分布,即),(2nNX则nXZ N(0,1)25构造均值构造均值 的置信区间的置信区间对给定的显著性水平, 有,212211136137)41. 5()43. 5(nnnnXPPP26nzXnzXnzXnzXPnzznz2222222,1,1,21,为置信水平下的置信区间在总体均值下在给定显著性水平即因此从而则有令27例例7.1 某种零件的长度服从正态分布,从该批产品中随机抽取9件,测得其平均长度为21.4mm。已知总体标准差为=0.15mm

10、, 试建立该零件平均长度的置信水平为95%的置信区间。28解解: 已知XN(,0.152), , n=9,1-=0.95, z/2=1.96。因此, 总体均值的置信区间为14.2x)498.21,302.21(915. 096. 14 .21,915. 096. 14 .21,22nzxnzx29 若总体不是正态总体若总体不是正态总体, ,但样本为大样本但样本为大样本时的总体均值的区间估计时的总体均值的区间估计 在概率论中,已经证明,对于从非正态分布总体中抽取的样本,只要样本容量足够大样本容量足够大,则其样本均值的抽样分布是近似于正态分布的。在这种条件下,仍然可用前面的方法构造总体均值的置信区

11、间.30例例7.2 某大学从该校学生中随机抽取100人, 调查到他们平均每天参加体育锻炼的时间为26分钟, 试以95%的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为36) 。31解解: 总体的分布形式未知, 但由于样本容量较大, 可认为 ,1-=0.95, ,z/2=1.96,n=100。 因此, 总体均值的置信区间为),(2nNX26x).176.27,824.24(100696.126,100696.126,22nzxnzx322.2.正态总体正态总体, ,方差方差 2 2未知未知, ,小样本小样本 简单随机样本X1, X2,Xn抽自正态总体N(, 2),若方差2未

12、知,则nSXtt(n-1)总体均值在置信水平1-下的置信区间为:nSntXnSntX) 1(,) 1(2233例例7.37.3 在例7.2中,若总体方差未知,而样本方差S2=34, 试估计全体学生平均每天参加体育锻炼的时间(假定总体XN(,2) 。34解解:总体XN(, 2), 2未知,S2=34,n=100, ,在=0.05时,t/2(n-1)=t0.025(99)=1.984.因此,总体均值的置信区间为: 26x).16.27,84.24(10034984. 126,10034984. 126) 1(,) 1(22nSntXnSntX35二、总体比例的区间估计二、总体比例的区间估计 在大样

13、本下,若np5, nq5,则可以把二项分布问题变换为正态分布问题近似求解,因此,)1(,(nNp 从而,npZ)1 ( N(0,1)36 在实际工作中, 总体比例 多数情况下是未知的,常用样本比例P替代 , 则此时的置信区间为22(1)(1),pppppzpznn相应的置信度为1-的置信区间为22(1)(1),pzpznn37例例7.4 某企业在一项关于职工流动原因的研究中, 从该企业前职工的总体中随机所取了200人组成一个样本。在对其进行访问时,有140人说他们离开企业是由于同管理人员不能融洽相处。试对由于这种原因离开该企业的真正比例构造95%的置信区间。380.05 222200,0.7,

14、1405,(1)605,1.96.,(1)(1),0.7 0.30.7 0.30.7 1.96, 0.7 1.962002000.636, 0.764.npnpnpZpppppZpZnn解: 因此39三、总体方差的区间估计三、总体方差的区间估计 样本方差S2满足 22) 1(Sn2(n-1) 因此, 总体方差2在置信度1-下的置信区间为2212222) 1(,) 1(SnSn40总体标准差在置信度1- 下的置信区间为SnSn22122) 1(,) 1(当n30时, S ) 1(2,2nN,的近似区间估计为) 1(21,) 1(212121nZSnZS41总体方差的1- 置信区间22122自由度

15、为n-1的2分布42例例7.5 对某种金属材料的10个样品所组成的一个随机样本作抗拉强度试验。从试验数据算出的方差为4,试求总体方差2的95%的置信区间,构造此区间估计时用了什么样的假设?标准差的95%的置信区间又是多少?43解:设该金属材料的抗拉强度服从正态分布,n=10, 1-=0.95, =0.05, S2=4。此时总体方差 2的95%的置信区间为:.3314.13,8925. 1 7004. 249,0228.1949标准差 的95%的置信区间是.65. 3,38. 1 3314.13,8925. 1447.3 7.3 两个总体参数的区间估计两个总体参数的区间估计两个总体的均值之差1-

16、 2; 两个总体的比例之差1- 2; 两个总体布局的方差比1/2;45一、两个总体的均值之差一、两个总体的均值之差1- 2的区间估计的区间估计 设两个总体的均值分别为1,2; 从两个总体中分别抽取容量为n1、n2的两个随机样本, 其样本均值分别为 和 ,则估计两个总体的均值之差1- 2的显然是估计 。 分两种情况讨论: 两个独立样本和两个非独立样本.21XX 1X2X46(一一)两个总体的均值之差两个总体的均值之差1-2: 独立样本独立样本1. 大样本条件下的区间估计大样本条件下的区间估计 独立样本独立样本(independent sample):两个样本分别从两个独立的总体中抽取。 若两个总

17、体是正态分布, 或两个总体不是正态分布但其相应的样本容量很大, 则可知两个样本均值之差服从:21XX 22212121,nnN472221212121nnXXN(0,1)标准化后,有48 (1) 当两个总体方差 都已知时, 在1-置信水平下的置信区间为:2221和21 (2) 当两个总体方差 都已知时, 在1-置信水平下的置信区间为:2221和21222121221nnzXX222121221nSnSzXX49例例7.67.6 一个银行负责人想知道储户存入两家银行的钱数。他从两家银行各抽取了一个由25个储户组成的样本,样本平均值如下:银行A:4500元; 银行B:3250元。已知两个总体服从方

18、差分别为 的正态分布。试求 的区间估计:(1)置信度为95%;(2)置信度为99%。3600,250022BA2150解解: 由题意知: nA=nB=25,AxN(A,2500)BxN(B,3600),4500Ax3250Bx的置信度为1-的置信区间为:21BBAABAnnzxx22251(1) 当1-=0.95时,Z/2=1.96, 区间估计为: )62.1280,78.1219(25360025250096.2) 当1-=0.99时,Z/2=2.58, 区间估计为: )30.1290,70.1209(25360025250058. 232504500532.小样本

19、条件下的区间小样本条件下的区间 在小样本条件下估计两个总体均值之差的区间估计, 需要如下假设: 两个总体服从正态分布; 两个总体的方差相等, 即 ; 两个随机样本独立地分别抽自两个总体。 此时此时, 无论样本容量大小无论样本容量大小, 两个样本均值两个样本均值之差都服从正态分布之差都服从正态分布。2221254(1) 当两个总体方差已知且 时,总体均值之差的区间估计222122212212XXznn55(2) 当两个总体方差未知但当两个总体方差未知但 时时,总体均值之差的区间估计总体均值之差的区间估计 总体方差 分别用样本方差 进行估计。此外, 还需要将两个样本数据合并, 然后给出总体方差的估

20、计量,记为 :22212221和2221SS 和2pS2) 1() 1(212222112nnSnSnSp56从而可得均值差从而可得均值差 的标准化分布的标准化分布2121212121)()(nnnnSxxtpt(n1+ n2 -2)因此, 两个总体均值之关在1-的置信区间为2212122111)2()(pSnnnntxx57例例7.7 为了估计两种方法组装产品所需时间的差异, 分别对两种不同的组装方法各随机安排12个工人,每个工人组装一件产品所需时间(单位:分钟)如下表:方法1 方法2 方法1 方法2 方法1 方法228.130.129.037.627.622.231.033.832.128

21、.8 36.037.220.030.2 31.726.038.534.428.030.032.031.233.426.558 假定两种方法组装产品的时间服从正态分布,且方差相等。试以95%的置信水平建立两种方法组装产品所需平均时间差的置信区间.59解解: 根据样本数据计算, 得358.198 .28:2996.155 .32:1222211sxsx方法方法总体方差的合并估计为.677.1721212358.1911996.15112) 1() 1(212222112nnSnSnSp60,0739. 2)22()2(205. 0212tnnt两个总体均值之差 的区间估计212122121211(

22、)(2)11(32.5 28.8)2.073917.67712123.73.56(0.14, 7.26).pxxtnnSnn613. 当两个总体方差未知且当两个总体方差未知且 时时,总体均值之差的区间估计总体均值之差的区间估计 (1) 只要两个总体都服从正态分布,且两个样本容量相等两个样本容量相等, 即n1=n2, 总体方差分别用样本方差 进行估计,则有两个总体均值之差 的区间估计: 22212221SS 和1222212121221)2()(nSnSnntxx62(2)两个总体都服从正态分布, 且两个样本容量不相等两个样本容量不相等, 则2221212121)()(nSnSxxtt(v)63

23、有两个总体均值之差 的区间估计21222121221)()(nSnSvtxx其中1122222121212222121nnSnnSnSnSv64例例7.8 为了比较两位银行职员为新顾客办理个人结算账目的平均时间长度,分别给两位职员安排了24名和16名顾客,并记录下了为每位顾客办理账单所需时间(单位:分钟),相应的样本均值和方差分别为:假定每位职员办理账单所需时间均服从正态分布,且方差不等,试估计两位职员办理账单的时间差的95%的区间估计.;92. 8,15;63. 6,10222211sxsx65解解: n1=24, n2=16, 则;92. 8,15;63. 6,10222211sxsx04

24、84. 2)28(28151692. 8232436. 61692. 82436. 62222tv66相应的置信区间为:221212212()( )6.368.92(1015)2.0484241652.04840.906751.86( 6.86,3.14).SSxxtvnn 67(二二) 两个总体均值之差的估计两个总体均值之差的估计: 匹配样本匹配样本匹配样本匹配样本(matched sample): 一个样本的数据与另一个样本中的数据相对应。68 在大样本条件下, 两个总体均值之差d =1- 2在1-置信水平下的置信区间为:其中, d 为两个样本对应数据的差值; 为各差值的均值; d为各差值

25、的标准差。 当总体的d 未知时, 可用样本差值的 标准差Sd 来替代。dnzdd269 在小样本条件下, 两个总体均值之差d =1- 2在1-置信水平下的置信区间为:nSntdd) 1(270例例7.9 由10名学生组成一个随机样本,让他们分别用A和B两套试卷测试,结果如下:学生编号试卷A试卷B差值d123456789107863728991496876855571446184745155607739 71911 517 -21316 81671试建立两种试卷平均分数之差的95%的置信区间。解解: 由上表数据,有,262.2)9(53.61)(,1110110025.01012101tnddS

26、ndddiiddii72 两个总体均值之差d =1- 2在95%置信水平下的置信区间为:).67.15,33.6(67.4111053.6262.211)1(2nSntdd73二、两个正态总体比例之差的区间估计二、两个正态总体比例之差的区间估计 设两个总体的比例分别为1 、2,为估计1-2, 分别从两个总体中各抽取容量为n1和n2的两个随机样本, 并计算两个样本比例 。 当n1和n2都很大,而且总体比例不太接近0或1时, 近似成立:21pp 和21pp 22211121)1 ()1 (,nnN74因此, 总体比例之差1-2在1-置信水平下的置信区间为:N(0,1)2221112121)1 ()

27、1 ()()(nnpp222111221)1 ()1 ()(nppnppzpp75例例7.10 某饮料公司对其所做的报纸广告在两个城市的效果进行了比较,他们从两个城市中分别随机地调查了1000个成年人,其中看过该广告的比例分别为试求两城市成年人中看过该广告的比例之差的95%的置信区间。.14.0,18.021pp76解解: n1 = n2 =1000, 属于大样本问题,.96.1,95.01,86.01,14.0,82.01,18.022211zpppp置信区间为:77)0721. 0,0079. 0(0321. 004. 0100086. 014. 0100082. 018. 096. 1)

28、14. 018. 0()1 ()1 ()(222111221nppnppzpp78三、两个总体方差比的区间估计三、两个总体方差比的区间估计 两个样本方差比的抽样分布服从F(n1-1,n2-1)分布,可用F分布来构造总体方差比 的置信区间估计。 构造置信区间, 即要找出F1-/2 和F, 使得 2221221FFF79由数理统计理论可知:2212122221221212222212122121221(1,1),.,1(1,1).(1,1)SFF nnSSFFSFFFFnnFnn于是其中是分布的上下分位数:80总体方差比 的置信区间为:2221222212122121212,(1,1)(1,1)SSSSFnnFnn81例例7.11 用某种特定工序生产的一批化工产品中的杂质含量依赖于操作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论