版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 # # * # #*威布尔和极值分布的推断方法这一章将对威布尔分布讨论其统计方法。威布尔密度函数是(40.1)其中00和0是参数,经常分别称它们为该分布的形状参数和尺度参数。代替威布尔分布的一种更方便的形式是与其等价的扱值分布,其密度函数为f(tUyb)=扌泸W&P(严7竹*iOQ工VOO(4Ch2)其中球(-oo0)是参数就像在1.3*2节中指出的那样,假如尸有密度函数(4.0.1儿那末X-log7T有密度函数(40*2),其中u=oga和研究极值分布更方便,主要是由于理和b是位置参数和尺度参数这个事实,从一个分布导出的任结果很容易转换到另一个分布上去。威布尔分布在实际中是很重要的寿命分布
2、,大量统计方法的文献都是由此分布引岀的。关于威布尔分布的很多文章都涉及它的统计性质“一般说来,由于对(43.1)的0和s或与之等价的(匸02)的捉和血没有二维充分统计量,从而使产生估计量的途径就很多。此外,与威布尔分布和极值分布有关的多数估计量和其它统计量的分布在数学上是难于处理的.这就导致多方面的研究如为便于推断而编制用表;对某种类型估计寻求近似分布。幸运地是相对便于使用的好的统计方法已有一些,多谢高速计算机帮助蔑实现。涉及耳型截尾数据的问题将首先讨论,接着进行I型截尾数据的推断,然后是威布尔分布的比较和其它专题。4U单样本:完全或R型截尾数据对完全的或型截尾数据来说,统计理论及其各种方法都
3、是较为成熟的,尽管他们在数学上和在计算上都是复杂的设Zm是来自威布尔分布(心01)的容量为提的随机样本中前F个最小观察值,或者等价地假设,复忘丢芯是来自(4.2)的容量为兀的样本中前厂个最小规察值,其中尤尸1碍“(为方便起见,我们将在如和班的卜标数字上省略括号,除非另外指定。在这节中如表示第(个最小观察值用(14.1)可得心卩的联合密度函数为(二”+宀7%xp(凸exp(一/。皿)41.1)这就定义了班和氏的似然函数,同时可看出,XZ,*好)是这个样本的最小充分统计量。抚和b的点估计将先讨论,然后讨论检验和区间估计,推导和结果将主要用极值分布语言给出O411点估计极大似然怙计从(4.1.1)可
4、以取出如下的似然函数L5、b)= # #*这里我们引出一个有用的记号,对任意序列盘2八记另g=、卩+Sr)wri=1El对数似然函数是1。吕K#)=一血苗+-、:飞以不uJlog/“鬲(t1-2) # # #* # # #*(4-K4)rn.1.e,矗和&叮同时解方程dogl8uh0和doL/3b)得到!为此,一个简便的途径是令(4-b3)为S给出皆用将此式代入方程町得(45)(4G为了寻找曲和队可以确定&作为(4.1+6)的解,然后从(4.5)得到讥由于(4.1.6)不能解出石的明显表达式,故某些数值方法必需采用。使用叠代法,譬如牛顿法(见附录F),给出(41,)的解是没有困难的。威布尔参数
5、0和的m丄匕是a=expzi和1假如有必要极大似然方程(社15)和(仁1飞)可以改写为威布尔形式,然后直接解出应和乩可是这样做没有特别方便之处,其最后方程是 #*(47)土-Liog/.=0418)2(=卩JI线性估计威布尔或极值分布的参数的极大似然估计是直接获得的,这常需要用计算机去解方程4J.6)或(4.1-8),不用计算机就可完成估计的计算有时是很方便的。衽这方面和b的线性估计常被釆用,他们是形如r-M=工务厂)爲/=131.9)b=j=:i的估计、其中诸爼和。是常系数,它们依赖于厂和处当给出诸曲和G后,线性估计很容易算得,然而对大多数最好的线性估计没有简单公式能以广和捉形式给出诸4和匚
6、,这样一来,必须要构造系数值的表角最好线性无偏估计(bdu.i),即在线性无偏估计类中具有最小方差的估计,可以从位置和尺度参数的线性估计的一般结果中获得(Lloyd1952;Kendall和Stuart1967,P8791;亦可见问题4*亦可参见&可靠性试验用表、(增订本几国防工业出版社,1987泽者注.1441),Lieblein和ZMtm(1956)和其他人曾对极值分布导出这样的估计。另外,Mann(1967a)考虑了殳和6的最好线性同变估计(KLLe,),这种估计在线性估计类中拥有最小均方误差,且均方误差2在对诸无作位置尺度变换下是不变的。对于这二类估计确定(肛19)中诸血和G要求先算出
7、标准极值分布次序统计量的均值方差和协方差(见问题氛1),Mann等人(1974,第5章)对极值分布给出了线性估计很好的讨J # #*论*Sarhan和GreenbEFg(1962)和David(1970)对线性估计作了一般地讨论。对小到中样本来说,b.Li.e.大概是最方便的。这些估计的系数名(心r)和c,(n,r)的表是容易得到的:Mann(1967a)和Mann等人(1974,ppl94-207)对的样本给岀了表,Mann(1967b)对2=厂川25给出了表,1丄1仁作为坯与b的点估计可以和m,Le.进行比较。两者都是渐近有效的,在小到中样本场合它们都有类似的性质,b.lle.更容易计算,
8、虽然它们现在只能对冷25的样本使用,因为超出这个范围还没有这样的表无论如何,容易计算不应成为压倒一切的理由口事实上*由于极大似然估计也可用于1型截尾数据,而线性估计一般是不能的,因此,任何人復只要他经常使用威布尔模型、且数据常常是I型截尾的,他就需要有计算极大似然估计的程序.无论mN丄还是线性估计在I型截尾数据场合总是被优先使用口在文献中还有很多其它的线性估计被提出来。Dagostino(1971)和另一些人讨论了bLu.已和b.Li.e.的近似式,很多作者提出这样的线性估计,它所需的表要比b.Le,或b.Li.e.的表要小得多。Mann等人(1974,第5章),Mann和Fertlg(197
9、7)和Engelhardt和Bain(1977a)研究了其中最好的。两个这样的估计将在412d节中讨论,在那里它们将用来获得韋和右的置信区间。最后,Thomas和Wilson(1972)讨论了逐步增加的型截尾样本的线性估计.有时我们希望很快或很容易地计算出材和b的估计“譬如,为了计算m丄巴的広和&时,对厶的值要有一个初始的予测这时可以利用简单的线性估计,如在4b2d节中讨论的估计,或它们的最小二乘估计.另一种可能性就是利用概率纸得其图估计口它们的一般叙述已在2.42节中给出“这里让我们对扱值分布简要地回顾一下全过程。假如一张概率纸就像氐2节那样已被构造岀来,那么对概率纸上的点拟合一条直线,用此
10、拟合直线即可获 #*得理和B的估计。这条直线可以用最小二乘法做出(见Z5节丰White,1969),但常用目测来拟合这条线增応列蠶衆時性用萄鈿该书于咖年由国防工业出版社槪146因为极值分布的生存函数满足logbgS(工)=(xu)b拟合的直线将有方程YloglogSO)=(工一叭)/b这条直线的斜率妬i可估计办文轴上的截距阿可估计哄当极值分布概率纸用5(工)作刻度时2的截距是用拟合直线与直线y的交点给出的这时对应的SCz)=1-0.368,图估计和其它估计方法町以用下面的例子来说明。例41-I(例Z4-2再考察)Mann和Fertig(1973)给岀飞机零件的失效时间,在这个寿命试验中共有13
11、个零件参与试验,试验是在第10个零件发生失效时结束。失效时间(小时)是62鮎630,0-88,00,1.32.1.33,b54,1.76,Z50和3*00.设这些数据来自威布尔分布让我们利用前面所叙述的各种估计方法。为了计算线性估计我们把这些数据转换成极值形式个观察值的对数分别是一1出心,一693,0.128,0,0.278,0*285,6432,0-0*916和h099。利用Mann等人(1974)的表5.3可得必要的数*.我们可算得b.l.i*e.如下五Cl002927(-1.込41)I0,615348(L099)-0,873石a0.083170(-1-541)+-40,528441(1*
12、099)=0.715这个例子的图估计曾在例2-4.2中描述过。在那里凭目测在概率纸上画出直线,然后得到的估计为m77和S69.为了确定niL巴我们先要对&用迭代法解方程16儿以图估计0+69作为初始的预测值,如用牛顿法只需二次叠代就给出m.L=706,然后由(415)算出821o寿命分布其它特征的估计可直接从参数估计获得。譬如.若 # #*用应和&估计M和勲那么P分位数也,=也十方log-log)可以用=i/+SlogL-log(1一去估计。假如在这当中使用的是肚和&的m丄“那么最后的估计当然是相应量的m.1比U和&的b,Li,e与b.1*u相应导出的也是工戶的b.l+i.巴与hl.i,但是,
13、假如用这二类估计来求诸如虫比)=exp(-少。之类的估计,那么最后的估计显然不具有线性也不具有原来估计的某些其它性质。4-L2置信区间和检验获得位置和尺度参数的置信区间的一般方法是众所周知的,然而当分布不同于正态分布时,数学上和计算上难于处理是常常遇到的问题。这些问题在附录G中已进行了讨论。但为了叙述方便,仍把这些内容在应用到极值分布之前在4.1.2a节中作回顾。显著性检验不作详细的讨论,但它很容易从构造置信区间的枢轴量得到。给出理和心的置信区间的几个方法将在4.h2b,c和d等节中讨论,生存函数的估计将在4h2e节中讨论.412忍位置和尺度参数的置信区间考察具有位置参数况(一8捉0)的分布族
14、,其密度函数形式为bjo-)(4.LIO)生存函数为G小/切,其中sG(y)=g(3:)dzJy设工应冬对是一个丄型截尾样本,它就是来自(4*1.10)的容量为n的样本的前r个最小观察值命u=u(劝,-,工和&=3(劝芯)是锐和b的估计,且具有如下同变性质五(北+0各+c)=N(文|,兀)+?(4.1*11)&(可工+“+0下面的定理在附录G中给出证明(见定理G2);定理411假如征和云是基于来自(仏b10)的1型截尾样本工笔兰兀的同变估计*那么(i)乙=(征一u)/b,Z2=h/b和厶=(厉一u)/b是枢轴量&5)诸量仏=(石一往)兀是一组辅助统计量(即是这样的统计量,它的分布不依赖于联或力
15、,其中只有厂一2个是函数独立的基于一对特别的同变估计的枢轴量乙和益可以用来构造斑和b的置信区间。譬如,若人和佥是这样的豊它们使PHhM乙仏=宀那么,GZT血SJT丽是m的Y置信区间,类似地,假女口,Pr(zzx/2)=y.那么(刃劭S/3)是方的丁置信区间。对分布的分位数的置信区间亦可得到弱(4.MO)的p分位数是叼=圧+詁,其中叫满足G(仞少)=1枢轴量(413)可以用来给岀心的置信区间,因为Pr(ZXZ/P=了意味着Pr(冠一滋冬文戶五一总)=儿它给出巧的F置信区间(竟一鸟氛乞环0而乙是枢轴量,这可从乙=21切中看岀虽然血b或可的置信区间原则上可以从枢轴量Z】,N和乙得到,但实际的困难在于
16、它们的分布是非常复杂的。下面的定理在附录G中给出(见定理G3)a定理4.1-2命冠和方是在定理4.1.1条件下的庄和作的同变估计,那么Z為砒,,的联合密度函数有如下形式148 # 力(忍尹纠)窃*才2+3庄2)G工2+r-i(4”114)其中kgr,n仅是门,a,.2,旷和伦的函数口在给定上=(4、*)下(乙,Z2)的条件密度函数同样冇(4.1*1心形式刃表达式(4.1J4)是任一模型中乙,jg,总的联合密度函数形式。不幸地.除正态分布的无截尾样本情况之外,(41.14)中的诸缶不可能被积掉,这表明不能获得乙和乙分布的解析表达式。极值分布场合下的这项结果将在4.K2c节中讨论口还有一点需要指出
17、,除正态分布的无截尾样本外,没有一对估计冠和乙是形如(4K10)的模型中聲和E的充分统计量。这-点已在4K1节中对极值分布作了注释。然而有厂T维辅助统计量,严格地说,我们应在给定忍的观察值的条件下作推断(见附录G),即置信区间可以从给定鼻时乙,乙或乙的条件分布得到口如*为了给出酩的置信区间,我们需找这样的舊和厶,使得Pr(ZjCZZja)=7(415)虽然这看上去似乎在推断中增加了复杂性,但它使得(4.1-15)的概率计算要比无条件概率PrQZ)的计算容易很多。这种得到置信区间的条件方法将在t2b节中讨论,其它方法将在4l2c和d中给出.一般位置一尺度参数模型中的条件方法进-步的讨论在附录G和
18、本书所引的文献中口Lawless(1978)综述了这个领域的研究工作和有关极值分布的专门文献。对极值分布来说,条件方法有在任何给定情况下都能够获得置信区间的优点,当然,要做到这一点需要有一台计算机。对某些问题可用一些更简单的方法,这些方法将叙述在和d节中。节将对方医的选择作出某些评论口4-12b用条件方法获得的置信区间命征和召是基于1型截尾样本的和b的同变估计“极值分布(L0.2)有形如(bbJO)的密度函数,其中cxp(v-e-y)和&(y)=exp(0)0从定理I”2口J推得,乙=j粉)/7?和Zib在给矩a时的密度函数有如下形式TOC o 1-5 h zTTV(日厂Zxp(:忌卜北声丿一
19、于汽严1勺|r=1i=1(4*L16)这电我们再-次采用在仁1-1节中引出的记号fr叫=+(耳门3?=/=I从(4.bIO我们可以在条件狙下推得和乙中枉一个的边缘分布。下面定理中的结果是Lawless(1972?1975)给出的(也可见lawless,1978)O定理4*L3命乙=(危一丁户)/厅=(uuwfib)/b和乙=肴/4其中叫=glog-户),京和禺是基于I型截尾样本M俎的现和b的同变估计*这个截尾样本是来自极值分布(4*0-2)tai(不一簸)/人i-1,Ir,那末(i)给定上下,N的条件密度函数有如下形式k(a,r,n)zrexp(肆一1):)(4.b17)在给定懣下,乙的条件分
20、布函数是Pt(乙/|a)=血&|合(厂泄阵+兵*)dzJ0*|i=LJ(4,b18)其中1(nj)是不完全珈玛函数B12)a在给定0下,乙的分布隨数可在(4118)式中命3円给出。证朋(门为得(4.17)我们对(41.16)求為的积分, * #* 可得r_fgy如(Zjja=k(“寸小厂ex卩勺乙址JociJ1r+灼之2沙勺A”严町dz令p=l可得尸r屁见=(a,rt7i)exp(艺口易呀孑/(工;出勺门八厂)E=1这实质上就是(4、11?儿为以后数值计算方便这里把几项合并为一个新的常数LZxkf(atr,rt)r(r)expCSI)ft(a,r,n)=(10对(4,1.16)求怨的积分不可能
21、有解析式,于是我们在给定捕下求乙的分布函数。在给定下,乙和乙二乙一w?Z2-的联合密度函数容易从(416)得到rh(zfi2|a)k1(a声2+衍亏+)一工*exp(iiE2+乂三引+3訂);=1其中引0,f1在给定衣下,Zp的分布函数是Pr(乙W価人乞詔匕J0JQC.作变量替换可得Pr(乙z|a)L辽筒2巴礼$XwxeydyJ0其中tH(S*exp(h汁矽J)稍作整理,就可给出4-blS)”为构造孙b或的置信区间,必需获得厶,Z或乙的分位点。这些容易从定理红1冷的结果中算出,不过对(4U.17)求积分和计算(4b18)的值都需要数值积分口这些将在例4L2中叙述。可以看出(见附录G),不同的同
22、变估计对给定的样本可产生相同的置信区间。因此用什么样的估计去构造枢轴量和玖是不重要的。由于计算机对数值积分是必需的,因此还是获得和使用m-1*e.为好,尽管任一个同变估计也都能满足需要。要指出,虽然含有未知常数氛叭m)*这是可以用加亿山)的积分为1算出的。这个方法的操作将在下面例子中清楚地看出例4.12下述数据由lawless(1975,p258)给出.其礼=45r=28,扱值形式的诸观察值益是一Z982,-2-849,-2.546,-2-350,-1*983?-L492,-b443-1394,-1.386,-L269,-b195,-h174,-0*845,-0.620一6576,一0.548
23、,4247,-0-195,-0.056,0013,-0.0060.03乩0-O37f0.046f0-084,6221,0,245.0.296我们将在m.Le的基础上作出枢轴量和辅助统计量。mtLe.算出为必=61563和6=0歸04,然后辅助统计量被定文为也=(筠一01563)/0.9104,/=.28.在计算几个置信区间前让我们先考虑以后计算需要的量。所有的知都可算得,而在(4b17中的常数矗曲)是可知道的。这可以从下式中算岀fh2(za)dz=1J0它意味着心,)=唄I)!/(+严“打1(41,19) # #在(4L19)中的被积函数是性质很好的函数,它的积分很容易在数值上计算出来。一个简
24、单方法是检查被积函数,确定一个区域使得位于N和必之外的累计值可以忽略不计口然后一个简单的数值方袪,如辛普森法,可用来计算这个积分.当在这里采用g1.巴时,就几乎没有必要考虑在0到10之外区域上的被积函数乜在获得心之后,利用Pr(Z2Z|a)=仏必(4-L20)我们很容易地确定乙的百分点.使(4L20)等于7的精确百分点=%可以用重复试算的方法获得。得到乙的百分点要对(4.1.18)进行类似的计算。这个积分在很多方面与积分(4.1.20)相同。因为Z(r,5)的计算在附录B中有讨论。最后指出,假如对左或$的某个特定值希望进行显著性捡验,那就只需要对乙或乙计算单个概率现让我们回到我们的数值例子上来
25、。很快会看到.在这个问题中在(4-M9)中的被积函数之下与在区域(0,3)之外的面积是可以忽略不计的。用数值积分方法,位于被积函数之下的总面积为0.4355,于是矗(a,厂n)=22961。现我们有个完整的密度函数沧4|町,于是可对乙*乙或乙计算任何一个想要得到的概率.譬如我们想要得到的090的双侧置信区间,可用数值方法对也(刃耐进行积分,可以确定Pr(Z2M0*713|a)=0-05和Pr(Zs1+257|ft)=695,于是Pr(O.713冬b/bb257|a)=690从观察值9104可得0.724-2,714,这就是算得的区间“条件方法的一个优点是可用来获得抚”或与的置信区间,而不管n型
26、截尾样本的大小口它也可以获得其它特征量的置信区间.如生存函数(见41-2e节人也可用来处理逐步增多的I型截尾数据。这个方法是直接的,但因它要求数值积分,这必须在计算机上进行这里所要求的计算在一台交换计算设备上进行是很方便的.Lawless(1978)对此有几点附加的忠告并提及一个FORTRAN程序使用者用此程序只要给出很少的输入就可算出置信区间。在某些场合,需要比条件方法计算更少的方法。在下面二肖将讨论这些方法勺412获狷精确置信区间的其它方法基于枢轴量条件分布(给定宜下)的置信区间可以用基于枢轴量的无条件分布的置信区间来代替口不过在条件方法中用什么样的同变估计来构造枢轴量是不重要的,但在无条
27、件方法中则不然,它要优先利用具有好性质的估计量。也就是用这样的估计量,它的抽样分布愈集中在参数周围愈好。对待估的极值参数肚和&已提出几种方法flMann1968a)和Mann和Ferti呂(1973)考虑基于m和b的bJTLe的枢轴量。Thoman等人(1969)和McCool(1970)提出基于m*L记的枢轴量.困难是在这二种场合FZ】,乙和乙的分布在数学上难于处理,于是就不可能用解析形式去表示精确的百分点.而可能的是用蒙得卡罗方法去产生各百分点近似估计口在这方面就需要构造(近似)百分点的表。这个基本思想如下所述:因为乙,乙和乙是枢轴量*它们的分布(对给定的厂和Q对极值分布的肚和&的无论什么
28、值都是相同的。当斑=0,和b=l时,枢轴量成为154- # #r五亍和W10g(1P)Zl厶=矢Z严_譬如,沧的分布町以用计算机上产生的标准极值分布b=1)的样本作出估计。这样的样本可以产生很多(在这里可用40000个样本儿对每个样本计算五和乩然后得到ZY=u/b的值。这样我们町以得到乙的分布的个很好的估计。乙和乙的分命可以类似地估计出来。下面的百分点表是用蒙得卡罗方法产生的,所用的枢轴量是基于b,1.i.e或m丄h基b,Eke的枢轴量:Mann等人(1971)对厂复駅W25的样本给出了乙、乙和Z尹(p=0010.05,0.10)的百分点表口这样的表也在Mann&Fenig(1973)和皿时口
29、等入(1974,第5章)中给岀,不过仅对3rC13的样本,而对乙仅为户=605和610。2*基于m丄巴的枢轴量:Thoman等人(1969)对样本量川120的完全样本给出乙和冬的百分点表。Thoman等人(1970)对样本量挖100的完全样本给岀生存函数的置信区间,对于截尾样本,Billmann等人(1972)给出了类似的表,但这些裘相当稀疏,只含有=40,60,80,100,120和厂=075耳,0.50血的样本,但用插值法可以一定的精度得到一些附加值。最后,McCool(1970,1974)对2】,乙和?户(户=0.01,0*10,0,50)给出厂和刃的17种组合的表。这些(厂,n)组合是
30、舁=5(厂=3,5)川=10(r3,5,10),n=l5(r=5,10,15),川=20,(r=5,10,15.20)和rt=30&=5,10r15.20,30).造出这样的表是很昂贵的,因为第一个厂和壮值的组合都必须分开处理柯因此没有张表能包含实际中可能出现的所有样本量。此外,这些表要占据相当大的空间,且不能集中于一页上。虽然如此,使用它们还是很方便的,谁大量使用威布尔分布,谁就应设送得到它们的拷贝円 #F面二个例子将说明如何使用这些表。例413(例4.b1幷考察在例心K1中给出的数据是飞行器零件的失效时间,它们是就=舟和厂=10的1型截尾样本。它们的对数寿命假设有极值分布。我们希望得到肚和
31、心的恥双侧置信区间和工。的095置信卜限。在上面所列的表中由Mann&.Fmig給出的表含有总二13和10的样本口这些表是基于就和*的和石构造出来的从Mann等人(1974)的表5.九5.8,和入10中我们可以找到(1)Pr(0.52Z?1*40)=幺90:2)Pr(-0.72ZL0-58)=090,(3)Pr(ZfK1(J437)=691其中乙=(uu)fb、7J?=b!b和Zx严(往-宜小)/h.这些式子给出的置信区间是6/K40CZ-CS/0.5緘u0.+72bfw4-37b_jc(l(0以观察值砸=山8阳和石=0.715代入,可顺次得到0511笛b375,0.458wl*3貂和一N25
32、2冬吐.心这些置信区间可以转换到相应威布尔分布参数和特征量的置信区间。譬如,威布尔分布(或寿命)的10分位数是4山=expjOl10t于是抵的d95置信下限是exp(2.252)=0.105&例4L4作为第二个例子,我们考察从极值分布来的科=20和厂=10的E型截尾样本::蠢57,255*2-02*一1.66,L36,413,-0*95,-0,77,出61,-0-45.在这个场合,为得到置信区间我们町用下面二个表中任一个:基于mds并由McCool1974)给出的表和基于b.Li.e,并由Mann等人(1971)给出的表。让我们对每一种情况都计算各自的估计,并且为了进一步比较也让我们用么b2b
33、节的条件方法给出156 # #置信区间从给定数据可算得git为五=一01鬱和Qs907,其bJ-i-e.为五一0.048和石=091乩利用Maim等人(1971)和McCool1974)给出的乙和乙)小的分位数表,对摊=20和厂10我们可得乩左和如皿的9。的双侧置信区间*结果列于表愛bl中。用条件方法所得的置信区间同样可以获得。为了进行比较,各种置信限都仅给出二位小数,因为这些表的精度不能支持更精确的比较口可清楚地看岀,在这个例子中的三种方袪的结果没有实质上的差别。表4.1*1三种方法得到的鼻90双侧置信区间B.Lj.c.枢轴量MJ.e.枢轴量条件方法064冬&1*82一乩5W0.89-N76
34、M;t6心氢一151081551冬&090374黑如亠一1490.50詔迄0.90-3-76id-1-51在很多场合,基于b.LLe,和mJ.e.的枢轴量的无条件分布所得的结果间只有很小的差别,而它与用条件方迭得到的结果间也只有很小的差别口差别发生在小样本或重截尾样本等情形。但对几乎所有的实用目的这些方法是大致相同的.4,12f节含有赞成和反对使用这些方法的-些评论。412d枢轴分布的近似*因为用蒙得卡罗方法对所有实际重要问题获得Z、?心和乙的分位点是不易办到的。因此研究转入寻找这些分布的近似。某些简单的近似及其应用和随后出现的专题讨论在此-并考虑。对刃力的分布的中近似对Zb/b(石是的m丄巴
35、)可以找到一很简单的近似口这个近似就是/分布,它对几乎所有的实际场合都是适用的。该近似除了能得到&的置信区间的简单方法外,亦可用来比较二个或更多个威布尔和极值分布(见4-3.1节中的讨论儿 #从经验中发展起来的这个近似有如下形式k0:幻為(4.1.21)其中A是力的m.L亡所用样本是时个观察值中前r个组成的U型截尾样本密亠肛厂沁)和A=hg)是常数。McCool(1975b),Lawless和MannC1976)和其它人都建议用这个方法去近似的分布口常常这样来选择聲和乩使得(山1-21)两边的均值和方差相等。这就给岀二个方程AVar(rj=2h由此M得g=2Eb/b)/virb/b-和AgE(
36、h/b)a困难在于Eib/b)和Var(b/b)对所有的(rC不是都知道的。不过,H眦时和Moore(1968)曾用模拟就氏=10或加的截尾样本进行了估计,而McCool(19756)和Lawless和Mtmti(1976)讨论了估计E(b/b)和Var(6/)的其它方法竹表4-b2是由H祈饶厂和Moow(1968),McCool(1975b)和Lawless和910-323.049.0100*9153-0204-9256-9260%1-012.929.362.412&2194.8257.6325.53.29旳:gSn)f,+2。和Zemroch(1978).对大概大于10的爪F概率和分位数的
37、很精确的近似可从Wilson-Hilferty变换(见附录B的(B14)和(815)得到。对概率有如下近似/9A2-11N(0.1)41,22)* # # #* # # #对;的分位数有如下近似公式2.Ar/2严丁亦卜叫丽)J(右b23)* # # #* # # #其中g是标准正态分布的p分位数这些近似对表4.L2中所* # #* #列的很多情况计算概率和分位数是容易的也是精确的。例4.15作为中近似的例子,考虑一个用=20和厂=10的E型截尾样本iy=20和厂/*=05可从表氣L2中得到值山=7和g=22.人于是近似(仏是人2?7&如门表4.1.3给出了b/b的分布的某些百分点它是用这个近似
38、计算的,另一些是来自McCool(1975b)表而实际上是的精确百分点。除去在胛分位点上有相当小的偏差外*这个近似是非常精确的。4U.3b/b的精确和近似的百分点百分点TOC o 1-5 h zIIiHXIJ.X.J.151050909599I.精确值6:逑0500-580.881.291.42h67(4.1.21)近似值0-380.500.570.881.291.42h70基于线性估计的枢轴的近似有儿个近似是在基于线性估计的枢轴量的分布上而建立起来的,其中两个将在这里讨论。它们都是很有用的,尤其是在与下面介绍的越和由的二个简单线性估计连结在一起时更是这样“这些近似要用到班和的无偏线性估计。这
39、不是一个限制,因为其它估计,譬如b.LLe.,也可以用无偏怙计形式表示。令五和石是拄和的无偏线性估计,它们是基于容量为允的隨机样本中前厂个毘小观察值组成的I型載尾样本。于是EG)熬和E(I)=矢此外.命Cot(冠為)对任一个特定的估计量诸值A(r小B(r,和C(c)原则上是容易得到的.因为它们是来自标准扱值分布次序统计量的均值、方差和协方差的函数然而在实际中*它们是很难获得的,以至于对烈25的样本这些量还没有列出表来口C(r,n)=Var下面二个近似方法是分别用廿分布和F分布去近似枢轴量的分布使得它们的某些矩相等,具体如下:砒的分布常可由F分布很好地近似。其做法与石兀的分布用(4121)去近似
40、相同fEngelhardt(1975),Lawless和Mnn(1976)和其他人使用这个方法。这里E(b/6)-1Var/力)=CCr,),这个近似是/7琴石总)4.L24)其中雷=(厂曲)和为=hCr.n)依赖于厂和饥使(4.1.24)两边的前二阶矩相等,可得2=h(rn)=R;C(r)2,Mann等人(1974,p.241)和皿吕(1977)导出用F分布去近似乙的分布。命P=u+bloglog(1一是极值分布的P分位数再命h=uB(rrn)5/C(r,fl).于是这个近似是中耳叫(4-L25)其中=loglog(lfi)JfC(rtn)=2j-需务f叫|/(A(s)-砍5)养di=c()
41、当釆用最好线性无偏估计(b.LuYj时,这个近似仅对一些情况是令人满意的,然而它们已包含了多数重要的实际场合。细节在Maim(1977)中给出。可概括地说,只要5.5且2 # #為的样本还没有为所有A(r,克),厂,理)和C(r.制成表。于是这些近似就不能使用.由于这一点,就有很大兴趣去寻找具有好性质的简单线性估计口这方面研究的文献已被MannFertig(1977)和Emgelhardt和B臥in(197九)给岀。具有很好好统计性质的一对估计量将在这里给出.当利用近似(纭1显4)和(4跖)时,它们也提供构造检验和置信区间的简单方法】简单线性估计这里所考察的估计和结果是由Bain(1972),
42、Engelhardt和Bain(1973,1974),Engelhardt(1975)和Mann和Fertig197Sa)建立的。所给的估计有二种形式,这要看样本是B型截尾GQ还是全样本.具体如下:X对于截尾样本(r)月=念一兀=|冰(厂“)(4,b26)U=XrW(r,72)S其中工是II型截尾极值样本皿(厂事)是常数,它是这样选出的,使得E=是来自标准极值分布的样本容量为摊的第厂个最小观察值的期望值。取自Engelhardt(1975)的表414提供了若干系数用它们可算得肛和酣(厂曲).用表4-14所得到的值是较为精确的近似值。它的最大误差仅在小数第4位上相差1.(表4-L5给出了41*2
43、6)的方差和协方箱(,)(“)和C(厂“),这些在使用近似(4124)和(仏L25)时也是需要 #表44,用来计尊简单銭性估计因子的系數”r/n1234-5678*90*102650*211290*327230.452340-589376742746920261.13821-14436走1-1-0271-1-0622一1060-1.163472415-h3540-h8313-1.8567一乙69290.00300-540.08D0.14562420.43309062、796Mo一22504-4999-E0309-0.671730.36651一0087420-185630.475890*8340
44、3S-5-5743一307402.2859-L93O1-1-7619-1-7114-1-7727一20110一乙773W2-7-848-1.886-0.767一0.3550-0910-1110*36908912.825。经允许.摘自Engelhardt(1975).占系数由下列给出(7Ml)=0I; #对表中未岀现的并值可利用线性内播法来寻求kZ)和切&川)。 #*4.L5筒单线性估计GVQ的方墓与协方差。r/nn1234567.S9nVar(u/&)1039-0412*0525.6093.233N1721-6501-384h255=nA(rn)20140,723-969-1364-666Z8
45、502-000L570L3501-24830100.42696&4164.4102*7431.949h546L339L2484087.0619,8&08842922-692k9251.5341-335h2495080.3918-977.9012232W62191115281*3321)1017.586109N8681-4740.7502(L33440-0826e0*0694=nB(rrn)2049-9110.7545052+2541-1840.59750-25000.0373一6085630359843974*1072.0891.1020-55330.22530.0245一0.08834031
46、36&8193.9272.012h064053230.21360.0185一0.08915029068.4993*8251-96?L041652000.20680.0150-0-08946027.6882963.7501.9381/0260.51200.2023Cl0127一0.0895co22197-383M4501.8011.0080.47340.180700019一0.0891?iVar(M)109.4884.6092.9792-161h66713361.0960.9197=wf(r2019*49仏牝43686N552L920h5151.2341625-69
47、13.4552.436b8511.4711.204L008(L86834013-005420335O23821.8191.4501-189699810*864150121852693.2902.3501-8001-4371.1810-9925Ch861960lb705、1733.2512.3301.787L4291-1750+988886058気74647423070Z2321+728L390M480-961068549a经允许摘自Engelhardt&Bain(1973.1974)和Engelhardt(1975). #* * #的。此表取自Engelhardt和B加(1973,1974)E
48、ngelhardt(1975)。乙对完全样本石=(一】H;i/川扎茹=壬十0.5772(41-27)其中心忑筮竝是极值样本的次序观察值,滾=C0-84是不超过0-84的最大整数。ka是无偏化常数*王是心仏的均值。表4.1.6取自Engelhardt和Bain(1977a),它给出诸趾值.逐和&的方差与协方差口S41完全样本下简单裟性怙计的常#(K,方差和悔方差nnVar(I/bnCovQjb号b/b)nVar(u/b)20.6931b42370,1286L319130.98081*0428-60621b22584L15070.9198一011511.205651.267408623一01357
49、1-200961-35450-8312-0.144220157K18280.7958-0.1872L163781.25470-7700-O19381-164791-31410-7526-0.19701-166810b36440-7405一019811695n1HO790-7321-0-19801-1725121*4461(h7263-0,19701_-175513L33320.72020.2148b1570141-36860-7129-0.21481*1594151*40040-7072-0*2144b161816129307029-02135b161317h45560-6996-0-2123
50、b1668181.47990-6972f2109i.1692191.3960(h695462224b1565*经允许取自Engelhardt&Bain(1977a),续表续表 续表 nVar(b/b)ztCov(玄/比ft/6)wVar(mA)201.419266919()22161-158521i-44080*3891220了b16062?L46090.686902196L162623b47970.68520L1645241-4975o.尿:頂0.2171L166523b5142aB82&一021571-1681251-447906811-0.2248b1584271-464207&50-2
51、239b1601281-4796O6781-62228b161829449430*6770-0.2217b16343D1-5083667610、2206L1650311-52160.6755一021941-166632B46650.67460-2267L1585331-47950-3735-0.22581.159934492066725-0-22481-161335K50400.苛18一022381-1627361-515666712-0-22281-164137b52666S7O7-0.22181.165538K47950.6702-0+2279b1586391.49040.66940,22
52、701.159840b50090.5687一022621-161141b51100*5682-0-22531-162342L52080.6677-0.22441-1635431.53030.667462234L164644L4890.6671-0.22871.1587451-49840.6664(X22791.159846L50750.6659一022711.160947b5163(b6655-0.2263I-161948b52480*6651-0.2255t1630491-53310.6649-0.2247L1640nnVar(5/6)rtCovG/b.b/b)nVar(ti/b)501-5
53、4116647一022381.165151h504606642一62285L1598521-51260.6638一6227XLJ608531.52040.66352271b1617541-52790*6632一022641+162755L53520.6630一622561-16365(554刘0-6628-0.2249645571-50960-6625-0.22911-1598581-51670-6621-0.22841.1607591.52360.6619-0.22771.161560b53040-6616-0-22711.1624co1讯9206484-0+2309b1624估计(4.1.
54、26)和(41.前)有很多好性质,虽然它们略次于b.LLe.和m.ke.,它们的简单性使它们很有用,特别对貝的样本。此外,它们的分布必可用(4124)和(4125)近似,这与bJu弋.的分布是处于相同情况,于是它们可以用来作枢轴量去得到或业的检验和置信区间下面例子将用来说明简单线性估计的使用。例4.1.6(例4.L2再考察)回忆例4,1,2的H型截尾数据,其中宛=40和尸=28,对这些数据有工|卫一如J=3283和=0-296.利用我4*1.4我们找到矗(28r40)=0,8822和w28,40)=0.141肌这样一来6=32*483/0*8822(40)-0.921五=0296乩14丄5(0
55、921)-0,166作为使用廿和F近似H-L24)和(4.1.25)的例子,首先我们希望得到力的0鳥0双侧置信区间口从表4.b5我们可找到4021(28.40)-4OVir(五)-K534,40(28,40)=0.2136和40C(28,40)=1-1894./近似(4.1.24)所用的自由度内二 # # 2/C(28,40)=6X3,于是67妨仏逬辭.小从(4h23)我们可找到比(734曲心/6人31,30)=690,此式给出6708255,可作为b的0.90置信区间。这与例41-2中用条件方法得到的置信区间724 # #其中工=厉一(28,40)b/C(28,40)&现要得到.的095置信
56、下限。在F分布表中使用内插法,可得Pr(入泊盼心冬K38)=0/95困此工“一1.38(2-070)b2.630就是想得到的先卫的置信下限。这与例4b2中得到的置信下限一2.714投有实质性差别口名b2e生存(可靠度)函数的估计现我们考虑在给定如处极值生存函数3(%)=exp(占厂也)的置信限朋(说)的置信限实际上可从抠轴量乙给岀分位数的置信限得到,因为在生存函数和分布的分位数之间有一个关系,这个关系曾在*5J节中提及。持别设仇幻是可基于数据笈上的了置信下限,即Pr/(x)(龙)、使得1)I1=095“根据4L28),我们需要确定这样的仞使得A“5=茁上=I*2071其中用到珥与存的m丄巴应=
57、0.1563和6=0.9104.因此,我们必须利用(4,1*18找到这样的宀使得F(Z-h2O7)-0,95.要指岀,$(-exp(=0*755,于是1一戶可从0.恥的附近开始,经过少数几次与(4.18)的迭代,就可找到所要求的1_苕的值0.647。因此所求的S(1*0)的095置信区间是S-L0)647.另外,Billmann等人(1972)的表6亦可用来给出置信下限“虽然这个表仅含有厂=20,n=40和r=30?n=40二种情况,但仍可看到,这二种情况下条件方法和无条件方祛可导出相同的置信限,于是在厂=2乩秤=40情况亦有相同的置信限,这些都是在恳0)=0755给定下而言的。在这张表中利用
58、线性内插法可给出要求的0*95置信下限为0647.这样一来,条件和无条件方法在这 #种情况给出了完全相同的结果。4-L2F选择方法的评论有大量涉及到极值或威布尔分布的n型截尾样本的推断方法。这个相当长的节里仅含有可用方法中的校好的,虽然如此,但仍在很多情况面临选择方法的问题假如有人想编写一些计算程序,4.L2b节的条件方法也许是最方便的.应用它们对样本容量没有任何限制,并对参数、任意的分位数和生存函数都可给岀置信区间.而吐,这个方法很容易扩展到逐步增加的I型截尾数据。另一方面*4h2c节的严格的无条件方袪要求相当大的表,而现有的表仅对几种样本容量和某些问题才可用。虽然如此,若有人愿意收集这些必
59、需的我,那么这些方法是容易使用的。在4.1.2d节中讨论的近似方法是精确方法的一种很有用的补充,尤其适用九h2c节讨论的表之外的那些情形。在多数场合*只要样本容量充分大就可使近似足够精确,从而用近似方法引起的损失就少。如2d节所指出的那样,这巳覆盖很多重要的实际情况另有二点要提及。首先,从纯技术观点看有理由优先选用4-h2b的条件方法。因为对极值分布来说,这电讨论的不同方法所给结果很接近一致,除非是很小的样本容量。这时在选择方法上主要基于方便程度。还有一个注释,对很大的样本来说,基于m.l”.大样本性质的方法和似然比检验可以使用这些在这里没有讨论,因为它们在这里没有需要.大样本方法将在4显节中
60、讨论。虽然那一节处理的是1型截尾数据。但所给方法对E型截尾数据也将适用。44单样本;丨型截尾数据对来自极值分布或威布尔分布的1型截尾样本来说般没170 #* 有什么选择,只有使用基于gLe.的大样本方法,我们将考察皿l.e.的分布的正态近似方袪和似然比方法口42.1极大似然怙计我们将继续讨论用极值分布表示的结果,虽然我们研究的是威布尔分布,但它能很方便地转过来,考虑常用的1型截尾样本的情形,这里匸表示寿命时间,L是容量为斤的样本中第,个样品的固定截尾时间。人们能观察到的仅仅是(T人),即观察到匚是寿命时间或是截尾时间。诸兀被假设有威布尔分布,或等价地,X.-Iogl;有参数为奠和力的极值分布勺
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 30443-2026保健服务通用要求
- 北京高中考勤制度
- 寿险考勤制度
- 三期员工违反考勤制度
- 学校阅读社团考勤制度
- 两学一做考核考勤制度
- 刚入职员工考勤制度
- 后厨考勤制度管理规定
- 油气田设备采购经理的职责与技能
- 汽车零部件生产厂家库存周转率提升方案介绍
- 2025四川绵阳市五八机器人科技有限责任公司外部招聘19人(第三批次)笔试参考题库附带答案详解
- 2025年3月天津高考英语真题 试题版
- 水务公司2026年节后复工安全生产培训
- (2025年)泰兴市事业单位招聘财务会计知识试题及答案
- 2026内蒙古地质矿产集团有限公司社会招聘65人备考题库带答案详解(b卷)
- 《力与大地:重力、摩擦力的科学透视与地理联结》-初中科学(八年级)单元复习课教学设计
- 2025年宁波职业技术学院单招职业技能考试题库附答案解析
- JB-T 14535-2023 塑料注射模 试模方法
- 古代汉语(全套课件)pdf
- 国家高考志愿规划师资格认定考试题库(高频300题)
- 口腔护理操作规范口腔护理PPT
评论
0/150
提交评论