威布尔分布寿命分析_第1页
威布尔分布寿命分析_第2页
威布尔分布寿命分析_第3页
威布尔分布寿命分析_第4页
威布尔分布寿命分析_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、威布尔和极值分布的推断方法这-章将对威布尔分布讨论其统计方法。威布尔密度函数是 # # II其中00和a>0是参数,经常分别称它们为该分布的形状参数 和尺度参如代替威布尔分布的-种更方便的形式是与其等价的 极值分布,其密度函数为./Ci川)=eT(-,i").(402)其中 » (一8<“<乂)和b (6>0)是参数。就像在L 32节中指出的那样,假如丁有密度函数(40.1),那未X=logT有密度函 数(4.0. 2),其中u=oga和円研究极值分布更方便,主要是由于“和0是位置参数和尺度参数这个事实,从-个分布导出 的任结果很容易转换到另-个分布

2、上去。威布尔分布在实际中是很重耍的寿命分布,大量射方法的 文献都是由此分布引岀的。关于威布尔分布的很多文章都涉及它 的统计性质。一般说来,由于对(4.0.1)的0和a,或与之等价 的(4.0.2)的"和0没有二维充分统计量,从而使产生估计量的 統就很多。此外,与威布尔分布和极值分布有关的多数估计量 和其它统计量的分布在数学上是难于处理的.这就导致多方面的研究如为便于推断而编制用表;对某种类型估计寻求近似分布。 幸运地妊相对便于使用的好的统计方法已有一些,多谢高速计算 机帮助其实现。涉及型截尾数据的问题将首先讨论,接着进行I型截尾数 据的推断然后是威布尔分布的比较和其它专题。4-1单样

3、本:完全或"型截尾数据对完全的或R型截尾数据来说,统计理论及其各种方法都是 较为成熟的,尽管他们在数学上和在计算上都是复杂的。设右 冬仃是来自威布尔分布(4()1)的容量为九的随机样本中前厂个最小观察值,或者等价地假设"W冬片是来自(4.0.2)的容量为n的样本中前r个最小观察值,其中* = 】og珀。(为方便起见.我们将在如和工"的卜标数字上省略括号,除非另外指定。在 这节中兀表示第个最小观察值用(141)可得q,.卩 的联合密度函数为(二;门(Q +严7"exp (宀 心讨exp (2。山)(4. 1. 1) 这就定义了立和5的似然函数9同时可看出,

4、G,.易)是这 个样本的最小充分统计量oU和5的点估计将先讨论,然后讨论检验和区间估计,推导和 结果将主要用极值分布语言给出。411点估计极大似然估计从(411)可以取出如下的似然函数 143 这里我们引出一个有用的记号,对任意序列炒,记rr:® =+(一 r)w, i= 1i i对数似然函数是logLCw ,6) rlogZ? 4- £:飞xp玉(4-1 4) m. L e,矗和&叮同时解方程?oL/du 0和31ogl/巧=()得到? 为此,一个简便的途径是令(4h3)为0,给出将此式代入方程刁1。屛/笳=0,可得(416)为了寻找立和人可以确定&作为(

5、4.1.6)的解,然后从(4.1.5)得到讥由于(416)不能解出厶的明显表达式,故某些数值方法必需采用。使用叠代法,譬如牛顿法(见附录F),给出(416)的解是没有困难的。威布尔参数"和a的m. Le,是&=expz;和'、假如有必 要,极大似然方程CL1-5)和(416)可以改写为威布尔形式, 然后直接解岀&和可是这样做没有特别方便之处,其壘后方程 是 145 (4<b7)(4. L 8)£ *亦可参见可靠性试验用表(增订本),国防工业出版社,1987 泽者注。 144 £ 7 - 4占 £ 1。筋=°i Mi

6、 -1线性估计 威布尔或极值分布的参数的极大似然估计是直接获得的,这常需要用计算机去解方程(416)或C4-1-8),不用计算机就可 完成估计的计算有时是很方便的。在这方面宀和b的线性估计常 被采用他们是形如u=工厂)不7= 1(4. 1.9) rb=的估计其中诸血和&是常系数,它们依赖于厂和心 当给出诸 e和心后9线性估计很容易算得,然而对大多数最好的线性估计 没有简单公式能以厂和挖形式给出诸彳和这样一来,必须要 构造系数值的表J最好线性无偏估计(b.Lu.x),即在线性无 偏估计类中具有最小方差的估计,可以从位置和尺度参数的线性 估计的一般结果中获得(Lloyd 1952 ; Ke

7、ndall 和 Stuart 1967, P(1956)和其他人曾8791;亦可见问题 41)9 Lieblein 和Zelen 对极值分布导出这样的估计。另外,Mann (1967a)考虑了统和6的最好线性同变估计(b.l.i.eQ,这种估计在线性估计类中拥有 最小均方误差,且(均方误差/h2在对诸无作位置尺度变换下是 不变的。对于这二类估计确定(4-1.9)中诸血和e,要求先算出标 准极值分布次序统计量的均值,方差和协方差(见问题4.1),Mann等人(1974.第5章)对极值分布给岀了线性估计很好的讨论,Sarhan 和 Greenberg (1962)和 David (1970)对线性

8、估计作了一般地讨论。对小到中样本来说,b. 1ic.大概是最方便的。这些估计的系 数“6, r)和c.(n,r)的表是容易得到的:Mann仃967a)和Mann 等人(1974, ppl94-207)对的样本给出了表,Mann(1967b)对2WW5给出了表,bLie作为u与b的点估计可以和m.Le.进行比较。两者都是渐近有效的,在小到中样本场 合它们都有类似的性质,blie更容易计算,虽然它们现在只能 对”£25的样本使用,因为超出这个范围还没有这样的表。无论 如何容易计算不应成为压倒一切的理由。事实上,由于极大似 然估计也可用于1型截尾数据,而线性估计一般是不能的,因此,任何人,

9、只要他经常使用威布尔模型、且数据常常是I型截尾的, 计在I型截尾数据场合总是被优先使用他就需要有计算极大似然估计的程序。无论nU.还是线性估在文献中还有很多其它的线性估计被提岀来。DAgostino (1971和另一些人讨论了 bL u, e.和b. L i. e的近似式,很多作 者提出这样的线性估计,它所需的表要比b1. iie.或b1. i. e.的 表要小得多。Mann等人(1974,第5章),Mann和Fertig(1977)和Engelhardt和Bain (1977a)研究了其中最好的。两个这样的估计将在41. 2d节中讨论、在那里它们将用来获得“和6 的置信区间。最后,Thoma

10、s和Wilson (1972)讨论了逐步增加的I型截尾样本的线性估计。有时我们希望很怏或很容易地计算出”和6的估计。譬如,为 了计算ml巴的*和&时,对A的值要有一个初始的予测。这时 可以利用简单的线性估计,如在412d节中讨论的估计,或它们 的最小二乘估计。另一种可能性就是利用概率纸得其图估计。它 们的一般叙述已在2.4.2节中给岀。这里让我们对极值分布简要 地回顾一下全过程。假如-张概率纸就像2.4.2节那样已被构造 出来,那么对概率纸上的点拟合一条直线,用此拟合直线即可获 145 得次和"的估计。这条直线可以用最小二乘法做出(见25节;White, 1969),但常用目

11、测来拟合这条线因为极值分布的生存函数满足log SgS=(XU)/久拟合的直线将有方程Y log logS (jt)=(rr "J /b这条直线的斜率济可估计“久轴上的截距“I可估计"当极 值分布概率纸用S&)作刻度时7的截距是用拟合直线与直线y =0的交点给出的。这时对应的S(n) = e 1 = 0- 368。图估计和其它估计方法nJ以用下面的例子来说明。例4I (例24Z再考察)Mann和Fertig (1973)给出飞 机零件的失效时间,在这个寿命试验中共有13个零件参与试验, 试验是在第10个零件发生失效时结束。失效时间(小时)是022, 0. 50, 0

12、.88, 1.00, 132 133, 1-54, 1, 76, 2 50 和 3 00,设这些数据来自威布尔分布让我们利用前面所叙述的各种估讣方法。为了计算线性估计我们把这些数据转换成极值形式"0 个观察值的对数分别是】5彳4 0. 693类似数表町柱町靠性试验用表査得该书于1978年由国防工业出版社出版 增订本一译者注。 012& 0, 0278, 0.285, 0. 432. 0.565, 0.916 和 1099。利用 Mann 等人( 1974) 的表53可得必要的数* ,我们可算得b.L i匕如下莎一一0 002927(- 1. 541) + -I 0, 6153

13、48(1. 099)-0. 873万二一0 083170(-1. 541)斗T 0 528441(1. 099) = 0.715这个例子的图估计曾在例2. 4.2中描述过。在那里凭目测在 概率纸上画岀直线,然后得到的估计为五=077和6-0. 69。为了确定in丄e我们先要对b用迭代法解方程(4116) °以 图估计069作为初始的预测值,如用牛顿法只需二次叠代就给出 m1.讥=0706,然后由(41. 5)算出必=0. 821。寿命分布其它特征的估计可直接从参数估计获得。譬如.若 用五和乙估计“和氛那么P分位数心=“+方log log fl p) 可以用=丑+弘g Tog (】-p

14、)去估计。假如在这当中使用 的是"和5的m. Le.那么最后的估计当然是相应量的mJ.已.比和6的blie与b1u. e相应导出的也是可的b.l.i.e.与b.Lue,但是,假如用这二类估计来求诸如S3。) = exp(-一必)之类的估计,那么最后的估计显然不具有线性也不具有 原来估计的某些其它性质。4-L2置信区间和检验获得位置和尺度参数的置信区间的一般方法是众所周知的, 然而当分布不同于正态分布时,数学上和计算上难于处理是常常 遇到的问题。这些问题在附录G中已进行了讨论。但为了叙述方 便,仍把这些内容在应用到极值分布之前在4.1.2a节中作回 顾。显著性检验不作详细的讨论,但它很

15、容易从构造置信区间的 枢轴量得到。给出s b和心的置信区间的几个方法将在4b 2b, c和d等节中讨论,生存函数的估计将在4l2e节中讨论。4l2a位置和尺度参数的置信区间考察具有位置参数«(-<w<oo)和尺度参数b (6>0)的 分布族,其密度函数形式为(8<久 <8)(4110)X Ub生存函数为G3f/$,其中G(y) = gMdz丿y设是一个I型截尾样本,它就是来自(41W)的容量为九的样本的前厂个最小观察值。命五=五5心)和方=(劝,乙)是"和方的估计,且具有如下同变性质五(/乂+“皿27 +刃=的(文|,(41. )1)bdx +

16、 ce>dxT + c)=勿(,皿)(4 1. 12) 147 其中C (一和/ W0)是任意实常数。这样的估计常 命名为“同变的=要求(4【11)和(41- 12)成立只是由于对 数据施行位置和尺度转换将对S诱导出相同的位置和尺度转换. 而对石只诱导出相同的尺度变换。这些对位置和尺度参数的估计 来说都是自然的要求。在411节中讨论的所有点估计都可以证 明满足4- hll和(4.1- 12)(见问题42。下面的定理在附录G中给出证明见定理G2):定理4. 11假如往和乙是基于来自(410)的I型截尾样 本心£=斗的同变估计,那么(i) Zj = (u u)/b, Z2 = h/

17、b 和 Z3 = (S u)/b 是枢轴量。 (“)诸量心=a征)/E是一组辅助统计量(即是这样的统 计量,它的分布不依赖于"或6),其中只有厂一2个是西数独立的。基于一对特别的同变估计的枢轴量乙和乙可以用来构造比 和b的置信区间。譬如,若人和佥是这样的量,它们使PrUi W Z、 £/=厂,那么,S-Z16)是“的丫置信区间,类似地, 假如,Pr (f 1WZ2WZ2=丁,那么(万/血,呂2是力的y置信区间。 对分布的分位数的置信区间亦可得到。(4. L10)的p分位数是 旳 = “+3,其中s满足G (wp =1一,枢轴量(413)刁(2u) Wpb_ uxz尸b=r可

18、以用来给出®的置信区间,因为匕=孑意味着 Pr (五一冷M灯冬莎一厶刃=儿它给岀叭的F置信区间(证一妙, 狂一Z#)。而乙,是枢轴量,这可从Zp = Z-uZi'中看岀。虽然赵或可的置信区间原则上可以从枢轴量Zi,z2和乙 得到但实际的困难在于它们的分布是非常复杂的。下面的定理 在附录G中给出(见定理G3)°定理4- 1.2命五和3是在定理411条件下的“和&的同 变估计.那么Z2, 5,2的联合密度函数有如下形式 148 +巧乞)Ga2 +釣之2)"(4114)其中k(a.r,n)仅是5,,a, 2厂和氏的函数。在给定*=(5 ,g)下(Z“乙)

19、的条件密度函数同样冇4114)形式。表达式(4打4)是任一模型中乙,Z2, ” 皿"的联合 密度瓯数形式。不幸地,除正态分布的无截尾样本情况之外, (4114)中的诸/不可能被积掉,这表明不能获得乙和乙分布 的解析表达式。极值分布场合下的这项结果将在4l2c节中讨 论。还有一点需要指岀,除正态分布的无截尾样本外,畏有一对 估计五和0是形如(4-1.10)的模型中羿和方的充分统计量。这一 点已在4- 1. 1节中对极值分布作了注释。然而有r-2维辅助统计 量,严格地说,我们应在给定独的观察值的条件下作推断(见附录 G),即置信区间可以从给定R时,乙,乙或乙的条件分布得到。 譬如,为了给

20、出弐的置信区间,我们需找这样的右和厶,使得Pr (ZjZj/Ja) =/(415)虽然这看上去似乎在推断中增加了复杂性,但它使得(41-15)的 概率计算要比无条件概率Pr (AWZWQ的计算容易很多。这种得到置信区间的条件方法将在4b 2b节中讨论,其它方 法将在412c和d中给出° 一般位置一尺度参数模型中的条件方 法进-步的讨论在附录G和本书所引的文献中。Lawless (1 978)综述了这个领域的研究工作和有关极值分布的专门文献。对极值分布来说,条件方法有在任何给定情况下都能够获得置信区间的优点,当然,要做到这一点需要有一台计算机。对某 些问题可用一些更简单的方法,这些方法

21、将叙述在4;2c和d节 中。4l2f节将对方法的选择作出某些评论。42b用条件方法获得的置信区间命狂和乙是基于I型截尾样本的“和b的同变估计。极值分布(1. 0. 2)有形如<1. b )0)的密度函数,其中g(y) -cxp(v- e-y)和 G(.y) = exp(- )。从定理 4- 1< 2 可推得,7 u - u)/b 和ZH在给足a时的密度函数有如下形式yTk1 (atr,n)z2r_Texp 丫 (atz2 卜2冋)一工 '卅2"旬f = 1"(4 b 16) 这电我们再-次采用在41-1节中引岀的记号沙7>=)i= IWf + (n

22、 - r)wr # 从(4. b 16)我们可以在条件a下推得Z】,Zp和乙中枉个的边缘分布。下面定理中的结果是Lawless (1972, 1975)给出的(也 nJ*见 Lawless、 1978)。定理 4- L 3 命乙=(2心)/5=(uu wfib)/b 和乙=b/b 其中s严log C-log (1-/>),玄和厶是基于I型截尾样本4冬 竝的蛀和b的同变估计,这个截尾样本是来自极值分布 (402), at(工匚一五)/人t- 1 f.厂9那末(i)绐定独下,N的条件密度函数冇如下形式h2z ja)=(a,r它exp (z 1);°J>=i # # (4.1.

23、17(ii)在给定R下彳7农的条件分布函数是Pt(乙 < /|a)= # # (4. b 18)其中1 (n 5)是不完全珈玛函数(£12。在给定&下,Z|的分布数可在(4】18)式中命3户=0给出。 # # 证明 (O为得(4117)我们对(41. 16)求场的积分 # 可得<x>如(|a z(a,roc+ rzxz2 &严2严坷 dz/-1,=|可得frA2(z2|a) = _kf (a,rtn)exp(工Jz厂/(另 K勺门八厂) e = i 1这实质上就是(4117),为以后数值计算方便这里把几项合并为一个新的常数<ii)对(4116)

24、求勺的积分不可能有解析式,于是我们在 给定«下求Zp的分布函数。在给定3下,Z2和Z严乙一w?Z2-的 联合密度函数容易从(4J.16)得到(另(a样2 + z2zp + wr)* (=】一*exp(2 + z2zp + U7)其中引>0,一在给定a下,Z”的分布函数是Pr(ZpQ|Qh(zf>2)dzpciz2cr. 151 # 作变量替换夕=£补勺£“严"“r I可得Pr(乙 £ /|a)=(a,r2exp(;_ia乂2 + r7Vp)(2=1$吧®)yr xeydy dz2 a其中t" (5?严勺)exp稍

25、作整理就可给出5118)1:1“为构造s b或的置信区间,必需获得ZirZ2或S的分位 点。这些容易从定理413的结果中算出,不过对(4li7)求 积分和计算(4b 18)的值都需要数值积分。这些将在例4L 2中 叙述。可以看出(见附录G),不同的同变估计对给定的样本可产 生相同的置信区间。因此用什么样的估计去构造枢轴量和氏是不 重要的。由于计算机对数值积分是必需的,因此还是获猖和使用 mH.e.为好尽管任一个同变估计也都能满足需要。要指出,虽 然A(z2a)含有未知常数&3、厂"),这是可以用九(讣)的积分 为1算出的。这个方法的操作将在下面例子中清楚地看岀。例412 下述

26、数据由lawless (1975, p. 258)给出.其 九= 40.厂=28, 极值形式的诸观察值益是一2 982,2 849, N 546,_2 350,-1 983, 一1 492, 1 443 一 1394,-1386,-1 269,7 195, 】 174, 0 845,-0. 620 一0576. 0548,0 247,-0- 195,-0.056,0 013,-0. 006 0.033,0.037,0.046,0084,0221,0245。0.296我们将在mJ. e的基础上作出枢轴量和辅助统计量。m1巴 算岀为 = 0.1563和& = 0.9104.然后辅助统计量被

27、定义为 么=3 01563)/0. 9104山=1.28。在计算几个置信区间前让 我们先考虑以后计算需要的量。所有的Q,都可算得,而在 (4L17)中的常数缸a*曲)是可知道的。这可以从下式中算岀f ft2(z |a)rfz = 1J 0它意味着i(a,r,n) = J z'-】exp( (z I)(4 b 19) 在(41.19)中的被积函数是性质很好的函数,它的积分很容易在 数值上计算岀来。一个简单方法是检查被积函数,确定一个区域 心埶,使得位于右和d2之外的累计值可以忽略不计。然后 一个简单的数值方法,如辛普森法,可用来计算这个积分当在这 里釆用n 1.巳时,就儿乎没有必要考虑在

28、0到10之外区域上的 被积函数。在获得Ka>r<n)之后,利用(4 L20)Pr(Zz < Z|a) = hz(z)dz0我们很容易地确定Z2的百分点。使(4.1.20)等于y的精确百分 点Z=Z"可以用重复试算的方法获得。得到乙的百分点要对(4-1.18)进行类似的计算。这个积分 在很多方面与积分(4.1.20)相同。因为 DM 1 ,积分 (4118)永远小于或等于积分(4120).不完全珈玛函数/ (厂. $)的计算在附录B中有讨论。最后指岀,假如对”或6的某个特 定值希望进行显著性检验,那就只需要对Z2或Zp计算单个概率 即可。现让我们冋到我们的数值例子上来

29、。很快会看到,在这个问 题中.在(4.1.19)中的被积函数之下与在区域(0, 3)之外的 面稅是可以忽略不计的,用数值积分方法,位于被积函数之下的 .总面积为0.4355,于是& (給厂,n) =22961。现我们有个完 整的密度函数h2(z»),干是可对Z2,Z|或乙计算任何一个想要 得到的概率。譬如我们想要得到6的0. 90的双侧置信区间,可用 数值方法对屁(小)进行积分,可以确定Pr(Z2<0.713|a)= 0. 05 和 Pr(Z2 < 1.257|a) = O 95 ,于是Pr(O 713 冬刃6 冬 1 257 |a) = 0 90从观察值&

30、;=09104可得0724冬炖277,这就是6的090置 信区亂假如我们还想得到r的095置信下限。从(4.1.18)找到 153 Pr(Zal0<3- 153|a) = 0 95这里不.尸 3-畑J /从于是xo.w>u-1536是想要得到的 置信区间,它给出心我孑一2.714,这就是算得的区间。条件方法的一个优点是可用来获得或可的置信区间,而 不管D型截尾样本的大小。它也可以获得其它特征量的置信区间 如生存函数(见4. 12e节),也可用来处理逐步增多的H型截尾数 据。这个方法是直接的.但因它要求数值积分,这必须在计算机 上进行这里所要求的计算在-台交换计算设备上进行是很方便

31、的.Lawless (1978)对此有几点附加的忠告并提及一个FORTRAN 程序使用者用此程序只要给岀很少的输入就可算岀置信 区间。在某些场合,需要比条件方法计算更少的方法。在下面二卩 将讨论这些方法。4- 12c荻得精确置信区间的其它方法 基于枢轴量条件分布(给定Q下)的置信区间可以用基于枢轴的同变估计来构造枢轴量是不重要的,但在无条件方法中则不然, 它要优先利用具有好性质的估计量。也就是用这样的估计量,它 的抽样分布愈集中在参数周围愈好。对待估的极值参数M和6已提出几种方法。阪rm (196%)和Mann和Fertig (1S73)考虑基于m和6的b> L L e的枢轴量。Thom

32、an等人(1969)和McCool (1970)提出基于m. 1e的枢轴量。困难是在这二种场合F2】,乙和乙的分布在数学上难于处 理,于是就不可能用解析形式去表示精确的百分点。而可能的是 用蒙得卡罗方法去产生各百分点近似估计。在这方面就需要构造 (近似)百分点的表。这个基本思想如下所述:因为Z?和乙 是枢轴量,它们的分布(对给定的厂和小对极值分布的“和6的 无论什么值都是相同的。当比=0,和6=1时,枢轴量成为E_log _log (1 />) b臂如.?的分布町以用计算机上产生的标准极值分布(" = 0, b =1)的样本作出估计。这样的样本可以产生很多(在这里可用40000

33、 个样本),对每个样本计算五和人然后得到Z,=u/b的值。这样 我们町以得到Z的分布的个很好的估计。Z?和乙的分布可以 类似地估计岀来。下面的百分点表是用蒙得卡罗方法产生的,所用的枢轴量是基于bL ie或mL efl1-基于b.LLe的枢轴量:Mann等人(1971)对3冬厂态斤冬 25的样本给岀了久乙和Zp "=0010.05, 0.10)的百分点 表.这样的表也在Mann &. Fertig (1973)和Mun等人(1974, 第5章)中给岀,不过仅对3WrM“gl3的样本,而对乙仅为 />=6 05 和 0 10。2基于mle的枢轴量:Thoman等人(1969

34、)对样本量n£120的完全样本给岀Z】和乙的百分点表。Thoman等人 (1970)对样本量100的完全样本给出生存函数的置信区间,对 于截尾样本,Billmann等人(1972)给出了类似的表,但这些表 相当稀疏,只含有力=40. 60, 80, 100, 120和厂=O75“ 050n的样本,但用插值法可以一定的精度得到一些附加值。最后9 McCool (1970, 1974)对Z, Z2 和 ZP (/»=0-0b 0.10, 0- 50)给 岀厂和刀的17种组合的表。这些(厂,兀)组合是” =5 (厂=3, 5).刀=10 (r3» 5, 10),用=15

35、 6=5,10, 15), x = 20,(厂= 5, 10, 15. 20)和“ =30 &=5, 10, 15, 20, 30)。造出这样的表是很昂贵的,因为第一个厂和值的组合都必 须分开处理。因此没有亠张表能包含实际中可能出现的所有样本 量。此外这些表要占据相当大的空间,且不能集中于一页上。虽 然如此,使用它们还是很方便的谁大量使用威布尔分布,谁就 应设法得到它们的拷贝。155F面二个例子将说明如何使用这些表。例413例4h 1再考察在例411中给出的数据是飞 行器零件的失效时间,它们是死=13和厂=10的D型截尾样本。它 们的对数寿命假设有极值分布。我们希望得到“和0的090双

36、侧 置信区间和工.0的095冒信卜限。在上而所列的表中由Mann &. FeMg給出的表含有n-13和 厂二0的样本。这些表是基丁乜和的bJ.i.c和乙构造岀来的° 从Mann等人(1974)的表575&和510中我们可以找到(l)Pr(O< 52<Z?< K4O) = 0. 90 ,<2) Pr(- 0. 72 W Zi £ 0- 58) = 0 90 ,(3) Pr(Z01<J M 4 37) = 095 °其中 = (2- w) /b9 Z2=b/b 和 Zai严U 这些式 子给出的置信区间是(1) 6/l<

37、;40S/0. 52 <2) a-0.586<w5 + 0. lib. u-4- 375jr0 l0以观察值2 = 0-873和宀0715代入,可顺次得到0.5110=1- 375, 0. 458冬388 和_2 252W如.叭这些置信区间可以转换到柑应威布尔分布参数和特征量的置 信区间。譬如威布尔分布(或寿命)的0J0分位数是心山=expso、于是".io的 0. 95 置信下限是exp(2252) = 0.105。例4 1.4作为第二个例子,我们考察从极值分布来的八=20 和厂=10的B型截尾样本:357, 255. 2O2, L 66» L 36 115,

38、 -095, -077, 0 61 今一0.45。在这个场合,为得到置信区间我们可用下面二个表中任一个:基 于m.l.e,并由McCool(1974)给出的表和基于h Li. e,并由 Mann等人(1971)给岀的表。让我们对每一种情况都计算各自的 估计,并且为了进一步比较也让我们用41.2b节的条件方法给岀 156 置信区间。从给定数据可算得e为K _0M2和儿0907. 其b.I.i.e.为五一 0- 048 和&0.915.利用Mann 等人(1971)和 McCool (1974)给出的ZZ?和Zo.w的分位数表,对n 2Q和厂 一】0我们叩得几"和航卫的09。的双

39、侧置信区间,结果列于表没有实质上的差别。表4 11411中。用条件方法所得的置信区间同样可以获得。为了进行比 较,各种置信限都仅给出二位小数,因为这些表的精度不能支持 更精确的比较。可清楚地看出,在这个例子中的三种方法的结果Bic枢轴量MJ.e.枢轴量条件方法0-64<Kh82()89-376航我冬一151064总©81一 05禺0903. 74如|忑一1490 65W6W1.83050总90 一376丸加 151三种方法得到的090双侧置信区间在很多场合,基于b丄i匕和m丄e.的枢轴量的无条件分布 所得的结果间只有很小的差别,而它与用条件方法得到的结果间 也只有很小的差别.差

40、别发生在小样本或重截尾样本等情形。但 对几乎所有的实用目的这些方法是大致相同的,4.1.2/节含有赞 成和反对使用这些方法的些评论。4 12d枢轴分布的近似因为用蒙得卡罗方法对所有实际重要问题获得ZH Z2ffJ zfi 的分位点是不易办到的。因此研究转人寻找这些分布的近似。某 些简单的近似及其应用和随后出现的专题讨论在此-并考虑。对刃D的分布的F近似对Zblb(厶是b的m丄匕)可以找到一很简单的近似。这个近似就是/分布,它对几乎所有的实际场合都是适用的。该近 似除了能得到b的置信区间的简单方法外,亦可用来比较二个或 更多个威布尔和极值分布(见4.3,1节中的讨论)。 157 (4. 1<

41、;21)从经脸中发展起来的这个近似有如下形式g(万畑其中Z是的m丄亡,所用样本是和个观察值中前厂个组成的It 型截尾样本舟亠g(r.n)和去=hgn)是常数。McCool(1975b), Lawless和Mann (1976)和其它人都建议用这个方法去近似厶”的分布。常常这样来选择&和H使得<4.h21)两边的 均值和方差相等"这就给出二个方程齟左卜h于Var(彳=2h由此可得g = 2E(b/b) /Var (b/b) 原文为g 2/V ar (6/b)t有课译者注。 158 和 h gE(b/b) 0 困难在于 E Cb/b)和Var (i/6)对所有的(r C不是

42、都知道的。不过,H沖心 和Moore1968)曾用模拟就睨=10或20的截尾样本进行了估计, 而 McCool (19756)和 Lawless 和 Mann (1976)讨论了估计 E(b/b) 和Var(6/)的其它方法。表 4 1 2 是由 Harter 和 Moore (1968,McCool (1975b)和 Lawless和Mann (1976)分别得到的结果组合而成的。它对各种(厂,并)组合给出了 hG、n)的值。g(d 由g(厂皿)=肛厂/) + 2给出。把用(4121)和育"的这些值得到的bib的百分点与McCool (1974, 1975b)和Billmann等人

43、(1972)给出的精确百分点 进行比较表明,这个近似在儿乎所有场合都是适用的。一般说来, 这个近似是随着n或厂/力增大而有改善。当刃->oo和r/n为固定 时,这个近似在极限状态是精确的。对没有包含在表412中的死和厂/九的值,A的值可用线性 内插法获得。对厂大约大于10的样本,这个近似是很精确的,分 布的下尾部要比上尾部略高一些。这个近似的精度的个例子在后面给出。要指岀,在4121)中的F自由度参数可能不是整数。对小的h值;的概率和百分点可用Z2累积分布函数和不完全伽玛函数之间的关系(见附录直接计算,也可用整数自由度的X2表进行内播来确定(见Pearson和Hartley (1966)

44、; Mardia表4.2近似(4】21)中所用的去(c n)值151020406080100OQ 12.06.010.014. 118. 10. 205刃22.06214.623.031.539. 90 420n3 4310.924. 037.050.16320.652«4226715.833851. 869. 987.9» 899h 5 r/n 63. 59. 120. 744067. 390. 6113-9I. 165m4- 711.425. 854783. 5112. 314L 11 457” 76.014. 832.66&1103. 8139. 5175.

45、01782丹81. 818. 540.08331264169.5212. 52. 155”910. 323.049. 0100.9153. 0204. 9256.92- 607并1.012.929.362. 412& 2194. 8257. 6325.53. 295n) hr 9 n)+ 2."2 r( ;燈丿和Zemroch (1978)。对大概大于10的力,於概率和分位数的很 精确的近似可从Wilson-Hilferty变换见附录B的(B14)和 (B15)得到。对概率有如下近似.1/32-1(4 b 22)(4123)(1 十窈一 1 N (0 1)对来&的分位

46、数有如下近似公式9/!? 1 2=3总,宀口-丽+川韵.其中g是标准正态分布的p分位数。这些近似对表4. 12中所 159 161列的很多情况计算概率和分位数是容易的也是精确的。例41-5作为/近似的例子,考虑一个兀=20和厂=2的 卫型截尾样本。以介=20和厂加=05可从表4.1.2中得到勺 207和g = 227。于是近似(4121)是人227(彳)也.厂表4. 1, 3给岀了乙“的分布的某些百分点,它是用这个近似计算 的,另一些是来自McCool (1975b)表而实际上是祢6的精确百分 点。除去在99%分位点上有相当小的偏羌外这个近似是非常精 确的。表43 b/b的精确和近似的百分点百

47、分点151050909599精确值0.38 0- 500- 580 881.291 421.67(4.;. 21)近似值0- 380- 500.570.881.291- 42h 70基于线性估计的枢轴的近似有儿个近似是在基于线性估计的枢轴量的分布上而建立起来 的,其中两个将在这里讨论。它们都是很有用的,尤其是在与下 面介绍的"和b的二个简单线性估计连结在一起时更是这样。这 些近似要用到"和6的无偏线性估计。这不是一个限制,因为其它 估计,譬如b. 1. ie,也可以用无偏估计形式表示。令五和呂是坯和b的无偏线性估计,它们是基于容量为力的Bt机样本中前厂个最小观察值组成的I型

48、截尾样本。于是E(u) =“和E (?)二"此外,命 对任一个特定的估计量诸值A 八B (八Q和(:(r. «)原 则上是容易得到的。因为它们是来自标准极值分布次序统计量的 均值、方差和协方差的两数。然而在实际中,它们是很难获得的, 以至于对九25的样本这些量还没有列出表来。cmVar(6)b2F面二个近似方法是分别用X Mann 等人(1974, p. 241)和 Mann (1977)导出用 F 分布去近似乙的分布。命log log (1 />)是极值 分布的P分位数。再命才=u - B(r,n)5/C(r,n).于是这个近 似是分布和F分布去近似枢轴量的分布使得

49、它们的某些矩相等,具体如下:Z2=b/b的分布常可由F分布很好地近似。其做法与厶的分布用(4121)去近似相同,Engelhardt (1975), Lawless和 Mann (1976)和其他人使用这个方法。这里E(b/b) - Var (恥)=C (厂,这个近似是气£|尬)(4124)其中g = g(S)和为=力(")依赖于r和札使(4. L24)两边 的前二阶矩相等,可得&(厂)=h(rn)2C(r)#(4.1.25)163#其中 Wp = log log(l 一 />),dzB(厂C(r.n)A")B(r9n)2C(rn) I2C(rfn)

50、#当采用最好线性无偏估计(B-Lu-eJ时,这个近似仅对一些 情况是令人满意的,然而它们已包含了多数重要的实际场合。细节在Mann (1977)中给出。可概括地说,只要心5且纽V <18-50,该近似对p025是适用的。要指出,在 (4.1. 25中的dx和dz常是非整数。在这种情况下确定F的概率 将在附录B. 43节和在例4L 6中讨论。这些近似是与bk u. c一起使用,当然这并不是必须的,因 为Mann-Fertig(1973)的表是基于b. L L匕(它与b】 u.e.有关) 的枢轴量的分布,其样本量最多为 =20。对"25的样本还没有 为所有AS d B(r, n)和

51、CS n)制成表。于是这些近似就 不能使用。由于这一点,就有很大兴趣去寻找具有好性质的简单 线性估计。这方面研究的文献已被Marm&Fertig (1977)和Em gelhardt和Bain (1977a)给岀。具有很好好统计性质的一对估计 量瘠在这里给岀。当利用近似(4.1.24)和(4.1.25)时,它们 也提供构造检验和置信区间的简单方法。简单线性估计这里所考察的估计和结果是由Bain (1972), EngelhardtBain (1973, 1974), Engelhardt ( 1975 )和 Mann 和 Fertig(1975a)建立的。所给的估计有:种形式,这要看样

52、本是B型截尾GO)还是全样本。具体如下:1对于截尾样本(r<«)j = y 旦 一(4.1.26)' i=i 廉(s) u = xr w(rn)b其中文伍是口型截尾极值样本M(s)是常数,它是这样 选出的,使得E=w(r,n)是来自标准极值分布的样本容量 为的第厂个最小观察值的期望值。取自Engelhardt (1975)的表 414提供了若干系数,用它们可算得和(厂曲几用表 4L4所得到的值是较为精确的近似值。它的最大误差仅在小数第4位上相差1。(表415给出了 (4.1.26)的方差和协方養4(”)")和C(r),这些在使用近似(4124)和(4125)时

53、也是需要#哀4! 4用来计算简单线性估计因子的系數* 1.2 34.5 6 7 8 9竝0 102650.211290. 327230. 452340 58937。 742740. 92026b 13821 14436局1- 02711. 06221. 10601 16341 24151 35401. 83131. 85672. 6929k?0. 00 0300540 0800. 1456 2420. 4330 9062. 7962 25041.4999 1-0309-0. 67173366510. 087420. 185630.475890. 83403切5- 57433 0740-22859k 93011. 76191.7114-L 77272- 0110Z. 7 737- 8481.886一 0. 7670. 3550. 0910U110.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论