




已阅读5页,还剩18页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
a b s t r a c t s o m es t u d ya b o u tb e h r e n s - f ls h e rp r o b l e m as u m m a r yo ft h ec o n t e n t s :t h i sp a p e rm a i n l ys t u d i e st h en o r m a la p p r o x i m a t i o n t e s tm e t h o df o rb e h r c n s f i s h e rp r o b l e m f i r s t l yi ti n t r o d u c e st h eb a s i cc o n t e n t so f b e h r e n s f i s h e rp r o b l e m ,a n dd e s c r i b e st h ee x i s t i n gs o l u t i o n st ot h i si s s u e ,f o l l o w e db y t h ei n t r o d u c t i o no fai l e wm e t h o d :t h en o r m a la p p r o x i m a t i o nt e s tm e t h o df o r b e h r e n s f i s h e rp r o b l e m ,w h i c hf o c u s e so nt h ec o m p a r i s o nb e t w e e nn e wt e s t i n g m e t h o da n dt r a d i t i o n a lm e t h o d s ( w 色l c h sa p p r o x i m a t et t e s tm e t h o d ) ,d i s c u s s i o no f i t se s s e n t i a ls a m p l es i z e ,a n ds oo n m a i nc o n c l u s i o n so ft h i sa r t i c l ea r e t h i sn e w m e t h o dc o u l dw e l lc o n t r o l lf i r s t t y p ee r r o r si na l lr e s e a r c hs i t u a t i o n s ,a n dt h ee f f i c a c y o ft e s t i n gi sn o tb a d :w e l c ha p p r o x i m a t e r e s t ,t h em o s tc o m m o n l yu s e dm e t h o d , c a n n o tc o n t r o lf i r s t t y p ee r r o r sw h e ns a m p l es i z ei sn o te q u a l ;f o rn o n i n f e r i o r i t y1 c s t w e l c ha p p r o x i m a t et e s tc 凋t nb e t t e rc o n t r o l lf a s t - t y p ee r r o r s a n de x a m i n a t i o no f e f 丘c a c yo fs c o r et e s tb e t t e r i nw e l c ha p p r o x i m a t et e s t , w h i c hs h o w st h a tu n d e r d i f f e r e n tc i r c u m s t a n c e s s c o r et e s t sa n dw e l c ha p p r o x i m a t et e s tb o t hh a v et h e i ro w n a d v a n t a g e s a d d i t i o n a l l y , u n d e rt h ec o n d i t i o n so ft h eg i v e np a r a m e t e r t h i sa r t i c l e i n f e r sc a l c u l a t i o nf o r m u l ao fn e c e s s a r ys a m p l es i z eo fs c o r et e s ts t a t i s t i c sw h e nt w o s a m p l es i z eo ft h ew h o l ea r ee q u a l t h i sp a p e rh a sf o u rc h a p t e r n ef i r s tc h a p t e ri sa ni n t r o d u c t i o n ,m a i n l ya b o u tt h eb a c k g r o u n do ft h i sp a p e r , l i t e r a t u r er e v i e w , s t r u c t u r ea n df r a m e w o r k ,a n dr e s e a r c hm e t h o d s ,a n ds oo n t h es e c o n dc h a p t e rd e s c r i b et h en o r m a la p p r o x i m a t i o nt e s tm e t h o df o r b e h r e n s f i s h e rp r o b l e m t h et h i r dc h a p t e ri sd i s s c u s t i o na b o u tn o n i n f e r i o r i t y r e s ta n de s s e n t i a ls a m p l e s i z e t h el a s tc h a p t e ri sc o n c l u s i o na n do t h e rd i s s c u s i o n s k e yw o r d s :b e h r e n s - f i s h e rp r o b l e m :n o r m a la p p r o x i m a t i o n ;n o n i n f 。6 0 r i t yt e s t : e s s e n t i a ls a m p l es i z e n 目录 中文摘要i 英文摘要:i i 第1 章绪论1 1 1b e h r e n s f i s h e r 问题1 1 2 已有的研究成果0 00000 1 1 3 本文的研究内容与思路o eeeto 2 第2 章b e h r e n s f i s h e r 问题的正态逼近3 2 1s c o r e 检验3 2 2 计算机模拟结果及分析4 第3 章非劣检验及样本量的估计7 3 1 非劣检验7 3 1 1 关于非劣检验7 3 1 2 基于非劣检验的s c o r e 检验8 3 1 3 随机模拟及分析o e o eeooee 9 3 2 必要样本量的估计1 1 3 2 1s c o r e 检验样本容量的确定11 3 2 2 随机模拟及分析13 第4 章总结及讨论0 00 00 0000 6 00 1 5 参考文献16 附录( 计算机程序) o oe e oo 1 7 攻读硕士学位期间承担的科研任务与主要成果2 0 ,致谢“o o 00 :“。2 1 一h 譬、卜 i l l 第一章绪论 1 1b e h r e n s f i s h e r 问题 应用统计中一个常见的问题是出较两总体的均值,感兴趣的参数是均值之 差。假设两总体分别服从正态分布( 心,彳) 、( 心,z ) ,从中分别抽出容量为 ”以:的简单随机样本( 置,) 、伍,k ) ,且两个随机样本相互独立,记 j 一瓦1 耄x t ,砰一去羹( 置厕2 歹i n 2 簧一去薹弼耐 若砰、砖已知或七a 彳砖已知的情况,问题容易解决,对七一砰砖未知 的情况要找出一个除段- , 2 # 1 不含任何未知参数且服从于自由度为+ 厅:- 2 的 f 分布的检验量是困难的,通常总体方差之比七;砰砖未知,这时对总体均值 之差一h 一心进行假设检验( 或区间估计) ,就是有名的b e h r e n s f i s h e r 问题眦羽。 包括我国著名的统计学家许宝禄先生嘲在内的一大批学者对这个问题进行过深 入系统的探讨。 1 2 已有的研究成果 在上面的条件下考虑双边假设检验问题:风:他一心仲风:心一j 【2 。w e l c h 1 给出一种基于随机自由度的近似方法( 常称为w e l c h 近似t 检验) ,他认为检验统 计量n 而器寡在原假设成立嘶伽纵自由度为埔份布,其中 自由肌项舞缔啡整数时四舍五入) w 觚g 嘲指出: w e l c h 的近似f 检验没有w r c l c h - a s p j n 检验7 哪! 有效,但是s c h e f f e 1 ,b e s t 和r a ) ,l l c r 1 羽 以及m o s e r b 和s t e v e n s g n 3 1 都认为:如果既要考虑检验的无偏性,又要兼顾实际应 用的方便,w e l c h 近似t 检验或许是最好的方法,因为它只需t 分布表,而 w e l c h a s p i n 检验的临界值计算相当麻烦。现在的大学教科书大都采用w e l c h 近似 f 检验这种方法n 纠射 1 3 本文的研究内容与思路 对于b e h r e n s f i s h e r 问题,本文提出一种新的近似方法,即利用最常见的正 态逼近进行假设检验。s c o r e 检验统计量近似服从正态分布,比w e l c h 近似f 检验 更直观,更容易让不太熟悉统计学的使用者接受。特别是在大学推广这种正态逼 近方法,更具有现实意义。首先,通过参数的设定,理论公式的推导,计算得出 s c o r e 检验统计量u 计算公式,为比较小样本情形下w e l c h 近似f 检验与s c o r e 检验 的第一类错误和检验功效,我们利用c 语言编程进行随机模拟试验。 目前,对于两总体均值差假设检验统计应用中,已公认的传统假设检验( 又 称显著性检验) 在临床试验中用于判断药物的疗效存在局限或不合理性,因此, 有必要在小样本情形下对w e l c h 近似t 检验统计量与s c o r e 检验统计量u 做非劣检 验方面的对比研究。 在做假设检验的研究时,样本容量的确定是一个非常重要的问题,只有选择 了合适的样本容量,才能比较经济且准确地对总体参数进行估计,对有关的假设 进行科学检验。通过理论公式的推导,本文给出了s c o r e 检验的必要样本容量的计 算公式。并用计算机随机模拟的方法,用该公式计算出的样本容量估计非劣检验 的第一类错误及检验功效,以验证公式的正确性。 鉴于c 语言具备较强的数据处理能力、简洁紧凑、灵活方便及可移植性好等 特点,本文所有的随机模拟试验程序均用c 语言编写。 2 。 ”t 皇1 :,0 , 第二章b e h r e n s f i s h e r 问题的正态逼近 2 1s c o r e 检验 假设两总体分别服从正态分布( 以,砰) 、( :,砖) ,从中分别抽出容量为,l l 、 的简单随机样本,样本均值分别记为j 、矿,样本方差分别记为砰、霹。 我们定义双边假设检验问题:h 。:地- :付甄:心一心,本节我们给出该双 边假设检验问题的s c o r e 检验统计量。 由于鸬心+ j c l ,故样本的对数似然函数可改写为 h 考h ( 耐) - 刍蠢 一心训2 专域冽) - 去薹” 其中是感兴趣的参数,而心,彳,z 都是讨厌参数。我们先在h o ( 即一0 ) 的条件下求出这些讨厌参数的最大似然估计。容易得到( 条件) 似然方程组为 a l l l 工o p 2 - 善“一:) o l + 薹( y ,一p :) 斫_ o 0 1 z , o ( o ;) - 1 ( 斫) + “哨) 2 ( 2 , 7 1 4 ) - o a l n l a 研) 一- , ( 2 0 2 2 ) + 薹o ,鸭) 2 ( 2 口d _ o 即 _ n i x - n l 2 + 型之丝0 0 io i 去+ 坚芑芋世一。2 d :2 0 : 一刍+ 生鼍笋趟t 。2 斫2 ( 片 f p 2 - ( n 。j 砖+ 咒2 聊) o l 呸2 + 一:彳) 彳一2 + ( j p :) 2 l 2 - s :2 + 一弘2 ) 2 于是可以得到讨厌参数卢:,西,的( 条件) 最大似然估计分别为 i 瓯一叉+ i 审一叉、) 茸一砰+ f 2 s 善 l 司一2 + ( 1 一f ) 2 这里9 2a 瓴一1 ) ,l l 砰,s 7t o :一1 ) 靠:霹,蹬一暖一矿) 2 ,f 为下面三 元一次方程在区间( 0 ,1 ) 中使对数似然函数l n l 达到最大的实数解: 瓴+ 以2 y 3 一蹯( 执+ 席2 y 2 + 瓴野+ 刀2 砰+ 惕$ y 一厅2 2 一。 再令s ( ,a 2 ,z ) 一a l n l l a - “一一心) 砰,于是 s ( 0 ,玩,茸,霹) z ,l l 暖一忍) 砰z 带暖一而茸= 暖一矿) ( 辞,l l + 谚咒:) 其渐近方差估计为v ( o ,历:,砰,吼- 2 ) - - 1 ( 5 ;,l i + 谚n :) ,故s c o r e 检验统计量 为 u - s ( o ,厨2 ,砰,- 2 j ,v u u ,心。,q 2 ,吼- 2 ) - ( 2 一矿) 辞,l l + 霹n 2 不难证明,在风( 即一0 ) 成立的条件下,当,l l ,厅:较大时,u 近似服从 标准正态分布。因此当i 【厂bz 1 _ 口:( 这里2 表示标准正态分布的1 一口2 分位数) 时,在显著性水平1 一口下我们就有充分理由拒绝原假设风,从而接受备择假设 风,即可认为两总体均值之间的差异有统计学意义。 2 2 计算机模拟结果 。为比较小样本情形下w e l c h 近似t 检验和s c o r e 检验的第一类错误和检验功 效,本节利用c + + 编程进行随机模拟。 我们研究两种方法在样本量不等( 取,l l 一5 ,n := 1 0 ) 和样本量相等( 取 ,l l 一8 肛:一8 ) 以及总方差和a 一西,l l + z 厶:与总体方差之比七一彳吒2 的不同 组合情况下的第一类错误( 此时j l 一0 ) 和检验功效( 我们设定【i l l l ) 。有关参 数a ,k 的取值我们参考了文章n 幻。两次随机模拟试验的结果见表1 为考察两种方法的第一类错误,取显著性水平口t0 0 5 ,在重复试验2 0 0 0 0 0 0 次( 如今计算机功能强大,时间不是问题) 时,则其置信水平为9 5 的置信区间 4 一- 一 一 一 一 一 一 为( 4 9 7 , 5 0 3 ) 。我们将表1 中w 色l c h 近似t 检验和s c o r c 检验的第一类错误率超 过置信上限的数据变斜体加粗加下划线,在置信区间内的数据加灰底。 试验1 ( n 1i5 , n 2 1 0 ) 试验2 ( n l 一8 , n 2 8 ) 第一类错误 功效第一类错误 功效 ( - 0 )( - 1 ) ( p 一0 ) ( - 1 ) aj rr, r ruru o 1o 14 8 8 4 6 3 0 8 2 2 6 0 8 1 0 8 5 j j 4 3 1 0 7 9 3 6 0 7 5 4 5 o 1 0 9 玉鲤经4 3 7 0 7 8 4 9 0 6 9 9 14 7 9 4 7 6 0 8 2 9 8 o 8 2 7 6 0 1 1 0 五逊4 3 5 o 7 7 9 4 0 6 8 4 64 7 6 4 7 4 0 8 2 9 9o 8 2 7 8 0 11 1 五。z 互经4 2 9 0 7 7 4 70 6 7 1 3 4 7 7 4 7 5 0 8 2 9 6 o 8 2 7 3 0 11 6 逊4 1 2 0 7 5 5 6 o 6 2 2 7 4 8 1 4 7 4 0 8 2 7 4 0 8 2 1 6 o 1 2 1 玉塑经 3 9 7 0 7 4 2 4 0 5 8 9 94 8 6 4 7 2 0 8 2 3 6 0 8 1 3 1 o 1 3 1 点。盥经 3 6 9 0 7 2 3 9 0 5 5 1 04 9 6 4 6 7 0 8 1 5 7 0 7 9 6 9 o 14 1 氩垃丝 3 4 7 0 7 1 1 6 0 5 2 9 4 5 d 4 4 6 1 0 8 1 0 6 0 7 8 5 8 o 2o 14 8 9 4 6 3 0 5 3 2 6 0 5 1 7 9 i j 4 4 3 4 0 5 0 8 4 0 4 6 3 7 o 20 9 点:笸丝4 3 9 0 5 0 3 0 o 4 3 3 24 7 5 4 7 2 0 5 3 9 5 0 5 3 6 9 o 2 1 o5 0 s 4 3 3 0 4 9 8 8 0 4 2 1 74 7 7 4 7 4 0 5 3 9 3 0 5 3 6 8 o 2 1 1 逊4 2 9 0 4 9 5 3 0 4 1 2 14 7 7 4 7 5 0 5 3 9 0 o 5 3 6 4 o 21 6 丝经 4 1 1 0 4 8 1 8 0 3 7 4 34 8 3 4 7 5 0 5 3 6 6 0 5 3 0 3 o 22 1s 4 0 3 9 6 0 4 7 2 1 0 3 4 9 3 4 8 8 4 7 4 0 5 3 3 4 0 5 2 1 8 0 23 1 工丝经 3 6 9 0 4 5 8 3 0 3 1 8 04 9 4 4 6 5 0 5 2 8 7 0 5 0 7 5 o 24 1 五。主z 经 3 4 7 o 4 4 7 6 0 2 9 9 45 0 2 糍4 6 0 0 5 2 3 8 0 4 9 5 7 o 3 0 14 9 0 4 6 5 0 3 8 5 2 0 3 7 2 65 1 6 4 3 4 0 3 6 8 8 0 3 3 0 1 0 30 9多0 3 锈4 3 6 0 3 6 4 9 0 3 1 1 8 4 7 9 4 7 6 0 3 8 8 6 0 3 8 6 5 0 31 05 0 8 4 3 2 0 3 6 2 6 0 3 0 4 2 4 7 7 4 7 3 0 3 8 9 0 0 3 8 7 0 0 31 1 丝丝4 2 8 0 3 6 0 1 0 2 9 6 94 7 5 4 7 3 0 3 8 9 4 o 3 8 7 4 o 3 1 6 丝丝4 1 1 0 3 5 1 6 0 2 6 9 14 8 4 4 7 6 0 3 8 8 3 0 3 8 3 1 o 32 1 5 4 4 3 9 9 0 3 4 4 40 2 5 0 1 4 8 6 4 7 2 0 3 8 5 5 0 3 7 5 9 o 33 1 主:经3 6 7 0 3 3 5 2 0 2 2 6 34 9 3 4 6 4 、_ 呻3 8 2 1 0 ;& 6 4 5 o 3 4 1 曼影 3 4 7 0 3 2 7 9 0 2 1 2 05 0 2 4 6 1 0 3 7 8 7 0 3 5 5 0 从表l 的结果来看,在样本量不等的小样本情况下,w e l c h 近似确佥验的第一 类错误率大部分( 8 3 3 3 ) 都超过了预先指定的显著性水平口t0 0 5 的置信上限; 5 即使在样本量相同的情况下,w e l c h 近似t 检验还是不能很好地控制第一类错误 ( 总体方差之比k 一砰呸2 较大或较小时的第一类错误率还是超过了口= o 0 5 的 置信上限) 。而在我们所模拟的所有情况下,s c o r e 检验的第一类错误率全都小于 5 ,表明我们的方法能保证控制第一类错误。至少从这点来说,s c o r e 检验要优 于w e l c h 近似t 检验。 比较两者的检验功效,在样本量不等( 一5 , n :1 0 ) 的情况下,w e l c h 近 似t 检验略大于s c o r e 检验,而样本量相同( n a 一8 ,。8 ) 时,两者的检验功效几 乎一样。因此,从功效来看,s c o r e 检验也并不比w e l c h 近似t 检验差多少。 另一方面,我们也要看到,s c o r e 检验与w e l c h 近似t 检验一样,在两样本量 不等时,检验功效受两个总体方差之比的变化影响较大;而在样本量相等时影响 较小。因此,在实际问题中,选取样本量如果不能做到大样本,最好也要让二个 样本量差不多,这样才有可能保证检验功效不会有太大变化。 6 3 1 非劣检验 第三章非劣检验及样本量的估计 3 1 1 关于非劣检验 目前,对于两总体均值差假设检验统计应用中,已公认的传统假设检验( 又 称显著性检验) 在临床试验中用于判断药物的疗效是不合理的,它不能准确区分 两种药效差异的方向性和体现差异大小所揭示的临床实际意义,因此,国际上根 据研究目的的不同,普遍用非劣性假设检验n 7 1 。 在许多研究领域,尤其是在医学的科学研究领域上,对新药或新的医疗方法 临床试验研究中,常常涉及到非劣性的检验问题,非劣性检验目的是显示试验药 或试验医疗方法的治疗效果在临床上不劣于对照药或医疗方法,例如,在诊断肝 癌的时候,我们想证明m r i ( 核磁共振) 比超声波有更高的灵敏度与特异度,另一 方面,我们也希望证明更省钱或者对人体伤害更小的技术非劣于或者是等效于标 准诊断技术;又例如,在给定的可容忍的水平下,我们想通过两个指标( 预测骨 折的灵敏度和特异度) 说明价格低廉,伤害更小的o u s ( 定量超声波) 技术不比 d x a ( 茹x - 光吸收测量) 技术差。 非劣性试验指主要研究目的是显示对试验药的反应,在临床意义上不差于 ( 非劣于) 对照药的试验。设a 药为待确证疗效的试验药,b 药为对照药,下同。非 劣效试验的假设检验如下n 8 1 : 无效假设h o :a 药疗效一b 药疗效妄一瓯, 备择假设日l :a 药疗效一b 药疗效 一氏 结论:如p 0 0 5 ,按单侧口= 0 0 5 的检验水准不能拒绝0 ,假设,即无法判 断a 药不差于b 药:如p 墨o 0 5 ,则接受h 1 假设,可认为a 药不差于b 药。 。 。 下 根据非劣试验的统计学原理,治疗差异( a 药疗效- b 药疗效) 0 ,则试验药的 疗效较好:治疗差异 一氏,则试验药非劣 于对照药,此处的一瓯表示临床意义上判断疗效不差、所允许的最大差异值,即非 一 。 7 , , - - r 一 一 k 劣试验的判断界值。 瓯是一个具有临床意义的值,该值的选定至关重要,若瓯选大了,将把药 效达不到要求的药物判断为非劣或等效而推向市场;若瓯选小了,则可能会埋没 一些本可推广使用的药物。在实际中,界值( 瓯) 的确定是一个比较棘手的问题, 国际上至今对于界值的选择都还没有一个明确的规定,虽然i c h 等或多或少的对 界值确定问题进行过讨论,如i c h :e 9 ( s t a t i s t i c a lp r i n c i p l e sf o rc l i n i c a lt r i a l s ) 、 i c h :e i o ( c h o i c eo fc o n t r o lg r o u pi nc l i n i c a lt r i a l s ) 、c h m p :p o i n t st oc o n s i d e r o ns w i t c h i n gb e t w e e ns u p e r i o r i t ya n dn o n 2 i n 2f e r i o r i t y 、g u i d e l i n eo nt h ec h o i c eo f t h en o n 2 i n f e r i o r i 2t ym a r g i n ,以及美国f d a 也一直关注此事,但都只是比较模糊 的界定。i c he 9 指南建议非劣效界值是一个临床上可以接受的最大差值并且应该 小于阳性对照药物在历史安慰剂对照的优效性试验中所观察到的疗效差值n 们 3 1 2 基于非劣检验的s c o r e 检验 假定,新药与对照药的疗效分别服从正态分布( 心,彳) 、( 心,z ) ,为了 判定新药的疗效不差于对照药的疗效,我们提出的假设检验如下: 非劣检验:o :h - z 2 墨一氏1 :地一心 一氐,其中氐 0 在q o :以一心s 一氏的成立的条件下,s c o r e 检验统计量为: u - s ( 一氐,届:,砰,z ) 少( 一瓯,届:,彳,彰) - ( x 一一歹+ 氐) 砰n 。+ 彰n : 因为似然方程组( 边界条件:n l z 2 一氐成立的情况) : f a l n l a 弘:- 薹“一,l :+ 氐) 。? + ( y ,- # 2 + 6 0 ) 彰一。 a l n 驯a ( o - z ) - - n , ( 2 咖荛纯- - 1 2 + 6 0 ) 2 ( 卅) i o 卜a - - n :( 2 咖荛” 啪2 ( 叫 ,一 f 届:一j + - 0 7 6 0 j ) 彳一2 + f 2 l 彰- 路+ ( 1 一f ) 2 $ 一- - +。 -一 ,) 一 这里砰= 瓴一1 ) _ ,l l g ,2 - - ( n 2 1 ) 1 1 2 岛,$ 一( j 一矿+ 氏) 2 ,f 为下面 三元一次方程在区间( 0 1 ) 中使对数似然函数l n l 达到最大的实数解: 蹯“+ 咒2 y 3 一s , 7 ( 砜+ 刀2 y 2 + ( ,1 1 s 三2 + 刀2 s 2 + 啦y 一靠2 墨2 一o 再令s ( 一氏,:,彳,o ;) - a t l a ( 一氏) 一“+ 如一心) ,于是 j ( 一6 0 ,届:,6 孑,厅;) - 以,( j j f i :+ 6 。) 6 ; 一( j y 一+ 6 。) 砰一( j 一矿+ 6 0 ) ( 曰,l l + 口- :2i n :) 其渐近方差估计为v ( 一6 。,成,砰,迸) 1 ( a e ,l l + 谚以:) ,故s c o r e 检验统计 量为 u 。草垒丝鱼垒。毒坠坠 少( 一氐,应,研,彰)茸,l l + 仃- :2 n : 在h 1 0 ( 边际条件:地一:- 一氐) 成立的条件下,当刀,万:较大时,u 近似 服从标准正态分布。因此当u 毒气一口( 这里缸口表示标准正态分布的1 一口分位数) 时,在显著性水平1 一口下我们就有充分理由拒绝原假设只o ,从而接受备择假设 h 1 。,即可以认为a 药非劣于( 不差于) b 药。若u 一瓯其中o 0 ,且6 。 6 ,。并假定检验统计量j 一矿的最佳否定域为 因为鞍粤譬昏0 2 1 t t i m l i ,r a 。( x 一再釉2 目( - 比2 + 6 0 ) 2 - 0 , 于是l i ml i r ai - 2 ( j y 一+ 6 0 ) 2 - 0 ,( f 2 ( 0 ,1 ) ) “ m _ , ”l i m l i m 。厅2 ; l i m 。心l i m 。( $ 1 t m + f 2 卜 t i m l i 到r a 等簧+ f 2 一歹+ 氏) 2 卜砰帆 呻,1 2 - 1 一w “2 ,l l :当n l , n 2 较大时,在h 。或h 。边界条件成立的情况下,了黜或 垒! 鱼l 近似服从标准正态分布( o ,1 ) 。 茸,l l + d - 2 2 n 2 f 尺拣迭a i h 户口 l 烈j 黜墨至。_ ,1 ) = 卢 ,。曹 即仁煮x - y + ( 5 0 二煮i 随h l o ,) i 一 一 , 我们得到: 从而解得: ( 3 - 1 ) 竺羔尚。吐删 2 ) ” z l 。- z 一 因为有砰_ 彳0 s ) 及吒- 2 za s ) 。 我们令群= 砰,彰一斫,并取口- 0 0 5 ,卢= 0 2 ,得s c o r e 检验的样本容量近 似斌州2 4 8 6 5 ) 2 器。 ( 3 _ 3 ) 3 2 2 随机模拟及分析 从公式( 3 2 ) ,。可以看到,决定样本容量估计厅值与值的参数有眠卢、 彳、谚、氐及瓯,为了探讨并验证非劣检验样本容量的计算公式( 3 2 ) 或( 3 3 ) , 我们不采取公式逆推的方法,而是通过计算机模拟试验的方法,使用该公式计算 出的样本量估计实际的第一类错误及检验功效,以验证公式( 3 - 2 ) 或公式( 3 3 ) 的正确,在参数的选择上,若我们参考2 2 ,令总方差和a 一彳t + z 厶:与总体 方差之比k ;彳嘎2 的不同组合情况下的第一类错误和检验功效。其中 a 一0 1 , 0 2 , 0 3 ,k ;0 1 , 0 9 , 1 0 , 1 1 , 1 6 , 2 1 , 3 1 , 4 1 。因为a 取值与,有关,且在 没包括氐及反的情况,已经有3 8 ;2 4 种情况,结果的讨论会太繁琐,因此我们 选取以下参数: tp 口2 0 0 5 ,卢t0 2 ,+ 一1 , 2 , 4 ,一k n 1 ,3 0 ,乓_ 反一0 2 ,0 5 ; p 在给定的参数下,按照我们的公式计算出样本容量,然后进行随机模拟,研 究此样本容量下我们检验方法的第一类错误和检验功效。模拟次数为1 0 0 0 0 0 次, 随机试验的结果见表3 : 1 3 纛 表3 非劣检验估计的样本量与对应的第一类错误及检验功效 样本容量估计值否定域边界值第一类错误检验功效 氐一盈砰+ 露 彳口; 万 g o 口 1 一p 0 2 1 0 11 5 5m 8 6 7 7 5 0 7 7 9 9 3 0 2111 5 50 8 6 7 75 0 9 7 9 9 3 0 2131 5 5- 0 8 6 7 74 9 5 8 0 0 5 0 220 13 0 9- 0 8 6 7 75 0 4 7 9 9 6 0 221 3 0 9 - 0 8 6 7 74 9 6 8 0 0 4 0 2233 0 9- 0 8 6 7 75 0 2 8 0 2 0 o 240 16 1 8- 0 8 6 7 74 9 9 7 9 9 9 0 2416 1 8- 0 8 6 7 74 9 0 7 9 9 8 0 2436 1 8- 0 8 6 7 75 0 3 7 9 9 1 0 5 1 0 1 2 5 - 0 6 6 9 24 9 0 8 0 5 0 0 5112 5- 0 6 6 9 25 0 1 8 0 1 0 0 5132 5- 0 6 6 9 25 0 9 8 0 1 7 0 520 14 90 6 6 9 25 0 6 8 0 0 1 0 52 1 4 90 6 6 9 25 1 1 8 0 1 3 0 5234 90 6 6 9 24 9 5 7 9 9 6 0 54o 19 9- 0 6 6 9 24 9 3 8 0 2 3 0 5419 90 6 6 9 24 9 1 7 9 9 2 0 5439 9- 0 6 6 9 25 0 1 7 9 9 5 从表3 的试验结果可以看到模拟出的第一类错误与检验功效全部与最初代入 公式计算时设定的第一类错误( 口;0 0 5 ) 与功效( 1 一声一0 8 ) 是一致的,这也 就验证了公式( 3 - 2 ) 及公式( 3 - 3 ) 的正确性。 以上我们只是对t 时样本容量的确定进行了相应的分析,关于两总体的 样本量不同乒时样本容量的确定尚有许多问题可以讨论,比如:当n l n :时, 方程组( 3 - 1 ) 可能没有唯一解。即当两总体样本量不同时,相应的必要样本量 的确定,是一个值得讨论的问题。 一、j 。:乞一 一 r 一 1 4 第四章总结及讨论 本文以有名的b e h r e n s f i s h e r 问题为研究对象,第l 章介绍并探讨了 b e h r e n s f i s h e r 问题已有解决方法的优缺点。第2 章引入新的解决方法一 b e h r e n s f i s h e r 问题的正态逼近方法,并利用严格的数学理论推导出s c o r e 检验 统计量u ,然后利用计算机做随机模拟实验,在小样本的情况下,做w e l c h 近似 f 检验和s c o r e 检验的第一类错误和检验功效的比较。模拟结果显示:在所有的 研究情况下,这种新方法都能很好地控制第一类错误,检验功效也不差;而最常 用的w e l c h 近似t 检验在样本量不等时大多数情况都不能控制第一类错误。 第3 章是本文的研究重点,在医学的科学研究领域上,对新药或新的医疗方 法临床试验研究中,常常涉及到非劣性的检验问题,本章研究的主要内容是s c o r e 检验统计量u 在非劣性检验方面的应用,此外,在做假设检验的研究时,样本容 量大小的确定或如何抽取样本是一个非常重要的问题,本文在给定参数条件下, 推导出当两总体样本量一致时s c o r e 检验统计量u 的必要样本容量运算公式,这 个结论( 公式) 对于非劣检验设计十分重要,使抽样估计建立在科学的基础之上, 即能确保估计的精确,又能避免人力物力的浪费。 1 5 参考文献 【1 】b vb e h r e n s e t ab e i t r a g z n rf e l d e r b e r e c h n u n gb e i w e n i g eb e o b a c h t u n g e n j 1 l a n d w i r t c h j b , 1 9 2 9 ( 6 ) :8 0 7 - 8 3 7 1 2 r a f i s h e r t h ef i d u c i a la r g u m e n ti ns t a t i s t i c a li n f e r e n c e 川t h ea n n a l so fe u g e n i c s , 1 9 3 5 ( e i ) :1 4 1 - 1 7 2 【3 】e li - i s u s t a t i s t i c a lr e s e a r c hm e m o i r s d e p a r t m e n to fs t a t i s t i c s , u n i v e r s i t yc o l l e g el o n d o n ,1 9 3 8 【4 】b lw e l c h t h es p e c i f i c a t i o no fm l e sf o rr e j e c t i n gt o ov a r i a b l eap r o d u c t , w i t hp a r t i c u l a rr e f e r e n c et oa l l e l e c t r i cl a m pp r o b l e m 1 1 j r s t a t i s t s o c s u p p l ,1 9 3 6 ( 3 ) :2 9 - 4 8 【5 】b lw e l c h t h es i g n i f i c a n c eo ft h ed i f f e r e n c eb e t w e e nm e a l 耻;w h e nt h ep o p u h t i o nv a r i a n c e sa r eu n e q u a l 阴 b i o m e t r i l m , 1 9 3 8 ( 3 4 ) :3 5 0 3 6 2 【6 jy yw a n g p r o b a b i l i t i e so ft h et y p eic 玎。幅o fw e l c h t e s t sf o rt h eb e h r e n s f i s h e rp r o b l e m 仞j a m s t a t i s t a s s o c , 1 9 7 1 ( 3 ) :6 0 5 - 6 0 8 1 7 b lw e l c h t h eg e n e r a l i z a t i o no fs t u d e n t sp r o b l e mw h e ns e v e r a lp o p u l a t i o n sa l ei n v o l v e d 田b i o m e t r i k a , 1 9 4 7 ( 1 2 ) :2 , 8 - 3 5 f 8 1 8b lw e l c h a p p e n d i xt om r s a s p i n st a b l e s b i o m e t r i k a , 1 9 4 9 ( 3 4 ) :2 9 3 2 9 6 【9 】a aa s p i n a ne x a m i n a t i o na n df u r t h e rd e v e l o p m e n to faf o r m u l aa r i s i n gi nt h ep r o b l e mo fc o m p a r i n gt w o m e a nv a l u e s 【j 1 b i o m e t r i k a , 1 9 4 8 ( 1 2 ) :8 8 - 9 6 【1 0 a aa s p i n t a b l e sf o ru i nc o m p a r i s o n sw h o s ea c c u r a c yi n v o l v e st w ov a r i a a c e s , s e p a r a t e l ye s t i m a t e d ( w i t h a p p e n d i xb yb lw e l c h ) 川b i o m e t r i k a , 1 9 4 9 0 4 ) :2 9 0 - 2 9 6 【1 1 】hs c h e f f e p r a c t i c a ls o l u t i o n so ft h eb e h r e n s f i s h e rp r o b l e m j a m s t a t i s t a s s o c ,1 9 7 0 ( 1 2 ) :1 5 0 1 1 5 0 8 【1 2 】d jb e s t j c wr a y n e r w e l c h sa p p r o x i m a t es o l u t i o nf o rt h eb e h r e n s - f i s h e rp r o b l e m 阴t e c h n o m e t r i c s , 1 9 8 7 ( 2 ) :2 0 5 - 2 1 0 f 1 3 1km o s e r b rs t e v e n s g h o m o g e n i t yo fv a r i a n c ei nt h et w o - s a m p l em e a n st e s t 【j 1 a m s t a t i s t i c i a n , 1 9 9 2 ( 1 ) :1 9 - 2 1 【1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 儿童消防体验活动方案
- 儿童活动烤面包活动方案
- 儿童牙科保护活动方案
- 儿童礼服活动方案
- 儿童线上美育活动方案
- 儿童节读书活动方案
- 儿童野趣活动方案
- 儿童馆冬季活动方案
- 元宵地产活动方案
- 元宵活动团建策划方案
- XB/T 505-2011汽油车排气净化催化剂载体
- GB/T 3672.2-2002橡胶制品的公差第2部分:几何公差
- GB/T 27744-2021异步起动永磁同步电动机技术条件及能效分级(机座号80~355)
- GB 8076-2008混凝土外加剂
- 宝盾转门故障代码
- 【课件】草原上的小木屋
- DB63-T 241-2021草地毒害草综合治理技术规范
- 高层建筑施工基坑工程勘察及支护结构选型培训
- 四年级上册音乐课件-活动 欢腾的那达慕 人教版(简谱) (共17张PPT)
- 四年级下册综合实践活动教案-我的时间我做主 全国通用
- 3~6岁儿童早期运动游戏干预课程设计研究-基于SKIP的研究证据
评论
0/150
提交评论