




已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
j j t 毫, 0 i 。 l i 独创性声明 舢删f i i f i i f f f f f f f | f j f f f 删 y 18 0 5 7 9 6 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果据我所知,除了 文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得 东北师范大学或其他教育机构的学位或证书而使用过的材料与我一同工作的同志对本研究所做的任何贡 献均已在论文中作了明确的说明并表示谢意 学位论文作者签名雄趣遣 日期: 学位论文版权使用授权书 本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东北师范大学有权保留 并向国家有关部门或机构送交学位论文的复印件和磁盘,允许论文被查阅和借阅本人授权东北师范大学 可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其它复制手段保存、 汇编学位论文 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名: 日期: 学位论文作者毕业后去向: 工作单位: 通讯地址: 指导教师签名: 日期:纠! ! 垒 电话: 邮编: 笠 l , 摘要 在因析设计最优准则的研究中,m a 准则和m e c 准则阐述了它们所具有的一种模型稳健 性。这种模型稳健性指的是:这两个准则确定最优设计m a 设计和m e c 设计能照顾到最多的 模型。即包含因子的主效应和部分二阶交互效应的模型。这是建立在试验者对试验因子的重要 性没有任何先验的基础之上的,同时把含有很多效应的模型和含有少量效应的模型视为同等 重要。但是,在实际中,在大多数情形,试验者都具有这方面的先验信息,丽且绝大多数实际 模型含有的效应只是少数。这就是试验设计中的效应稀疏原则所以,由m a 、m e c 准则所 具有的原来这种模型稳健性并不适合大多数的实际情形。 最近,由z h a n g l i z h a oa n da i ( 2 0 0 8 ) 提出了一种新的最优设计准则一一g m c 准则。随 后,有工作对二水平情况完整、漂亮的构造了因子个数从百n + 1 到一1 的全部g m c 设计。 其中n 为试验次数。本文提出一种建立在效应稀疏原则下的模型稳健性,给出了这种稳健性 的描述,并就这种模型稳健性对m a 设计和g m c 设计进行了一些理论上的比较。同时,给出 了一些例子,得到结论在这个新的模型稳健性下,g m c 设计优于m a 设计。 关键词:效应稀疏原则;m a 准则;g m c 准则;m e c 准则; f e we f f e c t s t h et w oc r i t e r i aa n dt h er o b u s t n e s sa r eb a s e do nh a v i n gn oa n yp r i o ro ff a c t o r s i ne x p e r i m e n t s ,i e ae x p e r i m e n t e rd o e sn o th a v ea n yp r i o ra b o u tt h ei m p o r t a n c eo r d e r i n go f t h ef a c t o r si nh i s h e re x p e r i m e n t s h o w e v e r ,i np r a c t i c eu s u a l l ya n ye x p e r i m e n t e rh a ss o m e i n f o r m a t i o no nt h i s a l s o ,a c c o r d i n gt ot h ep r i n c i p l eo ft h ee f f e c t s p a r s i t y , w h i c hi sac o n l m o n o n er e c o g n i z e db 、p e o p l e am o d e lt h a tc o n t a i n sl e s se f f e c t si sm u c hm o r ei m p o r t a n ta nm o r c l i k e l ya p p e a r i n gt h a nt h eo n cw h i c hc o n t a i n sal a r g en u m b e ro fe f f e c t s t h e r e f o r e 。t h em o d e l r o b u s t n e s st h em a ,m e cc r i t e r i ah a v ei sn o ts u i t a b l ef o rt h em o s to fp r a c t k :a 1s i t u a t i o n s r e c e n t l y , z h a n g ,l i ,z h a oa n da i ( 2 0 0 8 ) p r o p o s e dan e wc r i t e r i o nf o rc h o o s i n go d l i m a l d e s i g n s ,c a l l e dg e n e r a lm i n i m u ml o w e ro r d e rc o n f o u n d i n gc r i t e r i o n l a t e ro n 。a l lt h cg m c 2 ”一”d e s i g n sw i t h 了n + l 扎n 一1h a v eb e e no b t a i n e d ,w h e r eni st h er u nn u m b e ro f at w o - l e v e ld e s i g n i nt h ep a p e r ? w ep r o p o s ean e wm o d e lr o b u s t n e s sw h i c hi s b a s e do nt h e p r i n c i p l eo fe f t o c ts p a r s i t y w eg i v eab a s i cs t a t e m e n to ft h i sn e wm o d e lr o b u s t n c s sa n dm a k e ac o m p a r i s o no fg m c d e s i g n sa n dm ad e s i g n o nt h i sn e wm o d e lr o b u s t n e s s ,i n c l u d i n gs o i n c t h e o r e t i cr e s u l t sa n ds o m ee x a m p l e s w ec o n c l u d et h a tu n d e rt h i sr o b u s t n e s st h eg m c d e s i g n s a r cb e t t e rt h a nt h em a d e s i g n s k e y w o r d s :e f f e c ts p a r s i t yp r i n c i p l e ;m ac r i t e r i a ;g m cc r i t e r i a ;m e cc r i t e r i a i i , 0 r 目录 中文摘要一 英文摘要 目录 1 引言 5 2 预备知识 3 在效应稀疏原则下的模型稳健性 4 在效应稀疏原则下的模型稳健性下比较m a 设计和g m c 设计 晒两个具体例子 6 总结 参考文献 致谢 i i i u m 1 3 6 加 掩 盟 弱 丝 东北师范大学硕士学位论文 1 引言 试验设计和分析是数理统计学中最重要的分支之一,试验设计的一个最主要的工作就是 有限的条件下寻找一个好的设计,二水平的部分因析设计是应用最广泛的一种设计因而很 统计学家都对寻找最优二水平的部分因析设计的投入了大量的人力、物力,从而产生了很多 则。 1 、由b o xa n dh u n t e r ( 1 9 6 1 ) 提出了m r ( m a x i m u mr e s o l u t i o n ) 准则,最大分辨度准则。 分辨度越大的设计越好 2 、由f r i e sa n dh u n t e r ( 1 9 8 0 ) 提出了m a ( m i n i m u ma b e r r a t i o n ) 准则,最小低价混杂准 则这是应用最广的一条准则,是根据字长型定义的。 3 、由w ua n dc h c n ( 1 9 9 2 ) 首先提出的c e ( c l e a re f f e c t s ) 准则,纯净效应准则这是作为 设计选择的一个附加准则提出的 4 、由s u n ( 1 9 9 3 ) 提出的m e c ( m a x i m u me s t i m a t i o nc a p a c i t ) ,) 准则,最大估计容量准刚。 是要估计出所有的主效应和部分二阶效应的模型个数,忽略不在模型中的二阶效应和高阶效 应 其中m a 设计是应用最广的一种准则,迄今为止,已经被接受了三十年了。因而有很多关 于m a 的文章被发表,如c h e n ga n dm u k e r j e c ( 1 9 9 8 ) ,b u h e r ( 2 0 0 3 ) 等等。但是m a 设计还 是存在着一些问题。如在有些情况下通过m a 准则找到的设计并不是最小低阶混杂的设计而 且随着各种准则的陆续产生,找到最优设计的方法越来越多,但是有时在相同的想法下,根据 m a 准则找到的设计与根据其它准则所找到的设计与却有很大的差异。为了解决这些问题, 因而z h a n g ,l i z h a oa n da i ( 2 0 0 8 ) 提出了g m c ( g e n e r a lm i m i m u ml o w e r - o r d e rc o n f o u n d i n g ) 准则,通用最小低价混杂准则随后,c h c n ga n dz h a n g ( 2 0 1 0 ) ,z h a n ga n dc h e n g ( 2 0 1 0 ) , l i z h a oa n dz h a n g ( 2 0 0 9 ) 构造了因子个数从孚+ 1 到一l 的全部g m c 设计其中n 为试 验次数。该准则能解释上面几个准则之间的联系,并能回答为什么在同样的想法下根据不同的 准则能找到不同的设计。进而找到了二水平部分因的析最优设计 对于一个好的设计一般都会有一个好模型的稳健性,而以前的模型稳健性是能照顾到的 最多的模型,通过比较含有相同个二阶效应的模型个数来比较哪个设计模型的稳健性更好,在 这种方法当中,所有含有相同个数二阶效应的模型的重要性都是相同的,没有任何的先验条件 的。但是在实际当中,含有相同个数二阶效应的模型的重要性都是不同的。如含有全是纯净的 东北师范大学硕士学位论文 二阶效应的模型和含有被混杂的二阶效应的模型的重要性是不同的。而对于试验者来说,每 设计一个试验,都有其主观判断,根据实际经验来区分因子的重要性,知道重要的因子只有少 数几个,因而对于含有重要因子的模型和未含有重要因子的模型的重要性是不同的。故在实际 当中的大多数情况下,每设计一个试验都是有其先验性的。因而这样的模型稳健性存在着一些 不足 本文的模型稳健性是以效应稀疏原则,集中于“重要的少数”,而不是“不重要的多数” 为前提条件下考虑的加上这样的前提,就能充分考虑到了以前模型稳健性所未考虑到的一些 不足,更符合一般的实际情况。 g m c 准则在1 6 r u n 和3 2 r u n 的时候找到的设计与m a 准则找到的设计差异并不是很大, 但是当大于3 2 r u n 的时候所找到的设计差异就很大了。因而我们从效应稀疏原则下的模型稳 健| 生下比较m a 设计和g m c 设计看看在效应稀疏原则下的模型稳健性,哪个设计模型的 稳健性更好 第二部份介绍试验设计的预备知识,第三部分在效应稀疏原则下的模型稳健性,第四部分 在效应稀疏原则下的模型稳健性下比较m a 设计和g m c 设计,第五部分是两个具体例子, 第六部分总结。 2 东北师范大学硕士学位论文 2 预备知识 首先,我们回颐一些w ua r i dh a m a d a 著,张润楚等译,试验设计与分析及参数优化 和m u k c r j e ca n dw u ( 2 0 0 6 ) 中的一些原则,定义和准则 在试验设计中有三个重要的原则:效应排序原则,效应稀疏原则以及效应遗传原则本文 用到了前两个原则。 效应排序原则( e f f e c th i e r a r c h yp r i n c i p l e ) ( i ) 低级效应比高阶效应更重要 ( i i ) 同阶效应的重要性是相同的。 根据这一原则,在资源短缺,时间有限无法做大量试验的情况下,可以忽略高阶效应,从 而达到节省人力、物力的目的,其正确性也在实际的试验中得到证实。 效应稀疏原则( e f f e c t , s p a r s i t yp r i n c i p l e ) 它集中于“重要的少数”而不是“不重要的多数”。 对于任何一个试验,都有先验性,能够判断出一些重要的效应和一些不重要的效应。所以 要关注的模型应该是那些含有重要效应的少数模型而不是那些含有不重要效应的多数模型 由f r i e sa n dh u n t e r ( 1 9 8 0 ) 根据字长型定义提出了m a ( m i n i m u ma b e r r a t i o n ) 准则,最小 低价混杂准则 等式i = 1 2 3 4 5 称为设计定义关系;定义关系中的定义字中字母的个数称为字长;由p 个 定义字构成的群称为定义对照子群。 对于一个2 n - - p 设计,用a i 表示定义对照子群中字长为i 的字的个数,向量 w 7 = ( a 1 ,a 2 ,a 3 :a 4 4 ) 称为设计的字长型( w o r d l e n g t hp a t t e r n ) m a 准则:对于给定n 和p 的任意两个2 r - - p 设计d ,和d 2 ,根据定义子群g 中字长的 个数,得到其字长型 d i :( d 1 ) = ( a 1 ( d 1 ) ,。4 2 ( d 1 ) :a 3 ( d 1 ) 。a 4 ( d 1 ) a k ( d 1 ) ) d 2 :w j ( d 2 ) = ( a 1 ( d 2 ) ,a 2 ( d 2 ) ,a 3 ( d 2 ) ,a 4 ( d 2 ) a b f d 2 ) ) 如果a 】( d 1 ) = a 1 ( d 2 ) ,a 2 ( d i ) = a 2 ( d 2 ) a ( d 1 ) = a i ( d 2 ) ,a f + l ( d 】) a + 1 ( d 2 ) ,即i + 1 是使得a ( d 1 ) a ,( d 2 ) 的最小整数。若a i + 1 ( d 1 ) b ( d 2 ) ,则称在m e c 准则 下,设计d 1 优于设计如 若在m e c 准则下,没有其他的设计比设计d 。更优,则称设计d 1 是m e c 设计 z h a n g l i ? z h a oa n da i ( 2 0 0 8 ) 对定义子群的进一步探讨,得出了一个新的准则,即通用最 小低阶混杂准则( g m c 准则j 。 有向量 勤= ( 列m 蜊弼幻) 其中磐;2 表示恰好被k 个j 阶效应混杂的i 阶效应的个数。 ,j = 0 ,l ,佗, k = 0 ,l ,玛:= ( ? ) 根据效应排序原则,低阶效应比高阶效应更重要,即低阶效应被高阶效应混杂的情况越小 越好。因此,可以根据下面的规则把黟;作进一步的排序,得到一个新的向量 排序规则: ( i ) 如果m a x ( i ,j ) m a x ( s ,t ) ,那么弦,放在鹩前面。 ( i i ) 如果m a x ( i ,j ) = r f l a x ( 8 :t ) 且i s ,那么黟f 放在窖q 前面 ( i i i ) 如果m a x ( i :j ) = m a x ( s ,) ,i = s 且j 蚂( d 2 ) ,则称在g m c 准则下,设计d l 优于设计d 2 。 4 东北师范大学硕士学位论文 若在g m c 准则下,没有其他的设计比设计d 1 更优,则称设计d 1 是g m c 设计。 换句话说,g m c 设计就是把向量襻c 中的各个元素依次最大化后所得到的设计 由c h c n ga n ds u n ( 1 9 9 9 ) 提出的m a 准则与m e c 准则之间的关系: 2 n - p 设计是一个二水平,有1 2 个因子,p 个定义字的设计,含有2 ”- - p 一1 个效应p 个 定义字可以生成含有2 p 一1 个效应的定义子群。 除去定义子群中的2 p 一1 个效应还剩下2 ”一2 p 个效应,被分成了g = 2 n - p 一1 组,每组 分别用尬五如,表示其中f - - g - n 组是不包含主效应的别名集,用m “a 如,且乃表 示;1 1 组是包含主效应的别名集,用m i + l ,坞表示 m ,i 表示中二阶效应的个数。 则有: e ( d ! ) :2 ,鳅 。瞄t 耽肛) r sf ; l 0 其他情形 由z h a n g ,l i ? z h a oa n da i ( 2 0 0 8 ) 提出的g m c 准则与m e c 准则之间的关系: 把a z l :坞,屿中,含有相同二阶效应个数的各组归为一类,共计1 类。2 = m i n n l 。2 p 其中表示导的整数部分每类分别用g ,g ,g i 表示。 g 表示不含主效应,但是含有i + 1 个二阶效应的别名集。 含有i + 1 个二阶效应的别名集共有捌2 l ( i + 1 ) 含有一个主效应,i + 1 个二阶效应的别名集有警醍冲 有j g = 蜒曲( i + 1 ) 一荆功 则有: 5 r f ; 其他情形 卜 + 以= 一 g ;: 兀脚 甜 一 一 扣 l 伯0 一 ,卜k = 卜 似 = 已 ,g 一 n 一 o 中其 东北师范大学硕士学位论文 5 3 在效应稀疏原则下的模型稳健性 由效应排序原则,我们知道最好的设计是尽可能多的估计出低阶效应,即主效应和二阶效 应最为重要。而最大估计容量准则( m e c 准则) 的思想就是估计出所有的主效应和尽可能多 的二阶效应的模型个数,忽略不在模型中的其他二阶效应,故在以往的研究中模型稳健性的概 念以m e c 准则为量化 在实际中,不论是做试验,还是做什么事,都是有其目的性不可能无缘无故的去做,也 不可能在什么前提都不了解的情况下去做。这是客观事实故每个试验者在做实验之前都会有 一个预期的结果,并且对试验中的每个效应都有一定的了解。区分不同效应对试验结果影响程 度,判断出哪些效应有潜在的重要性( 重要效应只有少数几个) ,哪些效应是不重要的可以忽 略不计。根据每个效应的煎要性不同,知道含有相同个数的同阶效应的模型重要性是不同的。 试验设计是统计学的重要分支之一,而统计学是要从实际生活中得到信息,收集数据,要 经得住实际的检验。因此,在设计一个试验时一般都是从实际出发,从实际中得到检验 m e c 准则是根据所有的含有相同个二阶效应模型的重要性均相同的原则而制定的,因此 它只考虑了模型的个数,并没有考虑到模型的质量。如一个因子的主效应与一个二因子交互作 用混杂,m e c 准则是要估计出所有的主效应,因而含有这个二水平交互作用的模型就被忽略 了,但是在实际中,这个二水平交互作用很有可能是有潜在重要性的因此,含有这个二水平 交互作用的模型是很重要的故m e c 准则考虑到的模型有时与实际不符;一个纯净的二因子 交互作用和某三个二因子交互作用混杂的二水平交互作用,在m e c 准则下,含有这两个二水 平交互作用的模型的重要性是没有分别的,但是在实际生活中它们的差距是很大的因此,单 纯的根据含有相同个二阶效应的模型个数来判断设计的好坏,与实际不符因为有很多的模型 未含有那些有潜在重要性的效应,这样的模型是没有实际意义的,考虑它们只是浪费时间和金 钱。 我们要考虑一个新的稳健性一一效应稀疏原则下的模型稳健性根据效应稀疏原则:它集 中于“重要的少数”而不是“不重要的多数”而制定。加上效应稀疏原则这样的前提,考虑到 的模型既满足效应排序原则:低阶效应比高阶效应更重要,同阶效应的模型重要性是相同的; 又满足了含有相同个同阶效应模型的重要性是不同的因此,这样的模型稳健性更符合实际的 一般情况 对于分辨度月1 ,? 的任意一个2 ”m 设计,其主效应都是纯净的,故我们只考虑二因子 交互作用即可二因子交互作用还包括纯净的和非纯净的两种情况,而由先验知道的有潜在重 要性的二因子交互作用就应该纯净的估计它们。因此对于一个模型中的二因子交互作用可分成 三类:有潜在重要性的二因子交互作用;纯净的二因子交互作用;混杂的二因子交互作用故 6 东北师范大学硕士学位论文 模型中的二因子交互作用的重要性也不同 因此,我们可以把设计中的模型分成三类: ( i ) 模型中含有m 个重要的二阶交互作用,且其它的二因子交互效应全是纯净的; ( i i ) 模型中含有i 1 1 个重要的二阶交互作用,且含有不纯净的二因子交互作用; ( i i i ) 模型中不含有m 个重要的二因子交互作用。 其中i n 个重要的二阶交互作用表示为:m 个纯净的二阶交互效应且由先验性知有m 个 二阶效应有潜在的重要性 经过比较,发现( i ) 中的模型最为重要,( i i ) 中的模型其次重要,且含有不纯净的二因子 交互作用混杂程度小的模型要比含有混杂程度大的二因子交互作用的模型更重要,( i i i ) 中的 模型是最不重要的,因为它们没有有潜在重要性二因子交互作用因此,在实际中是可以忽略 不计的 如此分类,充分的体现了:它集中于“重要的少数”而不是“不重要的多数”;同阶效应的 重要性相同 因此把效应稀疏原则下的模型稳健性加以量化,就是以下三步: ( a ) ( i ) 类中的模型个数越多,其设计就越好; ( b ) ( i i ) 类中的模型个数越多越好,或者是( i i ) 类中的含有二阶效应混杂程度越小的模型 越多,其设计就越好; ( c ) ( i i i ) 类中的模型个数越多,其设计越不好。 “ 在效应稀疏原则下的模型稳健性下比较两个设计,三步依次比较,例:如果( a ) 就可以比 较出来,则后两步就无需再比 根据下面定理得到在各类中含有的r 个二阶效应的模型个数只,( d ) ,i = 1 ,2 ,3 定理3 h 当| c o l m 时 ( i ) 删2 竺二,; ( i i ) 10r m : 刚忙c ok + + 驻一m 扑c i i 叭广;c 州o l 叶+ ,肇旦l - 1 ( 瓢广 i + + ( 一+ ,三一吲鱼( 删广。 m m 时,首先i t l 个二 姐效应已经在模型中了,因此,要从剩余的里取因此的第( i ) 的模型个数为l ,( d ) : 州= 懈竺二,; 模型中含有m 个有潜在重要性的二水平交互作用,这些交互作用应该是纯净的,丽模型 中含有不是纯净的二水平交互作用 故当7 m 时;尼,( d ) = 0 当m r ,时;根据有r 个二因子交互作用的模型个数为: p f 。夏l 理- 1 ( 1 瓢i + 1 ) “r f : 耳( d ) : ,。+ 三一。:,娶( 1 暑) ( i + 1 ) “ r : 1 0 其他情形 其中0 nsl c i l ,f = 2 ”- - p 一1 一礼 故( i i ) ,( i i i ) 得证 例1 :设计一个试验,含有七个因子,分男i 是a ,b ,c ,d ,e ,f ,g ,由先验 知二因子交互作用a b 有潜在的重要性。 找到两个2 7 _ 2 设计d l 和如,七个因子分别用1 ,2 ,3 ,4 ,5 ,6 ,7 ,表示。 d l :i = 4 5 6 7 = 1 2 3 4 6 = 1 2 3 5 7d 2 :i = 1 2 3 6 = 1 4 5 7 = 2 3 4 5 6 7 只要是纯净的二阶交互作用,就可以把二阶交互作用a b 安排在该列上。如发现二阶交 互作用2 4 是c l e a r ,故可以把二阶交互作用a b 安排在2 4 列上。发现二阶交互作用2 5 是 c l e a r ,故也可以把二阶交互作用a b 安排在2 5 列上。 写出两个设计的字长型: i 矿( d 1 ) = ( 0 ,0 0 ,1 ,2 ,0 ,0 ) ,7 7 ( d 2 ) = ( 0 ,0 ,0 ,2 :0 ,1 ,0 ) g ( ( 2 1 ) l = 1 5| c , o ( d 2 ) l = 9 足,( d 1 ) = 1 5r 。( d 2 ) = 9 f 1 :( d 1 ) = 1 0 5f l 。( d 1 ) = 3 6 8 东北师范大学硕士学位论文 则在效应稀疏原则下的模型稳健性下,d l 设计优于如设计 例2 :设计一个试验,含有九个因子,分别是a ,b ,c ,d ,e ,f ,g ,h , i ,由先验知二因子交互作用a b 有潜在的重要性。 找到两个2 9 叫设计d 3 和d 4 ,九个因子分别用1 ,2 ,3 ,4 ,5 ,6 ,7 ,8 ,9 , 表示。发现二阶交互作用1 9 是c l e a r ,故可以把二阶交互作用a b 安排在1 9 列上等等 d 3 :i :1 2 3 6 = 1 2 4 7 = 1 2 5 8 = 1 3 4 5 9d 4 ;1 = 1 2 3 6 = 2 3 4 7 = 1 3 4 8 = 1 2 4 9 w ( d 3 ) = ( 0 :0 70 。6 ,8 ,0 j0 ,l ,0 ) ,7 ( d 4 ) = ( 0 0 ,0 ,1 4 0 0 0 ,0 ) i c o ( d 3 ) = 8i c o ( d 4 ) i = 8 只,( d 3 ) = 8五,( d 4 ) = 8 只。( d 3 ) = 2 8r 。( d 4 ) = 2 8 最。( d 3 ) = 5 6日。( d 4 ) = 5 6 只? ( d 3 ) = sr ? ( d 4 ) = 8 r 。( d 3 ) = 1,l 。( 也) = 1 ( i ) 两个设计均相同,比较( i i ) 类 易,( d 3 ) = 0f 2 。( d 4 ) = 0 忍:( 以) = 2 2 4局。( d 4 ) = 2 2 4 足。( d 3 ) = 3 6 6 4如。( d 4 ) = 3 4 7 2 则在效应稀疏原则下的模型稳健性下,d 3 设计优于d t 设计。 补充说明: 1 、上述定理是在分辨度为i v 的情况下考虑的,即a 3 = 0 当分辨度为i i i 时,存在 着不是纯净的主效应一般情况下,由于主效应的个数很少,因此考虑包含所有的主效应的模 型。即可通过上述定理来考虑模型的稳健性。但是有时由于实际的特殊原因,如所要考虑的是 并不是包含所有的主效应的模型,则应通过比较含有相同个纯净的主效应的模型个数来判断 模型的稳健性 2 、上述定理是在当| c o | m 的前提下考虑的如果i c :o i m 时,则m l a 。1 个二阶交 互作用应该从 c 。l 中取如果 c i l m 一 q i 时,则m 一| 瓯l 一 c 1 | 个二阶交互作用应该从 i q l 取,依次类推。公式也依次类推 9 东北师范大学硕士学位论文 5 4 在效应稀疏原则下的模型稳健性下比较m a 设计和g m c 设计 我们知道在1 6 r u n 和3 2 r u n 下的m a 设计和g m c 设计的差异并不是很大,而在6 4 r u n 及其以上的设计,二者的差异却很大由h ua n dz h a n g ( 2 0 0 9 ) 提出,m a 设计使( a 3 4 4 ,) 依次最小化,而g m c 设计仅使a 3 最小,a 并不一定最小试验设计的目的是要在有限的条 件下找到一个最好的设计,而m a 设计和g m c 设计都是从不同的角度下找到的最优设计。 从而在效应稀疏原则下的模型稳健性下比较m a 设计和g m c 设计,看看哪个设计具有更好 的模型稳健性,是有其现实意义。 在效应稀疏原则下的模型稳健性下比较m a 设计和g m c 设计: g m c 设计优于m a 设计; 证明:2 , 1 - p m a 设计d 1 ,设2 n - p g m c 设计d 2 ( i )首先在第一种情况下比较的两个设计d ,和d :哪个设计的模型稳健性更优,只需比 较两个设计d ,和d 2 中所含的纯净的二阶效应的个数。 设d l 中含有p 个纯净的二阶效应,d 2 中含有q 个纯净的二阶效应。 m a 设计是在使a 3 最小的同时使a 4 最小。 如果,= 1 2 3 = 3 4 5 = 2 6 7 ,则a 3 = 3 。 对于j = 1 2 3 可以看成是1 与2 3 混杂,2 与1 3 混杂,3 与1 2 混杂,则倾1 ) = 9 。 有 3 a 3 = 鲥a 3 = 矧” 由任意的2 ”p 设计d 圭州d ) = ( 钉2 ) 一3 a 3 ( d ) ( 6 ) 壹州妒:+ 6 a ;( d ) 由( a ) 得 a s c d ,= 丢 ( 至) 一娄仇,c d , 由( b ) 得 剐班蟮喇2 刮 1 0 东北师范大学硕士学位论文 所以有 又由于 从而有 g l = 鲥i 作+ 1 ) 一矧 模型中的二阶效应全是纯净的,因此只能取到g 类,仅含有一个二阶效应的别名集。 g i = 刘叭一鲥1 因此m a 设计就是使:弼1 最小化的同时使i c o l 最小,即使矧o 最小而g m c 设计是 依次最大化( 弼:捌,鲥地) ,即使即2 1 最大 因此不难得出m a 设计中的p 小于等于g m c 中的q 当m a 设计中的p 小于g m c 中的q ,贝l 在效应稀疏原则下的模型稳健性下g m c 设计 优于m a 设计。 ( i i ) 当m a 设计中的p 等于g m c 设计中的q 时: g m c 设计是使a 3 最小,并且依次最大化( 剃,瓤1 ,剃配) ,m a 设计是尽可能 的使a 3 ,a 4 最小,并且使二阶交互作用混杂程度平均。 不难得到g m c 设计二阶效应与二阶效应的混杂程度比m a 设计混杂的程度小 因此,通过( i i ) 中的第二点知道,g m c 设计优于m a 设计 ( i i i )由于m a 设计是使( a l :a 2 ,a 3 ,a 4 a ) 依次最小化,而m e c 同样是使a 3 ,a 。 最小 则m a 设计和m e c 设计更为接近而m e c 设计是使丘( d ) 最大。 剐) :k e 扯一旦( 铡l 广噬n 10 其他情形 厂 似 m , m兮 临, m ,越 伽m兮 a撕m p l+g h 础 = pm ,脚 d + “g 锄m兮 2 由,酞 m ,黼 讥m 东北师范大学硕士学位论文 其中0 n | c :i ,f = 2 ”- - p 一1 一他 因此,不难得到露f d l ) 之b ( 比) 因此g m c 设计优于m a 设计 综上,在效应稀疏原则下的模型稳健性下,g m c 设计优于m a 设计 1 2 , 东北师范大学硕士学位论文 5 两个具体例子 例1 设计一个3 2 r u n 试验,含有九个因子,分别是a ,b ,c ,d ,e ,f ,g , h ,i ,由先验知二因子交互作用a b 有潜在的重要性 找到两个2 9 - 4 设计d l 和d 2 ,九个因子分别用1 ,2 ,3 ,4 ,5 ,6 ,7 ,8 ,9 。表示。如果二阶交互作用1 9 是c l e a r ,贝i j 可以把二因子交互作用a b 安排在1 9 列上 d 1 si = 1 2 3 6 = 1 2 4 7 = 1 2 5 8 = 1 3 4 5 9 d 2 : i = 1 2 3 6 = 1 2 4 7 = 1 3 4 8 = 2 3 4 5 9 首先分析d ,设计: d 1 的定义对照子群 g 1 = ,1 2 3 6 ,1 2 4 7 ,1 2 5 8 ,3 4 6 7 ,3 5 6 8 ,4 5 7 8 ,1 3 4 5 9 ,2 4 5 6 9 ,2 3 5 7 9 , 2 3 4 8 9 ,1 5 6 7 9 ,1 4 6 8 9 1 3 7 8 9 ,2 6 7 8 9 :1 2 3 4 5 6 7 8 得到: l , t 一7 ( d 1 ) = ( 0 0 ,0 ,6 :8 ,070 1 ,0 ) 最大估计容量是估计出所有的主效应和尽可能多的二阶效应d ,设计的分辨度为i v , 主效应均是纯净的,即主效应都是可估的,所以我们关心二阶效应的情况 下面写出d 1 设计的二阶效应的混杂情况。 d 1 设计有八个纯净的二阶交互作用是:1 9 ,2 9 ,3 9 ,4 9 ,5 9 ,6 9 ,7 9 ,8 9 有十二组包含两个二阶交互作用混杂的别名集:1 3 = 2 6 ,1 4 = 2 7 ,1 5 = 2 8 ,1 6 = 2 3 ,1 7 = 2 4 , 1 8 = 2 5 ,3 4 = 6 7 ,3 5 = 6 8 ,3 7 = 4 6 ,3 8 = 5 6 ,4 5 = 7 8 ,4 8 = 5 7 有一组包含四个二阶交互作用混杂的别名集是1 2 = 3 6 = 4 7 = 5 8 根据每个别名集所含的二阶效应的个数,可以分成四类: 岛l = 8 :i c l i = 1 2 ,lc 2 l = o ,| c 3 i = 1 则 剃o ) = 8 ,瓤1 l2 4 ,剃2 l0 ,剃3 = 4 因此有向量 弘= ( 8 ,2 4 ,0 ,4 ) ( i ) 类d l 设计: 州= ( 8 1 ) = 8 东北师范大学硕士学位论文 ,l 。( d i ) = 五。( d i ) = ( i i ) 突d l 议计: 最,( d i ) = 0 叫,= ( 弧警) 删+ ( :) 刈惮2 4 疋。c d ,= ( ;) c ( 苫) 2 2 + ( 警) 2 1 ( :) 4 1 ,+ ( ! ) c ( ¥) 2 1 + ( :) 4 1 , = 3 6 6 4 ( i i i ) 类d 1 设计: b ,c d ,= ( ¥) 2 1 + ( :) 4 + ( ;) 一8 = 2 8 2 2 + ( 警) 2 1 ( ;) 1 1 + ( y ) 2 1 ( ;) 4 1 + ( ;) z 1 ( ;) 4 1 1 :一2 8 2 2 4 :3 6 0 忍。c d ,= ( 苫) 2 3 + ( 苫) 2 2 ( ;) 1 + ( 苫) 2 2 ( :) 4 1 + ( 警) 2 1 ( ;) 1 1 + ( ¥) 2 1 ( ;) 4 l + ( :) 1 1 ( ;) 4 1 + ( ;) x 1 3 - 5 6 - 3 6 6 4 = 2 8 1 6 其次分析d 2 设计: c f 2 的定义对照子群 得到: g 2 = j ,1 2 3 6 ,1 2 4 7 ,1 3 4 8 ,3 4 6 7 ,2 4 6 8 :2 3 7 8 :1 6 7 8 ,2 3 4 5 9 ,1 4 5 6 9 , 1 3 5 7 9 ,1 2 5 8 9 2 5 6 7 9 :3 5 6 8 9 ,4 5 7 8 9 1 2 3 4 5 6 7 8 9 w ,( d 2 ) = ( 0 ,0 ,0 :7 ,7 ,0 0 0 ,1 ) 最大估计容量是估计出所有的主效应和尽可能多的二阶效应d :设计的分辨度为i v , 主效应均是纯净的,即主效应都是可估的,所以我们关心二阶效应的情况。 1 4 8 6 2 5 = = 、, 8 2 8 3 ,一,一 、夕 、抱2 g ,、 卜 | i 、i, 以 “rb , , 东北师范大学硕士学位论文 下面写出如设计的二阶效应的混杂情况: d 2 设计有十五个纯净的二阶交互作用是:1 9 ,2 9 ,3 9 ,4 9 ,5 9 ,6 9 ,7 9 ,8 9 , 1 5 , 2 5 ,3 5 , 3 5 , 5 6 ,5 7 , 5 8 有七组包含三个二阶交互作用混杂的别名集:1 2 = 3 6 = 4 7 ,1 3 = 2 6 = 4 8 ,1 4 = 2 7 = 3 8 ,1 6 = 2 3 = 7 8 , 1 7 = 2 4 = 6 8 ,1 8 = 3 4 = 6 7 ,2 8 = 4 6 = 3 7 根据每个别名集所含的二阶效应的个数,可以分成三类: 则 因此有向量 岛i = 1 5 ,i c l i = 0 ,ic 2 = 7 考c 2 ( 0 1 57 列1 = 0 ,辫2 = 2 1 生2 c 2 = ( 1 5 :0 ,2 1 ,0 ) ( i ) d 2 设计: 啪,= ( ? ) 娟 五:( d 2 ) = 乃。f d 2 ) = ( i i ) d 2 设计: 疋,( d 2 ) = 0 冰,= ( 苫) ( ;) x 3 1 = 3 1 5 阱,= ( 掌) ( 三) 埘+ ( 苫) ( ;) x 3 1 = 5 0 4 0 ( i i i ) d 2 设计: 啪,= ( :) x3 t + ( ? ) - 1 5 = 2 1 飞池,= ( 三) x3 2 + ( ;) 删( 苫) + ( 苫) - 1 0 5 - 3 1 5 = 1 8 9 1 5 o ,l , | | = 、-、 m 2 3 ,一,一 东北师范大学硕士学位论文 瓦。e d 。,= ( ;) 3 3 + ( ;) 3 2 ( ? ) - l + ( 苫) - 4 5 5 - 5 0 4 0 = 5 8 5 在m a 准则下比较,d l 设计优于d 2 设计,并且d l 设计是m a 设计 u 在g m c 准则下比较,d 2 设计优于d l 设计,并且d 2 设计是g m c 设计 在效应稀疏原则下的模型稳健性下比较这两个设计: 一 通过( i ) 就已经比较出g m c 设计优于m a 设计无需在比较( i i ) 类和( i i i ) 类,但是发现 通过( i i ) 类和( i i i ) 类比较m a 设计和g m c 设计,g m c 设计仍优于m a 设计 铡2 设计一个6 4 r u n 试验,含有十四个因子,分别是a ,b ,c ,d ,e ,f ,g , h ,i ,j ,k ,l ,m ,n ,由先验知二因子交互作用a b 有潜在的重要性。 找到两个2 1 4 _ 8 设计d 3 和d 4 ,十四个因子分别用1 ,2 ,3 ,4 ,5 ,6 ,7 ,8 , - 9 ,t o ,t l ,t 2 ,t 3 ,t 4 ,表示如果二阶交互作用4 6 是c l e a r ,则可以把二因子交互作 用a b 安排在4 6 列上。 、 d 3 :i = 3 4 5 6 7 = 2 3 4 8 = 2 3 5 9 = 1 2 4 t o = 1 2 5 t 1 = 1 2 3 f := 1 3 4 t 3 = 1 3 5 t 4 d 4 :i = 3 4 5 6 7 = 1 2 3 4 6 = 2 3 5 9 = 1 2 6 o = 2 4 5 1 = 1 3 6 f 2 = 1 2 5 t 3 = 2 3 4 6 t 4 首先分析d 3 设计: d 3 的定义对照子群 g 3 = j ,3 4 5 6 7 ,2 3 4 8 :2 3 5 9 :4 5 8 9 :) 得到: 研j ( d a ) = ( 0 ,0 ,0 ,3 9 ,1 6 ,4 8 ) 最大估计容量是估计出所有的主效应和尽可能多的二阶效应。d 3 设计的分辨度为i v , 主效应均是纯净的,即主效应都是可估的,所以我们关一0 - - - 阶效应的情况。 下面写出d 3 设计的二阶效应的混杂情况: d 3 设计有二十五个纯净的二阶交互作用是:1 6 ,1 7 ,2 6 ,2 7 ,3 6 ,3 7 ,4 6 , 4 7 ,5 6 ,5 7 ,6 7 ,6 8 ,6 9 ,6 t o ,6 t l ,6 t 2 ,6 t 3 ,6 t 4 ,7 8 ,7 9 ,7 t o ,7 t l ,7 t 2 ,。t 3 ,7 t 4 有十二组包含四个二阶交互作用混杂的别名集:2 4 = 3 s = 1 t o = t 2 f 3 ,2 8 = 3 4 = i r a = t o t 2 ,2 5 = 3 9 = 1 t 1 = f 2 t 4 , 。 2 9 = 3 5 = l 4 = f l z 2 ,1 4 = 2 o = 3 t 3 = 8 f 2 0 ,1 5 = 2 t l = 3 t 4 = 9 t 2 ,l 3 = 3 4 = 2 8 = t o t 2 0 ,l t 4 = 3 5 = 2 9
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 年产7.1万吨电梯尼龙滚轮项目可行性研究报告
- 跨境电商合规框架-洞察及研究
- 经外周静脉穿刺中心静脉导管护理查房
- 基于区块链技术的2-氟-4-氯甲苯全生命周期供应链风险溯源与合规性验证
- 后爪机构振动抑制与能效转化悖论研究
- 反射型陶瓷金卤灯热应力分布与材料疲劳寿命的耦合机制研究
- 反光涂层寿命衰减与城市光污染治理的协同共生模式
- 企业政策性决策分析辅助工具
- 专业培训课程教材开发合同
- 农民技术培养与服务提供协议
- 中国秘书史(第二版)全套教学课件
- 建筑工程质量安全检查记录表
- 聚焦于人:人力资源领先战略
- GB/T 42866-2023煤化工废水处理与回用技术导则
- 病原生物与免疫学知识点
- ISO50001内部审核检查表
- DB31∕T 1191-2019 绿化土壤肥力质量综合评价方法
- 抢救工作制度培训课件
- 大学生劳动实践清单(本科收藏版)
- 无人机航空摄影测量数据获取与处理PPT完整全套教学课件
- 普通化学(第五版)浙江大学普通化学教研组P课件
评论
0/150
提交评论