




文档简介
博士擘住论文 d o c r o 叹a id i s s e 船【: n 0 n 中文摘要 在化工、材料工业、食品及低温超导等领域中的一些试验中,试验考察并不是各影响因素 不同水平组合对响应的影响或它们间的相互关系。而是要考察各因素在所有因素混料中所占比 例对响应的影响。这种与一般因子试验的区别使得混料设计( 或称配方设计) 不论是理论还是应 用上都非常重要。混料均匀设计以在混料试验区域均匀布点为出发点,提供了一种模型稳健的设 计方案。克服了最优设计在区域边界布点过多及过于依赖模型假设条件的弱点。丰富了试验设计 理论。 本文结合均匀设计的思想,提出了混料设计试验区域( 区域为标准单纯形) 上的l 2 一偏差 “d m j 偏差”及“c d m j 偏差”。并推导出了它们的一般计算公式。为均匀混料设计优良性提 供了一个方便可行的度量标准。在这两个偏差准则下,对于同一个试验问题的两个不同设计,可 以通过计算它们的偏差值方便的选出较均匀的设计。从而为实际实验选出较合理的设计方案。 在现有的设计表构造方法的基础上,本文提出了几种新的设计表构造方法。对于一般的无 限制条件混料设计,提出了u 型设计变换法及非边界单纯形格子搜索法。在试验维数不高,而 试验点数n 也不大时,这两种方法都有不错的效果。而对于有限制条件混料设计中的保序限制 条件混料设计,本文证明了在次序变换下,变量的分布仍保持原来的均匀分布。因此,为保序限 制条件混料设计找到了简单可行的设计表构造方法。 最后,考虑到混料均匀设计和一般因子设计中的均匀设计一样:“维数较高的时候,设计表 构造的计算是个n p h a r d 问题”。本文引入了门限接受和n n ,b g 两种算法,在减小设计表构 造中计算量的同时,找到较均匀的设计。并对n n 屉g 算法做出了该进,克服了n 兀b g 算法 仅对m s e 偏差收敛的弱点。提出了加权n n b g 算法,在d 偏差下也能找到较均匀的混 料设计。 关键词:试验设计;混料设计;均匀设计;混料均匀设计;偏差;门限接收法; n r 兀b g 算法:肝n e t 博士学位论文 d o c t o r a ld i s s e r t 加1 a n a b s t r a c t g a i l dw 抽g ( 1 9 9 0 ) d e v i s e dm e u m f o 肋d e s i g nf o r1 1 1 i x 眦e x p e 血e 心t oo v e r - c o m es o m eo fl i m i t a t i o n so f 吐l eo p c i i n a ld e s 远nt h a tb c c o m e 印p a r c n ti nc e n a i ns i t u a t i o n s t h e i rm e t h o d 仃a i l s f o 册e dt h eu i l i f o 册d e s i g no ff a c t o r i a le x p e r i i n e n t si nt 0t 1 1 em i x t u r e d e s i g n t h i sa p p r o a c hh a sm a n yb e n e 疗t sa n di so f t e ns u f 6 c i e n t ;h o w e v e r t h en o n l i n e a r 咖s f o 册a t i o nc 姗o tm 血t a i l l 山eu 删o 珊【i 哆1 1 1 em i x n 船d e s i g na c l l i e v e db y 吐l e i r m e 吐l o dm a yn o tb et 1 1 eb e s to n e i nt l l i sm e s i s ,if i n dac r i t e r i o nt oc o n s t m c tt h eu n i f 0 珊d e s i g nf o re x p e r i m e n t sw i t h m i x t u r e s p e c j f i c a l ly ,ip r o p o s et h ed i s c r e p a n c yd m j a j l dg d m ja san e wm e t h o dt 0 m e a s u r e 吐l eu i l i f 锄哆o fm i x t l l r ed e s i g n t h ec o i n l m t a t i o n a jf o 肋u l ao f 山ed i s c r e p a n c y b y 小ef h n c t j o n a lm e m o d ,w a sa l s od e t e n n i n e d t h es u p e r i o rd e s i g ni 1 1a i l y 哪om 诬t 1 1 r e d e s i g n sw a l sd e m o n s t r a t e dc o i e n i e n t l yb yc o m p a 血l gt h ev a l u e so fd m 2a n dc d 如 t h i s 山e s i sa d v a n c e st w o a p p r o a c h e st oc o n s m l c t 山e u i l i f b n nd e s i g nf b ru n c o n s t r a i l l c 通 r n i x t u 】汜e x p e r i r n e n t s o n ei s 山e t r a n s f o 】衄o fu 一哆p em a t r i x ”,a j l d 山es e c o n di st h e “s e a r c hi 1 1 血嘶0 ro fs 曲p l e x l a i c e ”b o 山a c h i e v e da9 0 0 dd e s i g i lw b e nt b en 1 如b e ro f i n g r e d i e n t sa j l dd e s i g np o i n t sw e r es m a l l f o ras p e c i f i c 妙p eo fc o n s t r a j n e dr i l i x t u r ee x - p e 血e n t ,i e i s o t 0 1 l i cr e s 啊c t i o nm 政t u r ee x p 咖e n t ,id 锄o n s 廿a t e 1 a tm ev 面a b l e ss d u f o l l o wau n j f o 】衄d i s 伍b u 【i o nm e rb e 遗go r d e r e d h e n c e ,au n 讧b 衄d e s i g ni sa c h i e v e df o r 吐l ei s o t o i l i cr e s t r i c t i o n 1 i x t u r ee x p e 血e n ti fau 1 删日衄d e s i g nf b ru n c o n s 岫e di n i x t l l r e e x p e r i m e n te 贴s t s l a s t ,血i st l l e s i sa p p l i e s 山e 1 1 l r e s h o l da c c 印血培a j l d n t i 层ga 】g o r i 山m t 0c o n - s 廿u c t 山el l l 0 md e s i g nf b re x p e 曲e n t a 】d e s i g n 、析山m i x t i l r e t h er e s u l t ss h o w e dt l l a t t 1 1 ea l g 商d l ma 出e v e dag o o dd e s i g n 确珂t 1 1 ec 0 i n p l i c a t eo fc o m p u t a d o nw a sr o d u c e d f u 【m i e r t 1 1 ew e i 曲t e d 卜b ga l g 嘣血n ,w l l i c hw a sa d v 纽c e db a l s e do n 山en 兀卫ga l g o r i 吐1 l n a c k e v e da9 0 0 dd e s i g nu n d e r 也ed 朋_ 2 谢t 嘶o nb u tn o tl l n d e rt h em s e 瓯t 缸o n , i e 山en t ib g a l g o r i t i m l i nc o n c l u s i o n t h i sn e wm e t h o dd e v e l o p st h e 出e o r yo f 吐l el l 玎商。衄e x p e 血e n t a ld e s i g n 谢t 1 1m 政t u 】汜,a n dc a i lh e l pt oa d v a n c ei t su 血t yi na c a d e 血aa n di 1 1 d u s 时 k e yw o r d s :u n 曲衄d e s i g n ;e x p e 血e n t 丽t hm 奴t l l i ;l l n 怕珊d e s i g nf o ri n i 叉t u r e e x p e r i r n e n t ;d i s c r e p 锄c y ;t h r e s h o l da c c 印曲g ;卜mb ga l g 嘶t 1 1 m ;n t - n e t 博士学位论文 d o c t o r a ld i s s e r t a t i o n 华中师范大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作 所取得的研究成果。除文中已经标明引用的内容外,本论文不包含任何其他个人或 集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在 文中以明确方式标明。本声明的法律结果由本人承担。 作者签名:日期:厮f 月印日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借 阅。本人授权华中师范大学可以将本学位论文的全部或部分内容编入有关数据库进 行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。同时授权 中国科学技术信息研究所将本学位论文收录到中国学位论文全文数据库,并通 过网络向社会公众提供信息服务。 作者签名: 日期:川年厂月z 日 导师签名:即嘶 导师签名:刁q 乞火l a 日期:口忍踔i ,月z 加 本人已经认真阅读“c a l i s 高校学位论文全文数据库发布章程”,同意将本人的 学位论文提交“c a l 工s 高校学位论文全文数据库 中全文发布,并可按“章程”中的 规定享受相关权益。回童途塞握变压澄后i 旦圭生;旦二生;旦三生蕉查! 作者签名: 劾,略 日期:召年r 月v 7 日 抑始和翰 日期:y 扩年r 月胡 博士学位论文 d c 研o r a id i s s e r i :a 1 1 0 n 第一章背景与引言 1 1 试验设计 我们的日常生活中到处都有试验的身影,小到家庭主妇日常的食品制作,大到如材料科学、 半导体、超导体、生命科学以及人工智能等现代科学行业中的技术创新都离不开试验设计。通过 试验和后续的数据分析,试验者可以挖掘出一个工艺过程中,输入因素是如何影响输出的。甚至 于建立起输入输出的数学关系模型。从而有效地指导实际的工艺生产过程。如何科学、合理地安 排试验,使得试验者在尽可能少的实验消耗下,得到大量的信息,为后续的数据分析提供尽可能 多的信息,以致事半功倍的效果就成为试验者努力追求的目标。如何科学的组织试验,包括很多 环节:选题、精心挑选试验因素及其变化范围,以及决定因素的水平和处理组合,试验中的技术 细节和组织工作等等。这些环节,有的是属于管理科学,有的是需要数学和统计学的方法来设计 试验方案,这就是所谓的统计试验设计。由于本文讨论内容仅限于统计试验设计范畴,在后文的 叙述中只简单的说试验设计,而略去统计两个字。 早在2 0 世纪初,r o n a 】da f i s h e r 爵士在他英国的农业试验站数据收集和分析中系统的 应用了统计方法,在试验设计和统计分析方面做出了一系列开创性先驱工作,奠定了现代试验设 计的基石。试验设计逐渐发展为统计科学的一个重要分支。一个好的试验设计能大量节省试验次 数能将试验数据从随机误差的烟雾中去伪存真,抓住事物的规律。当然针对不同的试验目的,试 验现状,必需选用不同的设计方法和原则。才能充分的发挥试验设计的高效率,否则只能事倍功 半。下面简单的对几种较流行的设计做简单的介绍: 最优设计即是在已知真实模型的结构形式而只有有限的参数未知时,选用设计的准则。在 最优准则下选取的设计将会使得在后续建模中对参数的估计的达到最优。例如: 例1 假设某试验前已知,输出和输入的客观真实关系为( 或可近似为) 简单回归模型 y = ,t ( z ) p + e = 扁+ 岛z + e ,e 一( o ,盯2 ) 因子区域为一l z 1 0 考虑三次试验,设计点分别为z 1 ,z 2 ,z 3 。则由回归分析最小二乘估 计理论得到估计及其方差 p = ( f t f ) 一1y ; y o r ( 卢)= 盯2 ( f t f ) 一1 博士学位论文 d o ( 汀d r a l d l s s e e m 0 咐 预测值及其方差 多= 厂( z ) p , y n r ( 雪) = 盯2 厂t ) ( f t f ) - 1 厂扛) , 其中矿= ( 三:。) 。因此,可以说估计的好坏和信息矩阵f t f ,也即设计点z 1 ,z 2 ,z 3 的取 值有密切联系。显然我们希望选择的信息矩阵上矽f 越大越好。正是基于这一思想j 1 ( i e f e r 于 1 9 5 9 年提出了最优设计。针对矩阵不同的比较方式产生了: a ) d 一最优设计:取合适的试验点使得l f r f i 达到最大。 b ) a 一最优设计:取合适的试验点使得打( ( f t f ) 一1 ) 达到最小。 c ) e 一最优设计:取合适的试验点使得( r f ) 一1 的最大特征根最小。 d ) g - 最优设计:取合适的试验点使得响应预报值的最大方差最小。 在模型已知的情形下,最优设计不失为一种非常好的设计,但它也有明显的缺点:a ) 在很 多复杂模型下,目前的理论还不能得到显性的设计。b ) 不具有稳健性,如前所述最优设计准则是 建立在模型结构已知的前提下最优没的,一旦此前提假设出现偏差,则设计可能就成为较差的设 计。 正交试验设计是用于多因素试验的一种试验设计方法,它是从全面试验中挑选出部分有代 表的点进行试验,这些点具有“均匀”和“均衡”的特点。正交试验设计是部分因子设计的主要 方法。设在一项研究中考察s 个因素,根据实际的需求分别取了9 1 ,吼个水平,则全部的 水平组合总共有= 口1 g s 个。当s 及9 1 g s 都不是很大时,有可能对所有个水平组 合都作同样次数的试验,这种试验方法称为全面试验。可是当全部水平组合数太大时,可从 中个水平组合中抽取部分有代表性的水平组合来做试验,这种方法称为部分因子设计。正交 设计提供了一种选择的原则: a ) 任一因素的诸水平做相同数目的试验; b ) 任两因素的水平组合做相同数目的试验。 例2 ( 摘自方开泰、马长兴( 2 0 0 1 ) 例2 1 )为了提高某化工产品的转化率,试验者选择 了3 个有关的影响因素:反应湿度( a ) ,反应时间( b ) ,用碱量( c ) ,并选择如下的试验范 围:a :8 0 。9 0 。,b :9 0 分1 5 0 分,c :5 一7 。若对每个因素取3 个水平: 2 博士擘住论文 d c c t o r a l d 塔s e k m a n 表1 1 :正交表l 9 ( 3 4 ) n o l 2 34 1 1111 21222 3133 3 42 1 2 3 52231 62312 7 3 1 32 832l3 9 33 2 1 a :8 0 0 ,8 5 。,9 0 0 : b :9 0 分,1 2 0 分,1 5 0 分; c :5 ,6 ,7 。 对这一问题若采用全面试验,则至少要进行3 3 = 2 7 次试验。全面试验可以将因素和响应 之间的关系分析较彻底,但全面试验的试验次数太多,特别是当试验的因素或因素的水平较多 时。采用正交试验则可以有效的减少试验次数。本例若采用正交设计方法指导试验,则可以减少 许多试验次数。可以采用正交表l 9 ( 3 4 ) ( 见表1 1 ) 前三列对应的因素水平组合进行试验,只需 9 次试验。 表1 1 中的1 ,2 ,3 只是代号,代表因素的水平。如第一、二、三列分别对应因素a 、b 及 c 。则表第一行表示一次试验,各试验因素水平分别为8 0 。、9 0 分及5 。如此类推可得到9 次 试验的实际水平组合。9 次试验的顺序随机决定。 许多文献在理论上证明了,正交设计具有很好的统计性质。如:c h e n g ( 1 9 8 0 ) 在方差分析 模型下证明了正交设计是一致最优的。c h e n ,f 抽g 柚dw i i l l ( e “1 9 9 8 ) 给出了:任一正交设计 一定是某个多项式回归模型的d 一最优设计。、 均匀试验设计是一种空间填充( s p a c ef i l l i n g ) 设计,对于试验的真实模型假设较少,因此 均匀试验设计是一种稳健设计。上文提到的正交设计和最优设计有一个共同的特点,就是假设潜 3 博士学位论文 d o c t o r a ld l s s e r t 棚o n 在的真实模型结构是己知的,只有模型的参数未知。针对试验的特殊模型结构找到对未知参数估 计高效的设计。正是这种对模型的针对性使得设计在稳健型方面较差。而事实上,很多试验在实 验前并没有足够的信息对潜在的真实模型结构作假设。因此,在很多情况下,我们需要更为稳健 的设计。f :m g ( 1 9 8 0 ) 和r m ga i l d b g ( 1 9 8 1 ) 提出的均匀设计正是这样一种设计。 设一个试验中5 个因素,它们各自取了口个水平。若用正交试验法来安排这一试验,欲估 计某因素的主效应,在方差分析模型中占g 一1 个自由度,s 个因素共有s ( g 一1 ) 个自由度。如 果进一步考虑任两个因素的交互作用,共有( :) 个这样的交互作用,每个占( g 一1 ) 2 个自由度。 上述两项自由度之和为s ( 口一1 ) + ;s ( s 一1 ) ( g 一1 ) 2 。通常我们可以忽略更高阶的交互效应,因 此试验数n 必须大于s ( g 一1 ) + ;s ( s 一1 ) ( g 一1 ) 2 。例如,在一个5 因素三水平的试验中,试 验数几必须大于5 0 。在多数试验中上述的主效应和二因素间的交互可能不同时显著,若试验前 己有足够的证据可忽略某些主效应或交互效应,则n 可适当减少。只是,在许多试验中,试验前 试验者并不清楚各效应的相对重要程度。在正交设计方案下,试验者只有选择做5 0 次以上试验。 于是,在文献中强烈推荐使用二水平试验,这时s ( g 一1 ) + ;s ( s 一1 ) ( g 一1 ) 2 = s + ;s ( s 1 ) , 当s 增加时,其试验次数增加的速度为s 2 阶,对大多数试验可以接受。众所周知二水平试验只 能揭示响应和因素间的线性关系,三水平试验只能拟合响应和因素间的二次多项式关系。当响应 和因素间的关系为高次多项式或非线性关系时,就需要更高水平的试验。这时方差分析模型要求 的试验次数会使试验者望而止步。 用回归模型代替方差分析模型可能是解决上述困难的方法之一。用z 1 ,轧代表试验中 的s 个因素,则巧,z ;,z ;分别表示因素z ,的一阶,二阶,三阶主效应,既z ,表示因素盈和 巧的二阶交互效应,。;巧和盈z ;表示它们的三阶交互效应,盈z ;,z ;z ;和z i 巧表示它们的 四阶交互效应,等等。这时,二次模型 中有2 + s + s ( s + 1 ) 2 个未知参数,其中包括误差方差仃2 = y o r ( e ) 。当s = 5 时,上 式中有2 2 个未知参数,若试验数n 2 2 ,则上述参数均可以估计,比方差分析模型要求的试 验礼 5 0 的条件要低很多。若采用回归分析中的变量筛选技术,则试验数还可以进一步减少。 众所周知,最优设计是建立在回归模型基础上,特别当回归模型为( 1 1 ) 时,最优设计是已知的 效率最高的设计。但,若潜在的真实模型并不是( 1 1 ) ,例如,模型中含有更高阶的交互作用项 盈z ;,z ;巧,z ;z ;甚至于有非线性项时,寻求相应的最优设计必须使用相关的电脑软件,很多 4 十 巧 谕 晟 。芦 。甜 + 以屈 。汹 + 岛 = y 博士学住论文 d c c 卫d 1 砒d i s s e l n a n o n 时候得到的解并不是真正的最优设计。更严重的是,试验者并不知道真正的模型是什么,这时就 无法采用最优设计了。而均匀设计正好是这样一种对模型的变化有一定的稳健性。 综上所述,均匀设计引入了非参数或半参数回归模型,从而避免了方差分析模型( 正交设计 的基础) 中效应多且复杂的缺点。大大的减少了试验必需的次数。 不失一般性设z 1 ,z 2 ,钆的试验区域为c 8 = 【o ,1 】5 , 可= 夕( z 1 ,z 2 ,z 。) + e , ( 1 2 ) 式中9 属于某个已知函数类( 例如二次可微,可积) ,但未知。试验者希望通过试验,找到函 数9 的近似表达式。数学意义上,试验设计即是要在试验区域c 5 挑选n ( 试验次数) 个点 z 1 ,z 2 ,z 。进行试验,从而收集到影响因素对试验响应影响方式及影响力度的信息。但 到底n 个试验点分别取在什么位置,或以什么方式,准则确定死个试验点的具体位置,坐标。在 缺少潜在真实模型信息的情况下,均匀设计认为试验区域的任一点所包含的信息量无差别,也就 是认为试验点应尽可能均匀的散布在试验区域中。因此,均匀设计判断设计是否优良的基本原则 为“试验点在试验区域散布越均匀的设计越优良”。 有了基本的原则,接下来就是如何量化和执行的问题了。如何来比较设计间的均匀性,首 先要解决的问题就是如何来量化和刻画一个设计的均匀性。例如:区域c 5 中的任意一个点集 r = ( z l ,z 。) n 。,它的均匀性如何? 能不能从数学上给出一个定量的刻画。星偏差( s t a r d i s c r e p a i l c y ) 是度量点集7 在区域c 8 上分布均匀的测度( 详见h u a 衄dw a n g ( 1 9 8 1 ) ) 。 h i c k e m e u ( 1 9 9 8 a ) 和h i c k e m e u ( 1 9 9 8 b ) 改进了通常的l 2 - 偏差( w e y l ( 1 9 1 6 ) 提出) ,提出了 中心化l 2 - 偏差和可卷l 2 - 偏差。之后, 王i c k 锄e ua n dl u ( 2 0 0 2 ) 又提出了离散偏差。较好 地度量了设计的均匀性。特别是其中的中心化工2 一偏差具有许多统计上,应用上以及计算上的 好性质。 以上述偏差为目标函数,寻找最优的均匀设计,就是个优化问题。到目前已经有了许多的 方法。大多数方法都是建立在一种称为u 一矩阵设计的基础上。如:好格子点法( w 抽ga i l d f a j l g ( 1 9 8 1 ) ,r m ga n dw 抽g ( 1 9 9 4 ) 和方开泰和马长兴( 2 0 0 1 ) ) ,拉丁方法( f a n g ,s h u i 锄d p 锄( 1 9 9 9 ) ) ,正交设计扩展法唧培( 1 9 9 5 ) ) 以及随机优化方法,包括淬火算法,遗传算法,门 限接受法等。 另外,均匀设计的应用也非常简单易行。实际工作者只需根据自己的试验需求,找到相应 的均匀设计表,根据设计表容易给出试验方案。有两种方法可以找到所需的均匀设计表:1 ) 从一 些现有的均匀设计表库里面下载,如均匀设计协会网页。2 ) 通过某些商业软件搜索。 5 = : 博士学位论文 d d c t r j r a ld i s s e r l - :n o n 均匀设计从提出到现在,不仅在理论上越来越完善,实际的应用中也日益广泛。在航天、制 药、石油、化工、自然科学研究、抽样调查、高科技产品和军工产品的研制等许多领域发挥着重 要作用。值得一提的是美国福特汽车公司己将均匀设计法作为他们新引擎的研究常规方法之一。 1 2 混料均匀试验设计 通常我们考虑的试验都可以将试验的试验区域抽象到立方体c 8 区域内,或可以通过简单 的变换转化到立方体c 8 内。也就是说试验时,各影响因素所取的试验水平相互间是独立的,一 个因素的试验水平不受其它因素的试验水平影响。可是现实中却不常常这样。特别是工业、食品 等行业。许多产品都是由若干种配料混合而成的。例如:各种合金钢材都是以铁为基础再加适量 的镊、铬、锰、碳等成分组成;氖灯灯泡巾包含有氦、氖、氩、氤等多种惰性气体;通常饮用的 饮料则可能含有多种果汁及糖份和水:药品、酒类产品则更复杂,含有更多种类的物质。在这些 产品中,各种配料的比例( p r o p o n i o n s ) ,配比或比率,常常是其产品品质的保证,也是厂家的 重要技术机密。如何选择各种配料在总混料中所占的比例,使得产品质量最佳,也是个生产厂家 技术人员的核心目标。寻找最佳配料比离不开试验。但,这类产品的试验与一般的试验显然有 很大的区别。我们知道一般的试验,各试验的影响因素的试验区域之间是独立的,或可近似看作 独立的。但在上述配料试验当中,显然这种假设不成立。因为各种配料所占的比例总是大于等 于0 ,且总和一定等于1 。统计学家们针对这类实际问题提出了所谓的混料试验设计( d e s i g r lo f e x p e 曲e n t sw i mm 奴t u r e ) 。 定义1 2 1 ( 摘自c o m e l l ( 1 9 9 0 ) 一书1 3 节) 我们称这样一类试验为混料试验,该类 型试验的响应依赖于各试验因素在混料总量中所占的相对比例值,而不是各因素的实际水平值。 混料试验中,各成份( i i l g r e d i e n t ) 或配料之间受非负和总和为1 的条件约束,因此混料设 计大大难于一般的s 个因素之间无约束因子设计。为次,文献中发展了许多方法来进行混料试 验设计。s c h e f 伦( 1 9 5 8 ) 首先提出了单纯形- 格子点设计( s i r n p l e x l a t t i c e ) ,奠定了混料设计的 基础。之后s c h e 舱( 1 9 6 3 ) 针对单纯形- 格子点设计在建模上的缺点,提出了单纯形- 中心设 计( s i i n p l e x - c e n t r o i d ) 。单纯形一格子点设计和单纯形二中心设计的试验点多数位于单纯形因素 空间的边界上。而在现实的试验中通常我们往往需要的是完全混料试验,即每个成份的比例需大 于o 。c o m e ua n dg o o d ( 1 9 7 0 ) 和c o m e ( 1 9 7 5 ) 提出了c o x 设计和轴设计。 6 博士擘住论文 d c c r c i r a ld i s s h n a n o n 上述设计都是从直观和最优设计的角度提出的,有缺乏模型稳健和边界布点过多的缺点。 为克服这两个缺点w a n g 弛dr l i l g ( 1 9 9 0 ) 将均匀设计的思想引入到混料设计中,提出了混料 均匀设计。其思想是将死个试验点m 中不同的配方) 均匀的散布在混料设计区域一单纯形上。 与一般的均匀设计最大的不同是,混料均匀设计的影响因素的取值区域不再是超级立方体,而 是单纯形或其子集。由于均匀设计在实际应用和理论研究上的日益重要性,混料均匀设计,甚 至于不规则区域上的空间填充设计,也日渐引起统计学家和实际工作者的重视。自w a n ga n d r m g ( 1 9 9 0 ) 提出了通过特殊变换超级立方体中的均匀性较好的设计得到混料均匀设计方法后, 许多文献推广发展了这一方法。如:w r a n ga n dr m g ( 1 9 9 6 ) ,f a n ga n dw 钿g ( 1 9 9 4 ) ,r n a j la 1 1 d g ( 1 9 9 9 ) ,陆ga n dy 抽g ( 2 0 0 0 ) a n dt i 趾( 1 9 9 8 ) 。在这些文献中,他们提出了一些准则来 度量试验点在混料设计区域内的均匀性。遗憾的是这些准则基本上是原超立方体c 5 上均匀测 度的变换,而由于变换的非线性性,有时给出的度量不尽合理,得到的设计也不一定是最佳的。 因此能否直接在混料设计区域( 后文描述可知该区域为标准单纯形) 定义一个均匀性测度,这是 本文要解决的关键问题之一。为混料均匀设计定义出方便、合理的均匀测度及在这些测度下构造 出方便实用的均匀设计表就具有很大的实际和理论意义。 另外,混料设计也可以看作是一种不规则区域试验设计。过去,不规则区域中的试验设计 广泛使用的是最优设计( 参见c h m ( 2 0 0 0 ) ) ,如:d 一最优和g 最优设计等等。可是,最优设计 有个众所周知的缺点。即,最优设计总是放置太多的试验点在试验区域的边界上或边界附近,特 别是在维数稍微偏高时。j o h i l s o ne ta 1 ( 1 9 9 0 ) ,j 0 h ne ta 1 ( 1 9 9 5 ) ,d u c k w o r l ( 2 0 0 0 ) ,s a i l t e r e ta 1 ( 2 0 0 3 ) 和s 血s ,ae ta 1 ( 2 0 0 3 ) 等文献试图发展一种所谓的极大极小或极小极大距离设 计( m a x i 血或m j n i m a xd i s t a i l c ed e s i g t l s ) ,使得不仅区域边界上有试验点,同时保证区域内 部也有足够的试验点。遗憾的是极大极小或极小极大距离设计仍只是对维数较低的试验有效,对 于维数稍高的试验仍然不能得到足够的区域内部点的试验信息。p i e p e le ta l l ( 1 9 9 3 ) 提出了所谓 的分层试验设计法( l a y 朗e dd e s i g na p p r o a c h ) ,将试验区域分为不同的的层次,在每层中找最 优设计。但这种方法使用起来较困难,对于试验区域不规则的设计难于展开。而混料设计的发展 也将极大地推动不规则区域填充试验设计的发展。特别是有限制条件混料均匀设计,作为一种不 规则空间填充设计,有关它的理论、应用的发展即是不规则区域试验设计理论和应用的发展。 51 3 预备知识与记号 本节介绍与本文相关的一些基础知识。 7 博士学位论文 d o c t o r a ld 玲s e r 砌0 咐 1 3 1u 矩阵及好格子点法 矿一矩阵及好格子点法是均匀设计表的重要构造方法之一,相关详细内容可参见w a n ga n d r m g ( 1 9 8 1 ) 或方开泰、马长兴( 2 0 0 1 ) 。 u - 矩阵 n s 矩阵u = ( u 莳) 的任意元素u 巧都来自集合 1 ,2 ,g ) ,即让巧 1 ,2 ,g ) , i = 1 ,n ,j = 1 ,s ;且矩阵每一列中g 个元素出现的频率相同。则称矩阵u = ( 让巧) 为u 一矩阵,通常记为u ;旷) 。 若令u 一矩阵u ( 礼;g s ) 中口= 他,得到一类特殊的u 一矩阵,矩阵的每一列为1 ,2 ,n 的一个置换。 对u 一矩阵u ;口s ) 做变换 铲等小1 ) 一 歹_ 1 i j s 得到矩阵矩阵x = ( z 巧) 。显然总有o z 巧 1 ,因此可视x 为单位超级立方体c 5 = o ,1 】s 上的n 个点,也即可将其看为c 8 上一个设计。事实上目前大多数均匀设计就是在u - 矩阵中找 一个一定意义下最均匀的作为均匀设计。 好格子点法( g dl a t t i c ep o i n t s 或g l p ) 给定正整数凡,令h 。= 1 ,啊危】,其中m 南 著名的欧拉函数( 佗) 所决定。即,对于任意正整数几及其唯一的素数分解n = 硝1 r t ,式中 p 1 ,觑为互不形同的素数,艺1 ,r t 为正整数。则 c 佗,= 佗( 1 一去) ( 1 一去) 又令u 巧= i 如( m o dn ) ,这里( m o dn ) 是同余运算。则u = ( 乱巧) 为一个大小为凡m 的 u - 矩阵。给定s m ,则u 的任意s 列组成的矩阵仍为玑矩阵,且共有( :) 个这样的子阵, 其中均匀性最好的子阵就是均匀设计( 矿) 的一个近似解,该子阵的。,吻组成的向 量 = ( 吻。,u ) 称为该均匀设计的生成向量。 1 3 2 单纯形及相关的几何知识 几何上,“单纯形”是s 维( 或更高维) 空间中的s 一1 维凸多面体。它在s 维情况下,是由 s 个顶点、所有连接顶点的线段,以及多边形面等几何体组成的多面体。若单纯形相邻顶点之间 8 博士学位论文 d d c t 。】m ld i s s e j 玎i t j o n 的距离( 即,边长) 都是相等,称其为正则单纯形。如:二维空间中的单纯形即为三角形,三维空 间中的单纯形是一个四面体。 而一类可以表示为 酽= ,t 2 ,屯) r s i 屯= 1 ,胃岛o ) i = 1 的特殊单纯形被称为“( s 一1 ) 一标准单纯形”。其s 个顶点的坐标分别为 e 1 = ( 1 ,o ,o ,o ) , e 2 = ( o ,1 ,o ,o ) , e 。= ( o ,o ,o ,1 ) 将( s 一1 ) 一标准单纯形沿任意坐标轴逆方向向s l 空间中投影,可得到另一单纯形。不 失一般性,假设沿t 1 坐标投影到t 2 ,t 2 空间中得到的s 一1 维单纯形 = ,乞) 酬如1 ,且屯o ) t = 2 单纯形5 1 在s 一1 维空间中的体积为y d l ( 8 1 ) = 百。因而,由积分变换易知单 纯形驴_ 1 的体积y 。z ( 9 _ 1 ) = 石i 知。 1 3 3n t - n e t n t n e t ( n 哪b e rt h e o r e 6 c n e t ) 是对由数论方法生成的某一类区域上的、一定意义下 分布均匀的点集的总称。如在超级立方体c 8 上,k o r o b o v ( 1 9 5 9 ) ,如a w k a ( 1 9 6 2 ) ,w 抽g 皿df a j l g ( 1 9 8 1 ) 等提出和发展的酉p 方法:了h u a 衄dw 抽g ( 1 9 “) ,b a l ( e “1 9 6 5 ) 以及 s c h i 血d t ( 1 9 7 0 ) 发展的g p 方法。另外h a l t o n ( 1 9 6 0 ) 、h a b e “1 9 7 0 ) 及s o b 0 1 ( 1 9 6 7 ) 等提出了 一些其它数论方法构造c 5 上n t n e t 的方法。详细可参见h u a 锄dw 抽g ( 1 9 8 1 ) ,n i e d e r r e i t c r ( 1 9 9 2 ) 或f 缸ga n dw j m g ( 1 9 9 4 ) 。 f m g 趾dw 抽g ( 1 9 9 4 ) 除了介绍在c 8 上的n t _ n e t 外,还介绍了怎样用数论方法在诸如 在球面、球体及单纯形上生成n r - n e t 。他们从统计理论上推导出了一系列从c 5 到上述区域内 的变换方法,这些变换能保证变换后的点集仍具有较好的均匀性。 9 博士学位论文 d o c t o r a ld l s s e r r 了1 0 n l - 3 4 本文结构 本文将按下述结构展开叙述。第一章将简单介绍试验设计及混料试验设计的现实背景及其 发展,并为后文的叙述介绍一些相关的背景知识。第二章介绍现有的混料试验设计方法,这些方 法有针对各阶混料多项式模型的最优设计。也有从均匀性出发的混料均匀设计。并针对现有均匀 性测度的不足,提出了新的均匀性测度d 尬和g d 尬偏差。第三章以第二章论述的偏差为 均匀标准,提出了构造混料均匀设计的两种方法:u 型设计变化法及单纯形格子点搜索法。由于 构造混料均匀设计表在计算上的复杂性,特别是在维数较高,或设计点较多的情况下。第四章我 们引入两种数值理论搜索方法,门限接受法和n 兀b g 算法来简化计算的复杂性。第五章中我 们针对实际问题背景,进一步讨论了有限制条件的混料均匀设计。介绍了如何在有限制条件混料 设计中构造出较好的均匀设计表。第六章将对本文工作做评论,并对此领域未来的发展给出自己 的一点意见。第七章为附录,给出文中两个定理的详细证明。 1 0 博士学住论文 d c c t o r a l d i s s e i ( r 加o n 第二章混料均匀试验设计及其均匀性度量 2 1 一般混料试验 首先,引用关颖南( 1 9 9 0 ) 关于汽油混料的例子解释混料设计。 例3考虑两种牌号的汽油a 与b 的混料试验,所要考察的特性指标是每加仑汽油的行 驶里程。假定试验所使用的卡车、司机水平及道路情况完全相同。再假定以前曾进行过试验,在 完全相同的条件下,用一加仑的汽油a 平均行驶1 3 公里,用一加仑的汽油b 平均行驶7 公 里。现在,如先用一加仑汽油4 开动汽车,然后再用一加仑汽油b 开动汽车,我们则期望用 这两加仑的汽油行驶1 3 + 7 = 2 0 公里或者说可以期望每加仑汽油平均行驶2 0 2 = 1 0 公里。自 然,我们会想知道,如果我们不是分别用两种汽油开动汽车,而是将两种汽油按一定的比例混合, 如:a :b = 0 5 :0 5 后,用混合汽油开动汽车。那么每加仑汽油的平均行驶公里数是否能高 于1 0 公里,力口仑- 汽油a 与b 的每加仑平均行驶公里数。试验者进行了5 次试验。5 次试验的 数据如表2 1 。从表2 1 中的数据可以看出,混合汽油的平均行驶公里数1 2 公里力口仑高于分 别使用两种汽油的平均行驶公里数1 0 公里,加仑。这里试验采用的混合比例是0 5 :0 5 ,自然我 们会问,采用其它比例混合是否会得到更好的效果。这里我们考察的是平均行驶公里数,因此最 终的结果至于两种汽油在混合汽油中所占的比例有关,而与其具体的数量无关。 从这个例子我们可以归纳出一般混料设计问题的共同特征:“试验所度量的响应只是混料中 各种配料的比例或成数的函数,而与混料的总量无关”。设z = 扛1 ,z 2 ,) 表示5 种配料 试验中各种配料所占的比例。也即,试验设计中的影响因素。表示试验响应,则混料试验响应 与因素关系模型可以表示为 可= ,( z 1 ,z 2 ,z 。) + e( 2 1 ) 其中因素z 满足约束条件 一产1 ( 2 - 2 )、二- 二, io 盈1 ,i = 1 ,2 ,s 函数,属于已知的函数类( 例如二次可微,可积,或者多项式类) ,。但未知。满足约束条件( 2 2 ) 是混料试验设计问题中最基本的约束条件。在有些混料问题中,由于实际问题和工艺条件的要 求,除了上述基本约束条件的限制外,还要附加上一些其它的约束条件( 将在后面章节讨论) 。 博士擘位论文 d 0 c 丁 o r a ld i s s e r t a l l o 咐 表2 1 :5 次试验的平均行驶公里数 总平均数1 2 o o 木本表摘自芡颖男( 1 9 9 0 ) 一书表1 1 。 相对于一般试验,混料试验多了约束条件( 2 2 ) 。因此,其试验区域不再是规则的立方体。 根据基本的几何知识,我们不难知道,混料试验的试验区域为标准单纯形。如3 个影响因素的混 料试验( 即,s = 3 ) ,则试验区域为如图2 1 所示的2 一标准单纯形。同理,若试验因素数为s ,则 试验区域为( s 一1 ) 标准单纯形。 因此,一般混料试验设计( 或无限制条件混料设计) 就是要在( s 一1 ) 一标准单纯形内进行布 点。从而收集到足够的信息进行建模。下面简略介绍几种现有的,使用较广的混料设计方法( 详 细介绍见关颖男( 1 9 9 0 ) 或c o 订l e l l ( 2 0 0 2 ) ) 。 2 1 1 单纯形格子点设计 被誉为混料设计奠基性方法之一的单纯形格子点设计( s i l 卫p l e x - l a t t i c ed e s i g n ) 是由 s c h 酣陀在1 9 5 8 1 9 6 5 期间提出并发展起来的。为了更好的拟合建模中采用的多项式模型,很 自然的设计想法就是在试验区域内尽可能的均匀、规律的布点。而单纯形格子点显然满足这个 条件。因此,称这种针对给定的混料规范多项式模型( 将限制条件z 1 + z 2 + + = 1 乘 以完全多项式中的某些项,化简后得到的适合混料试验的回归模型被称为混料规范多项式模型 (
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三年级上册信息技术教学设计-7.装扮美丽的花园∣粤教版
- 2024年届九年级历史上册 第15课 决定美利坚命运的内战说课稿1 北师大版
- 单元学习总结教学设计-2025-2026学年高中信息技术教科版2019选择性必修4 人工智能初步-教科版2019
- 2025年中考数学试题分类汇编:勾股定理与翻折、动点、最值问题(10大考点40题) (第1期)解析版
- (2025秋新版)苏教版科学三年级上册全册教案2
- 小学科学新教科版三年级上册全册教案(2025秋新版)
- 神奇的泡泡 教学设计-2023-2024学年小学生科学课后服务拓展
- 人教版 2019年第二学期高中物理必修2 7.8 机械能守恒定律 教学设计
- 2025年中考地理试题分类汇编:西半球的地区和国家、极地地区、地区综合(第1期)解析版
- 本章复习与测试教学设计-2025-2026学年初中数学鲁教版五四制2012六年级下册-鲁教版五四制2012
- 《通信网络基础》课件
- 物管物业交接验收明细表格(全)模板
- 产后出血-教学查房
- 体育开学第一课
- 人音版小学四年级音乐上册教案全册
- 车主与货车驾驶员合同范本
- 绿化养护服务投标方案(技术标)
- 护理专业实训室设备管理制度
- TB-T 3356-2021铁路隧道锚杆-PDF解密
- 2024届陕西省渭南市临渭区小升初语文重难点模拟卷含答案
- 配电自动化终端缺陷处理
评论
0/150
提交评论