(概率论与数理统计专业论文)因子水平带误差设计的d最优性.pdf_第1页
(概率论与数理统计专业论文)因子水平带误差设计的d最优性.pdf_第2页
(概率论与数理统计专业论文)因子水平带误差设计的d最优性.pdf_第3页
(概率论与数理统计专业论文)因子水平带误差设计的d最优性.pdf_第4页
(概率论与数理统计专业论文)因子水平带误差设计的d最优性.pdf_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 在实际生产和生活中,我们在做试验的时候,经常会遇到因子水平不能准确 控制的情形。若此时采用因子水平存在误差的设计,相应的设计阵表现如何呢? 本文从试验设计出发,比较和讨论了因子水平在存在误差和不存在误差时的 差异。在正交设计这个背景下,我们将试验设计中遇到的设计阵择优问题用线性 模型中的d 最优准则来衡量。我们从简单到复杂地讨论了d 最优准则在试验设计 中的应用,并得到了如下的结论:当因子水平无法准确控制时,在平均意义下,因 子水平存在误差的设计阵,在d 最优准则下的效果要比因子水平不存在误差的设 计阵好。 关键词:正交设计线性模型d 最优准则 a b s t r a c t a b s t r a c t w h e nw ed oe x p e r i m e n t si no u r d a i l yl i v e s ,w eu s u a l l ym e e tt h i sk i n do fs i t u a t i o n t h a tt h ef a c t o rl e v e l sa r eh a r dt oc o n t r 0 1 i fw eu s ea d e s i g nw i t he r r o r si nt h ef a c t o r l e v e l s ,h o ww i l lt h ec o r r e s p o n d i n gd e s i g nm a t r i xp e r f o r m ? i nt h i sp a p e r , w ed i s c u s st h ed i f f e r e n c e sb e t w e e nt h es i t u a t i o n t h a tt h e r ee x i s te r r o r s i nt h ef a c t o rl e v e l sa n dt h ec a s ew i t h o u te r r o r si nt h ef a c t o rl e v e l s i nt h e b a c k g r o u n d o fo r t h o g o n a ld e s i g n ,w eu s et h ed o p t i m a lc r i t e r i o ni nt h el i n e a rm o d e lt h e o r yt od e a l w i t ht h ep r o b l e mt h a th o wt os e l e c tt h ed e s i g nm a t r i xw em e ti nt h e e x p e r i m e n t a ld e s i g n w ed i s c u s st h ea p p l i c a t i o no fdo p t i m a lc r i t e r i o ni nt h ee x p e r i m e n t a ld e s i g nf r o m s i m p l et oc o m p l e x a n dw eg e t 廿1 ef o l l o w i n gc o n c l u s i o nt h a ti ft h ef a c t o rl e v e l sc a nn o t b ea c c u r a t e l y c o n t r o l l e d ,c o m p a r i n gw i t ht h ed e s i g nm a t r i xw i t h o u te r r o r si nt h ef a c t o r l e v e l s ,w eg e tab e t t e rr e s u l to ft h ed e s i g nm a t r i xw h e nt h e r ea r ee r r o r si nt h ef a c t o r l e v e l sb a s e do nt h ed o p t i m a lc r i t e r i o nu n d e rt h ea v e r a g em e a n i n g k e y w o r d s :o r t h o g o n a ld e s i g n l i n e a rm o d e ld o p t i m a lc r i t e r i o n 南开大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行 研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文 的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的 作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集 体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任 由本人承担。 学位论文作者签名:勿鹏 争r 朋日 南开大学学位论文电子版授权使用协议 ( 请将此协议书装订于论文首页) 论文 系本人在 南开大学工作和学习期间创作完成的作品,并已通过论文答辩。 本人系本作品的唯一作者( 第一作者) ,即著作权人。现本人同意将本作品收 录于“南开大学博硕士学位论文全文数据库 。本人承诺:已提交的学位论文电子 版与印刷版论文的内容一致,如因不同而引起学术声誉上的损失由本人自负。 本人完全了解笪直珏太堂图里焦苤王堡查! 焦旦堂鱼诠塞的筐堡盘选! 同意 南开大学图书馆在下述范围内免费使用本人作品的电子版: 本作品呈交当年,在校园网上提供论文目录检索、文摘浏览以及论文全文部分 浏览服务( 论文前1 6 页) 。公开级学位论文全文电子版于提交1 年后,在校园网上允 许读者浏览并下载全文。 注:本协议书对于“非公开学位论文”在保密期限过后同样适用。 院系所名称: 作者签名: 学号: 日期:年月 日 第一章简介 第一章简介 在大多数试验设计中,考虑线性模型的时候,我们考虑的通常是因变量带有 误差的情形,而很少考虑自变量存在误差的情况,这与实际情况是有出入的。当 我们做试验的时候因子水平和试验结果都会出现一些难以避免的误差,就拿因子 水平来说,当我们测量的工具本身读取时的误差以及一些系统误差都是不可避免 的( 后文有交代) 。而在理论情形下,我们做设计的时候通常仅仅考虑的是因子水 平的期望值( 目标值) ,这会对实际情形造成怎样的影响呢? 在线性模型= x p + e 中,总是假设因变量可存在误差( e 服从某个分布) ,但 当我们用广义的最小二乘法估计系数p 时所用的公式( x 7 x ) 一x 7 中也存在自变量 的影响,而若不考虑x 本身所带的误差,所求估计肯定会产生偏差。本文从另一 个方面考虑的d 一最优( 例如,c o r w i n ( 1 9 7 3 ) ,t o b y ( 1 9 7 4 ) ,c o o ka n dc h r i s t o p h e r ( 1 9 8 0 ) ,w e n d y , e d w a r da n dj e 恐r y ( 1 9 9 8 ) ,j a m ia n db y u n g ( 2 0 0 6 ,2 0 0 7 ) ,b r a d l e y ( 2 0 0 9 ) ) 也涉及到这方面的问题,所以考虑带误差的因子水平是十分必要的。 而在实际情形中,由于大型试验的存在,如果我们对每一个因子水平都加一 个误差惩罚,在计算时就会产生一些很复杂的结果,很大程度上也不会产生有用 的结果。我们这里从另一个角度出发,先考虑简单的情形,即对同一个因子水平 添加一个相同的误差,这样做也是有道理的,也就是说在不同的因子之间存在不 同的误差,因子内部水平之间可看作在可控制范围内的存在相同误差。当我们考 虑大型试验的时候,我们引用b o x ( 1 9 6 3 ) 的一些结果,对不同因子不同误差的情况 做出解释。 第二章正交设计 第二章正交设计 弟一早止父阪丌 2 1 外延层生长试验 在许多科学研究中,我们感兴趣的是同时研究两个或者两个以上的试验因子 的主效应或者交互效应,因子设计是研究这类试验的最常用的工具。它们包括特 殊情形的两因子试验,以及一般情形的多个因子包含多个水平的试验。本文主要 考虑的是k 个因子的两水平正交因子设计。 我们首先来考虑一个有四个因子,每个因子包含两个水平的晶体外延层生长 试验: 生产集成电路期间的一个步骤是在抛光的硅晶片上产生一个外延层。晶片镶 在一个称为感应器的六面柱体上,这个六面柱体在一个钟形容器里旋转,并通过 其顶部的喷咀喷入化学蒸汽并加热,这个过程持续到外延层生长到所要求的厚 度。 在外延层生长过程中,假定有四个试验因子要进行研究:感应旋转方法、喷 咀位置、沉积温度和沉积时间( 分别记为a ,b ,c 和d ) ,其中每个因子有两个水平, 因子和水平如下表: 表2 1晶体外延层生长试验的因子和水平 水平 因子 jl 感应旋转方法连续震荡 喷咀位置 26 沉积温度( o c ) 1 2 1 01 2 2 0 沉积时间低高 在实际的试验过程中,我们的目的是通过多次试验得到一个最优的因子水平 组合来达到我们所要求的外延层厚度。实际中具体的设计阵和试验结果数据见 表2 2 。 这样我们就得到了一个四因子两水平,1 6 个处理的因子设计。再通过一个二 2 第二章正交设计 表2 2 晶体外延层生长试验的设计阵和厚度数据 因子 试验号abc d 厚度( p m ) l - l - 1 4 5 0 6 1 4 1 5 31 4 1 3 41 4 3 3 91 4 9 5 3 1 5 4 5 5 2 1 2 8 8 6 1 2 9 6 31 3 6 6 9 1 3 8 6 91 4 1 4 51 4 0 0 7 3一一+ +1 3 9 2 61 4 0 5 21 4 3 9 21 4 4 2 8 1 3 5 6 81 5 0 7 4 4 上 1 3 7 5 81 3 9 9 21 4 8 0 81 3 5 5 41 4 2 8 31 3 9 0 4 5 一+一+1 4 6 2 9 1 3 9 4 0 1 4 4 6 61 4 5 3 81 5 2 8115 0 4 6 6 上 1 4 0 5 91 3 9 8 9 1 3 6 6 61 4 7 0 61 3 8 6 31 3 3 5 7 7一+1 3 8 0 0 1 3 8 9 61 4 8 8 71 4 9 0 21 4 4 6 11 4 4 5 4 8 一+ 一1 3 7 0 7 1 3 6 2 31 4 2 1 01 4 0 4 21 4 8 8 11 4 3 7 8 9 + 一一+1 5 0 5 01 4 3 6 1 1 3 9 1 61 4 4 3 1 1 4 9 6 81 5 2 9 4 1 0 l 1 4 2 4 91 3 9 0 01 3 0 6 5 1 3 1 4 31 3 7 0 81 4 2 5 5 l l + 一+1 3 3 2 71 3 4 5 7 1 4 3 6 81 4 4 0 51 3 9 3 2 1 3 5 5 2 1 2 + 一+一 1 3 6 0 51 3 1 9 01 3 6 9 51 4 2 5 9 1 4 4 2 81 4 2 2 3 1 3+一+1 4 2 7 41 3 9 0 41 4 3 1 71 4 7 5 41 5 1 8 8 1 4 9 2 3 1 4+一 一 1 3 。7 7 51 4 5 8 61 4 3 7 91 3 7 7 5 1 3 3 8 2 1 3 。3 8 2 1 5+1 3 7 2 31 3 9 1 41 4 9 1 31 4 8 0 8 1 4 4 6 9 1 3 9 7 3 1 6+ 一 1 4 0 3 11 4 4 6 71 4 6 7 51 4 2 5 2 1 3 6 5 8 1 3 5 7 8 次损失函数来确定哪一组是最优的因子水平组合【1 】,那么什么样的设计是正交设 计呢? 我们这里提到的设计是正交设计吗? 2 2 正交设计和正交表 正交设计 以2 1 中提到的外延层生长试验为例,如果每个因子的水平出现的次数相同, 那么设计是均衡的,如果任取两个因子,所有因子水平组合出现的次数相同,那 么我们称这两个因子是正交的,如果设计中所有的的因子对都是正交的,那么称 设计是正交的。 一个2 知完全因子设计由尼个2 水平因子的所有2 詹个水平组合组成,同理,一 个s 知完全因子设计由老个s 水平因子的所有s 凳个水平组合组成。因子的一个水平组 合称为一个处理,也称为一个试验号。表2 1 和表2 2 中的一和+ 分别表示因子的两 个水平。对表2 2 中四个因子a ,b ,c 和d ,结合以上的定义,我们可以得出,上 述2 1 中的外延层生长试验是一个2 4 完全正交设计的一部分,四个因子之间都是 三l 第二章正交设计 表2 3o a ( 8 ,2 r ) 对称正交表 试验号 121 231 32 31 2 3 1一 一 + 一 + 一 2 一一+一一+ 3一+一一+一+ 4 一+ 一 +一+一 5+一 一一 一+ 6 +一一+一一 7 +一一一一 8+ 表2 4o a ( 8 ,2 a 4 1 ) t b 对称正交表 试验号 a31 32 31 2 3 l0 一 +一 20+ 一一 + 31 一+一+ 41 +一+一 52一 一 + 62 +一一 73 一一一一 83 + 正交的。因为四个组合( 一,一) ,( 一,+ ) ,( + ,一) 和( + ,+ ) 在任意因子对之中都出现4 次。 正交表 一个强度为t 的正交表o a ( n ,s ? 1 8 , y ,亡) 是一个n m 矩阵,m = m l + + ,其中m 。个列有8 i ( 2 ) 个符号或者水平,使得对任t 个列,所有可能的符号组 合在设计阵中出现的次数相同。 当所有因子有相同的水平数时,称这类设计表为对称正交表。当,y 1 时,称 它们为非对称正交表,分别见表2 3 和表2 4 中的例子。 通过上面的讨论,我们了解了正交设计的一些基本情况。接下来我们要做的 就是通过给定的一个正交设计来分析试验因子与试验结果的相互联系,我们通常 4 第二章正交设计 做的是通过给定的模型来分析两者之间的关系,常用的有线性模型,以及二次模 型,由于三次或者高次的模型实际解释起来的困难性,所以很少用到高次的情形, 本文主要以线性模型为例来分析相关结果。 5 第三章线性模型和d 最优准则 第三章线性模型和d 最优准则 3 1 线性模型 试验数据常可以用一般线性模型【2 】来建模。假设响应秒与p 个变量z 1 ,却有 如下关系: y = 阮+ 风z l + + 岛+ e , ( 3 1 ) 其中e 是模型的随机部分,并假设其服从均值为0 ,方差为盯2 的正态分布,即e n ( o ,盯2 ) 。因为e 服从正态分布,所以可也服从正态分布,_ 且v a r ( y ) = 仃2 。模型的 结构部分为: e ( u ) = 岛+ 历z l + + 岛勖- 4 - e ( e ) = 风+ 风z 1 + + 戽唧, 这里,e ( 可) 是其回归系数岛,j = 1 ,p 的线性函数。 如果在试验中有个观测值,则模型取以下形式: y i = 岛4 - 尻x i l + + p p x i p + 龟,i = 1 , ( 3 2 ) 其中犰是第i 个响应值,兢1 ,z i p 为对应的p 个变量的取值。写成矩阵的形式如 下: y = x p + e , ( 3 3 ) 其中,y = ( y l ,y n ) 7 是n x l 的响应向量,x 是n p 的设计矩阵,p = ( 岛,历,岛) 7 是p - 4 - 1 ) 1 回归系数向量,e = ( e 1 ,勺) 7 是n 1 误差向量模型中未知参数 是回归系数p 以及误差方差伊2 ,因此,收集试验数据的目的就是对这些参数作估 计和推断,以及对求得的模型结果进行可行性的分析。要估计p ,一般用最小二乘 估计( l s e ) ( 记为p ) 最小化下面的量: 篓1 ( 轨一( 风+ 风既1 + + 体。咖) ) 2 , 用矩阵表示即为: ( 可一x p ) 7 一x z ) , 6 第三章线性模型和d 最优准则 也就是说使响应变量与拟合向量x p 的平方距离达到最小。 在拟合模型时,我们想知道是否任意的变量( 回归元,预测元或协变量) 都有 解释功效。若零假设: 凰:尻= = 岛= 0 , 成立,那么任一变量均无解释功效。要检验这个零假设,人们需要评价在响应数 据的总变差中,相对于拟合模型后的剩余变差( 其中包含残差中的) 来说,有多少 可由模型来解释。 而对于0 2 来说,它的估计值通常通过均方误差来得到,以盯2 来表示即为: 仃2 = ( y x p ) 7 ( 可一x 夕) ( 一p 一1 ) , 这样我们就得到了需要估计的两种参数,对于参数的检验问题,可参照【2 】。这种 建模的方法是通过给定的数据来建模的,那我们是不是可以事先通过理论模型得 到一些好的模型呢? 3 2 最优设计 设计阵x 在线性模型的统计推断中起着重要的作用,几乎所有的统计推断结 果都与x 的取值有密切的关系。我们可以在试验前适当选择设计试验点,使设计 阵x 表现出某种优良的性质,这就是所谓的最优设计( p a n o sa n dd o u g l a s s ( 2 0 0 0 ) , m o e r b e e k ( 2 0 0 5 ) ) 。它是尉咖,- 于1 9 5 9 年首先提出来的。 对给定的理论线性模型 y = z 7 p + e , ( 3 4 ) 其中z 7 = ( z ,唧) ,p 7 = ( 风,岛) 设自变量z 的取值域( 试验区域) 为d ,从 中任取n 个点z ( 1 ) ,z ( n ) ,在这仡个点上进行试验得到礼个观测值y = ( y l ,) , 则由( 3 4 ) 我们得到一个线性模型 y = x p + e ,( 3 5 ) 其中设计阵x = ( 。( 1 ) ,z ( 他) ) 7 。所谓的设计问题就是研究如何在d 中选取n 个 点z ( 1 ) ,z ( n ) ,使得设计阵x = ( z ( 1 ) ,茁( n ) ) 7 ( 要求x 是行满秩) 具有某些所要 求的性质。这里所说的最优问题就是找到一个x 使得可的l s 估计x p 具有某些优 良性。 7 第三章线性模型和d 最优准则 d 最优设计准则 根据3 1 中的线性模型理论,若存在,使得 i ( 硒) l = r a i ni ( 形) , ( 3 6 ) 成立,则称x d 为d 最优。这里彤指的是试验区域d 上所有礼个试验点的全组合,若 任取。形中的一个组合记为x ,则( x ) = ( x 7 x ) 。 因为参的广义方差为盯2 1 ( x ) i ,= ( x 7 x ) ,所以d 最优准则也称为广义 方差最小准则。若r k ( x ) = p ,则( 3 6 ) n - - j 表示为 i i = m a xi 彤7 s r l ( 3 7 ) 最优设计准则还有诸如4 最优( w o n ga n dj o s e p h ( 1 9 9 4 ) ) ,e 最优( m o r g a n aa n db r i a n ( 2 0 0 7 ) ) 等等,都是在线性模型中经常采用的最优性准则。由于在这两种准则中都 要求特征值,而我们下面所要提及的矩阵中包含有一些未知的变量,对求特征值 有一定的局限性,所以我们仅用d 最优的准则来探讨我们所要说的因子水平带误 差的设计的优缺性。 8 第四章因子水平带误差的设计 第四章因子水平带误差的设计 4 1 因子水平带误差的正交设计 我们首先考虑试验设计中一种比较简单的情形,以下面的2 3 完全因子设计为 例,设计阵为: m = 设计阵中的一1 和1 分别代表因子的两个水平的期望值,在两水平设计中,我们 用一1 和1 表示因子水平的时候,设计阵是否正交,只要考虑一般情形下的向量正 交情形即可。显然上述设计阵是正交的。但在实际中我们很难保证每次做试验的 时候,所测量到的因子水平正好等于期望值。以外延层晶体生长试验为例,其中 的沉积温度和沉积时间两个变量在测量的时候就很难保证每一次的测量结果都是 我们要的准确值,那么实际情况是怎样的呢? 我们考虑在每一个因子水平后面加一个误差,首先考虑对同一个因子加一个 相同的误差( d r a p e ra n db e g g s ( 1 9 7 1 ) ) ,这么做是有道理的,也就是说在不同的因 子之间存在不同的误差,因子内部水平之间可看作在可控制范围内存在相同误差, 9 一 一 一 一 l 1 1 上1 1上1上1上1 一 一 一 一 1 1 工1 上1 上1 1 1 上1 工 1 一 一 一 一 1 1上1上1工1上1上1_ 1 一 一 一 一 1 1 上1 上1 工 1 1 上1 工 1 一 一 一 一 1 1 1 1 - 1 1 1 1 11 一 一 一 一 1 1 1 1 1 - 1 1 工1 一 一 一 一 第四章因子水平带误差的设计 那么上述设计阵m 就变成了: m 7 1 + e 11 + e 2 1 + e 11 + e 2 1 + e 11 - i - e 2 1 + e 11 + e 2 1 + e 1 1 + e 2 1 + e 11 + e 2 l + e l1 + e 2 1 - i - e 1 1 + e 2 1 + e 3 1 - 4 - e 3 1 + e 3 1 - i - c 3 1 + e 3 1 - i - e 3 1 + e 3 1 + e 3 1 - i - e 4 1 - i - e 4 1 + e 4 1 + c 4 1 + e 4 1 + e 4 1 + e 4 1 - i - e 4 1 + e 5 1 + c 5 1 - i - e 5 一l + e 5 1 + e 5 1 - i - e 5 一l + 5 1 + e 5 1 + e 6 1 + e 6 1 + e 6 1 + e 6 1 + e 6 1 + e 6 1 + e 6 1 - i - e 6 1 + e 7 1 + e 7 1 - i - e 7 1 + e 7 1 - i - e 7 1 + 7 1 + e 7 1 - i - e 7 其中,龟一n ( o ,盯2 ) ,i = 1 ,7 。那么这个设计阵是不是正交的呢? 我们任取其 中的两列,不妨取前两列。做两列之间的对应量的乘积之和, r = 釜。蟛。蟛2 , 对上述结果t 求期望得到,e ( r ) = 0 。所以,我们可以近似的看作设计阵m 7 仍然 是正交的。这种情形我们称之为情形i 。 我们再考虑更一般的情形,相应设计阵如下: m “= - 1 + e l l - 1 + e 2 1 - 1 + e 3 1 - 1 + e 4 1 1 + e 5 1 1 + e 6 1 1 - i - e 7 1 1 + e 8 1 - 1 + e 1 2 - 1 + e 2 2 i + e 3 2 1 + e 4 2 - 1 + e 5 2 - 1 + e 6 2 i - i - e 7 2 1 + e 8 2 - - i + 5 1 3 1 - 4 - e 2 3 - 1 + e 3 3 1 + e 4 3 - 1 + e 5 3 1 + e 6 3 - 1 + e 7 3 1 + e 8 3 1 + e 1 4 1 + e 2 4 - - 1 - i - e 3 4 1 + e 4 4 - 1 - i - e 5 4 - - 1 + e 6 4 1 + e 7 4 1 + e 8 4 1 + e 1 5 - 1 + e 2 5 1 + e 3 5 - 1 + e 4 5 - 1 + e 5 5 1 + e 6 5 - 1 + e 7 5 1 + e 8 5 1 + e 1 6 - 1 - i - e 2 6 - 1 + e 3 6 1 + e 4 6 1 + e 5 6 - 1 + e 6 6 - 1 + e 7 6 1 + e 8 6 - 1 + e 1 7 1 - i - e 2 7 1 + e 3 7 - 1 + q 7 1 - t - e 5 7 - 1 + e 6 7 - 1 + e 7 7 i - i - e 8 7 这里我们对每个因子的每次试验水平都加一个独立的误差,并且一n ( 0 ,盯2 ) ,i = 1 ,8 ;j = 1 ,7 。和情形i 类似,我们称这种情形为情形。类似地, r = ;:1 。_ m 。j h1 t 。, 4 弦 并且仍有e ( p ) = 0 ,我们仍然可以近似的看作设计阵拶是正交的。 所以我们有理由相信对任意的理论正交的设计阵,我们对每个因子添加一 个0 均值,方差为盯2 的误差变量之后,设计阵仍然是正交的。那么对我们得到的这 些正交的设计阵以及原来的设计阵,它们的d 最优性如何呢? 1 0 第四章因子水平带误差的设计 4 2 理论与实际模型的d 最优性 按一般的情形而言,我们会想当然的认为,理论的设计阵有更好的d 最优性, 那么实际情况是如此吗? 我们从最简单的特殊情形2 2 完全因子设计考虑。 ( i ) 理论的设计阵如下: 此时我们有, 1 。:f 一1 1 _ | i d 7 d i = 4 3 。 ( i i ) 在我们提到的情形i 的情况下,得到的设计阵为: d1= 此时得到的行列式结果为: 求期望得到: d i d l i = 4 3 + 4 3 ( e 一e ;+ ) , e ( d i d l ) = 4 3 ( 1 + 仃2 ) 。 ( i i i ) 再来求我们得到的情形i i 的情况下的设计阵: d2= 、lili, 1 1 上1 1 一 一 1 1 1 1 一 一 、lil, 彩韶船韶+ + + + 1 1 1 1 一 一 眈q 钇钇 + + + + 1 1工1上1 一 一 n 臼n n+ 十+ + 1 1 1 上1 一 一 、llll, 以。如以+ + + + 1 上1 1 上1 一 一 2 2 2 2以彩舒倒+ + + + ,上1 1 上1 一 一以彩彩“+ + + + 1上1上1 1 一 一 第四章因子水平带误差的设计 由于这种类型在求行列式的时候情况比较复杂,这里就不给出具体的式子结 果( 详情见附录) ,我们只给出结果。 e ( i d :d 2 1 ) = 4 3 + 6 4 a 6 + 1 9 2 0 - a + 9 6 c r 2 通过比较三种情形得到的结果我们容易看出,由于d 最优准则比较的是所求 得的三个行列式的值,所以显然情形i i 在d 最优准则下是三种情形下最优的情况, 而理论情况却在d 最优准则下是最差的。这其实也可以解释为越接近真实的情形, 我们的设计阵其实更具有某些优良的性质。而通过求期望后得到的理论模型,反 而由于偏离了实际情况而使得设计阵丧失了某些性质。 我们不妨再来看看2 3 全设计的情形。 ( i ) 拿理论设计阵来说,设计阵如下: m = 在d 最优准则下: i m 7 m i = 8 7 。 ( i i ) 而情形i 的情况下,设计阵尬为: m 1 = 这时的结果为: 一1 + c 2 1 + e 2 1 + 2 1 + 5 2 1 + e 2 1 + e 2 1 + e 2 1 + e 2 一l + c 3 1 + e 3 1 十e 3 l + c 3 1 + e 3 1 + e 3 1 + e 3 1 + e 3 l + e 4 1 + c 4 1 + c 4 1 + c 4 1 + c 4 1 + c 4 1 + e 4 1 + e 4 1 2 1 + e 5 1 + e 5 1 + e 5 1 + e 5 1 + e 5 1 + e 5 1 + e 5 1 + e 5 1 + e 6 1 + e 6 1 + e 6 1 + e 6 1 + e 6 1 + e 6 一l + e 6 1 + e 6 1 + e 7 1 + e 7 1 + e 7 1 + e 7 1 + e 7 1 + e 7 1 + e 7 1 + e 7 一 一 一 一 1 1_1上1 1 1 1 上1 一 一 一 一 1 1上1i1工1上1上1上 1 一 一 一 一 1 1 1上1_1上1上1工 1 一 一 一 一 1 1_1上1上1 1 上1 1 一 一 一 一 1 1 1 1 i 1 1 1 1 1 _ 1 一 一 一 一 1 1上1上1上1 1 1 1 一 一 一 一 11,11111 1 e e e e e e e e + + + + + + + + 1 1 上1 上1 1 1 1 1 1 一 一 一 一 第四章因子水平带误差的设计 而 鸠尬l = 8 7 ( 1 + ;一;+ e ;一i + e ;一e :+ ;) , e i 媚m i i = 8 7 ( 1 + 盯2 ) 。 ( i i i ) 而对于情形情况来说,设计阵m 2 为: m 2 = - - i + e 1 2 - - i + e 2 2 1 + e 3 2 i + e 4 2 - 1 + e 5 2 - 1 + e 6 2 i + e 7 2 1 + 8 2 - - 1 + e 1 3 1 + 2 3 - i + e 3 3 i + e 4 3 - 1 + e 5 3 i + e 6 3 - i + e 7 3 i + 8 3 i + e 1 4 i + e 2 4 - - i + 3 4 1 + e “ - - 1 + e 5 4 - i + e 6 4 i + e 7 4 1 + c 8 4 1 + e 1 5 - i + e 2 5 1 + e 3 5 - i + e 4 5 - - 1 + e 5 5 1 + e 6 5 - 1 + e 7 5 i + e 8 5 由于这种情形过于复杂,这里就不给出结果了,但通过上面的比较我们有理 由相信情形i i 在这三种情况下仍然是d 最优的,其次情形i 显然l l - , ( i ) 中的结果要好, 理论情形下的设计阵仍然是三种情况里最差的。 定理4 1 对给定的2 知全设计( = 2 k ) ,假设设计阵为x ,那么对理论模型y = x p + e 应用d 最优准则我们有: x 7 x l = ( 2 蠡) 2 。= n , 而对情形,的情况,假设设计阵为墨,我们对实际模型秒= 墨夕+ 应用d 最优准 则有: e ( i x i x l1 ) = n n - 1 ( 1 + 盯2 ) 通过上面的讨论,运用数学归纳法我们很容易得到上面的定理是成立的。 而对于情形i i 的情况,由于设计阵涉及到的参数变量较多,计算起来比较复 杂,这里就不给出具体结果了,但我们可以通过下面的一些结果给出更一般的结 论。 1 3 7 7 7 7 7 7 7 7 1 2 3 4 5 6 7 8 e e e e e e e + + + + + + + + 1 1,上1上1 1 1 上1 一 一 一 一 埔 ;5 诣 i 弓 宕 8 e e e e e e e + + + + + + + + 1 1 1 1上1上1上1 1 l 一 一 一 一 1 1 1 1 1 1 1 1 1 1 1 1 1 2 3 4 5 6 7 8 e e e e e e e + + + + + + + + 1 1 1 1 1 1 1 1 一 一 一 一 第四章因子水平带误差的设计 4 3 一般情形下的结果 对给定的k 个因子,个处理,首先考虑n = 1 的情形,此时,k 个因子分别 用x l ,z 知表示,观测值变量用y 表示,令 e ( y ) = 叩= 歹( z 1 ,z 南) = ,( z ) ,( 4 1 ) 这里的k 个因子包括所有已知和未知的影响叩的因子,我们可以分为以下两种类 型: ( i ) k 个重要因子,包括我们通常说的主效应和纯净的二因子交互效应; ( i i ) 乘u 余的k k 个重要性未知的因子效应。 那么当我们考虑 1 的情形时,完全可以利用上述的情形,假设第u 个处理 的因子水平分别是x 幽x u l ,。u k ,分别拥有期望值乳1 ,乳2 ,缸七,如果z 饿= 缸,我们就说第i 个因子的第u 次处理没有校准误差,校准误差有两方面的原因, 第一个就是测量工具本身引起的误差,第二个用系统误差来解释,比如当我们测 量水蒸气的温度时,由于本身所带的辐射效应很可能导致测量到的温度和实际的 温度不符。 而通常这种校准误差是普遍存在的,并且我们可以用下面的关系式来表示两 者之间的关系: 白= 咖( x l ,x 2 ,x k ) o = 1 ,尼) , ( 4 2 ) 其中已表示第j 个因子水平的校准误差,表示定义关系。这个关系式通常是未知 的,而在实际情形中,我们考虑的一般都是前k 个重要的因子,而不是整个的x 或 者。上述校准函数并不能改变误差的起因,比如在一个特定的反应堆中做试验, 我们只能尽可能的提高反应堆的效用而不能改变反应堆本身固有的某些误差。考 虑我们本文中所考虑的线性情形,校准函数通常表示如下: 岛= x j + 白,( c j 是常数) 假设在第u 个处理时的观测值误差为e u o = 纨一吼,第i 个因子在第u 个处理的 1 4 第四章因子水平带误差的设计 误差为e u i = z 讲一厶t ,那么模型可写作: 钆= ,( 矗1 + 气1 ,5 2 + e u 2 ,& 膏+ 气七) + 气o , ( 4 3 ) 假设误差e u 0 ,气1 ,e 俄,e u k 独立同分布,并且: e ( ) = 0 ,e ( e 乞) = 盯2 其余处理的情形类似。 , 通过上式( 4 3 ) ,我们在试验因子x 的试验区域上得到了观测值可的一个线性 模型,表示如下: 彭= f ( x l ,x k ) = x 夕+ e 。 通常情况下我们考虑的是没有误差的情形,这里我们考虑带误差的情形,对第u 个 处理线性模型如下: 玑= ,( z u l ,。u k ) + e u o , 也就是 讥= 风+ 叁1 屈z 砸+ e u o , 或者 纨= 岛+ 警1 屈( 缸+ e 谢) + e u o , 即 钆= 岛+ 扛k1 屈缸+ 气, 气= 瓦+ e u 0 这里民= 仁k1 屈e u 。是因子水平误差的求和形式。 现在假设 如果我们令 锄= 白,d = k + 1 ,忌) ,( u = 1 ,) , 扁= 风+ 名k + 。岛白, 1 5 第四章因子水平带误差的设计 那么纨= 风+ 笔1 屈缸+ 气,变成 批= 磊+ 釜1 屈矗i + 气, 最后我们得到原始模型的线性模型 纨= f ( u l ,已k ) + 气 根据我们的假设气是第u 次处理的综合误差,并且 缸 e ( 气) = o ,y n r ( 气) = ( 1 + 群) 盯2 , i - - - - - 1 且对每个处理的情形类似,即对让= 1 ,上式都成立。 模型弛= ,( 乳1 ,已) + z u 和模型y u = ,( 矗1 ,已k ) + e u o 具有相同的形 式。不同之处在于纨= ,( 乳l ,乳k ) + c u o 忽略了x 本身的误差( 即因子水平本身 存在的误差) ,对误差项气和e u o ,在计算方差时得到的结果分别为( 1 + 警1 群) 仃2 和盯2 。 上述两种情形的线性模型分别可以看作是因子水平存在误差的情形和因子 水平不存在误差的情形,若不考虑误差项,我们通过上述两种完全相同模型,运 用d 最优准则得到的结果肯定是相同的。而由于实际试验中,我们要求误差尽可能 的小,也就是说要使( 1 + 注k ,厮) 盯2 尽可能的接近仃2 ,这不可避免的就要使得y u = ,( 缸1 ,已k ) + 气中的因子水平误差会产生变化,从而得到的d 最优结果也不可 能再和理论模型相同,而通过我们前面所讨论的结果,我们可以认定在因子水平 存在误差的情形下,在平均意义下,运用d 最优准则得到的结果要优于理论模型 的设计阵。但是,我们可以通过缩放因子水平误差使得( 1 + 矧k 群) 仃2 和i x 7 x l 达 到某种程度的平衡。 1 6 第五章结论 第五章结论 通过上面三个章节的讨论,我们可以得到一些实际中有用的结果,并不一定 理论上的模型都是最好的,要看从什么角度出发和考虑问题。当因子水平无法准 确选取时,实际模型由于具备了一些实际应用方面的各种因素,有时候反而对做 出的结果有更强的说服力,比如本文所介绍的有关d 最优准则在选择设计阵的时 候,显然要使得i x 7 x i 越大越好,我们此时很可能选的就是因子水平存在误差的设 计阵。而如果我们想要的仅仅是验证一些理论上的结果,这时理论模型反而是更 好的选择。再次,我们从误差方面分析,可以得到如果在d 最优的情形下,我们尽 可能的减少模型误差,能够使实际与理论模型建立更强的联系。甚至,如果我们舍 弃某些方面的要求,l :l 女n ,在第四章中提到的,如果不考虑( 1 - - i - 竺,所) 仃2 和仃2 的 差别,此时在d 最优准则下的结果完全可以认为是相同的。从另一个方面考虑,如 果我们同样舍弃了设计阵的某些优良性质,比如d 最优性,也可以使得实际模型 和理论模型在响应变量模型误差方面达到一致。如何把握这个度的问题,我们可 以进行更进一步的讨论。 1 7 参考文献 参考文献 【1 】张润楚,郑海涛,兰燕,艾明要,林怡,杨贵军译( 2 0 0 3 ) 试验设计与分析及参 数优化中国统计出版社 【2 】王松桂,史建红,尹素菊,吴密霞( 2 0 0 4 ) 线性模型引论科学出版社 【3 】北京大学数学系几何与代数研究室代数小组( 1 9 8 8 ) 高等代数高等教育出版 社 【4 】b o x ,g e e ( 1 9 6 3 ) t h ee f f e c to f e r r o ri nt h ef a c t o rl e v e l sa n de x p e r i m e n td e s i g n t e c h n o m e t r i c s5 ,2 4 7 2 6 2 5 】b r a d l e y , j ( 2 0 0 9 ) d - o p t i m a ld e s i g no fs p l i t - s p l i t - p l o te x p e r i m e n t s b i o m e t r i k a 9 6 6 7 - 8 2 【6 】c o o k ,r d a n dc h r i s t o p h e rj n ( 1 9 8 0 ) ac o m p a r i s o no fa l g o r i t h m sf o r c o n s t r u c t i n ge x a c td - o p t i m a ld e s i g n s t e c h n o m e t r i c s2 2 ,31 5 - 3 2 4 【7 】c o r w i n ,l a ( 1 9 7 3 ) s e q u e n c e sc o n v e r g i n gt od - o p t i m a ld e s i g n so fe x p e r i m e n t s t h ea n n a l so f s t a t i s t i c s1 ,3 4 2 - 3 5 2 【8 】d r a p e r , n 。r a n db e g g s ,w :j ( 1 9 7 1 ) e r r o r si nt h ef a c t o rl e v e l sa n de x p e r i m e n t d e s i g n a n n m a t h s t a t i s t 41 ,4 6 5 6 9 】j a m i ,k a n db y u n g ,r c ( 2 0 0 6 ) ad - o p t i m a ld e s i g na p p r o a c ht or o b u s td e s i g n u n d e rc o n s t r a i n t s :an e wd e s i g nf o rs i xs i g m at 0 0 1 i n t e r n a t i o n a lj o u r n a lo fs i x s i g m aa n dc o m p e t i t i v ea d v a n t a g e2 ,3 8 9 4 0 3 1 0 】j a m i ,k a n db y u n g ,r c ( 2 0 0 7 ) d e v e l p m e n to fad - o p t i m a lr o b u s td e s i g n m o d e lf o rr e s t r i c t e de x p e r i m e n t s i n t e r n a t i o n a lj o u r n a lo f l n d u s t r i a le n g i n e e r i n g 1 4 11 7 - 1 2 8 。 11 】k i e f e r , j c ( 19 5 9 ) o p t i m u me x p e r i m e n t a ld e s i g n s j o u r n a lo ft h er o y a ls t a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论