(概率论与数理统计专业论文)几种无重复试验的饱和析因设计分析方法的稳健性.pdf_第1页
(概率论与数理统计专业论文)几种无重复试验的饱和析因设计分析方法的稳健性.pdf_第2页
(概率论与数理统计专业论文)几种无重复试验的饱和析因设计分析方法的稳健性.pdf_第3页
(概率论与数理统计专业论文)几种无重复试验的饱和析因设计分析方法的稳健性.pdf_第4页
(概率论与数理统计专业论文)几种无重复试验的饱和析因设计分析方法的稳健性.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

(概率论与数理统计专业论文)几种无重复试验的饱和析因设计分析方法的稳健性.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

论文摘要 在工业应用的许多领域,由于无重复试验的饱和析因设计所需的 总试验次数减少,同时又可考察较多的因子,从而能节约大量的时间、 人力和物力,所以它正越来越受到欢迎。然而在分析这类数据时因为 无多余的自由度可用于估计误差方差,因而不能采用标准的方差分析 法。现在,已有一些用于分析饱和析因设计的数值分析方法,通常它 们假设试验指标服从正态分布,但是在实际情况来看试验指标并不总 是服从正态分布的,例如在可靠性试验中产品的寿命就通常服从威布 尔分布。本文采用蒙特卡洛方法模拟研究了五种典型的饱和析因设计 数值分析法在采用二水平析因设计时试验指标分别服从正态分布、指 数分布、威布尔分布下检验的势表现,并讨论了势与变异系数倒数之 间的关系。 关键词:饱和析因设计,稳健性,势,变异系数倒数 a b s t r a c t i n m a 郦i n d u s 缸i a la p p l i c a t i o n s ,u 甜e p l i c 如d 蠡l c t o r i a l d e s i g n s b e c o m em o r e 锄dm o r ep o p u l a r b e c a u s em e yn e e dl e s se x p e r i m e m sa i l d f o c u 5o nm o r ec o n t r a s t s ,t k yc a nb r i n g 黟e a tb e n e f i t n o d e g r e e so f f k e d o mj e rt oe s t i m a t et l l ee r r o rv a r i 如c ew h e nt h ed a t ao fm i sd e s i g n a r ea n a l y z e d ,s om es t a i l d a r da n o v a c a n tb eu s e d s o m em e m o d so f a n a i y z i n gu i 唧l i c a t e df a c t 嘶a ld e s i g n sh a v eb e e nu s e d 加p m c t i c es of a r u s u a l l yt h e ya s s u m e 廿l a tt 1 1 ee 职h e n tm d e x e sa r en o 胁a l l yd i s 由一b u t e d b u t i n f a c t 崃e x p e 幽e n t i n d e x e sa r en o ta l w a y s l i k e 也a t f o r 懿啪p 】e , t h el i v e so fp m d u c t sa r eo f 【e n 盘o ms o m ew e i b u l ld j s 仃i b 佣o n 抽n l e r e l i a b l ee x p e r i m e n t s t h i sp a p e rs t i l d i e sf i v er e p r e s e n t a “v em e t h o d so f a n a l y z i n gs 舢a t e du n r e p l i c a t e df a c t 州a 1d e s i 印so ni d 曲t i 聊n ga c t i v e c o n t r a s t sa n d 廿1 e i rt e s t sp 耐- o 舢a n c e 谢1 e nm ee x p 一m e n ti n d e x e s 戤 s e p a r a t e j yf o mn o m a jd i s t r i b u f j d n ,e x p o n e n t i a ld i s t r i b u t j d n 锄dw e i b u l l d j s t r 而u t j o n ,a n da 】s od j s c u s s e sm er e j a t i o nb e “v e e np o w e ra n dt h e i n v e r s eo fc o e 蕊c i e n to fv a i a t i o n b ym o n t ec a r l om e t h o d 计婶nt h e e x p e r i m e n 如s i 印j s 帆o - 1 e v e l 蠡c t o r i a id e s i g l l k e y w o r d s :s a n 玉r a t e d 蠡c t o r i a ld e s i 印s ,r o b u s m e s s ,p o w e r t h ei n v e r s eo f c o e f 王i c i e n to f v a r i a 石o n 学位论文独创性声明 本人所呈交的学位论文是我在导师的指导下进行的研究工作及 取得的研究成果据我所知,除文中已经注明引用的内容外,本论文 不包含其他个人已经发表或撰写过的研究成果对本文的研究做出重 要贡献的个人和集体,均已在文中作了明确说明并表示谢意 作者擀:蟀魄趔 学位论文授权使用声明 本人完全了解华东师范大学有关保留、使用学位论文的规定,学 校有权保留学位论文并向国家主管部门或其指定机构送交论文的电 子版和纸质版有权将学位论文用于非赢利目的的少量复制并允许论 文进入学校图书馆被查阅有权将学位论文的内容编入有关数据库进 行检索。有权将学位论文的标题和摘要汇编出版。保密的学位论文在 解密后适用本规定 学位论文作者獬:秘覆导师签名:仍锟 硼je j 够 华东师箍大学硕士论文几种无重复试验的饱和析因设计分析方法的稳健性 1 1 试验设计 第一章试验设计简分 目的在于回答个或几个经过精心构思的问题的实践活动称为试验,又称为 实验。一项试验要有明确的目的,即要明确要回答的问题,如: 为提高产品产量或质量而寻找最佳的或满意的工艺参数搭配: 为控制生产过程而寻求描述过程的数学模型; ,为开发新产品而寻找性能稳定和成本低廉的设计方案; 在工农业生产中,人们总是希望通过试验来达到优质、高产、低消耗的目的。 所以科学试验是发展必不可少的手段。当试验比较简单的时候,例如只有一个因 素影喻试验结果的时候,人们有时凭经验就可以进行。但是随着科学技术的发展, 现代试验涉及的因素众多,它们之间的关系就更加复杂,光凭经验已经无法达到 预期要求。如何合理安排试验,如何对试验结果进行科学的分析。就是一个很现 实的问题。试验安排的好,通过几次试验就能得到满意的结果;试验安排的不好, 试验次数就多,结果也不理想。所以在试验之前要好好“设计”一下。这样才可 以最大限度地节约成本,缩短试验周期,同时又麓迅速获得明确可靠的结论。试 验设计的目的就是获得条件和结果之间规律性的认识,抓住是事物的规律,确定 最好的生产条件。试验设计也是制定试验方案及分析试验结果的最有力工具。 我们先来介绍一下试验设计中的一些基本概念。将影响试验结果的因素称为 因子,因子所处的状态称为水平。因子常可分为两类:可控因子和噪声因子。将 用于衡量试验结果好坏的特性值就称为指标或观察值,在回归设计中指标有时称 为响应变量。常见的指标有两类:定量指标与定性指标。用测量结果数值表示的 指标称为定量指标,用等级评分等表示的指标称为定性指标。试验结果常用指标 的测量值( 或评分值) y 表示,测量值,与指标真值卢之间的偏差s = y 一称为 试验误差,简称为误差。由于诸多噪声因子存在,误差是不可避免的,它或大或 小或正或负,以不可预测的方式出现,使得误差总是呈现随机性,故s 是一个随 机变量。只包含一个因子的试验,叫做单因子试验。包含两个或两个以上的因子 的试验叫做多因子试验。 先来看一个侧子,例如为了提高某个化工产品的转化率,试验者选择了3 个 有关的因子:反应温度( a ) 、反应时间( b ) 、用碱囊( c ) ,并选择如下的试验范围: a :8 0 摄氏度9 0 摄氏度,b ;9 0 分钟一1 5 0 分钟,c :5 7 ,若对每个因子取 3 个水平: a :8 0 摄氏度,8 5 摄氏度,9 0 摄氏度; 华东师范大学硕士论文 几种无重复试验的饱和析因设计分析方法的稳健性 b :9 0 分钟,1 2 0 分钟,1 5 0 分钟: c :5 ,6 ,7 , 为叙述方便,a 的3 个水平分别用4 ,4 ,4 表示,这里4 = 8 0 摄氏度,呜= 8 5 摄氏度, = 9 0 摄氏度,对因子b 、c 也有类似的记号。在这个试验里面试 验指标就是转化率,试验的因子就有a 、b 、c 三个,且每个因子有三个水平,那 如何具体来安排这个试验呢? 这个试验我们可以做全面试验,一共有2 7 个水平组合 且c i ,4 置c 2 ,4 蜀c 3 , 4 :b c - “足毋已,全面的试验对剖析因子和指标之间的关系比较彻底,但这个只 适合因子个数和水平数都不大的时候,例如单因子试验。若因子数和水平个数较 大的时候就不适用了。例如当有6 个因子,每个因子取5 个水平的试验,全面实 验就需要做5 6 = 1 5 6 2 5 次试验,这是很不现实的。当全面试验要求太多的试验时, 一个自然的想法是从全面的试验水平组合中选出一部分有代表的试验水平组合 作实验。如何选择有代表性的试验点呢? 例如可以选用部分析因设计,上述的例 子就只需要9 次试验即可。下一章我们将介绍析因设计。 1 2 试验设计的基本原则 在明确所要的考察的因子及其水平后对试验进行总体安排称为试验设计。要 使一项试验设计有效必须在安排试验时注意以下几点: 1 尽量减少试验误差。这就必须对试验方案作出合理安排,减轻随机误差 的影响,提高试验结果的可靠性。 2 尽量减少试验次数。这意味着可以减少试验费用、缩短试验周期。 3 便于对试验结果进行统计分析。由于在试验中存在随机误差并体现在指 标的测量值上,所以对指标值的分析只有用统计方法才是客观科学的分 析方法。 在试验设计实际运用中有三个基本原则:重复、随机化、区组。这三个基本 原则在实际试验中都必须要考虑。 1 重复 重复是指在一个试验点在相同条件现重复若干次试验。若重复进行疗次试 验,其h 个试验结果记为儿,儿,儿,它就是一个样本。常假定 儿= 一+ 日 f = l ,2 ,一 其中是一个试验点上指标的真值,e 为第f 次重复试验的误差。 重复有两个作用:一是它能提供标准差口的估计, 华东师范大学硕士论文 几种无重复试验的饱和析因设计分析方法的稳健性 手= s = 巴喜c 只一歹户 “2 其中歹= 三m 为样本均值;二是它能提供指标均值的更为精确的估计 n 面 丘= 歹。但是试验重复会带来试验时间的延长和费用的增加,另外有些时 候重复试验是无法实施的,譬如在破坏性试验和寿命试验等试验中,它们 在同一个条件下对于同一个试验对象不可能进行重复试验。 2 ,随机化 随机化是指试验材料的分配和各试验点的试验次序都要随机确定。它有下 面的一些好处: 随机化常能使各次试验结果相互独立而这是试验设计中正确使用统 计方法分析试验结果的基石。 可以使噪声因子的影响“抵消”部分,不至于积累成灾; 对试验人员尚未意识到的噪声因子的影响可以得到减弱; - 可使试验误差得到准确的估计。 3 区组 把试验单元分为若干个小组,使每组内的试验条件相同或近似相同,而组 与组之间在试验条件上允许有较大差异,这样的小组在试验设计中被称为 区组。实施区组,是为了把区组问的差异估计出来。从恧把区组对试验结 果的干扰排除或减少到最低限度,保证统计分析结果的正确性。 华东师范大学硕士论文 几种无重复试验的饱和柝园设计分析方法的稳健性 第二章二水平的饱和析因设计 2 1 二水平的析因设计 在实际问题中,影响指标的因子往往有很多个,要考察他们就要涉及多因子 的试验设计问题。析因设计是一种多因子多水平交叉分组进行全面试验的设计方 法。它可以研究两个或两个以上因子多个水平的效应。在析因设计中,研究因子 的所有可能的水平组合都能被研究到,例如4 个因子同时进行实验,每个因子取 两个水平,实验的总组合数为2 4 _ 1 6 。如果一个试验问题有女个因子,每个因子 有2 个水平,全部水平组合的有2 个,这样的析因设计就称为2 设计,也是二 水平的析因设计。析因设计可以分析观测指标与研究因子间的复杂关系,包括备 因子间的交互效应。在这里交互效应是指一个因子的水平好坏或好坏的程度受另 一个因子制约的情况。因子间的交互效应随着因子个数的增加而增加,如四个因 子a 、b 、c 、d 之间的交互效应就有以下几类: 二级交互效应有6 个:a b 、a c 、a d 、b c 、b d 、c d 三级交互效应有4 个:a b c 、a b d 、a c d 、b c d 四级交互效应有1 个:a b c d 共有1 1 个交互效应,比因子本身的数目还多。实际经验表明:多数交互效应是 不存在的或者很小以至可以忽略不计,实际中主要考虑部分二级交互效应。 多因子试验遇到的最大困难就是试验次数太多,这在实际中是不胜负担的。 但是,在很多的情况下,高阶交互效应往往是不存在或极其微弱而可以忽略不计, 这就提供了减少试验次数的可能。在析因设计的所有水平组合中选取具有代表性 的水平组合来做试验,这种方法称为部分析因设计。这样就可以减少试验的次数, 节约成本。部分析因设计的方法很多,利用正交表来做部分析因设计就是一个方 法,而且它的效率也很高。 2 2 正交表与析因设计 一般将使用正交表做试验设计和数据分析的试验方法简称为正交设计。其中 正交表是正交设计的重要工具,下面对它介绍一下: 1 正交表及其特征 正交表有许多,表2 1 便是一张8 行7 列的正交表记为| 己8 ( 2 7 ) ,这里 “”是表示正交表的符号,三的下标“8 ”表示表的行数,在试验中 表示用这张表安排试验的话,要做8 次不同条件的试验,最多可以安 华东师范大学硕士论文 几种无重复试验的饱和析因设计分析方法的稳健性 排7 个因子,圆括号中的底数“2 ”表示表的主体只有2 个不同的数 字:l ,2 ,在试验中它们分别代表因子水平的编号,即用这张表安排 试验时应取2 个不同水平。这张表就称为二水平的一张正交表。 表2 1 工8 ( 2 ) 试验号列号 l23 4567 l11 lll11 2 1ll2222 3 l22ll22 4l22221l 52 12l2l2 6 2l22l2l 72 2 l l221 82 2l2112 正交表当然还有很多。正交表具有正交性,这是指它有如下两个特征: ( 1 ) 每一列中不同的数字重复次数相同。在表工啦 中每一列有不 同两个数字1 、2 ,每一个各出现4 次。 ( 2 ) 将任意两列的同行数字看成一个数对,那么一切可能数对重复 次数相同。在表上8 ( 27 ) 中,任意两列有四种可能的数对:( 1 ,1 ) 、 ( 1 ,2 ) 、( 2 ,1 ) 、( 2 ,2 ) ,每一对各出现两次。 2 正交表的分类 正交表可以按其水平数分类,若记正交表为厶( 矿) 。则称其为9 水 平的正交表。例如: 二水平正交表:厶( 2 3 ) ,工8 ( 2 7 ) ,工】6 ( 2 1 5 ) 、上1 2 ( 2 “) 等 三水平正交表:三“3 4 ) ,三2 7 ( 3 3 ) 、三i s ( 3 7 ) 等 常用的正交表也可以按其行数n 、列数m 水平数g 之间的关系分为 两大类:一类正交表的行数n 、列数p ,水平数g 之间有如下两个关 系: 玎:矿t :2 ,3 ,p = 型 g l 它们被称为完全正交表,譬如上述的上8 ( 2 7 ) ,用这类正交表安排试验 的话,将可以考察因子间的交互效应,每张正交表附有一张交互效应 列表。另外一类正交表,上述两个关系中至少一个不成立。譬如三1 2 ( 2 “) 等,一般不能用来考察交互效应,但是某些场合也常被使用。 在使用正交设计前,应该要明确因子的个数及其水平数,然后再选用合适的 正交表,进行表头设计。在选定正交表之后把因子放到正交表的列上去,就称为 华东师范大学硕士论文 几种无重复试验的饱和拆因设计分析方法的稳健性 表头设计。在表头设计时应注意是否考虑交互效应,若不考虑交互效应的场合, 可以把因子放在任意的列上,一个因子占一列。若考虑交互效应则按照其交互效 应表,做到不混杂即可。不考虑因子间交互效应时或者正交表中有多余的空白列 时,就可以把考察因子放在空白列上,即可实施部分析因设计,减少试验次数。 在选用正交表和表头设计时需要说明的还有以下几点: 表的自由度为试验次数减l ,即厶= n 一1 ,其中”是表的行数; 列的自由度为水平数减1 ,即厶= g l ,其中g 是该列的水平数; 因子的自由度为水平减l ; 交互效应的自由度为对应的因子自由度的乘积; 在表头设计要遵循以下原则: 因子的自由度应该等于所在列的自由度; 交互效应的自由度应该等于所在列的自由度,或者其之和( 在合并正交表 时使用) ; 所有因子与交互效应自由度不能超过所选正交表的自由度。 对于正交表的析因设计的数据统计分析,一般有多种方法,有直观分析法, 方差分析法和贡献率分析法等,一般最常用最有效的方法是方差分析法。先看一 个例子如下 例:某公司做一个上浆对织物阻燃影响的试验,试验的因子和其水平如下: 织物( 因子a ) : 为假锻,4 为粗厚平方织物; 上浆( 因子b ) :骂为上浆前,马为上一次浆; 采用正交表厶( 2 3 ) 来做析因设计,不考虑其交互效应。观察值y 为经过燃烧 试验后的标 表头设计ab 试验号 列号123 lll4 ,2 2 l224 o 32123 1 4 2212 8 该试验的统计模型为均= + f + 岛+ 勺,f ,= 1 ,2 ,其中诸白相互独立同分 布( o ,仃2 ) ,约束条件为f = o ,局= o = l ,2 。称一r 2 为因子a 的主 , 效应,其估计量记做a ,表示因子a 的水平变动对指标y 的影响:称盔一磊为 因子b 的主效应,其估计量记做b ,表示因子b 的水平变动对指标y 的影响。 华东师范大学硕士论文 几种无重复试验的饱和析因设计分析方法的稳健性 首先计算,局,2 l ,2 的估计值,司以利用己知的条件通过线性模型做 最小二乘估计来得到它们的估计值: 声= 3 5 2 5 ,最= 4 1 ,乞= 2 9 5 ,a = 3 6 5 ,厦= 3 4 主效应的估计值a = 最一之= 1 2 5 ,b = 磊一虞= o 2 5 , 再利用偏差平方和分解公式s 昌= 5 邑+ 峨+ 避做平方和分解,可以知道 总偏差平方和蹰= 饥一歹) 2 = 1 3 8 7 5 , 因子a 的平方和砜二( 只一歹! ) 2 = 1 3 2 2 5 , 因子b 的平方和船。= ( 罗,一歹! ) 2 = o 0 6 2 5 , 误差平方和s 墨= ( k 只一乃+ 歹:) 2 = o 0 0 2 5 。 其中只= 圭喜托歹,= 三喜趵,歹:= 丢喜喜均 其中只= 寺托歹,= 趵,歹:= 三均 j 2 l r - l 1 ,= i ,。l 方差分析表 来源平方和自由度,均方和f 值p 值 因子a1 3 2 2 5 = 1 1 3 2 2 55 2 9o 0 2 7 7 因子bo 0 6 2 5 五= l o 0 6 2 52 5o 1 2 5 7 误差 o 0 0 2 5 詹= 1 o 0 0 2 5 总和 1 3 8 7 53 表中的均方和为平方和与自由度的比值,f 值为该行因子的均方和与误差均方和 的比值,p 值为该行f 值相对应的自由度为,和疋的f 分布的分位数。从上表来 看,可以看到在显著性水平为o 0 5 的时候,因子a 是显著的,它对指标值的影 响很明显。在因子a 取为2 水平时即织物为粗厚平方织物时,烧痕比较小。 从上述的例子来看,在做方差分析的时候必须要有误差平方和存在。而这需 要在正交表中要有空白列或者做重复试验时才会有误差平方和,否则就不能使用 方差分析这样的方法来傲数据分析。 2 3 饱和析因设计 先看一个实例:为得到靛红的更高产量,需要找出对产量有显著影响的重要 因子,考察酸的强度( a ) ,时间( b ) 。酸的数量( c ) ,温度( d ) 四个因子及 其所有交互效应,由于条件限制无法进行重复试验,表头设计和数据见表2 2 。 从表2 2 可见,这是一个2 水平的折因设计,它的数据来源见脚i e s ( 1 9 5 4 ) 。 当它考察了4 个因子及其所有的交互效应时,这些所考察的因子及其交互效应放 满了正交表的各列。因为没有重复试验,对其就不能使用如方差分析法那样的标 准的分析方法来检验各因子的显著性,只能进行直观分析。 华东师范大学硕士论文 几种无重复试验的饱和析因设计分析方法的稳健性 在一个试验设计中,当被考虑的因子( 包括交互效应) 个数多到使得需要估 计参数的个数达到可估参数的最大个数时,这个试验设计就被称为饱和设计。这 里可估参数指的是可获得其无偏估计量的参数。在开发新产品和改进产品设计或 生产过程的初始阶段( 即筛选阶段) ,人们常常使用基于析囡设计的试验来确定 在大量可能的因子中是哪些因子有显著影响的。这种设计就称为是饱和析因设 计。由于饱和析因设计可节省大量的试验时间和费用,带来巨大的经济效益,因 而饱和析因设计在实际应用中使用的越来越多。 表2 2靛红产量试验的表头设计 表头设计 b b c cb c ac da d硒c d 口d c d c d b c d 刃考 y l234567891 0l l1 21 31 41 5 试验粤 1 i 1l l 11 1 l1ll111l 0 0 8 211lllll22222222o 7 9 3ll12222llll22220 3 1 4ill22222222llllo 7 7 sl22l1221l221l22o 5 3 6l22l12222l122ll0 7 3 7 l22221l1l 2 222l10 1 2 8122221l22 1 l1 l 220 4 9 92l2l2l2l 2t 2l 2 l2o 0 4 1 02l2l2l22l 2 l2 l 2l0 6 8 1 1 212212ll2 l 22 1 21o 0 9 1 22122 l 2l 2 l 2 1l 2 l20 3 8 1 322l122il2 2 l1 2 2l0 4 3 1 422ll 22 i 2ll2 2 il 2o 0 8 1 522l21l212 2 l2 1 12n 3 6 1 622l21l22l 1 2l 2 21o 2 3 饱和折因设计可分为正交饱和析园设计和非正交饱和析因设计两种类型。当 一个饱和析园设计又是一个正交设计时,那么称其为正交饱和析因设计,否则就 称为非正交饱和析因设计。任何一个正交设计方案,当考察的因子和交互效应排 满正交表各列时,就成为了一个正交饱和析因设计,如表2 2 。它可以在正交表 中能安排因子直至填满正交表各列,从而能减少试验的次数,节约成本。 在饱和析因设计中。若不进行重复试验,虽然仍能估计各因子的效应,但却 无法再用通常的方差分析方法来检验因子显著性,因为在方差分析时可以估计误 差方差,但在饱和析因设计是就没有了误差方差的估计值,故需要另外设法对饱 和析因设计进行分折。 华东师范大学硕士论文 几种无重复试验的饱和析因设计分析方法的稳健性 第三章饱和析因设计分析方法 3 1 饱和析因设计统计模型 对于饱和设计问题,通常使用如下的线性统计模型来描述: y = z 口+ ( 3 1 ) 其中r = ( m ,虬,只) 是观察值向量,卢= ( 屏,届,卢) 是未知的待估参数,岛 是一般平均,届,屈声可以代表因子的主效应或者是某些我们感兴趣的因子 交互效应,z = ( 1 。,d ) ,其中l 。是元素均为l 的n 维列向量,d 为已知的设计矩 阵,由采取的试验设计来决定,= ( 毛,岛,) 是误差向量,h 是试验次数。 假设 1 ) e ,f - 1 ,2 ,h 是相互独立的随机变量,均值为0 ,方差为仃2 ; 2 ) ,f _ l ,2 ,h 服从正态分布; 3 ) 在脚个因子中最多有,( 1 s , o 时,届的最小二乘估计矗就是 一个对比( c o n 仃a 5 t 也称对照) 。若蜃的期望不为零,则就称对比矗是活动的。 在试验设计是正交时并且假设1 ) 成立的条件下,易知口的最小方差线性无 偏估计( b l u e ) 为 西= ( z 7 x ) 。z 7 y ( 3 2 ) 且它的方差为 p t 口( 历= p 研( ( 五7 j ) 。x 7 y ) = ( z 7 z ) “工矿( ( x 7 z ) 。z 7 ) 7 其中矿= 哳( s ) = 脚( y ) = 编昭( 砰,霹,) 为误差向量的方差阵,由于z 为已 知矩阵且x 7 = 吐,其中l 为n 阶单位阵。故有 脚( 向= 砉蹦2 砉( 吩) 。 ( 3 3 ) 拧 。 其中a ! ,= 斫靠啊。由假设1 ) 知砰= 司一= 一= 盯2 ,则 “ f 舸2o 、f 舸1 ui 哳c 向= 吉l 。耵:j 2 吉l ( 3 4 ) 由( 3 2 ) 式、( 3 4 ) 式以及假设1 ) 、2 ) ,可知各矗均服从正态分布即矗( 层,三盯2 ) , 而且各矗之间相互独立。 华东师范大学硕士论文 几种无重复试验的饱和析因设计分析方法的稳健性 我们分析的目标就是:利用 个观察值m ,儿,只,借助某些统计量来判断 在m 个对比中是否存在活动对比,即对假设 风:届= 届一一尾= 0 e :诸届不全为零 借助某些统计量进行检验;若峨被拒绝,则说明有活动对比存在,然后再确定 哪些对比是活动的。 我们的困难是,由于没有进行重复试验,正交表中也就没有空白列,从而误 差平方和为零,无法估计方差和标准差仃,因此无法进行利用方差分析来对因子 进行显著性检验。由于饱和析因设计主要使用在筛选阶段,幸运的是,在试验筛 选阶段p a r e t o 原理常常是正确的,也就是,过程波动的大部分是由少部分因子所 引起的。换言之,就是大部分的因子的效应都为零,而非零效应的因子只是占少 部分。在这种因子稀疏的假设下。人们提出了一些分析无重复试验饱和析因设计 的方法。这些可以分为图形法和数值分析法两大类,下面分别介绍它们。 3 2 图形分析法 图形分析法,就是利用图来分析是否存在是否有活动对比。第一个可以接受 的达到实用程度的分析方法是由d a i l i e l 在1 9 5 9 年提出的正态或半正态图法。它 理论依据是:假设所估计的效应服从均值等于效应的正态分布,则在所有效应为 零的零假设的情况下,所有估计的效应的均值为零。因而所估计效应作出的正态 图或半正态图应是一条直线。图形分析法的优点是它不需要估计盯。在判断效应 的显著性时,半正态图的优点就是所有较大的估计效应均出现在图的右上角,并 落在穿过小估计效应直线的上面。下面我们就介绍一下半正态图: 制作半正态图主要依据半正态分布。若一个随机变量工的概率密度函数为: f , 一 贴) : 高,娩o ox 5 2 2 时,就判断该因子显著,否则就认为该因子不显著。判断结果列在 表3 3 1 的第五列中,判断的结果为第1 4 个和第1 5 个因子为显著因子。 2 d o n g 方法 这是d o n g 在1 9 9 3 年提出的另一种直接分析法。它的检验过程和l e n t l l 方 法基本一样,但是采用了标准差的另一个估计 k = 爿舾= 其中m ,。是满足条件陋1 2 5 对比的个数,临界值为乞焉。,可选 华东师范大学硕士论文几种无重复试验的饱和析匠设计分析方法的稳健性 择口= ( 1 + o 9 5 ”1 ) ,2 。 例:在一个无重复的1 6 次二水平饱和析因设计的试验中,数据来源于 d i e l ( 1 9 7 6 ) ,共1 5 个因子,各个因子效应的估计如表3 3 2 中第二列。 解:根据d o n g 方法得到其脚霪即q 蓐1 ) = o 0 2 ,= 1 5 x _ 粤( i 岔d = o 0 3 , 标准差的估计i 哳= o 0 2 6 ,此时码。= 1 2 ,当选择口= ( 1 + o 9 5 “”) 2 。 临界值此时为,= 3 6 7 。当t 3 6 7 时,就判断该因子显著,否则就认为 该因子不显著。判断结果列在表3 3 2 的第五列中,判断的结果为第2 个, 第4 个,第8 个因子共3 个因子为显著因子。 表3 3 ,11 h g u c h i 姐dw u ( 1 9 8 0 )表3 3 2d 柚i e m l 9 7 6 ) 引t 是否显著因子 届 10 1 20 1 20 5 3 否 20 1 5o 1 50 6 7 否 3o 3 00 t 3 01 3 3 否 4 0 1 5 0 1 50 6 7 否 50 4 0 o 4 0 1 7 8 否 6- o 0 20 0 20 0 9 否 70 3 70 3 7 1 6 4 否 8o 4 00 4 01 7 8 否 9一o 0 50 0 5o 2 2 否 1 0o 4 20 4 21 8 7 否 1 1o 。1 3o ,1 30 。5 8 否 1 2o 1 2 0 1 20 5 3 否 1 3o 3 70 3 71 “ 否 1 42 1 52 1 59 5 6 是 1 53 ,l o3 1 01 3 7 3 是 例 是否显著因子 矗 10 0 6 o 0 62 3 l 否 20 2 50 2 59 6 2 是 3- 0 o lo t 0 10 3 8 否 4o 5 00 5 01 9 是 5o 0 00 0 0o 0 0 否 6 0 0 2 0 0 2 q 1 否 7 0 o o0 0 0 o 0 0 否 8o 1 40 1 45 3 3 是 90 0 3o 0 31 1 5 否 1 0- o 0 lo o lo 3 8 否 儿o 0 2o ,0 2o 7 7 否 1 20 0 4o 0 41 5 4 否 1 3o 0 2 o ,0 2 0 7 7 否 1 40 o l 0 o l0 3 8 否 1 50 0 20 0 20 。7 7 否 2 ) m a ) ( u r 方法 这是c h e n 和k 蚰e n 在2 0 0 4 年提出一种基于广义似然统计量的分析方法。 它使用的检验统计量是 肘口工u ,= m a xm a x l i r “,如,l 卜 薏霹 瓦一c 毒备, m 一七,t 怠吨 1 其中p i 是含有 l ,2 ,朋) 中t 个元素的所有子集组成的集合,e 。肿。( ) 是 自由度为t 和m t 的f 分布的分布函数,其中州= ”一l ,一1 r 4 m e d o ,则认为第1 2 个因子为 显著因子,去除第1 2 个因子继续第二次过程如上,判断结果如下表3 3 4 中,其中第五列f 表示第f 次过程。最后结果为第4 ,1 2 ,1 3 个因子共3 个因子是显著因子。 表3 3 4b 啦h 岫把r 姐d h 帅t e r ( 1 9 7 8 ) 吲 显著4 m e d 0显著因子因子 届 1o 6o 6 否 】2 4 ,1 2 2o 4 o 4 否 2 2 4,d 30 60 6 否 32 4 芦1 3 44 6 4 ,6 是 4 2 0无 50 90 9 否 60 2o 2 否 70 | 30 3 否 81 2 l ,2 否 90 7o 7 否 1 0o 1o 1 否 l l0 30 3 否 1 25 55 5 是 1 3 3 s 3 8 是 1 4o 1o 1 否 1 50 60 6 否 2 j t l l l c e y 方法 这个是j o h n s o n 和t u k e y 在1 9 8 7 年提出的另一种检验异常点的逐步检验 华东师范大学颐士论文 几种无重复试验的饱和析因设计分析方法的稳健性 法。它利用显不比( 以驴 秒加f 向) 却切舶:簪胤。 其中p i 。是无符号对比的第f 个秩序统计量, m 是半正态分布容量为肌 的第f 个秩序统计量的中位数,它可以用下列公式近似计算: h ,珂1 ( 端 其中西。( - ) 是标准正态分布函数的逆函数。检验时使用的统计量为 。= 铡篙鬻糍舞舞 m e m 硼m s 口t a vr n l m l o rm lc o n l r a s n 利用毋措7 来检验活动对比的存在,临界值在【1 l 】的表1 2 中查得。当母研 大于相应临界值心。( 女为所用对比数) ,就认为绝对值最大的对比是活 动的,将其剔除,再用剩余对比重复如上过程直至检验出所有活动对比。 例:一个基于工1 6 ( 2 1 5 ) 的二水平饱和析因设计,数据来源于d a v i e s ( 1 9 5 4 ) , 它的因子效应估计列在表3 3 5 的第二列。 解:运用j t u k e y 的方法,取口= o 0 5 ,表中第五列的j i 为所用对比数, 计算得到母彤为1 2 8 1 0 ,小于临界值1 6 5 ,即认为没有显著因子存在。 表3 3 5 d “i e s ( 1 9 5 4 ) 显著 七 足m , 吃 显著因子因子 眉 10 1 9o 1 9 否 j 5 1 2 8 1 0 1 6 5无 20 0 2o 0 2 否 30 0 0o 0 0 否 4- 0 0 8o 0 8 否 50 0 3o 0 3 否 60 0 70 0 7 否 7 o 1 5 0 1 5 否 80 2 70 2 7 否 90 1 6 0 1 6 否 1 0o 2 50 2 s 否 l l- 0 1 00 1 0 否 1 20 0 30 0 3 否 1 3o 0 lo 0 1 否 1 40 1 2o 1 2 否 1 50 0 2o 0 2 否 华东师范大学硕士论文几种无重复试验的饱和析因设计分析方法的稳健性 4 1 稳健性问题 第四章稳健性研究 许多数值分析方法的研究都是假设误差服从正态分布即观察值服从正态 分布。到目前为止,已有l o u g i l la n dn o b l e ( 1 9 9 7 ) ,h 姗a 血a 1 1 db a l a s l l i l a n ( 1 9 9 8 ) ,a b o u h l a m 矾d a l s h m a ( 2 0 0 1 ) 等考虑了误差服从t 分布的情况,l o u g i n a n d b l e ( 1 9 9 7 ) 考虑了误差服从指数分布,a b o u k a i 锄锄d a i s h i h a ( 2 0 0 i ) 还简单考虑了对比服从混合正态分布o 9 ( 0 ,1 ) + 0 1 ( 2 ,1 ) 。但是t 分布既不是截 尾分布,也不是非对称分布,与正态分布的差别不是很大,而l o u g i n 粕dn o b l e ( 1 9 9 7 ) 研究的误差服从指数分布也只是针对自己的非参数方法与l e n t l l 方法之 间的比较,并没有研究其他更多的方法在误差服从指数分布下的情况。 在实际生产中,一些观察值不总是服从正态分布的,譬如在可靠性试验中寿 命分布往往是非对称的,经常会服从威布尔分布或指数分布。那么自然会问,上 述的那些方法对于观察值是为非正态分布的时候是否还能有好的表现? 对于哪 些分布有好的表现? 在本文中选择了指数分布和威布尔分布两个非正态分布进 行了研究。 4 2 模型修正 当观察值为非正态分布时,那么原来的模型假设就不再适用了,需要进行对 模型( 3 1 ) 的假设1 ) 、2 ) 、3 ) 进行修改,以便于该模型能继续适用于观察值为 非正态分布时的情况 模型( 3 1 ) 的假设1 ) 、2 ) 、3 ) 实际上可以等价的表述成如下假设: a ) 只,f = l ,2 ,”相互独立,e ( y ) = x 卢 b ) 卫,f = l ,2 。,月服从正态分布 c ) 只,f = 1 ,2 ,n 有相同的方差盯2 此时,由( 1 1 ) 式得到s = 】,一x 卢,又假设a ) 、b ) 、c ) 成立故有 e ( s ) = 0 ,i 7 :矿( ) = 陆( y z 历= ,7 z 矿( y ) = 盯2 , 即误差向量占满足假设1 ) 、2 ) ,反之若假设1 ) 、2 ) 成立很显然能得知假设a ) 、b ) , c ) 也成立。这样假设a ) 、b ) ,c ) 和假设1 ) 、2 ) 是等价的。 修正假设之后,模型( 3 1 ) 及假设a ) 、b ) 、c ) 就可以对观察值变量来进行 刻画了。在观察值变量服从为某种分布时,只要对假设b ) 加以改变即改为 b ) m ,f = l ,2 ,n 服从某一分布,且该分布的期望和方差均存在。 华东师范大学硕士论文 几种无重复试验的饱和析因设计分析方法的稳健性 不妨就设e ( 】,) = ( h ,鸬,以) 7 ,p 铷( y ) = 托g ( 砰,正,砰) = 矿。由( 3 1 ) 式可知占= y x 卢,根据假设a ) ,故e ( 占) = o 即误差向量均值为零。的b l u e 由马尔可夫定理可知: 彦= ( z 7 矿- 1 j f ) 1 x 7 矿_ y 1 由x 7 肖= 以,故z 7 = 二x ,因此 夕= ( x 7 y 一1 z ) 一1 2 7 y 1 l ,= z 1 矿( z 7 ) 。1 2 7 矿一1 y = z 一。刃r l y = 土z 7 y = ( z 7 肖) 1x 7 j , 刀 它和( 3 2 ) 式完全一致,依然具有无偏性,且其方差亦可由为( 3 t 3 ) 式表出。若假设 c ) 成立即m ,儿,m 具有方差齐性,则由( 3 3 ) 式可知各局之间是互不相关的。 在引入一般分布的假设后,无论观察值变量服从什么分布只要满足假设b ) , 模型( 3 1 ) 就可继续使用,以便进行后面的活动对比检验。在本文中我们讨论的非 正态分布为两个:指数分布和威布尔分布。因为在实际的生产和生活中很常见, 观察值服从这两个分布的情况也是比较多的。这两个分布的分布函数及其数字特 征如下: 1 指数分布的密度分布函数 1, ,( = e 印 勺) ,x o 其中 是寿命参数,其期望和方差分别为 e ( d = 五,哳( y ) = ( 4 1 ) 2 威布尔分布的密度分布函数 ,( 。) :鱼南“e x p _ o d nd 其中口 0 是特征寿命参数,6 o 是形状参数,其期望和方差分别为 刚) = n r ( 1 + 吉) ,陆( 】,) = 矾r ( 1 + ;) 一呷+ 】2 ) ( 4 2 ) 4 3 模拟描述 我们要研究的是在3 3 中提到的五种数值分析方法的稳健性,即在不同分 布下是否还能保持良好的表现。 为了比较上述五种方法的稳健性,采用真实试验来实施,显然是不现实的。 由于被比较方法的势函数的解析式难以获得,故采用计算机随机模拟方法来加以 比较。本文傲随机模拟和计算时主要利用了软件s a s 和m 融l a b6 5 。由于各个方 法是按照不同的思想构造的,它们犯第一类错误的概率也是各不相同的,当一个 方法犯第一类错误的概率大时则它的势自然也会大。这里的势的定义是:被正确 华东师范大学硕士论文几种无重复试验的饱和析因设计分析方法的稳健性 识别的活动对比数与全部活动对比数之比的期望值。为了使得被研究的五种分析 方法之间的比较具有公正性和可比性,我们将对被比较的方法进行标准化。 在进行标准化时,常用的方法有两种:一是控制个体错误率( i n d i v i d u a le r i d r r 丑t c ,缩写为i e r ) 在同一水平,这里i e r 是指每个非活动对比被误判为活动的 错误率:二是控制试验错误率( e x p e r i m e n t w i e r r o r l t e ,缩写为e e 固在同一水 平,这里e e r 是在无活动对比存在的条件下至少有一对比被误判为活动的试验 比率,也就是在原假设胁下犯第一类错误的概率。本文在研究时采取第二种标 准化方法,将每种数值分析法的e e r 控制在o 0 5 ,由于五种被比较方法的原始 版本并没有全部将其e e r 控制在0 0 5 ,因此需要对一些方法在不改变其思想的 前提下进行适当的修改。具体修改方式如下:对m 缸u r 方法不用修改,只需先 选取一个不小于真实活动对比个数的正整数r = 8 ,查得e e r = o 0 5 时相应的临 界值为0 9 9 9 9 7 3 3 ;对d o n g 和l e n m 方法的修改主要是对原来的临界值进行修改, 即在原假设成立下利用蒙特卡洛方法得到e e r = o 0 5 的情况下的临界值,模拟 的次数为1 0 0 0 0 次,由此而得到的l e m h 方法临界值不再是。,而是通过模拟 之后得到的临界值为4 2 4 ,得到d o n g 方法的临界值为4 0 0 9 2 :对s n l k c y 方法的 修改就是把原来在判断绝对值最大的对比是否大于4 m e d o 都变为是否大于6 m e d 0 ,因为原始s t i l k e y 方法的e e r 约为0 2 5 8 ,而修改后的e e r 就约为o 0 5 ; 对j n i l ( e y 方法的修改主要是添加它的临界值,由于在j o l u l s o n 髓d1 、l k e y ( 1 9 8 7 ) 的 表1 2 中n = 1 l ,1 2 ,1 3 ,1 4 都没

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论