试验设计与优化拟合教案资料_第1页
试验设计与优化拟合教案资料_第2页
试验设计与优化拟合教案资料_第3页
试验设计与优化拟合教案资料_第4页
试验设计与优化拟合教案资料_第5页
已阅读5页,还剩180页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三部分

试验(shìyàn)设计第一页,共185页。实验设计与优化的重要性就分析化学而言,通过试验设计以找到最优的量测实验条件一直是化学计量学研究(yánjiū)的一个重要内容,如色谱分析中的最优分离条件的选择、各种仪器分析方法的诸多参量的选择等。对于化学量测实验,试验设计的成败,关系到实验能否得到包含所需信息的化学量测数据,一个失败的试验设计将导致所得到的数据中包含的信息量极低,任何卓有成效的处理数据的化学计量学方法也无法从中提取有用的信息。第二页,共185页。教学内容1基本概念2因子设计和部分因子设计3正交试验(shìyàn)设计4均匀试验(shìyàn)设计5D-最优试验(shìyàn)设计6星点设计第三页,共185页。基本概念试验(shìyàn)指标或响应值在试验设计中,衡量试验效果的量称为(chēnɡwéi)试验指标或响应值能用数值(shùzí)表述的指标称定量指标,如化学反应的产率、分析试验的检测限或其他品质因数等。

定性指标不是用量表示的指标称为定性指标,如化学产品的色度等。定量指标定性指标常可转化为定量指标,如用5级计分进行评分等。第四页,共185页。多指标试验(shìyàn)设计当试验(shìyàn)设计的指标要用一组数表示时,如分析方法的优化需考虑灵敏度、准确度、选择性等,称多指标试验(shìyàn)设计的问题。因素(yīnsù)(因子)在改变试验条件时,能够影响试验指标取值的量称为因素(亦称因子)。因素也可以是定量因素或定性因素,和指标一样,定性因素总可转化为定量因素。水平第五页,共185页。因素的取值,称为因素(或因子(yīnzǐ))的水平。一般试验方案是由若干个试验组成,因素在这些试验中变化(biànhuà)了几种状态就称为几种水平。试验设计中,只对可控因素在试验前作出设计,而对不可控因素,则在试验过程中记录其水平(shuǐpíng),在数据分析中加以处理。有的因素所处的状态是不可控制的,例如在自然条件下进行的某些试验。一般化学实验的条件多是可控。水平第六页,共185页。协同(xiétóng)作用,交互作用试验(shìyàn)域因素的可能(kěnéng)取值的区域称为试验域多个因素对试验的共同影响,但不是简单的加和的现象。

同时试验通过试验设计对有关因素的水平进行规划后,同时进行诸因子各水平的试验,继综合分析所得到的试验结果,求出最优条件。

序贯试验每进行一次或少数几次试验后,先分析已取得的试验结果,再根据这些结果规划下一步的试验第七页,共185页。目前应用广泛的正交试验、均匀试验设计及最优试验设计基本上属于(shǔyú)同时试验法,而序贯试验法的典型代表是单纯形优化法。值得提出的是,同时试验与序贯试验可在优化试验中综合使用。序贯试验(shìyàn)设计(shèjì)和优化试验设计就是研究如何选择和优化实验条件,好的试验设计能够通过有限次数的试验,选择优良的实验条件,节约人力、物力、财力和时间。因此,试验的设计与优化密不可分。第八页,共185页。第九页,共185页。方法(fāngfǎ)分类分析法在试验区域内有目的、有规律地散布一定量的试验点,多方向同时寻找优化目标。因只是对给定条件下一切可能的试验点进行优化,因此不能真正实现全局优化,所谓的最优化只是近似的,最优点也只是较优点。但实际应用表明,该优化方法完全能够(nénggòu)满足一般科研和生产的实际需要。也就是(jiùshì)同时试验法又称同步试验法或离散优化法第十页,共185页。黑箱(hēixiānɡ)法在实现优化目标的整个过程中,遵循一定的优化路径逐渐寻找最优点(yōudiǎn)的方法,它是单向寻优,后一阶段是在前一阶段优化的基础上进行。方法(fāngfǎ)分类也就是序贯试验又称循序试验法或序贯优化拉丁方18世纪的欧洲,普鲁士弗里德里希·威廉二世要举行一次与往常不一样的阅兵仪式,他要求阅兵式由6列方队组成,每个方队的行和列都要由6种不同部队的6种军官组成,不得有重复和空缺。这实际上就是要求在6列方队中,安排的部队、军官在第十一页,共185页。行和列全部排列(páiliè)均衡。这在当时可难坏了大臣们,他们冥思苦想也没有找到答案,就请教于当时著名的数学家欧拉。由此引起(yǐnqǐ)了数学家们的极大兴趣,提出了均衡分布的新的数学思想,这种思想对研究自然世界具有普遍的意义。这种思想正是今天试验设计的基本思想。20世纪20年代,英国统计学家Fisher运用均衡排列的拉丁方成功地解决了农业试验中的试验条件不均匀问题,创立了试验设计这一学科。拉丁方是用字母或数字排列的具有一定性质的方阵,每个字母或数字在该方阵中每行和每列中恰好(qiàhǎo)出现一次,方阵的行数或列数称为拉丁方的阶。第十二页,共185页。ABBAabba1221ABCBCACABBACCBAACB第一行,以及第1列上所有字母(或数字(shùzì))是按字母(或数字(shùzì))顺序排列的拉丁方。如上图中前一种标准(biāozhǔn)拉丁方从标准(biāozhǔn)拉丁方出发,通过交换行或列可得到其它形式的拉丁方。如上图后一种是由标准(biāozhǔn)形式的1和2列互换而得第十三页,共185页。因子(yīnzǐ)设计因子设计(FactorialDesign)是一种多因素试验(shìyàn)设计方法。因子设计根据拉丁方的思想,考察各因素所有可能的组合来安排实验,属于全面试验(shìyàn)。试验(shìyàn)数目因子设计的任务就是要通过这样的试验安排来了解各个因素及各因素水平之间的搭配对响应值或指标的影响,即析因问题。为水平数(n)为底、因素数(m)为指数的幂,即nm第十四页,共185页。2水平(shuǐpíng)3因素:23=82水平(shuǐpíng)4因素:24=162水平(shuǐpíng)7因素:27=1283水平(shuǐpíng)4因素:34=81析因设计(shèjì)表因素(yīnsù):A因素(yīnsù)B因素(yīnsù)AB因素(yīnsù)水平:-低水平+高水平第十五页,共185页。NoABAB1―-+2+--3-+-4+++FD4(22)析因设计(shèjì)表第1列是试验(shìyàn)序号第2列是第1个因素(yīnsù)从-开始,以-与+相间排列第3列是第2个因素从--与开++相间排列,

即前一因素的水平加倍后,再相间排列第4列是两因素的交互效应列,遵守乘法规则排列第十六页,共185页。FD8(23)析因设计(shèjì)表NoABCABACBCABC1---+++-2+----++3-+--+-+4++-+---5--++--+6+-+-+--7-++--+-8+++++++第十七页,共185页。设计(shèjì)矩阵MATLABR的实现fullfact函数(hánshù)desing=fullfact(levels)格式(géshi)说明函数FULLFACT用于混合水平(mixed-levels)的全因子设计矩阵。输入矢量参数levels用于定义因素的水平数,如levels=[243],函数将给出24次试验的全因子设计矩阵。其中第1列是2水平;第2列是4水平;第3列是3水平。第十八页,共185页。示例(shìlì)d=111211121221112212122222113213123223>>d=fullfact([223])

第十九页,共185页。d=000001010011100101110111示例(shìlì)>>d=ff2n(3)full2n函数(hánshù)格式(géshi)desing=full2n(N)说明Full2n用于构建两水平设计表,给出具有N列的设计矩阵,其中输入参数N为因子数第二十页,共185页。效应(xiàoyìng)分析主效应(xiàoyìng)估价主效应:单个因素对实验(shíyàn)结果的影响NoABABy1―-+y12+--y23-+-y34+++y4第二十一页,共185页。A因素(yīnsù)主效应B因素(yīnsù)主效应因素(yīnsù)主效应等于:(高水平和-低水平之和)/水平重复数效应A=[(y2-y1)+(y4-y3)]/2=[(y2+y4)-(y1+y3)]/2=[(y3-y1)+(y4-y2)]/2=[(y3+y4)-(y1+y2)]/2第二十二页,共185页。交互(jiāohù)效应估价交互效应在直观图上表现(biǎoxiàn)为对角线的变化交互效应=(正项(zhènɡxiànɡ)和-负项和)/重复数NoABABy1―-+y12+--y23-+-y34+++y4第二十三页,共185页。交互效应存在(cúnzài)于否的直观判定第二十四页,共185页。FD8(23)析因设计(shèjì)表NoABCABACBCABC1---+++-2+----++3-+--+-+4++-+---5--++--+6+-+-+--7-++--+-8+++++++第二十五页,共185页。对于(duìyú)FD8(23)析因设计各因素(yīnsù)主效应第二十六页,共185页。A效应(xiàoyìng)=[(y2+y4+y6+y8)-(y1+y3+y5+y7)]/4B效应(xiàoyìng)=[(y3+y4+y7+y8)-(y1+y2+y5+y6)]/4C效应(xiàoyìng)=[(y5+y6+y7-y8)-(y1+y2+y3+y4)]/4对于三因素的试验,其各因素的主效应已由原来的二因素的线表示,变化成面的表示。联系其设计表,各因素的主效应对应的计算式如下第二十七页,共185页。FD8(23)析因设计(shèjì)表NoABCABACBCABC1---+++-2+----++3-+--+-+4++-+---5--++--+6+-+-+--7-++--+-8+++++++第二十八页,共185页。两因素(yīnsù)间交互作用效应第二十九页,共185页。三因素中任意两因素间的交互效应已由原来(yuánlái)的二因素试验时的交线变为交叉成面的表示。联系其设计表对应的计算式如下AB交叉(jiāochā)效应=[(y1+y4+y5+y8)-(y2+y3+y6+y7)]/4AC交叉(jiāochā)效应=[(y1+y3+y6+y8)-(y2+y34+y5+y7)]/4BC交叉效应=[(y1+y2+y7+y8)-(y2+y3+y5+y6)]/4三因素间交互作用效应ABC三项间的交叉作用在立体直观图上无法表示,其对应的计算式为ABC交叉效应=[(y2+y3+y5+y8)-(y1+y4+y6+y7)]/4第三十页,共185页。【例】液相色谱(sèpǔ)分离酚第三十一页,共185页。试验(shìyàn)立体直观图第三十二页,共185页。主效应(xiàoyìng)=[(y2+y4+y6+y8)-(y1+y3+y5+y7)]/4=[(9.5+10.7+8.8+11.7)-(10.0+11.0+9.3+11.9)]/4=-0.375

=[(y3+y4+y7+y8)-(y1+y2+y5+y6)]/4 =[(11.0+10.7+11.9+11.7)-(10.0+9.5+9.3+8.8)]/4

=1.925=[(y5+y6+y7+y8)-(y1+y2+y3+y4)]/4=[(9.3+8.8+11.9+11.7)-(10.0+9.5+11.0+10.7)]/4=0.125甲醇(jiǎchún)(M)乙酸(yǐsuān)(A)柠檬酸(C)第三十三页,共185页。两因素交叉(jiāochā)效应乙酸(yǐsuān)对甲醇(AM)=[(y8+y5+y4+y1)-(y7+y6+y3+y12)]/4=[(11.7+9.3+10.7+10)-(11.9+8.8+11+9.5+)]/4=0.125乙酸(yǐsuān)对柠檬酸(AC)=[(y8+y6+y3+y1)-(y7+y5+y4+y2)]/4=[(11.7+8.8+11+10)-(11.9+9.3+10.7+9.5+)]/4=0.025第三十四页,共185页。两因素(yīnsù)交叉效应甲醇(jiǎchún)对柠檬酸(MC)=[(y1+y2+y7+y8)-(y3+y4+y5+y6)]/4=[(10+9.5+11.9+11.7)-(11+10.7+9.3+8.8)]/4=0.825三因素(yīnsù)交叉效应乙酸甲醇柠檬酸(AMC)=[(y2+y3+y5+y8)-(y1+y4+y6+y7)]/4=[(9.5+11+9.3+11.9)-(10+10.7+8.8+11.9)]/4=0.025第三十五页,共185页。效应(xiàoyìng)及残差正态图效应(xiàoyìng)正态图(Normalplotofeffects)对各因素的主效应(xiàoyìng)及交叉效应(xiàoyìng)的计算后,进而需对这些效应(xiàoyìng)进行统计估价,决定哪些效应(xiàoyìng)在模型建立时需要包括,哪些可以忽略。正态图即正态分布图。是用来检测一系列

变量是否服从正态分布的图形。因正态分布为一种由多种不定因素综合效

果而产生出来的分布,所以,如某些效应

服从正态分布,就可认为它们实际对实验

不产生显著影响。第三十六页,共185页。

残差正态图(Normalplotofresiduals)残差正态图是在建立模型后,按模型计算(jìsuàn)试验结果的残差,进而对残差进行统计估价,判断所得模型是否合理。正态分布图的构造(gòuzào)1)先将需检验的一系列变量(biànliàng)按大小进行排列,对于已得到的各种效应,可得如下表所示的排列;色谱分离试验所得各种效应的顺序排列表效应名称AACAMCC AMMCM效应数值-0.3750.0250.0250.125 0.125 0.825 1.925第三十七页,共185页。2)计算累积概率:对于有T个数据(shùjù)的系列,可根据以下公式计算它们的累积概率Pi(%)=100(i-0.5)/T3)以需检验(jiǎnyàn)变量的标度为x轴,以累积概率为y轴作图,在图上能用一条直线描述的变量可视为是服从正态分布的变量。效应(xiàoyìng)名AACAMCCAMMCM概率7.1421.4335.715064.8878.5792.86第三十八页,共185页。色谱分离(fēnlí)试验的正态分布图第三十九页,共185页。从图可以看出,效应AC、AMC、C以及AM正好(zhènghǎo)落在一条直线上,说明它们对试验的影响很小,可以忽略。于是,如果需对此色谱分离试验建立回归模型的话,只需选择乙酸(A)、甲醇(M)和甲醇及柠檬酸的交叉效应(MC)来建立相应的模型即可。对数据(shùjù)建模得y=10.363-(0.375/2)XA+(1.925/2)XM+(0.825/2)XMC第四十页,共185页。得到上述模型后,用它来计算(jìsuàn)该模型的残差,如所得残差按上述方法所得的残差正态分布图可用一直线表出,说明模型是合理的。用此模型算出的残差列表,它们的残差正态分布图示于下图。这些残差点近似可由一条直线表出,但分散度较大。No. 1 2 3 4 5 6 7 8实验(shíyàn)值10.0 9.5 11.0 10.7 9.3 8.8 11.911.7计算值10.0 8.80 11.1 11.55 10.0 8.80 11.1011.55残差 -0.0 0.70 -0.10 -0.85 -0.70 -0.00 0.800.15色谱(sèpǔ)分离试验所得残差表第四十一页,共185页。色谱分离(fēnlí)试验的残差正态分布图第四十二页,共185页。对于来自于正态分布的一系列数据X,当把X按升序(由小到大)排列、对序号绘图后,大多数数据近似一条(yītiáo)直线。正态分布图正态分布随机产生的标准差为1的组数,排序后示意图(均值(jūnzhí)为0,100个数据)第四十三页,共185页。将T个自然数进行变换(biànhuàn),使成累积概率形式Pi(%)=100(i-0.5)/T此时,累积概率(gàilǜ)同自然数序列成线性关系第四十四页,共185页。正态分布随机(suíjī)产生的(均值为0,标准差为1)100个数据的组数,排序后,对按自然数进行变换,使成累积概率作图第四十五页,共185页。正态分布随机产生(chǎnshēng)的(均值为0,标准差为1)10个数据的组数,排序后,对按自然数进行变换,使成累积概率作图第四十六页,共185页。正态分布随机产生10个数据,排序(páixù)后,对按自然数进行变换,使成累积概率作图对直线偏离较大的点,或是不来自不同(bùtónɡ)分布蓝:均值(jūnzhí)为0标准差为1;红,均值(jūnzhí)为0标准差为4黑:均值(jūnzhí)为4标准差为1第四十七页,共185页。有关(yǒuguān)MATLAB指令生成服从正态分布的随机数:r=normrnd(mu,sigma,m)%mu为均值%sigma为标准差%m为1×2的向量%r=normrnd(0,1,[1001])排序:r=sort(r)累积(lěijī)概率:y=100*(i-0.5)/T绘图:plot(r,y,’o’)添加最小二乘拟合线:isline第四十八页,共185页。经正态分布图估算效应(xiàoyìng)的其它算法直接(zhíjiē)绘正态概率图MATLAB指令(zhǐlìng)normplot(x)%x待处理原始数组第四十九页,共185页。正态分布的Q-Q图MATLAB指令(zhǐlìng)qqplot(x)第五十页,共185页。第五十一页,共185页。关系(guānxì)模型对于二因素试验(shìyàn)方案,当用代表Y指标,代表X因素,因素与指标间的模型可用下列方程表示式中y表示4次试验结果构成的矢量,xj表示第j个因素在4次试验中的水平(shuǐpíng)矢量;e为误差矢量。写成矩阵为第五十二页,共185页。即A的最小二乘解为矩阵A中第一个a0元素是一常量(平均(píngjūn)贡献)a1,a2,分别是因素x1和x2的主效应a3是因素x1和x2的两者之间x1x2的交互效应的量度。在因子设计中,X矩阵(jǔzhèn)的形式非常简单,元素仅为“+1”和“-1”,其逆阵存在、且其值是原矩阵(jǔzhèn)的X的转置1/n倍。其中n为试验次数第五十三页,共185页。故可有即第五十四页,共185页。同理对于(duìyú)三因素试验方案第五十五页,共185页。第五十六页,共185页。对于实例(shílì)模型y=10.363-(0.375/2)XA+(1.925/2)XM+(0.825/2)XMC平均(píngjūn)贡献=10.363第五十七页,共185页。2水平(shuǐpíng)因子设计时需计算的效应数第五十八页,共185页。在实际研究中,因素只有(zhǐyǒu)3个的并不多,而且因素试验的水平也不可能只限于2,只要因素和水平数一增加,因子设计就显出了它的不足。即使全部因素均是二水平的,当因素数为n时,总试验数就是N=2n。第五十九页,共185页。部分(bùfen)因子设计(FractionalFactorialDesign)对于2水平(shuǐpíng)的部分因子设计半因子设计法N=2n-1四分之一因子设计法N=2n-1对于3水平(shuǐpíng)的部分因子设计三分之一因子设计法N=3n-1为何要进行部分因子(yīnzǐ)设计?在不损失信息的情况下,减少试验次数这一目标可能实现吗?第六十页,共185页。相关因素(yīnsù)硫酸锌(Zincsulphate,Z)硫酸镁(Magnesiumsulphate,M)pH值(P)对硝基苯基磷酸二钠(Disodiump-nitrophenylphosphate,D)2-氨基2-甲基-1-丙醇(2-Amino-2-methyl-1-propanol,A)实例(shílì):磷酸酶活性构造一个五因素两水平的全因子设计表来进行实验,以得到有关磷酸酶活性的主要影响因素等信息。试验(shìyàn)次数N=25=32第六十一页,共185页。第六十二页,共185页。第六十三页,共185页。第六十四页,共185页。磷酸酶活性25次全因子(yīnzǐ)效应正态分布图第六十五页,共185页。此结果似乎说明对于磷酸酶活性的试验原本就可只用三因子设计表来完成,因pH和硫酸镁的效应不显著。这从另一方面说明25次全因子试验本身就存在信息盈余,完全可以(kěyǐ)想办法减少试验次数。对磷酸酶活性有显著(xiǎnzhù)影响的因素A(2-氨基(ānjī)2-甲基-1-丙醇)D(对硝基苯基磷酸二钠)Z(硫酸锌)

ZD交叉效应(对硝基苯基磷酸二钠与硫酸锌)

DA交叉效应(2-氨基2-甲基-1-丙醇与对硝基苯基磷酸二钠)第六十六页,共185页。第六十七页,共185页。磷酸酶活性25-1次半因子(yīnzǐ)效应正态分布图第六十八页,共185页。3正交试验(shìyàn)设计基本思想在试验因素的全部水平组合中,挑选部分有代表性的水平组合进行(jìnxíng)试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优的水平组合。特点用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。本质上正交试验设计是一种特殊的部分因子设计第六十九页,共185页。正交试验(shìyàn)设计正交试验设计法是利用规格化的表格—正交表,科学地挑选试验条件,合理安排实验。正交试验设计法最早由日本质量管量专家田口玄一(Taguchi日本工业(gōngyè)之父)提出,称为国际标准型正交试验法。认为:“一个工程技术人员若不掌握正交试验设计法,只能算半个工程师”。我国工业(gōngyè)企业,正交试验设计法的应用也取得相当的成就,中国数学家张里千教授发明了中国型正交试验设计法。上世纪六七十年代由华罗庚教授倡导而兴起。第七十页,共185页。全面(quánmiàn)试验与正交试验全面试验(shìyàn)指参与试验(shìyàn)的全部因素与全部水平互之间的全部组合。例:有3个因素(A,B,C),每个因素有两水平(A1A2,B1B2,C1C2)则全面试验(shìyàn)数为:23=8当3因素3水平时,全面试验(shìyàn)的次数达到27次正交试验(shìyàn)相应的试验(shìyàn)次数分别为4次和9次。第七十一页,共185页。3因素(ABC)2水平(shuǐpíng)(1,2)的全面试验A1B1C1,A1B1C2,A1B2C1,A1B2C2,A2B1C1,A2B1C2,A2B2C1,A2B2C2NoABC1-(1)-(1)-(1)2+(2)-(1)-(1)3-(1)+(2)-(1)4+(2)+(2)-(1)5-(1)-(1)+(2)6+(2)-(1)+(2)7-(1)+(2)+(2)8+(2)+(2)+(2)23因子(yīnzǐ)设计(全面试验)表第七十二页,共185页。全面(quánmiàn)试验与正交试验直观图全面(quánmiàn)试验:27个试验点正交试验:9个试验点二因素(yīnsù)三水平直观图三因素三水平直观图每一平面有均匀分布的2个试验点3因素(ABC)3水平(1,2,3)试验每一平面有均匀分布的3个试验点第七十三页,共185页。完全(wánquán)对设有两组元素(yuánsù)a1,a2,…,an与b1,b2,…,bn,则有n×m个“元素(yuánsù)对”上数表为两组元素构成的“完全对”。如有一个矩阵的某两列中,同行元素所构成的元素是一完全对,并在此两列中每对出现的次数(cìshù)也相同,则称这两列搭配均衡,否则为搭配不均衡。第七十四页,共185页。两列搭配(dāpèi)均衡两列搭配不均衡(jūnhéng)(每对出现的次数不同)第七十五页,共185页。对于(duìyú)一个n×m阶矩阵A,它的第j列的元素由数码1,2,…,tj(j=1,2,…,m)所构成,如该矩阵的任意两列都搭配均衡,则称矩阵A为一个正交表。这里称矩阵为表,因可将其写成表格的形式,常简记为L:正交表的代号,拉丁(lādīnɡ)方(Latinsquare)第一个字母n:试验(shìyàn)次数tj(j=1,2,…,m):第j列由tj个水平组成t水平正交表各列水平均相同的正交表混合型正交表水平数均不同的正交表第七十六页,共185页。L9(33)试验(shìyàn)表(1/3实验)第七十七页,共185页。正交表的基本(jīběn)性质任一列中,各水平都出现,且出现的次数相等。例如L9(33)中不同数字有1、2和3,它们(tāmen)各出现3次。任何两列之间各种不同水平的所有可能组合都出现,且对出现的次数相等。即每个因素的一个水平与另一因素的各个水平所有可能组合次数相等。例如L9(34)中,A列与B列,A的3个水平分别与B的3个水平均进行了组合。A与C、A与D、B与C,B与D、C与D同样呈现上述的规律。正交性第七十八页,共185页。正交表的基本(jīběn)性质(1)任一列的各水平都出现,使得部分试验中包括了所有因素的所有水平;(2)任两列的所有水平组合都出现,使任意两因素间的试验组合为全面试验。由于正交表的正交性,正交试验的试验点必然均衡地分布在全面试验点中,具有很强的代表性。因此(yīncǐ),部分试验寻找的最优条件与全面试验所找的最优条件,应有一致的趋势。代表性第七十九页,共185页。正交表的基本(jīběn)性质综合(zōnghé)可比性在这9个水平组合中,A因素各水平下包括了B、C因素的3个水平,虽然搭配方式(fāngshì)不同,但B、C皆处于同等地位,当比较A因素不同水平时,B因素不同水平的效应相互抵消,C因素不同水平的效应也相互抵消。所以A因素3个水平间具有综合可比性。同样,B、C因素3个水平间亦具有综合可比性。第八十页,共185页。正交表的基本(jīběn)性质正交表的三个基本性质中,正交性是核心,是基础,代表性和综合可比性是正交性的必然结果根据(gēnjù)以上特性,我们用正交表安排的试验,具有均衡分散和整齐可比的特点。第八十一页,共185页。La(bc)正交设计(shèjì)试验(shìyàn)总次数,行数因素(yīnsù)的水平数因素个数,列数正交表的符号La(bc)第八十二页,共185页。正交试验(shìyàn)方案设计试验目的(mùdì)与要求试验(shìyàn)指标选因素、定水平选择合适正交表列试验方案试验结果分析第八十三页,共185页。交互(jiāohù)效应第八十四页,共185页。根据L8(27)表和其交互效应表,可将A因素(yīnsù)定在L8(27)表的第一列,B因素(yīnsù)定在L8(27)表的第二列。从L8(27)的交互效应表知,第1列与第2列的交叉效应在第3列,将其空出,将C因素(yīnsù)定在第4列,再由交互效应表知,第1列与第4列的交互效应在第5列,故也需将第5列空出,在根据交互效应表找出B因素(yīnsù)与C因素(yīnsù)的交互效应列,即第2列与第4列的交互效应列,从交互效应表可找出它们的交互效应列是第6列,也将其空出。于是,D因素(yīnsù)就定在第7列了。示例(shìlì)设有一化学反应,需考察(kǎochá)四个实验条件的影响:1)反应温度(A);2)反应时间(B);3)反应物配比(C);4)反应压力(D),并设各条件均是两水平考察交叉效应:A与B、A与C、B与C使用L8(27)表第八十五页,共185页。直观(zhíguān)分析法-极差分析法计算(jìsuàn)Kjm,kjm,Rj判断(pànduàn)因素主次优水平优组合正交试验的结果分析Kjm为第j列因素m水平所对应的试验指标和,kjm为Kjm平均值。Rj为第j列因素的极差,反映了第j列因素水平波动时,试验指标的变动幅度。Rj越大,说明该因素对试验指标的影响越大。根据Rj大小根据kjm大小根据kjm大小第八十六页,共185页。山楂液化(yèhuà)率试验影响(yǐngxiǎng)因素品种、果肉破碎度、加水量(shuǐliànɡ)、pH、果胶酶种类、酶量、酶解温度、酶解时间试验因素A:水量、B:酶量、C:酶解温度、D:酶解时间因素个水平:3水平试验因素加水量(mL/100g)A加酶量(mL/100g)B酶解温度(℃)C酶解时间(h)D1101201.52504352.53907503.5第八十七页,共185页。试验仅考察四个因素对液化率的影响效果(xiàoguǒ),不考察因素间的交互作,选用L9(34)正交表。试验号因素ABCD111112122231333421235223162312731328321393321试验结果(液化率%)0172412472811842第八十八页,共185页。试验号因素液化率%ABCD1111102122217313332442123125223147623122873132183213189332142K141134689K287827146K361947254k113.74.315.329.7k229.027.323.715.3k320.331.324.018.0极差R15.327.08.714.3主次顺序B>A>D>C优水平A2B3C3D1优组合A2B3C3D1第八十九页,共185页。指标(zhǐbiāo)趋势图第九十页,共185页。MATLAB计算(jìsuàn)>>r=4;f=3;%因素、水平数>>[r1,c]=size(data1);%数据大小>>t=zeros(f,r);%预设极差为零>>fork=1:fforj=1:rb=0;fori=1:r1ifdata1(i,j)==k%水平相同(xiānɡtónɡ)b=b+data1(i,c);%同水平相加endendt(k,j)=b;%替换endend>>t1=t/3;%求均值>>r=max(t1)-min(t1);%求极差>>data1=[1111012221713332421231222314723122831321321318332142];第九十一页,共185页。正交试验(shìyàn)结果的方差分析将数据的总变异分解成因素引起的变异和误差引起的变异两部分,构造F统计量,作F检验,即可判断因素作用(zuòyòng)是否显著。基本(jīběn)思想偏差平方和分解自由度分解方差构造F统计量列方差分析表,作F检验若计算出的F值F0>Fa,则拒绝原假设,认为该因素或交互作用对试验结果有显著影响;若F0≼Fa,则认为该因素或交互作用对试验结果无显著影响。第九十二页,共185页。L9(34)正交表处理号第1列(A)第2列第3列第4列试验结果yi11111y121222y231333y342123y452231y562312y673132y783213y893321y9分析第1列因素时,其它列暂不考虑(kǎolǜ),将其看做条件因素。因素A第1水平3次重复(chóngfù)测定值因素(yīnsù)A第2水平3次重复测定值因素A第3水平3次重复测定值因素重复1重复2重复3A1y1y2y3A2y4y5y6A3y7y8y9单因素试验数据资料格式和y1+y2+y3K1y4+y5+y6K2y7+y8+y9K3第九十三页,共185页。表头设计AB……试验数据列号12…kxixi2试验号11………x1x1221………x2x22…………………nm………xnxn2K1jK11K12…K1kK2jK21K22…K2k……………KmjKm1Km2…KmkK1j2K112K122…K1k2K2j2K212K222K2k2……………Kmj2Km12Km22…Kmk2SSjSS1SS2…SSkLn(mk)正交表及计算(jìsuàn)表格第九十四页,共185页。总偏差(piānchā)平方和列偏差(piānchā)平方和试验总次数(cìshù)为n,每个因素水平数为m个,每个水平作r次重复r=n/m。当m=2时,总自由度因素自由度第九十五页,共185页。啤酒酵母的最适自溶条件(tiáojiàn)示例(shìlì)2试验(shìyàn)指标自溶液中蛋白质含量(%)。试验因素温度(℃),pH值,加酶量(%)水平试验因素温度(℃)ApH值B加酶量(%)C1506.52.02557.02.43587.52.8因素水平表第九十六页,共185页。试验方案及结果(jiēguǒ)分析表处理号ABC空列试验结果yi11(50)1(6.5)1(2.0)16.25212(7.0)2(2.4)24.97313(7.5)3(2.834.5442(55)1237.53522315.54623125.573(58)13211.48321310.9933218.95K1j15.7625.1822.6520.74K2j18.5721.4121.4521.87K3j31.2518.9921.4822.97K1j2248.38634.03513.02430.15K2j2344.84458.39460.10478.30K3j2976.56360.62461.39527.62第九十七页,共185页。计算(jìsuàn)计算各列各水平(shuǐpíng)对应数据之和K1j、K2j、K3j及其平方K1j2、K2j2、K3j2。计算各列偏差(piānchā)平方同理,SSB=6.49,SSC=0.31,SSe=0.83(空列)第九十八页,共185页。计算(jìsuàn)自由度计算(jìsuàn)方差显著性检验(jiǎnyàn)根据以上计算,进行显著性检验,列出方差分析表,结果见表2-1变异来源平方和自由度均方F值Fa显著水平A45.40222.7079.6F0.05(2,4)=6.94**B6.4923.2411.4F0.01(2,4)=18.0*C△0.3120.16误差e0.8320.41误差e△

1.1440.285总和53.03表2-1方差分析表dfA=dfB=dfC=dfe=3-1=2第九十九页,共185页。因素A高度显著,因素B显著,因素C不显著。因素主次顺序A-B-C。(c可以(kěyǐ)选取最小值)优化工艺条件(tiáojiàn)的确定本试验(shìyàn)指标越大越好。对因素A、B分析,确定优水平为A3、B1;因素C的水平改变对试验(shìyàn)结果几乎无影响,从经济角度考虑,选C1。优水平组合为A3B1C1。即温度为58℃,pH值为6.5,加酶量为2.0%。

MATLAB的运用anovan函数功能:进行多因素的方差分析(analysisofvariance)p=anovan(x,group)x:试验结果。group:因素水平(各个因素个水平的排布即每列的排布没有交互相和误差项)第一百页,共185页。>>x=[6.254.974.547.535.545.511.410.98.95];>>g={[111222333];[123123123];[123231312]}>>p=anovan(x,g)'%转置使p结果(jiēguǒ)行显示pp=0.01790.11330.7264C因素最不显著(xiǎnzhù),将其剔除再做方差分析(c与e作误差相)>>g={[111222333];[123123123]}>>p=anovan(x,g)'p=0.00060.0224p:N个主效应零假设的p值。小于0.05或0.01时,认为(rènwéi)结果显著%花括号:元胞数组第一百零一页,共185页。正交试验(shìyàn)方差分析说明误差自由度一般不应小于2,dfe很小,F检验灵敏度很低,有时即使因素对试验指标有影响,用F检验也判断不出来。为了增大dfe,提高F检验的灵敏度,在进行显著性检验之前,先将各因素和交互作用的方差与误差方差比较,若MS因(MS交)<2MSe,可将这些因素或交互作用的偏差平方和、自由度并入误差的偏差平方和、自由度,这样(zhèyàng)使误差的偏差平方和和自由度增大,提高了F检验的灵敏度。由于进行F检验时,要用误差偏差平方和SSe及其自由度dfe,因此,为进行方差分析,所选正交表应留出一定空列。当无空列时,应进行重复试验,以估计试验误差。第一百零二页,共185页。表3-1试验方案(fāngàn)及结果分析表试验号ABA×BCA×CB×C空列吸光度111111112.42211122222.24312211222.66412222112.58521212122.36621221212.4722112212.79822121122.76K1j9.99.4210.2110.2310.2410.1210.19K2j10.3110.79109.989.9710.0910.02K1j-K2j-0.41-1.370.210.250.270.030.17SSj0.0210.2350.00550.00780.00910.00010.0036示例(shìlì)3AAS法测定食品中的铅第一百零三页,共185页。变异来源平方和自由度均方F值临界值Fa显著水平A0.021010.0216.82

F0.05(1,3)=10.13B0.234610.23576.19

F0.01(1,3)=34.12**A×B△0.005510.006C0.007810.0082.53A×C0.009110.0092.96B×C△0.000110.000误差e0.003610.004误差e△

0.009230.00308总和0.2818表3-2方差分析表显著性检验(jiǎnyàn)因素B高度显著,因素A、C及交互作用A×B、A×C、B×C均不显著。各因素对试验(shìyàn)结果影响的主次顺序为:B、A、A×C、C、A×B、B×C。第一百零四页,共185页。优化条件(tiáojiàn)确定交互作用均不显著,确定因素(yīnsù)的优水平时可以不考虑交互作用的影响。对显著因素(yīnsù)B,通过比较K1B和K2B的大小确定优水平为B2;同理A取A2,C取C1或C2。优组合为A2B2C1或A2B2C2。方差分析可以分析出试验误差的大小,从而知道试验精度;不仅可给出各因素及交互作用对试验指标影响的主次顺序,而且可分析出哪些因素影响显著,哪些影响不显著。对于显著因素,选取优水平并在试验中加以(jiāyǐ)严格控制;对不显著因素,可视具体情况确定优水平。但极差分析不能对各因素的主要程度给予精确的数量估计。第一百零五页,共185页。mydata=[11111112.42;11122222.24;12211222.66;12222112.58;21212122.36;21221212.4;22112212.79;22121122.76];f=2;r=7;[r1,c]=size(mydata);t=zeros(f,r);fork=1:fforj=1:rb=0;fori=1:r1ifmydata(i,j)==kb=b+mydata(i,c);endendt(k,j)=b;endendt/4R=max(t/4)-min(t/4)运用(yùnyòng)MATLAB分析第一百零六页,共185页。R=0.10250.34250.05250.06250.06750.00750.0425t=9.90009.420010.210010.230010.240010.120010.1900

10.3100

10.790010.00009.98009.970010.090010.0200>>g={[11112222];[11221122];[12121212]};>>anovan(mydata(:,8),g,[12345])'

由极差结果可知,6与7列对试验结果影响(yǐngxiǎng)很小,可删除方差分析%mydata(:,8):试验(shìyàn)指标%[12345]方差分析的编码1主项(zhǔxiànɡ)A2主项(zhǔxiànɡ)B3交叉项AB4主项(zhǔxiànɡ)C5交叉项AC6交叉项BC7交叉项ABC8交叉项D第一百零七页,共185页。>>anovan(mydata(:,8),g,[1245])'

ans=0.07950.00320.20940.1839ans=0.07840.00780.22750.17710.1575第一百零八页,共185页。试验(shìyàn)目的与要求试验(shìyàn)指标选因素(yīnsù)、定水平因素、水平确定选择合适正交表表头设计列试验方案试验方案设计试验结果分析第一百零九页,共185页。进行(jìnxíng)试验,记录试验结果试验结果(jiēguǒ)极差分析计算(jìsuàn)K值计算k值计算极差R绘制因素指标趋势图优水平因素主次顺序优组合结论试验结果分析试验结果方差分析列方差分析表,进行F检验计算各列偏差平方和、自由度分析检验结果,写出结论第一百一十页,共185页。表达设计ABCY试验结果列号试验号12341234567891(900)112(1100)223(1300)331(10)2(11)3(12)1231211(70)2(80)3(90)231312123312231160215180168236190157205140K1K2K3555594502485656510555523573yi=T=1651yi²=310519ST=7652.2k1k2k3185198167.3161.7218.7170185174.3191R30.75716.7S1421.65686.9427.6116.2第一百一十一页,共185页。4均匀(jūnyún)设计(uniformdesign)第一百一十二页,共185页。概述上世纪70年代(niándài)我国巡航导弹研究,当时七机部的5因素多于10水平,试验总数小于50的要求问题(wèntí)提出发明人王元时任中科院数学所所长(suǒchánɡ)方开泰时任中科院应用数学所副所长(suǒchánɡ)历史85多元统计学习班2002福特汽车公司讲学论文、专著均匀设计学会第一百一十三页,共185页。第一百一十四页,共185页。特点(tèdiǎn)试验(shìyàn)点分布均匀分散在处理设计中各个因素每个水平(shuǐpíng)只出现一次适用于多水平多因素模型拟合及优化试验试验结果采用回归分析方法与正交设计的比较正交试验特点为“均衡分散、整齐可比”,而均匀设计不考虑整齐可比性而完全保证均匀性,让试验点在试验范围内充分地均匀分散,大大地减少了试验点,对于3因素5水平试验,正交法需25次试验,而均匀法仅有5次。第一百一十五页,共185页。3因素(yīnsù)5水平均匀设计和正交设计的比较图第一百一十六页,共185页。均匀设计(shèjì)表及其使用Un(qs)均匀(jūnyún)设计试验(shìyàn)次数因素的最大数水平数第一百一十七页,共185页。

均匀设计(shèjì)表及其使用均匀(jūnyún)设计是通过一套精心设计的表来进行试验设计的。每一个均匀(jūnyún)设计表有一个代号,Un(qs)其中“U”表示均匀(jūnyún)设计,“n”表示要做n次试验,“q”表示每个因素有q个水平(n=q),“s”表示该表有s列。每个均匀设计表都附有一个(yīɡè)使用表,它指示我们如何从设计表中选用适当的列,以及由这些列所组成的试验方案的偏差。由于均匀设计表列间的相关性最多安排因素第一百一十八页,共185页。12341123422413331424432155555U5(54)表因素数列号2123124U5(54)使用(shǐyòng)表第一百一十九页,共185页。1234561123456224613533625144415263553164266543217777777因素数列号212312341236U7(76)表U7(76)使用(shǐyòng)表第一百二十页,共185页。U9(96)表因素数列号212313541235U9(96)使用(shǐyòng)表第一百二十一页,共185页。均匀设计(shèjì)表结构每个因素(yīnsù)的每个水平各作一次试验,表中的行数体现了水平数,即试验次数;表中的列数是最多可供选择的列数。表中第一列的数字(shùzì)按自然数的顺序由1排到n(试验次数)对于为素数的试验表,表中第一行的数字,按自然数的顺序由1排到n-1对于为非素数的试验表,表中第一行的数字均小于n

,且不包括可被n整除的数,排列顺序也是由小到大任一列的数字没有重复对于n为偶数的试验表,列数较少。第一百二十二页,共185页。均匀设计(shèjì)表使用对于均匀设计使用表,是建议我们(wǒmen)如何选择适当的列。其中‘偏差’为均匀性的度量值,数值小的设计表示均匀性好。例如U7(74)的使用表为第一百二十三页,共185页。均匀(jūnyún)设计表使用第一百二十四页,共185页。数据分析—多元回归复习(fùxí)一元(yīyuán)线性回归分析x:0.000

0.020

0.040

0.060

0.080

0.100

0.120y:0.032

0.135

0.187

0.268

0.395

0.435

0.511X与Y的函数(hánshù)表达?X与Y函数式怎样确定?X与Y函数式正确性如何?第一百二十五页,共185页。X与Y的函数(hánshù)表达?若n有个实验点(xi,yi),则的观察(guānchá)值yi可由下式表达式中,ei为残差。令yi的估计值为则X与Y函数式怎样(zěnyàng)确定?只要确定了线性方程中的b(斜率)与a

(截距),即可确定函数式X与Y函数式正确性如何?所有的点(xi,yi)到直线距离越近,即选取a与b

,使残差平方和Q=ei2=[yi-(a+bxi)]2越小,所建立的函数式越准确,即最小二乘。第一百二十六页,共185页。求Q(a,b)的最小,即求其极值(jízhí)利用(lìyòng)上二式可解得系数(xìshù)的求算第一百二十七页,共185页。相关(xiāngguān)程度检验用一个(yīɡè)数量性指标来描述两变量线性关系的密切程度。在直线回归中,人们常用相关系数r来衡量两变量间线性关系的密切程度。r值在0-1之间,r值越接近(jiējìn)0,两变量间的线性相关性越差;越接近(jiējìn)1,两变量间的线性相关性越好。第一百二十八页,共185页。方差分析总偏离(piānlí)平方和加归平方和残差平方和第一百二十九页,共185页。MATLAB的实现(shíxiàn)restool函数(hánshù)生成(shēnɡchénɡ)线性拟合图在图中Export下拉式中进行选择,当选all后蓝线可拖动,相应的X1,Y1发生变化,或在X1框中输入第一百三十页,共185页。>>beta‘%拟合(nǐhé)系数beta=0.03994.0089前一为截距a,后一为斜率(xiélǜ)b>>rmse%均方差(fānɡchà)rmse=0.0197>>residuals‘

%残差-0.00790.0149-0.0133-0.01240.0344-0.0058-0.0100Corrcoef

函数>>corrcoef(x,y)ans=1.00000.99470.99471.0000第一百三十一页,共185页。多元线性回归(huíguī)分析观测数yx1x2x3xm1y1x11x12x13x1m2y2x21x22x23x2m3y3x31x32x33x3m::::::nynxn1xn2xn2xnmm个变量(biànliàng)n次测试的一般表示y的观测(guāncè)值可表示为令则第一百三十二页,共185页。类似一元(yīyuán)回归统计(tǒngjì)检验若则说明(shuōmíng)回归效果较显著复相关系数第一百三十三页,共185页。MATLAB的实现(shíxiàn)regess函数(hánshù)[b,bint,r,rint,stats]=regress(y,x)stats包含R2统计(tǒngjì)量,回归的F值和p值X=71111171,13122111110262956315255713154474066686158869172218423986052204733226442226341212y=[78.574.3104.387.695.9109.2102.772.593.1115.983.8113.3109.4]在b中返回的β估计bint为的95置信区间r为残差,第一百三十四页,共185页。b=2.19301.15330.75850.4863bint=1.77392.61221.04491.26180.39771.11940.39260.5800r=-0.56801.9943-0.2042-1.2017-0.02394.1180-1.5779-3.53142.0821-0.03861.49330.3946-2.8605rint=-4.72183.5858-2.64786.6363-5.63255.2240-6.17673.7733-4.73054.6828-0.22838.4642-6.03042.8747-7.11300.0502-2.86647.0306-3.32623.2490-2.94095.9276-4.80885.5980-7.38501.6639stats=0.9860152.69200.0000第一百三十五页,共185页。逐步回归分析(fēnxī)最优回归方程的选择(xuǎnzé)从所有可能(kěnéng)的组合中挑选最优。但变量多时不可行从包含全部变量方程中剔除。但当变量很多,且重要变量少时,方法效率低。把变量个引入方程。但先引入的可能使后面的变量的显著性降低逐步回归法按自变量对y作用的显著程度,从大到小依次逐个引入,但先引入的变量由于后面的变量变的不显著时,则随时将其剔除。即每一步的前后都要作显著性检验,引入新变量前回归方程中只包含显著的变量,直到没有显著的变量可引入。第一百三十六页,共185页。MATLAB的实现(shíxiàn)Stepwise(x,y)函数(hánshù)窗口(chuāngkǒu)1Parameter:变量回归系数Cofidenceintervals:变量回归系数95%置信区间RMSE:均方差;R-suare:相关系数平方第一百三十七页,共185页。窗口(chuāngkǒu)2均方差(fānɡchà)示意图窗口(chuāngkǒu)3误差条图点击图中圆圈或线,可转换对应变量的引入或剔除状态。红色对应剔除,绿色为引入。下拉式列表框,可确定有关信息的输出常数项mean(y)-mean(x(:,in))*beta(in)第一百三十八页,共185页。拟水平均匀(jūny

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论