正交试验设计的方差分析_第1页
正交试验设计的方差分析_第2页
正交试验设计的方差分析_第3页
正交试验设计的方差分析_第4页
正交试验设计的方差分析_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

正交试验设计的方差分析第1页,共28页,2023年,2月20日,星期六

为了弥补直观分析方法的不足,可采用方差分析方法对实验结果进行计算分析。所谓方差分析就是将因素水平(或交互作用)的变化引起的实验结果间的差异与误差的波动所引起的实验结果间的差异区分开来的一种数学方法。

方差分析的中心要点是:把实验数据总的波动分解成两部分,一部分反映因素水平变化引起的波动,另一部分反映实验误差引起的波动。即把数据总的偏差平方和(S总)分解为因素的偏差平方和(SA、SB、SC

……)与误差的偏差平方和(Se),并计算它们的平均偏差平方和(也称均方和,或均方),然后进行检验,最后得出方差分析表。第2页,共28页,2023年,2月20日,星期六二.方差分析中的一些基本概念

1.偏差平方和

方差分析的关键是对偏差平方和的分解,因此,充分理解这一概念是至关重要的。

所谓偏差平方和是指一组数据中,各个数(y1,y2,y3……yn)与它们的算术平均数y之差的平方和。用符号S来表示。即:则第3页,共28页,2023年,2月20日,星期六为了计算方便,上式可简化为一种更常见的形式:若令:则第4页,共28页,2023年,2月20日,星期六

偏差平方和(S)反映了该组数据的分散或集中程度。显然,S越大,该组数据越分散;反之,S越小,说明该组数据越集中。

2.平均偏差平方和与自由度

为了合理地比较由不同个数所组成的两组数据的分散或集中的程度,通常采用平均偏差平方和(简称均方和)平均偏差平方和的计算方法是:将n个数(y1,y2,y3,……yn)

的偏差平方和除以平方项的个数减1,

即除以(n-1),就得到平均偏差平方和。第5页,共28页,2023年,2月20日,星期六

为什么不除以n而要除以(n-1)呢?这是因为n个数(y1,y2,y3,……yn)之间并非彼此毫无关系,它们满足的关系是:

即n个数之和的均值为一定值,因此,n个数中只有(n-1)个可“自由”变动,所以,求平均偏差平方和时除以(n-1),数学上将这个(n-1)称为S的自由度。当实验所测得的n个数(y1,y2,y3,……yn)数值较大时,为了简化计算,可将每一个原始数据yi(i=1,2,3……n)都减去同一个常数C,这并不影响偏差平方和的计算结果,但计算的工作量却简化了许多。第6页,共28页,2023年,2月20日,星期六上述推论可通过以下简单换算予以证明。

若令Xi=yi-C(i=1,2,……n)则于是第7页,共28页,2023年,2月20日,星期六3.F比与F分布表

(1)F比

F比是指因素水平的改变引起的平均偏差平方和与误差的平均偏差平方和的比值。即:(2)F分布表及其查阅方法为了判断F比值的大小所表明的物理意义(即F比值多大时,可以认为实验结果的差异主要是由因素水平的改变所引起的;其值多小时,可以认为实验结果的差异主要是由实验误差所引起的),这就需要有一个标准来衡量F比值,此标准就是根据统计数学原理编制的F分布表,F分布表列出了各种自由度情况下F比的临界值。第8页,共28页,2023年,2月20日,星期六

在F分布表上横行(n1:1,2,3…)代表F比中分子的自由度;竖行(n2:1,2,3…)代表F比中分母的自由度;表中的数值即各种自由度情况下F比的临界值。

例如,某因素A的偏差平方和的自由度fA=1,误差(e)的偏差平方和的自由度fe=8,查得F0.1(1,8)=3.64,这里0.1是信度。

在判断时(如判断因素A的水平的改变对实验结果是否有显著影响),信度a是指我们对做出的判断有多大的把握,若a=5%,那就是指当FA>F0.05(fA,fe)时,大概有95%的把握判断因素A的水平改变对实验结果有显著影响。对于不同的信度a,有不同的F分布表,常用的有a=1%,a=5%,a=10%等。根据自由度的大小,可在各种信度的F表上查得F比的临界值,分别记作

F0.01(n1,n2),F0.05(n1,n2),F0.10(n1,n2)等。第9页,共28页,2023年,2月20日,星期六4.因素的显著性判断

设因素A的F比为FA:

当FA>F0.01(n1,n2)时,说明该因素水平的改变对实验结果有很显著的影响,记作**。

当FA>F0.05(n1,n2)时,说明该因素水平的改变对实验结果有显著的影响,记作*。

当FA>F0.10(n1,n2)时,说明该因素水平的改变对实验结果有一定的影响,记作O。第10页,共28页,2023年,2月20日,星期六三.正交试验设计的方差分析

现以实验室制取H2为例,来说明正交设计的方差分析的基本方法。若该实验所考察的因素、水平如表1和表2所示。

因素水平AwH2SO4(%)BmCuSO4·5H2O(g)CmZn(g)一200.44二250.55三300.66表1.因素水平第11页,共28页,2023年,2月20日,星期六表2.实验方案及实验结果的直观分析

列号实验号AwH2SO4(%)BmCuSO4·5H2O(g)CmZn(g)空白列10min内H2的产率1111232.622212140.403313341.074123134.975221336.536322245.757132336.628233239.199331144.53第12页,共28页,2023年,2月20日,星期六

列号实验号AwH2SO4(%)BmCuSO4·5H2O(g)CmZn(g)空白列10min内H2的产率K1104.21114.09122.77119.9最佳实验条件是A3B3C1K2116.12117.25115.23117.56K3131.35120.34113.68114.22k134.7838.0340.9239.96k238.7039.0838.4139.18k343.7840.1137.8938.07R9.052.083.031.89第13页,共28页,2023年,2月20日,星期六上述正交试验设计所获得的数据,从直观分析的角度来看,提供给我们如下有用的信息:

第一:从极差值的大小可以判断各个因素对实验指标影响的主次关系,即:

主--------------------------------------------次

A[wH2SO4]C[mZn]B[mCuSO4·5H2O]

但是,极差值仅仅反映了各因素影响实验指标的主次关系,它不能告诉我们各个因素对实验指标影响的程度。也就是说,它既不能指明这些因素中哪个是影响实验指标的关键因素,也不能提供一个标准,用来考察、判断各个因素的作用是否显著。第14页,共28页,2023年,2月20日,星期六第二:就因素A而言(因素B、C也类同),其中k1、k2、k3值之间的差异是如何产生的?是由于A因素水平不同引起的呢?还是由于实验误差所造成的呢?还是两者综合作用的结果?从直观分析角度是无法说清楚的。

正是由于直观分析存在着上述的缺点,所以需要采用方差分析的方法来弥补上述的不足。

1.单因素实验的方差分析

为了便于讨论,我们仍以实验室制取H2的因素之一------A因素(硫酸的质量分数)为例,来说明单个因素的实验数据的方差分析方法。第15页,共28页,2023年,2月20日,星期六

方差分析是把实验数据总的波动(即数据的总的偏差平方和S总)分解成两部分:一部分反映因素水平变化引起的波动(即因素的偏差平方和),对本例而言仅为SwH2SO4;另一部分反映实验误差引起的波动(即误差的偏差平方和Se)。即:

(1)Se的计算

参与wH2SO4某一水平的实验编号

10minH2产率A1(20%)A2(25%)A3(30%)A1(20%)A2(25%)A3(30%)12332.6240.4041.0745634.9736.5345.7578936.6239.1944.53

平均值y34.7438.7143.78表3.实验结果分析第16页,共28页,2023年,2月20日,星期六若以S1表示A1水平下实验误差所引起的波动,其值应为:S1=(32.62-34.74)2+(34.97-34.74)2+(36.62-34.74)2

=8.0870。同理可以求出A2、A3水平下实验误差所引起的波动,其值分别为S2=7.8389,S3=11.7875

则,A因素的各个水平下总的偏差平方和应为:

Se=S1+S2+S3=8.0870+7.8389+11.7875=27.71

(2)S总的计算

总的偏差平方和S总是指全部实验数据中,每个数据(yi)与总平均值(y总)之差的平方和,即:第17页,共28页,2023年,2月20日,星期六由表3知:

y总=1/9(32.62+34.97+36.62+40.40+…+44.53)=39.08

则:S总=(32.62-39.08)2+(34.97-39.08)2+…+(44.53-39.08)2=151.08

S总反映了实验数据总的波动情况,如果硫酸质量分数水平的改变对实验指标不发生影响,而且实验中也没有误差产生的话,那么全部实验数据理应都一样,即S总应等于零,但情况并非如此。第18页,共28页,2023年,2月20日,星期六(3)SwH2SO4(SA)的计算

对于因素A来讲,当它取一水平时,3次实验(即1、4、7实验)结果的均值(y)应为:

y1=1/3(y1+y4+y7)=1/3(32.62+34.93+36.62)=34.74

y1代表了3次一水平实验对H2产率的影响。同理:

y2=1/3(y2+y5+y8)=38.71

y3=1/3(y3+y6+y9)=43.78

y2、y3分别代表了3次二水平和三水平实验对H2产率的影响。因此,因素水平变化所引起的波动,即因素A的偏差平方和SA应为:

SA=∑(yi-y总)2=(34.74-39.08)2+(38.71-39.08)2+(43.78-39.08)2

=123.37上述计算结果我们可以通过S总=SA+Se式来检验SA和Se计算正确与否。第19页,共28页,2023年,2月20日,星期六(4)自由度和平均偏差平方和的计算

为了消除个数不同对实验指标所产生的影响,应采用平均偏差平方和,其计算公式为:

因素A的平均偏差平方和=SA/fA

误差的平均偏差平方和=Se/fe

式中SA、Se分别代表因素A和误差的偏差平方和

fA=A因素的水平数-1,它代表SA的自由度

fe=f总-fA,它代表Se的自由度

f总=总的实验次数-1,它代表S总的自由度

在本例中f总=9-1=8,fA=3-1=2,fe=8-2=6第20页,共28页,2023年,2月20日,星期六(5)F值的计算及因素显著性的检验

因素水平的变化引起的平均偏差平方和与误差的平均偏差平方和的比值称为F值,即:用F值的大小来判断因素水平对实验指标的影响。显然,只有当比值大于1时,才能表明因素水平的改变对实验指标的影响,即超过了实验误差所产生的影响。第21页,共28页,2023年,2月20日,星期六

为了判断因素对实验结果形象的显著性的大小,须将计算得到的F值与从F分布表上查到的相应临界值进行比较。当F值大于临界值时,表明该因素对实验结果影响显著。

就本例而言:FA=(123.37/2)/(27.71/6)=13.36

查F检验的临界值表可知:

F0.10(2,6)=3.46,F0.05(2,6)=5.14,F0.01(2,6)=10.9

由于FA>

F0.10(2,6),所以我们可以认为,有99%以上的把握判断因素A的水平改变对实验结果有极为显著的影响,以“**”标记。由此可得出如下结论:对10minH2产率的影响是由硫酸浓度的差异所引起的。第22页,共28页,2023年,2月20日,星期六2.多因素实验的方法分析

和单因素实验的情况一样,多因素实验方差分析的目的仍然是将实验误差所引起的结果与实验条件的改变(即各因素水平的改变)所引起的结果区分开来,以便能抓住问题的实质,此外,多因素实验的方差分析还要将影响实验结果的主要因素和次要因素区分开来,以便集中力量研究主要因素。

我们仍以实验室制取H2为例,来阐明多因素单指标实验方差分析的基本步骤。第23页,共28页,2023年,2月20日,星期六(1)因素的偏差平方和的计算自由度f=3-1=2,为了简化计算,上式可写为其中CT=G2/n第24页,共28页,2023年,2月20日,星期六则将数据带入上式CT=G2/9=(351.68)2/9=13742.09第25页,共28页,2023年,2月20日,星期六SA=(104.21

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论