田间试验与统计方法11 响应面设计_第1页
田间试验与统计方法11 响应面设计_第2页
田间试验与统计方法11 响应面设计_第3页
田间试验与统计方法11 响应面设计_第4页
田间试验与统计方法11 响应面设计_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、11.1 回归设计概述回归设计概述 回归设计(也称为响应曲面设计),目的是回归设计(也称为响应曲面设计),目的是寻找试验指标与各因子间的定量规律,考察的因寻找试验指标与各因子间的定量规律,考察的因子都是定量的子都是定量的 。 它是在它是在多元线性回归多元线性回归的基础上用主动收集数的基础上用主动收集数据的方法获得具有较好性质的据的方法获得具有较好性质的回归方程回归方程的一种试的一种试验设计方法验设计方法。 11.1.1 多项式回归模型多项式回归模型 在一些试验中希望建立指标在一些试验中希望建立指标y与各定量因子与各定量因子 (又称变量)(又称变量) 间相关关系的定量表达式,即回归方程,间相关关

2、系的定量表达式,即回归方程,以便通过该回归方程找出使指标满足要求的各因子的范以便通过该回归方程找出使指标满足要求的各因子的范围围 。 可以假定可以假定 y与与 间有如下关系:间有如下关系: 这里这里 是是 的一个函数,常称为的一个函数,常称为响应函数,其图形也称为响应曲面;响应函数,其图形也称为响应曲面; 是随机误差,通常假定它服从均值为是随机误差,通常假定它服从均值为0,方差为,方差为 的正态分布。的正态分布。 在上述假定下,在上述假定下, 可以看作为在给定可以看作为在给定 后指标的均值,即后指标的均值,即 pzzz,21pzzz,21),(21pzzzfy),(21pzzzfpzzz,21

3、2),(21pzzzfpzzz,21),()(21pzzzfyE 称称z 的可能取值的空间为的可能取值的空间为因子因子空间。我们的任务便空间。我们的任务便是从因子空间中寻找一个点是从因子空间中寻找一个点z0 使使E(y)满足质量要满足质量要求。求。 当当f的函数形式已知时,可以通过最优化的方法去寻找的函数形式已知时,可以通过最优化的方法去寻找z0 。在在许多情况下许多情况下f的形式并不知道,这时常常用一个多项式去逼近它,的形式并不知道,这时常常用一个多项式去逼近它,即假定:即假定: ),(21pzzz),(00201pzzz(7.1.1) 20jijiijjjjjjjjzzzzy这里各这里各

4、为未知参数,也称为回归系数,通常需要通为未知参数,也称为回归系数,通常需要通过收集到的数据对它们进行估计。过收集到的数据对它们进行估计。 若用若用 表示相应的估计,则称表示相应的估计,则称 ,0ijjjj,0ijjjjbbbb ybb zb zb z zjjjjjjjijijij02为为y关于关于 的多项式回归方程。的多项式回归方程。 pzzz,21 在实际中常用的是如下的一次与二次回归方程(也称一在实际中常用的是如下的一次与二次回归方程(也称一阶与二阶模型):阶与二阶模型):jjjzbby0 20jijiijjjjjjjjzzbzbzbby一般一般p个自变量的个自变量的d次回归方程的系数个数

5、为次回归方程的系数个数为 ddp11.1.2 多元线性回归多元线性回归 (14.1.1)是一个多项式回归模型,在对变量作了变换并重新命是一个多项式回归模型,在对变量作了变换并重新命名后也可以看成是一个多元线性回归模型。名后也可以看成是一个多元线性回归模型。 1 1回归模型回归模型 设所收集到的设所收集到的n n组数据为组数据为假定回归模型为:假定回归模型为: niyxxxiipii, 2 , 1 ),(21 ), 0(, 2 , 12110Niidnixxyiiippii各,记随机变量的观察向量为记随机变量的观察向量为 未知参数向量为未知参数向量为 不可观察的随机误差向量为不可观察的随机误差向

6、量为 结构矩阵结构矩阵那么上述模型可以表示为:那么上述模型可以表示为:nyyyY21p10n21npnppxxxxxxX1221111111),(nnINXY20或或),(2nnIXNY 2回归系数的最小二乘估计回归系数的最小二乘估计 估计回归模型中回归系数的方法是最小二乘法。估计回归模型中回归系数的方法是最小二乘法。 记回归系数的最小二乘估计(记回归系数的最小二乘估计(LSE)为)为 ,应满足如下正规方程组:应满足如下正规方程组: 当当 存在时,最小二乘估计为存在时,最小二乘估计为 在求得了最小二乘估计后,可以写出回归方程:在求得了最小二乘估计后,可以写出回归方程: 今后称今后称 为正规方程

7、组的系数矩阵,为正规方程组的系数矩阵, 为正为正规方程组的常数项向量,规方程组的常数项向量, 为相关矩阵。为相关矩阵。 在前述模型下,有在前述模型下,有 ),(10pbbbbYXXbX1XXYXXXb1ppxbxbby110XXAYXB1XXC)(,(12XXNb若记若记 ,那么,那么)(1ijcXXCpjcNbjjjj, 2 , 1 , 0 ),(2在通常的回归分析中,由于在通常的回归分析中,由于C C非对角阵,所以各回归系数间非对角阵,所以各回归系数间是相关的:是相关的: 2),(ijjicbbCov 3对回归方程的显著性检验对回归方程的显著性检验 对回归方程的显著性检验是指检验如下假设:

8、对回归方程的显著性检验是指检验如下假设: H0: H1: 不全为不全为0检验方法是作方差分析。检验方法是作方差分析。 记记 则有平方和分解式则有平方和分解式 其中其中 为残差平方和,自由度为为残差平方和,自由度为 为回归平方和,自由度为为回归平方和,自由度为当当H0为真时,有为真时,有 对于给定的显著性水平对于给定的显著性水平 ,拒绝域为,拒绝域为 。 021pp,21nixbxbbyippii,2,1110,REniiniiiniiTSSyyyyyyS121212)()()(iiiEyyS2)(1pnfE2)(yySiRpfR) 1,(),(/pnpFffFfSfSFEREERR) 1,(1

9、pnpFF 若记p+1维向量 ,那么 )(jBBYXppniiiiiEBbBbBbyyyS1100122)(ETiRSSyyS2)( 4失拟检验失拟检验 当在某些点有重复试验数据的话,可以在检验回归方程显著性当在某些点有重复试验数据的话,可以在检验回归方程显著性之前,先对之前,先对y 的期望是否是的期望是否是 的线性函数进行检验,这种的线性函数进行检验,这种检验称为失拟检验,它要检验如下假设:检验称为失拟检验,它要检验如下假设: H H0 0: H H1 1:当在当在 上有重复试验或观察时,将数据记为上有重复试验或观察时,将数据记为 其中至少有一个其中至少有一个 ,记,记 。此时残差平方和可进

10、一。此时残差平方和可进一步分解为组内平方和与组间平方和,其中组内平方和就是误差平方步分解为组内平方和与组间平方和,其中组内平方和就是误差平方和,记为和,记为 ,组间平方和称为失拟平方和,记为,组间平方和称为失拟平方和,记为 ,即:,即: pxxx,21ppxxEy110ppxxEy110),(21ipiixxxnimjyxxxiijipii, 2 , 1, 2 , 1),(21,2imniimN1eSLfeESSSLfSnimjiijeiyyS121)(nNmfie) 1(imjijiiymy11niiiiLfyymS12)(1pnfLf, 检验统计量为检验统计量为 在在H0为真时,为真时,

11、,对于给定的显著性水,对于给定的显著性水平平 ,拒绝域为,拒绝域为 当拒绝当拒绝H0时,需要寻找原因,改变模型,否则认为线性回归时,需要寻找原因,改变模型,否则认为线性回归模型合适,可以将模型合适,可以将Se与与SLf合并作为合并作为SE检验方程是否显著。检验方程是否显著。其中其中eeLfLfLffSfSF/),(eLfLfffFF),(1eLfLfffFF 5对回归系数的显著性检验对回归系数的显著性检验 当回归方程显著时,可进一步检验某个回归系数是否为当回归方程显著时,可进一步检验某个回归系数是否为0,也即检验如下假设:也即检验如下假设: 此种检验应对此种检验应对j=1,2, p逐一进行。逐

12、一进行。 常用的检验方法是常用的检验方法是t t检验或等价的检验或等价的F F检验,检验,F F检验统计量为:检验统计量为:其中其中 是是 中的第中的第j j+1+1个对角元。个对角元。 记分子为记分子为 ,即,即 ,它是因子,它是因子 的偏回归平方和的偏回归平方和 分母是模型中分母是模型中 的无偏估计。的无偏估计。 , 也称为也称为 的标准误,即其标准差的估的标准误,即其标准差的估计。计。 0010jjjjHH:,:222/jjjjjcbtFjjc1)(XXjSjjjjcbS/2jx2EEfS / jjcjb 当当H0j为真时,有为真时,有 。 给定的显著性水平给定的显著性水平 ,当,当 时

13、拒绝假设时拒绝假设H0j,即认为即认为 显著不为零,否则可以将对应的变量从回归方程中显著不为零,否则可以将对应的变量从回归方程中删除。删除。 注:当有不显著的系数时,一般情况下一次只注:当有不显著的系数时,一般情况下一次只能删除一个能删除一个F值最小的变量,重新计算回归系值最小的变量,重新计算回归系数,再重新检验。通常要到余下的系数都显著数,再重新检验。通常要到余下的系数都显著时为止。时为止。 ), 1 (EjfFF), 1 (1EjfFFj11.1.3 回归分析对数据的处理由被动变主动回归分析对数据的处理由被动变主动 古典的回归分析方法只是被动地处理已有的试验数据,古典的回归分析方法只是被动

14、地处理已有的试验数据,对试验的安排不提任何要求,对如何提高回归方程的精度研对试验的安排不提任何要求,对如何提高回归方程的精度研究很少。究很少。 后果:后果: (1)盲目增加试验次数,而这些试验结果还不能提供充)盲目增加试验次数,而这些试验结果还不能提供充分的信息,以致在许多多因子试验问题中达不到试验目的。分的信息,以致在许多多因子试验问题中达不到试验目的。 (2)对模型的合适性有时无法检验,因为在被动处理数)对模型的合适性有时无法检验,因为在被动处理数据时在同一试验点上不一定存在重复试验数据。据时在同一试验点上不一定存在重复试验数据。 为了适应寻求最佳工艺、最佳配方、建立生产过程的数为了适应寻

15、求最佳工艺、最佳配方、建立生产过程的数学模型等的需要,人们就要求以较少的试验次数建立精度较学模型等的需要,人们就要求以较少的试验次数建立精度较高的回归方程。高的回归方程。 为此,要求摆脱古典回归分析的被动局面,主动把试验为此,要求摆脱古典回归分析的被动局面,主动把试验的安排、数据的处理和回归方程的精度统一起来考虑,即根的安排、数据的处理和回归方程的精度统一起来考虑,即根据试验目的和数据分析的要求来选择试验点,不仅使得在每据试验目的和数据分析的要求来选择试验点,不仅使得在每一个试验点上获得的数据含有最大的信息,从而减少试验次一个试验点上获得的数据含有最大的信息,从而减少试验次数,而且使数据的统计

16、分析具有一些较好的性质。数,而且使数据的统计分析具有一些较好的性质。 这就是二十世纪五十年代发展起来的这就是二十世纪五十年代发展起来的“回归设计回归设计”所研究所研究的问题。的问题。 回归设计的分类:回归设计的分类: 根据建立的回归方程的次数不同,回归设计有一次回归根据建立的回归方程的次数不同,回归设计有一次回归设计、二次回归设计、三次回归设计等;设计、二次回归设计、三次回归设计等; 根据设计的性质又有正交设计、旋转设计等。根据设计的性质又有正交设计、旋转设计等。 11.1.4 因子水平的编码因子水平的编码 在回归问题中各因子的量纲不同,其取值的范围也不同,为在回归问题中各因子的量纲不同,其取

17、值的范围也不同,为了数据处理的方便,对所有的因子作一个线性变换,使所有因了数据处理的方便,对所有的因子作一个线性变换,使所有因子的取值范围都转化为中心在原点的一个子的取值范围都转化为中心在原点的一个“立方体立方体”中,这一中,这一变换称为对因子水平的编码。变换称为对因子水平的编码。 方法如下:方法如下: 设因子设因子 的取值范围为:的取值范围为: , 与与 分别称为因子分别称为因子 的下水平与上水平。的下水平与上水平。其中心也称为零水平:其中心也称为零水平: , 因子的变化半径为因子的变化半径为 , 令令 ,此变换式就称为此变换式就称为“编码式编码式”。 jzjjjzzz21pj, 2 , 1

18、jzjz1jz22/ )(210jjjzzzpj, 2 , 12/ )(12jjjzzpj, 2 , 1jjjjzzx0pj, 2 , 1 例例 硝基蒽醌中某物质的含量硝基蒽醌中某物质的含量y与以下三个因子有关:与以下三个因子有关: z1:亚硝酸钠(单位:克):亚硝酸钠(单位:克) z2:大苏打(单位:克):大苏打(单位:克) z3:反应时间(单位:小时):反应时间(单位:小时)为提高该物质的含量,需建立为提高该物质的含量,需建立y关于变量关于变量z1,z2,z3的回归方程。的回归方程。 1试验设计试验设计 (1)确定因子取值范围,并对它们的水平进行编码)确定因子取值范围,并对它们的水平进行编

19、码 本例的因子水平编码见下表。本例的因子水平编码见下表。 表表 因子水平编码表因子水平编码表 因子因子 水平水平 编码值编码值 z1 z2 z3 上水平上水平 +1 9.0 4.5 3 下水平下水平 - -1 5.0 2.5 1 零水平零水平 0 7.0 3.5 2 变化半径变化半径j 2 1 1确信或怀疑因素对指标存在非线性影响;确信或怀疑因素对指标存在非线性影响;因素个数因素个数2-72-7个,一般不超过个,一般不超过4 4个;个;所有因素均为计量值数据;所有因素均为计量值数据;试验区域已接近最优区域;试验区域已接近最优区域;基于基于2 2水平的全因子正交试验。水平的全因子正交试验。中心复

20、合试验设计中心复合试验设计(central composite design(central composite design,CCD)CCD);Box-Behnken design BBD Box-Behnken design BBD 试验设计;试验设计;方法分类方法分类 立方点立方点 轴向点轴向点 中心点中心点 区组区组 序贯试验序贯试验 旋转性旋转性基本概念基本概念11.1.5.111.1.5.1 中心复合试验设计中心复合试验设计 立方点立方点(cube point)(cube point)立方点:也称立方体点、角点,即2水平对应的“-1”和“+1”点。各点坐标皆为+1或-1。在k个因素

21、的情况下,共有2k个立方点 轴向点轴向点(axial point)(axial point)轴向点:又称始点、星号点,分布在轴向上。除一个坐标为+或-外,其余坐标皆为0。在k个因素的情况下,共有2k个轴向点。 中心点中心点(center point)(center point)中心点:亦即设计中心,表示在图上,坐标皆为0。三因素下的立方点、轴向点和中心点三因素下的立方点、轴向点和中心点 区组区组(block)(block) 也叫块。设计包含正交模块,正交模块可以允许独立评估模型中的各项及模块影响,并使误差最小化。 但由于把区组也作为一个因素来安排,增加了分析的复杂程度。 序贯试验(顺序试验)序

22、贯试验(顺序试验) 先后分几段完成试验,前次试验设计的点上做过的试验结果,在后续的试验设计中继续有用。 旋转性旋转性(rotatable)(rotatable)设计 旋转设计具有在设计中心等距点上预测方差恒定的性质,这改善了预测精度。的选取的选取 在的选取上可以有多种出发点,旋转性是个很有意义的考虑。在k个因素的情况下,应取 = 2 k/4当k=2, =1.414;当k=3, =1.682;当k=4, =2.000;当k=5, =2.378 按上述公式选定的值来安排中心复合试验设计(CCD)是最典型的情形,它可以实现试验的序贯性,这种CCD设计特称中心复合序贯设计(central compos

23、ite circumscribed design,CCC),它是CCD中最常用的一种。 如果要求进行如果要求进行CCDCCD设计,但又希望试验水平安排不设计,但又希望试验水平安排不超过立方体边界,可以将轴向点设置为超过立方体边界,可以将轴向点设置为+1+1及及-1-1,则计,则计算机会自动将原算机会自动将原CCDCCD缩小到整个立方体内,这种设计也缩小到整个立方体内,这种设计也称为称为中心复合有界设计中心复合有界设计(central composite (central composite inscribed design,CCI)inscribed design,CCI)。 这种设计失去了序

24、贯性,前一次在立方点上已经这种设计失去了序贯性,前一次在立方点上已经做过的试验结果,在后续的做过的试验结果,在后续的CCICCI设计中不能继续使用。设计中不能继续使用。 对于值选取的另一个出发点也是有意义的,就是取=1,这意味着将轴向点设在立方体的表面上,同时不改变原来立方体点的设置,这样的设计称为中心复合表面设计 (central composite face-centered design,CCF)。 这样做,每个因素的取值水平只有3个(-1,0,1),而一般的CCD设计,因素的水平是5个(-,-1,0,1,),这在更换水平较困难的情况下是有意义的。这种设计失去了旋转性。但保留了序贯性,即

25、前一次在一次在立方点上已经做过的试验结立方点上已经做过的试验结果,在后续的果,在后续的CCFCCF设计中可设计中可以继续使用以继续使用,可以在二阶回归中采用。中心点的个数选择中心点的个数选择 在满足旋转性的前提下,如果适当选择Nc,则可以使整个试验区域内的预测值都有一致均匀精度(uniform precision)。见下表:n 但有时认为,这样做的试验次数多,代价但有时认为,这样做的试验次数多,代价太大,太大, NcNc其实取其实取2 2以上也可以;如果中心点以上也可以;如果中心点的选取主要是为了估计试验误差,的选取主要是为了估计试验误差, NcNc取取4 4以以上也够了上也够了。n 总之,当

26、时间和资源条件都允许时,应总之,当时间和资源条件都允许时,应尽可能按推荐的尽可能按推荐的NcNc个数去安排试验,设计结个数去安排试验,设计结果和推测出的最佳点都比较可信。实在需要果和推测出的最佳点都比较可信。实在需要减少试验次数时,减少试验次数时,中心点至少也要中心点至少也要2-52-5次。次。1.1. 拟合选定模型;拟合选定模型;2.2. 分析模型的有效性:分析模型的有效性:P P值、值、R R2 2及及R R2 2(adj)(adj)、s s值、值、 失拟分析、残差图等;失拟分析、残差图等;3.3. 如果模型需要改进,重复如果模型需要改进,重复1-31-3步;步;4.4. 对选定模型分析解

27、释:等高线图、曲面图;对选定模型分析解释:等高线图、曲面图;5.5. 求解最佳点的因素水平及最佳值;求解最佳点的因素水平及最佳值;6.6. 进行验证试验。进行验证试验。分析响应曲面设计的一般步骤分析响应曲面设计的一般步骤 Box-Behnken Design Box-Behnken Design 试验设计试验设计将各试验点取在立方体棱的中点上 在因素相同时,比中心复合设计的试在因素相同时,比中心复合设计的试验次数少;验次数少; 没有将所有试验因素同时安排为高水平没有将所有试验因素同时安排为高水平的试验组合,对某些有安全要求或特别需的试验组合,对某些有安全要求或特别需求的试验尤为适用;求的试验尤

28、为适用; 具有近似旋转性,具有近似旋转性,没有没有序贯性。序贯性。特点特点11.2 Design-Expert 的应用的应用BBD Design-Expert是全球顶尖级的实验设计软件。是全球顶尖级的实验设计软件。Design-Expert 是最容易使用、功能最完整、界面最具亲和力的软件。是最容易使用、功能最完整、界面最具亲和力的软件。在已经发表的有关响应曲面(在已经发表的有关响应曲面(RSM)优化试验的论文中,)优化试验的论文中, Design-Expert是最是最 广泛使用的软件。广泛使用的软件。 PlackettBurman(PB)、Central Composite Design(CC

29、D)、Box-Behnken Design(BBD)是最常用的实验设计方法。是最常用的实验设计方法。打开design expert软件,进入主界面,然后点击file-new创建一个新的试验设计工程文件,然后点击左侧的Response surface选项卡,进入响应面试验设计.WO DE 因素数量本实验中的绝对因素中点试验每个BLOCK重复次数本次试验分几个区块进行该处为响应面设计的几种方法,最常用的就是BOX-BEHNKEN设计法,其他几种设计方法有兴趣的同学可以找对应的资料来看一下因变量个数,即本试验中改因变量个数,即本试验中改变自变量会有几个因变量发变自变量会有几个因变量发生变化,一般试验

30、指标都是生变化,一般试验指标都是一个,因此常常为一个,因此常常为1,例如,例如,检测温度,检测温度,pH,时间对某处,时间对某处理工艺对样品中含糖量的变理工艺对样品中含糖量的变化,那么含糖量即为唯一的化,那么含糖量即为唯一的指标,即因变量数量为指标,即因变量数量为1,该处选该处选1。如果检测温度,。如果检测温度,pH,时间对某处理工艺同时,时间对某处理工艺同时对样品中含糖量和蛋白质含对样品中含糖量和蛋白质含量的影响,即因变量数量为量的影响,即因变量数量为2,该处选,该处选2,并在下方因变,并在下方因变量设置中设置好对应的名称量设置中设置好对应的名称和单位。和单位。两种排序方式,可任选试验中设置

31、的因素的水平把每个试验对应的试验结果填入本栏内,准备做数据分析各因素的实际值变为编码值,比如,因素1的高点设置为0.5,编码值即为+1,低点设置为0,编码值即为-1,中点为0.25,编码值即为0转变为编码值之后的页面完成每组试验,将试验结果填入对应的响应值框内。点击此处即开始进行数据分析拟合公式的处理方法,一拟合公式的处理方法,一般取默认即可般取默认即可例如本试验例如本试验中,拟合的中,拟合的方程显著性方程显著性不好,显示不好,显示为不显著为不显著残差的正态概率分布,越靠近直线越好残差与方程预测值的对应关系图,分布越分散越无规律越好预测值与试验实际值预测值与试验实际值的对应关系图,其中的对应关系图,其中点越靠近同一条直线点越靠近同一条直线越好越好按照黄色框操作进入数按照黄色框操作进入数据报告界面据报告界面点击此处进入点击此处进入响应面图形显响应面图形显示界面示界面等

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论