《试验设计与建模》课件-1.(66页PPT)_第1页
《试验设计与建模》课件-1.(66页PPT)_第2页
《试验设计与建模》课件-1.(66页PPT)_第3页
《试验设计与建模》课件-1.(66页PPT)_第4页
《试验设计与建模》课件-1.(66页PPT)_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、试验设计和建模周永道四川大学数学学院第1页,共66页。试验设计和分析教材: 方开泰、刘民千、周永道(2011),试验设计 和建模。 期末最终成绩构成: 期末考试: 70% 作业: 10% 随堂测试: 10% 小课题: 10%软件: MATLAB, SPSS 第2页,共66页。参考书方开泰、马长兴,正交与均勻试验设计,科学出版社,2001.Douglas C. Montgomery. Design and Analysis of Experiments, 6th Edition,中国邮电出版社, 2007.Hamada, M. and Wu, Jeff C.F., Experiments: Pl

2、anning, Analysis, and Parameter Design Optimization , Wiley, 2000.Cornell, J.A. Experiments with Mixtures, 3nd Ed., Wiley, 2002.Fang, K.T., Li, R. and Sudjianto, A. Design and Modeling for Computer Experiments, Chapman & Hall/CRC Press, London, 2005.第3页,共66页。第一章试验设计的基本概念第4页,共66页。1.1 科学试验1.1.1 试验的重要性

3、科学试验是人们认识自然、了解自然的重要手段。许多重要的科学规律都通过科学试验发现和证实。随着科学和技术的发展,试验涉及的因素越来越多,它们之间的关系更加复杂,光凭经验已不能达到预期要求,于是产生了试验设计这门学科。设计一个试验涉及到试验目的、试验方案、技术保证、分析数据以及有关组织管理等。这些环节有的是属于管理科学,有的是需要数学和统计学的方法来设计试验方案,后者称为统计试验设计, 它是统计学的一个重要分支。第5页,共66页。统计试验设计 是统计学的重要分支,它能大量节省试验的次数。能将试验数据从随机误差的烟幕中去伪存真,抓住事物的规律。 所以一个精心设计的试验是认识世界的有效方法 (Atki

4、nson and Donev (1992)。第6页,共66页。 奠定了现代遗传理论的基础例1.1孟德尔豌豆实验例1.2化工试验在某化工产品的合成工艺中,考虑反应温度(A)、压力(B) 和催化剂用量(C),并选择了试验范围分别为:温度(A): 80oC120oC;压力(B): 46 大气压;催化剂用量(C): 0.5%1.5%; 我们需要选择这三个因素的最佳组合,以达到高产的目的。第7页,共66页。许多产品都是混合多种成分在一起形成的。面粉水糖蔬菜汁 椰子汁盐发酵粉乳酸钙 咖啡粉香料色素面包怎样确定各种成分的比例呢?经验试验混料试验例1.3 加工面包试验第8页,共66页。例1.4环保试验 在水及

5、食物中的某些化学元素,吃多了对人体是有害的,为了研究这些元素对人体健康的影响。48,275,138Cadmium (Cd)镉 Copper (Cu) 铜Zinc (ZN) 锌Nickel (Ni)镍Chromium(Cr) 铬Lead (Pb)铅因素0 200 200 200 200 20 0 20 0.01, 0.05, 0.1, 0.2, 0.4, 0.8, 1, 2, 4, 5, 8, 10, 12, 14, 16, 18, 200.01, 0.05, 0.1, 0.2, 0.4, 0.8, 1, 2, 4, 5, 8, 10, 12, 14, 16, 18, 200.01, 0.05,

6、 0.1, 0.2, 0.4, 0.8, 1, 2, 4, 5, 8, 10, 12, 14, 16, 18, 200.01, 0.05, 0.1, 0.2, 0.4, 0.8, 1, 2, 4, 5, 8, 10, 12, 14, 16, 18, 200.01, 0.05, 0.1, 0.2, 0.4, 0.8, 1, 2, 4, 5, 8, 10, 12, 14, 16, 18, 200.01, 0.05, 0.1, 0.2, 0.4, 0.8, 1, 2, 4, 5, 8, 10, 12, 14, 16, 18, 20范围 和 水平第9页,共66页。试验设计的目的 增加产量提高质量降低成

7、本缩短研究时间科学试验是人类了解自然的手段,通过试验来了解因素和指标(响应)之间的关系,希望一个好的试验设计是用最少的试验次数获得最多的有用信息。 第10页,共66页。试验设计的目的水平组合的比较建模参数估计证实猜想优化筛选发现规律等等第11页,共66页。Experiments are performed by investigators in virtually all fields of inquiry, usually to discover something about a particular process or system.Scientific experiments are

8、 of essential importance in peoplessurviving and exploring of nature.A well designed experiment is an efficient method of learning about the worldMake it your motto day and night.Experiment!And it will lead you to the light.Experiment!The Usefulness of Experimental Design第12页,共66页。多因素统计模型未知响应曲面多峰当代科

9、学试验的复杂性非线性响应曲面无解析表达第13页,共66页。多峰非线性模型第14页,共66页。瞎子摸象第15页,共66页。1.1.2 试验的重要元素让我们首先通过一个例子来介绍一些重要元素 例 在一个化工试验中, 试验者希望通过如下 的可控变量来增加产量: x1:原料品种m1, m2, m3x2:加酸量 (ml) 10,28x3:反应时间 (时) 0.5, 3.5第16页,共66页。因素(因子) 在试验中可控的并用于考察对试验结果(y)的变量称为 因素 或 因子 (factor)。如反应温度、压力、催化剂品种、施化肥量、水稻品种等。 因素可以是 定量 的, 也可以是 定性 的。 第17页,共66

10、页。水平 (level) 因素变化的范围称为试验区域, 在本例中,试验区域为: m1, m2, m3 x 10,28 x 0.5,3.5.原料品种:m1, m2, m3加酸量:10,19,28反应时间:0.5, 1.5, 2.5, 3.5第18页,共66页。水平组合 因素诸水平的组合称为 水平组合 (level-combination), 如 m2, 10, 2.5, m1, 28, 0.5 。水平组合在文献中又称为 处理组合 。 一个因子设计 (Factorial design) 是一组水平组合。 第19页,共66页。处理, 响应 在试验环境下对确定的水平组合所作的试验称为一个 处理 (tr

11、ial 或 run) 。 试验的结果称为 响应 (response), 响应可以是定性的, 也可是定量的。 第20页,共66页。不可控的诸微小因素之总和, 称为 随机误差。 同样条件下的两次试验结果可能不同。随机误差存在于一切试验之中。 随机误差 (random error)第21页,共66页。随机误差随机误差可假定遵从 正态分布 。 方差给出随机误差大之度量 。令 为重复试验之响应值 这里, 为真值, 独立同分布,遵从 。 第22页,共66页。 和 的无偏估计为 第23页,共66页。AA1A2y均值 = 190.5/6 = 31.75自由度 : 5NOISE随机误差:第24页,共66页。 部

12、份因子设计设有 s 个因素, 它们分别取个水平。则全部水平组合有 一个 水平组合 可视为 s 维空间的一个点, 称为试验点 。个。 第25页,共66页。例如, 一个六因素, 五水平的全面试验至少需要 次试验。 全面试验若所有的水平组合都作相同重复数的试验, 称为全面试验 。第26页,共66页。在农业、生物等试验中,很难做到试验条件完全一样。区组的概念成为古典试验设计中非常有用的工具,同一区组的试验有十分近似的试验环境。区组设计可以避免或减少系统误差的干扰,从而大大提高试验结论的可靠性。在体育比赛中,区组及有关设计已在普遍使用。 区组第27页,共66页。试验的环境随着时间的推移,可能有趋势型的变

13、化,如室温渐高、湿度渐小、电压波动加剧等。为了使试验的结论更加可靠,随机化是用来减少试验误差的重要手段。常用的是对试验次序随机化,哪个试验先做,哪个试验后做,随机决定。若试验有区组,要根据试验的具体情形采取所有试验的完全随机化,或仅区组内的试验随机化。 随机化第28页,共66页。同一个试验重复两次或多次是减少试验误差干扰的一种方法,在传统的计算方法中经常使用。若 y1, ym 是同一个试验条件下的响应,且 yi 独立同分布,方差为 ,则均值 均值的方差 重复传统试验的三个基本原则: 重复性、随机化、分区组第29页,共66页。针对不同的试验,试验者要选择合适的试验方法,建立相应的统计模型 统计模

14、型试验的组织和管理一支专业队伍明确的试验目标科学的试验方案试验中,处理可控与不可控因素第30页,共66页。A. 试验实现方式:1.1.3 试验的类型传统的试验实验室试验工业试验计算机试验计算机模拟计算寻找近似模型第31页,共66页。B. 因素约束条件无约束试验 诸因素可以自由的选择试验的值,不受其它因素约束,试验区域是一个超矩形 混料试验 因素之间的取值会相互影响,例如或第32页,共66页。单因素试验水平数可以适当多取,而且可以考虑做重复试验多因素试验各因素的水平数一般不能取得很大二水平试验多水平试验C. 因素个数第33页,共66页。D. 响应个数单响应试验每次试验只观察一个响应值。如产量多响

15、应试验每次试验观察多个响应值。如鞋子橡胶底的试验响应:强度、弹性和最大弯曲次数等等多媒体试验试验有无穷多个的响应。例如,响应是人的指纹、化学或生物中指纹曲线、声音的曲线、图像的颜色及深浅,等等第34页,共66页。E. 试验轮次单一试验一次试验达到要求序贯试验优选法响应曲面分析均匀序贯试验第35页,共66页。单区组试验每次试验在相同或十分近似的条件下进行区组试验目的是使得组内的差异比组间差异小常见的区组有以日、月、年、批次、双胞胎,等等F. 试验分组第36页,共66页。例1.5. (自由落体运动) 若不计空气阻力,自由落体运动的初始速度为零,记下落时间为x (秒)(s),下落距离y (米)(m)

16、,人们发现它们之间有如下规律 g 为重力加速度。设想试验者对关系(1.3) 一无所知,希望通过试验来揭示y 和x 之间的关系1.2 统计模型 (1.3)第37页,共66页。试验结果可用二次回归模型拟合第38页,共66页。试验设计的统计模型 方差分析模型 因子设计,正交设计参数回归模型 最优设计非参数回归模型 均匀设计稳健回归模型第39页,共66页。例1.6:威布尔生长曲线第40页,共66页。方差分析模型在0,10中取若干个点作试验,设 x1, , xq 为试验点,n1, , nq 为其重复数,其统计模型为第41页,共66页。 用统计方法估计 1, , q 或 , a1, , aq, 以及 2二

17、水平试验在西方被广泛推荐二水平不足以揭示非线性关系多水平试验值得推荐第42页,共66页。二水平试验的不足试验范围对,但水平不合适试验范围及水平都对,但不能揭示A和Y之间更复杂的关系试验范围错第43页,共66页。只能预报四个水平处的响应值,进一步采用回归模型是有益的。因子设计第44页,共66页。试验设计的统计模型 方差分析模型 因子设计,正交设计参数回归模型 最优设计非参数回归模型 均匀设计稳健回归模型第45页,共66页。根据专业知识, 可选用适当的回归模型, 比如用二次模型回归模型其中函数 f1, fm已知, 但参数 b1, bm未知。或三次模型更一般地,第46页,共66页。给定试验次数 n,

18、希望能获得最精确的回归系数 b0, b1, 的估计。缺点:对模型的变化缺乏稳健性。Kiefer, J.C. (1958), Ann Math.Stat.Kiefer, J.C. (1959), JRSS, B, with discussionAtkinson, A.C. and Donev, A.N. (1992), Optimal Experimental Designs, Clavendon Press, Oxford最优设计第47页,共66页。三次回归模型的D-最优设计及其拟合如果采用4次多项式模型,效果会显著地改进。第48页,共66页。试验设计的统计模型 方差分析模型 因子设计,正交设

19、计参数回归模型 最优设计非参数回归模型 均匀设计稳健回归模型第49页,共66页。式中函数形式 g(x)未知。希望通过试验求得g(x)一个近似模型。这时,一个自然的想法是将试验点在0,2上均匀散布,即均匀设计。 若试验者对模型未知,这时将面对非参数回归模型非参数回归模型第50页,共66页。均匀设计及其拟合多项式回归第51页,共66页。均匀设计是一种试验设计方法。它可以用较少的试验次数,安排多因素、多水平的析因试验,当试验者对析因试验的统计模型未知时,均匀设计是最好的设计方法。均匀设计也是仿真试验设计和稳健设计的重要方法。均匀设计第52页,共66页。试验设计的统计模型 方差分析模型 因子设计,正交

20、设计参数回归模型 最优设计非参数回归模型 均匀设计稳健回归模型第53页,共66页。稳健回归模型常用于部分模型已知的情形此时,可用一些 稳健设计 或 均匀设计.其中 f(x) 为已知函数,h(x) 为 偏离真实函数 的部分。稳健回归模型即 f(x) 为参数 的线性函数。第54页,共66页。回归模型:yi, xi1, xi2, , xi,p-1, i = 1, , ny = b0 + b1x1 + b2x2 + + b p-1 x p-1 + eE(e) = 0,Var(e) = s2 未知或 yi = b0 + b1xi1 + b2xi2 + + b p-1 xi, p-1 + ei ei,en

21、 i.i.d. E(ei) = 0, Var(ei) = s2.或更一般的, yi= b1 g1(xi) + b2 g2(xi) + + b p gp(xi) + ei ei,en i.i.d. E(ei) = 0, Var(ei) = s2.xi=( xi1, xi2, , xi,p-1), i=1, , n1.3 回归分析简介 第55页,共66页。一般回归模型的矩阵表示:y = Gb + eE(e) = 0,Cov(e) = s2In其中 y : n1, G : np, b : p1, e : n1 其元素 i.i.d.(1.14)第56页,共66页。线性模型 (1.14) 包括很多有用的

22、模型:线性模型通过原点的线性模型二次模型中心化二次模型y = b0 + b1x1 + b2x2 + + b p-1 x p-1 + ey = b1x1 + b2x2 + + b p-1 x p-1 + e(1.16)第57页,共66页。对于模型 (1.14) (a) 估计 模型 (1.14) 的最小二乘估计为 性质: 其中 M=GG 为 信息矩阵, 或有时称 M=GG/n 为信息矩阵. 第58页,共66页。s 2 的估计的矩阵表达形式E(y) = XbCov(y) = s2In0为无偏估计. 第59页,共66页。对于线性模型 (1.16), 在实际中常检验下面的假设: (k=p-1)A. 检验模型是否有意义. H0: b1 = = bk = 0 VS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论