生物仪器分析chapter2采样与优化课件_第1页
生物仪器分析chapter2采样与优化课件_第2页
生物仪器分析chapter2采样与优化课件_第3页
生物仪器分析chapter2采样与优化课件_第4页
生物仪器分析chapter2采样与优化课件_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章:采样与优化,一、采样及相关的理论 二、分析试验设计和最优化理论,一、采样及相关的理论,1.1 常见样品的类型 1.2 取样应遵循的基本原则 1.3 取样方法 1.4 取样的统计学要求,1. 气体的采样 气体的性质受温度、压力的影响,因密度不一样会产生分层现象,难以储存、运输,这些都表明气休样品采集后应该马上进行分析。 气体样品可以通过抽吸、液体置换或扩散到真空接受器中进行吸取气体采样装置一般是由玻璃制成,并带有适宜的旋塞。,1.1 常见样品的类型,2液体的采样 液体的采样方法有流动法、吸移法和虹吸法等。 如果液体因不相溶或密度不同而分层,在采样前应充分摇动使之均匀。 具有不混溶而分层的液体应从各分层中吸取与层厚度成一定比例的体积,对各层样品分别进行分析,或者将它们重新混合配成一个具有代表性的样品。,3固体的采样 固体物质受固体性质与固体形状的影响取样方法也不同。大多数固体物质是由不同大小的颗粒组成,可以先分离再取样。另外,某种生物组织样品的取样应按照参考文献中的要求进行。总之,固体物质的取样相对来说难度增大。,1.2 取样应遵循的基本原则 1、目的性;根据研究目的进行取样设计; 2、可度量性;根据样本值能做出有效的估计; 3、可行性;在实际操作中能按预定的设计完成任务; 4、经济性;以最小的代价去实现取样的目的。 抽样设计:确定抽样的原理、形式、程序和方法等。 抽样分为概率抽样和非概率抽样两大类,以概率抽样为主。 概率抽样的基本原理是按照概率论的随机原理。 随机原理:抽取样本时必须严格遵循一定方法和规则,使得总体中每一个对象都有相同的机会被选入样本。,把所要考察的对象的全体叫做总体。 组成总体的每一个考察对象叫做个体。 从总体中抽取出的一部分个体的集合叫做一个样本。 样本中个体的数目叫做样本容量。,总体,推断总体,样本,抽取样本,如:500只白老鼠中抽取12只进行实验。总体?个体?样本容量?,1.3 取样方法与分析,1.简单随机抽样和机械抽样 当对被测对象了解甚少时,应采取随机抽样,而且数量应尽可能多一些。 采用简单随机抽样方法,一个最简便易行又符合随机原则的方式就是使用随机数字表。随机数字表可以通过计算机来产生。因为随机数字表中的每个数码出现的几率相等,所以构成总体的每个个体被抽取的几率也相等。,简单随机抽样的特点,优点: (1)比较容易理解和掌握;(2)抽样框不需要其他辅助信息;(3)理论上比较成熟,有现成的方差估计公式。 缺点: (1)没有利用辅助信息;(2)样本分散,面访费用较高;(3)有可能抽到较差的样本;(4)抽选大样本比较费时,总体,第一阶样本,最终样本,2、多阶抽样 对于大总体,往往要采取分阶段抽样的方法,这种方法就称为多级抽样。 先按简单随机抽样方法或机械抽样方法抽取总体中n个一级单位(总体中的样本容量为N个)然后再在这n个一级单位中(每个一级单位中各含M个样本)分别抽取m个二级单位,如此,直到抽得最基础单位(最小单位)。,优点: (1)当群具有同质性时,多阶抽样的效率高于 整群抽样;(2)样本的分布比简单随机抽样集 中,采用面访可以节约时间和费用;(3)不需 要整个总体单元的名录框,只要群的名录框和抽 中群的单元名录框。 缺点: (1)效率不如简单随机抽样;(2)通常不能提 前知道最终的样本量;(3)调查的组织较整群 抽样复杂;(4)估计值与抽样方差的计算较为复杂。,3、分层抽样 随机抽样依赖于机遇,无须事先对样品的物理、化学、生物属性以及环境条件加以区别和掌握,这样反而浪费了一些重要的信息。 分层抽样是将抽样总体按其固有属性、特点或某种原因划分为若干层,然后在各层中用随机取样或机械抽样抽取适当的抽样单位以组成样本。 分层抽样示意图:,1.4 抽样的统计学要求 1. 样本均值应能提供总体均值的无偏估计 2. 样本方差应能提供总体方差的无偏估计 3. 在给定的时间和人力消耗下,应给出尽可能精密的总体估计。,二、分析试验设计和最优化理论,2.1 试验设计与原则 2.2 优化试验设计方法 2.3 简单比较和正交拉丁方 2.4 正交试验验设计 2.5 均匀试验设计 2.6 序贯优化法(单纯形法) 2.7 色谱选择性优化方法,2.1 试验设计与其原则 试验设计:试验方案的设计,它的基本任务就是:合理地安排实验,分析实验结果与影响因素之间的关系,确定影响因素的主次关系。 试验设计的原则 : 科学性原则:指实验的目的要明确,实验材料和实验手段的选择要恰当,整个设计思路和实验方法的确定都不能偏离生物学基本知识和基本原理以及其他学科的基本原则。 平行重复原则:在同样条件下重复实验,观察自变量的变化对实验结果的影响程度。,单一变量的原则: 不论一个实验有几个实验变量,都应做到一个实验变量对应观测一个反应变量; 实验操作中要尽可能避免无关变量及额外变量的干扰; 如:检查温度对实验结果的影响,需按照低温,适温,高温的顺序进行。否则会混入常温这个无关变量,控制与平衡控制的原则,通过试验设计来设法平衡和消除实验中无关变量的影响。常用的方法有, 单组实验法: 对一组(或一个)对象,既用A法,又用B法,顺序随机或轮流循环。如;将做好的洋葱鳞片叶表皮细胞装片,先用蔗糖溶液做质壁分离观察,接着又用清水做质壁分离复原观察 。 等组实验法 :将状况相同的对象,分成两组或多组,一组用A法,另一组用B法。如,玉米的向光性实验,取萌发期,粗细生长状况相同的玉米幼苗,作如下实验处理:甲组:用不透光处理;乙组:用单侧光处理。,轮组实验法:对两组以上的对象,循环进行两个或两个以上的实验处理。 如甲组A法,B法,乙组B法,A法等,这样就有效地平衡和抵消无关变量的影响。 例如,植物向光性实验,可随机取两株(组)生长状况并不相等的玉米幼苗,作如下实验处理:甲组:玉米幼苗,A先用不透光处理,B后用单侧光处理 乙组:玉米幼苗,C先用单侧光处理,D后用不透光处理。,对照原则,按对照的内容和形式上的不同,通常有以下对照类型 1、空白对照:指不做任何实验处理的对象组; 2、自身对照:指实验和对照在同一对象上进行; 3、条件对照:指虽给对象施以某种实验处理,但这种处理是作为对照意义的。,例如,动物激素饲喂小动物的实验,采用的实验设计方案是: 甲组:饲喂甲状腺激素(实验组) 乙组:饲喂甲状腺抑制剂(条件对照组) 丙组:不饲喂药剂(空白对照组) 显然,乙组为条件对照,该实验既设置了条件对照,又设置了空白对照,通过比较,对照,更能充分说明实验变量甲状腺激素能促进动物的生物发育。,2.2 优化试验设计方法,合理地安排试验以求迅速找到最佳点的数学方法。一般来说,它是考虑在多因素情况下安排试验的方法,它可以帮助人们通过较少的试验次数得到较好的因素组合,形成较好的设计方案。,2.2.1 优化试验设计方法起源 上世纪30年代,由于农业试验的需要,费歇(R.A.Fisher)在试验设计和统计分析方面做出了一系列先驱工作,从此试验设计成为统计科学的一个分支。 上世纪40年代,在二次世界大战期间,美国军方大量应用试验设计方法进行武器装备的研究。 随后,F.Yates,R.C.Bose, O.Kempthome, W.G.Cochran, D.R.Cox和G.E.P.Box对试验设计都作出了杰出的贡献,使该分支在理论上日趋完善,在应用上日趋广泛。, 50年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化,在方法解说方面深入浅出为试验设计的更广泛使用作出了众所周知的贡献。 60末期代,华罗庚教授在我国倡导与普及的“优选法”,如黄金分割法、分数法和斐波那契数列法等。 70年代中期,优选法在全国各行各业取得明显成效。 1978年,七机部由于导弹设计的要求,提出了一个五因素的试验,希望每个因素的水平数要多于10,而试验总数又不超过50,由于优选法和正交设计都不能用,随后,方开泰教授(中国科学院应用数学研究所)和王元院士提出 “均匀设计”法,这一方法在导弹设计中取得了成效。,2.2.2 优化试验设计的主要方法,早期:区组设计、拉丁方设计、尤登设计 当今:正交试验设计、回归设计、混料设计、参数设计和均匀设计,2.2.3 优化试验设计在科学研究中的地位 1.试验设计方法是一项通用技术,是当代科技和工程技术人员必须掌握的技术方法。 2.科学地安排实验,以最少的人力和物力消费,在最短的时间内取得更多、更好的生产和科研成果。简称为:多、快、好、省。 3.它可应用于: 提高试验效率、优化产品设计、改进工艺技术、强化质量管理。,在分析试验设计中,当影响的因素较多时,就无法对各个因素的每个水平进行全面的搭配实验,这就需要寻找试验次数少而又能获得可靠结果的试验方法。 通常,全面的因素试验只有在因素不多的情况下才可能进行,如果是6个因素,每个因素是5个水平,全面试验就是56 =15625次,这显然是行不通的。因此,常采取的简化试验次数的办法有:,2.3 简单比较和正交拉丁方,1、简单比较法 例如某合成反应,需要寻找最适宜的酸度(A)、试剂浓度(B)、温度(C),每个因素分三个水平,一般常用的简单做法是单因素条件试验,即首先人为地固定A和B的量,来变化C。,但是这种方法有不少缺点: 看起来好象是做了9次试验,但实际上只是7 次,因为其中有两个各做了两次。 各因素,各水平出现的机会不等。 一开始只知道C2是在A1B1条件下最好,但其他条件下是否好,未做试验,因此是不是最佳,并不确定。 当因素间交互作用影响比较大时,就不一定是各种条件因素的最好的搭配组合。 用这种方法安排试验,如不重复做试验,是给不出误差估计的,因此,同样的试验次数,提供信息不多。,2、拉丁方试验设计 均衡分布思想:整个布局结构给人一种匀称、平衡、安定的心理感受。,4 9 2 3 5 7 8 1 6,表中,无论是行、列,还是对角线,所有数字之和都等于15,这就是拉丁方的均衡性。,正交拉丁方法:指由拉丁字母组成的 正方形中,其每一行,每一列内都没有 重复的字母。例如下面两个就是44拉丁方。 A B C D A B C D B A D C B C D A C D B A C D A B D C A B D A B C,拉丁方也可用其它形式表示,例如因素C的33拉丁方,可写成 C1 C2 C3 C2 C3 C1 C3 C1 C2 利用上述拉丁方就可以把试验安排得很均衡。,2.4正交试验设计,正交的含义是指两列向量的数量积等于零,它有着搭配均衡的特性。 正交试验设计利用正交表来安排试验。 在正交表中,每个因素的每个水平与其它因素的各水平只碰一次。 对于一个4因素3水平的试验,只要安排9次试验,而不是34=81次,为什么正交试验法能大大减小试验工作量呢?三因素三水平如要做全面试验共需做27次,而正交试验也只要做9次就可以了呢?,图中9次试验点在整个试验空间中分布均衡,而且因素变化很有规律性。正交试验法实际上是一种在多维空间中寻优的试验法。,举例,某药厂为了改革潘生丁合成工艺进行的实验设计方案,其方法是用尿素与双乙烯酮代替原工艺中的硫脲和乙酰乙酸乙酯,试验指标是6一甲基尿嘧啶的收率。 有3个因素影响其收率:反应温度(A)、反应时间(B)和反应物投料(尿素:双乙烯酮)物质的量比(C)。每个因素按3个水平设计。,第1步: 将试验因素的水平列成下表,第2步:应用选择的正交表, 做出试验安排,1.将 A,B和C放入列1,和3。,2.用A的3个水平替代第一列的1到9。,3. 对第二列,第三列做同样的替代。,4. 完成该设计对应的试验结果,将其放入最后一列。,根据试验结果,我们可以发现,在A2B2C2的试验条件下,其最高的产率为73.7%。因而直观分析最好的试验条件为A2B2C2。 我们还可以应用方差分析方法来研究各因素水平变化对结果的影响,考察各因素诸水平间的差别及各因素间的相互作用,这些分析是生物统计学的工作,在这里不再重复。 总之,正交试验安排试验的规则:因素顺序上列,水平对号入座,试验横着做。,为寻找一种适用于多因素、多水平而试验次数更少的试验设计方法是有意义的,我国数学家方开泰和王元等利用数论方法构造了均匀试验设计(uniform design)表。 如果不考察试验数据的整齐可比性,而让试验点在试验范围内充分地均衡分散,则可以从全面试验中挑选比正交试验设计更少的实验点作为代表进行试验,这种着眼于实验点充分地均衡分散的试验方法,称为均匀试验设计方法。,2.5 均匀试验设计,均匀试验设计需要用均匀设计表,简称U表,如果水平数相等,则均匀表可记为Un(tq),其中U指均匀设计表,n指试验次数,t为因素的水平数,q为最多可安排的因素数。 试验安排的特点使试验数据失去了整齐可比性,所以数据一般应采用回归分析法进行分析。,均匀表与正交表不同的是:为了保证不同因素、水平所设计的试验点均匀分布,每个均匀表都带有一个使用表,指出不同因素数应选择哪几列。,通常,为了减少误差和数据处理方便,水平数一般应大于因素数的2倍。,例:阿魏酸的制备 阿魏酸是某些药品的主要成分,为了在制备过程中能增加其产量。经过分析研究挑选出因素和试验区域为: 原料配比:1.0-3.4 吡啶总量:10-28 反应时间:0.5-3.5 确定了每个因素相应的水平数为7。,U7(76),按此表中的1,2,3列设计实验方案,第1步: 将试验因素的水平列成下表,从上表中可以直观的看出原料配比为2.2,吡啶用量为10ml,反应时间为2.5h时,得到的反应产率最高。,第2步:应用选择的U表, 做出试验安排,1.将 x1, x2和 x3放入列1,2和3。,2. 用x1的个水平替代第一列的1到 7。,3. 对第二列,第三列做同样的替代。,4. 完成试验结果,将其放入最后一列。,2.6 序贯优化法,序贯优化法,黄金分割法,单纯形法,2.6.1 单纯形试验法(simplex),单纯形优化法最初由Erns引入化学研究,它基于在多维空间中的几何图形的变换来寻找试验点,这里所说的图形是指的在n维空间中,具有n+1个顶点的图形,例如,两维空间使用三角形,三维空间使用有四个顶点的多面体。 这些图形的顶点即是试验所安排的试验点,通过比较各试验点的结果并丢弃最差点而代之以新点,从而再构成新的单纯形,这样就可逐步逼近最优试验点。 如果对于某个相应体系,有n个待优化的因素,则有n+1个顶点的单纯形被用于实验设计。,1、两因素试验 两因素试验(n=2),可以看成是在两维空间中进行的,即在平面上寻优的过程。假定试验从初始点X0开始,在平面中X0的坐标为(a1,a2),例如a1可以是pH值,a2可以是试剂的浓度值。 对每一个因素,应选择一个步长,即选两点间的距离为a,各点的p值,q值,可根据公式来计算。 再根据试验点因素水平的不同做试验,得到不同试验结果(目标值),根据结果的优劣,舍去最差的点,按照单纯形试验法,逐一算出新的试验点,这样最终就达到了优化的目标。,X0(a1,a2),X1(a1+p,a2+q),X0(a1+q,a2+p),a,a,a,2.6.2改良形的单纯形,由于在步长不变的正规单纯形最优点附近的收敛速度慢,而且收敛精度也较差。因此出现了改良形的单纯形法,即增加了步长可变的寻优步骤,使得寻优的收敛速度和精度都能得到改善。,(1)试验者先根据化学知识和经验选取初始试验点X0和步长a,并计算出其余各试验点的试验水平,构成初始单纯形BNW。 (2)比较各试验点的指标值,确定最坏点W。 (3)求重心P:去掉最坏点W,计算出其余各点的重心,即BN的中点,寻优过程,(4)求出反射点R,使R=P+(P-W),取反射系数=1 (5)对进一步试验的结果进行判断 如R的响应优于B点,则在PR方向上继续延伸至E,E=P+(P-W),扩张系数=1.2-3.0,如果=2,EB, 以BNE组成新单纯形,继续调优。 如R的响应比N点差,则要进行收缩,在WR之间取点。它分为两种情况: 如果WRN,则靠近R点取新点CR,CR =P+(P-W),压缩系数=0.5,如图a。 如果RW,则靠近W点取新点CW,CW =P-(P-W),压缩系数=0.5,如图b。,a,b,(6)如果WP方向上所有点的响应都比W点差,则以B点为中心进行整体收缩,使W和N点向B点移近一半距离,得到新的BN1W1如图。,N1,W1,例示波极谱法测定痕量Cu,Pb,Cd,用单纯形试验法选择支持电解质的试剂盐酸、盐酸羟胺、氯化钠的配比,以体积相同,重量百分比浓度不同的水平作试验,所取的试验水平列在下表。,起始单纯形的顶点很容易确定,不需计算。从表中可知,P0应舍弃,舍弃后的重心计算如下:,反射点计算如下: P A = 2 Pe P0 = 21.80.5 = 3.1(=1) P B = 21.10.2 = 2.0 P C = 21.51.0 = 2.0 于是求得P4(3.1,2.0,2.0),此时P1 P2 P3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论