化学试验设计法中的回归分析.ppt_第1页
化学试验设计法中的回归分析.ppt_第2页
化学试验设计法中的回归分析.ppt_第3页
化学试验设计法中的回归分析.ppt_第4页
化学试验设计法中的回归分析.ppt_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,第六章 化学试验设计法中的回归分析,变量之间的各种关系是客观世界中普遍存在的关系。这些关系大致分为两类: 1) 确定性关系,可用精确的函数表达的关系; 譬如球体积Vpd3/6 。 2)非确定性关系,通常称为相关关系 。 譬如产品合成中收率与反应温度、搅拌速度等的关系;反应速率与温度、压力、催化剂加入量等的关系;农作物产量与降雨量、施肥量、农药量等的关系。 我们在工作中碰到的问题大都是这种相关关系的问题。,2,那么如何在这些关系不确定的变量之间找到一些内在的规律,从而为科学研究做出一定的预测? 譬如在我们的化学试验中,如何才能从有限的试验数据中找出一定的规律,从而为获得指标最优化做出正确地判

2、断?,3,通常,回归分析(Regression Analysis)是试验数据处理中最常用的一种方法,也是比较好的一种方法。 所谓回归分析,其实就是研究相关关系的一种数学工具,它能提供变量之间关系的一种近似表达,即回归方程,根据回归方程作图,就可以得到对各数据点误差最小,因而也是最好的一条曲线,即回归曲线。 回归方程可用来达到预测和控制的目的。,4,回归分析分类: 按自变量的数目分类: 一元回归: 多元回归:,一个因变量和一个自变量 (Y&X),一个因变量和多个自变量(2)(Y&X1、X2),按回归关系分类: 线性回归和非线性回归。,这两种分类方式相互交叉,可以产生常见的四种回归模式:一元线性回

3、归、一元非线性回归、多元线性回归,多元非线性回归。,5,62 一元线性回归,假设用(xi,yi)表示一组数据点(i1,2,n)。 请问一下:这些数据点代表什么样的试验设计方案? 是不是代表单因素试验设计?,任意一条直线的函数关系可表示为: y*=a+bx (1) 如果用这条直线代表(xi,yi)里x和y的关系,则每个点的误差为: yi-y*=yi-a-bxi (2),6,(3),若各数据点的差方和为Qi*,则总的差方和Q*为:,一元线性回归就是指在所有的直线中,使差方和Q*最小的一条直线。 即回归直线的系数b和截距a应使Q*达到最小值。即: Q*(a,b)=minQ*(a,b),那么怎样的a、

4、b值才能使Q*最小呢?,(3)式分别对a、b求偏微分,并使之等于零:,7,(4)式和(5)式经转换分别可得:,8,(6)、(7)式构成一个二元一次方程组,因此肯定有唯一解。这就是一元线性回归的基础。,经过一系列推导,最终:,其中:,9,上面所讲的就是确定一元回归方程所根据的原则。 即应使回归方程与所有观测数值的差方和达到极小值。 因为平方运算也称为“二乘”运算,因此这种回归方法就通称为“最小二乘法”。 最小二乘法就是最小差方和法。,事实上,现在计算机线性拟和(如excel、origin等)就是依据的上述(8)、(9)式,实际工作中根本不需要大家计算。但是我们应该知道这个原理。 当然,大家也可以

5、自己写一个小程序进行这些工作。,10,如何判断一元线性回归方程是否有意义?,在数学上有一个非常重要的判别方法,就是相关系数法。即我们经常求的R值法。,(10),或者:,(10),这里sx、sy为x和y的标准偏差。,11,关于R的说明: R1,说明没有试验误差; R0说明回归线与x轴平行,y与x没有线性相关。0R1,有相关性。 其中R愈接近1,相关性越强。 一般只有当R大于某个临界值时,y与x的线性关系才是显著相关,回归才有意义。 R的临界值与样本个数、显著性水平都有关系。一般的,R最起码应大于0.95。,一元线性回归在单因素法中有很重要的应用。,12,63 一元非线性回归,在很多实际的工作中,

6、我们碰到的y-x按线性回归时,相关系数很差,意味着y-x不是一个线性关系。这时需要考虑非线性回归。 自变量只有一个时,就是一元非线性回归。 在一些情况下,一元非线性回归经过适当的变换,可以转化为线性回归问题。,13,具体做法是: (1) 根据样本数据,先作出散点图; (2) 根据散点图推测yx之间的函数关系; (3) 选择适当的变换,使之变成线性关系; (4) 用线性回归方法求出线性回归方程; (5) 最后返回原来的函数关系,得到要求的回归方程。,14,如:,1.双曲线,2.抛物线,3.幂函数,4.指数函数,5. S型函数,15,事实上,我们在很多情况下对数学曲线的类型了解的并没有这么深入,这

7、个时候就主要靠对各种函数进行试验,然后看相关系数是否接近于1来判断拟和的函数是否有用 。,16,例题13. 发光半导体纳米晶体也叫作量子点(Quantum Dots, QDs),最近15年才得以迅速发展起来。它具有非常优异的光学性能。和有机荧光染料相比,量子点具有亮度高,光稳定性好,荧光发射波长窄(fwhm=25-30nm,full width at half-maximum),激发和发射波长依赖于粒径等优点。通常粒径是用TEM测定的,但是对于水溶性QDs,直接用TEM测定时经常会在铜网上聚集,从而得不到有用的电镜照片。为此发展了一种荧光相关光谱法(FCS)测定量子点的粒径。(Zhang PD

8、 et al, Anal. Chim. Acta. 546 (2005) 4651),17,FCS依据的原理就是下面这个公式:,其中:,实际测得的最大激发波长和粒径的对应关系如下:,如何对他们进行回归呢 ?,R: 动力学半径,18,事实上,只要我们知道了回归模型,回归分析将变得很简单。 譬如,单分子在微区中的运动轨迹就可按照FCS模型进行非线性拟和(这里不讨论)。 如果不知道回归模型,那么只能从常规的线性回归开始尝试。 在本例中,将测定的激发波长作为自变量x,粒径作为因变量y,那么通过excel或者origin很容易对其作出散点图:,19,如果按照线性回归,得到的图形线性很差。,20,观察图形

9、,并考虑到实际测定的误差,试图用一元二次函数进行回归:,从R2可以看出,回归有所改进。进一步分析,将多项式回归的阶数再增高一阶,即一元三次多项式回归 。,21,更进一步,一元四次、五次、六次回归得到的图形:,22,可以看出,似乎拟和阶数越高,回归的相关系数越高,但事实上6次式是不对的,因为在实际的QD合成中,粒径是随着激发波长单调增长的。而且,我们也看到,5次式、4次式、3次式的相关系数都大于0.99,已远远大于99的置信度范围的临界R值(对7个试验点,临界R值为0.874),因此实际工作中选一元三次式回归方程。 事实上,考虑到试验的误差,试验点数目的限制等因素,一元三次回归方程已经完全能满足预测功能。,23,补充说明:任何一条单变量的曲线,如光谱曲线、极谱或伏安曲线、动力学

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论