第6章 线性回归与曲线拟合_第1页
已阅读1页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 第第6章章 线性回归与曲线拟合线性回归与曲线拟合 2 线 性 回 归 n y与x之间是一种相关关系,即当自变量x变化时,因变 量y大体按某规律变化,两者之间的关系不能直观地看出 来,需要用统计学的办法加以确定,回归分析就是研究 随机现象中变量间关系的一种数理统计方法,相关关系 存在着某种程度的不确定性。 身高与体重;矿物中A组 分含量与B组分含量间的关系;分析化学制备标准工作曲 线,浓度与吸光度间的关系。 n 求回归方程的方法,通常是用最小二乘法,其基本思想 就是从并不完全成一条直线的各点中用数理统计的方法 找出一条直线,使各数据点到该直线的距离的总和相对 其他任何线来说最小,即各点到回归

2、线的差分和为最小, 简称最小二乘法。 3 6.1 散点图 n 要研究两个变量之间是否存在相关要研究两个变量之间是否存在相关 关系,自然要先作实验,拥有一批实验关系,自然要先作实验,拥有一批实验 数据,然后,作散点图,以便直观地观数据,然后,作散点图,以便直观地观 察两个变量之间的关系。察两个变量之间的关系。 n 合成纤维强度与拉伸倍数的关系,合成纤维强度与拉伸倍数的关系, 24组实验。组实验。 4 某合成纤维拉伸倍数和强度的关系 编号编号拉伸倍数拉伸倍数强度强度y编号编号拉伸倍数拉伸倍数强度强度y xkgf/cm2xkgf/cm2 1 11.91.91.41.413135 55.55.5 2

3、22 21.31.314145.25.25 5 3 32.12.11.81.815156 65.55.5 4 42.52.52.52.516166.36.36.46.4 5 52.72.72.82.817176.56.56 6 6 62.72.72.52.518187.17.15.35.3 7 73.53.53 319198 86.56.5 8 83.53.52.72.720208 87 7 9 94 44 421218.98.98.58.5 10104 43.53.522229 98 8 11114.54.54.24.223239.59.58.18.1 12124.64.63.53.5242

4、410108.18.1 5 0 2 4 6 8 10 051015 拉伸倍数x 强度y 6 从从散散点点图图中中看看出出,这这些些点点虽虽然然散散乱乱,但但大大体体上上散散布布 在在某某直直线线的的周周围围,也也就就是是说说,拉拉伸伸倍倍数数与与强强度度之之间间 大大致致成成线线性性关关系系。其其关关系系可可用用下下式式表表示示: Y=a+bx Y是是y的的计计算算值值,与与实实际际值值不不完完全全相相同同。 Y与与x之之间间不不具具有有确确定定的的函函数数关关系系,而而是是相相关关关关系系。 确确定定回回归归方方程程Y=a+bx中中的的回回归归系系数数a、b。 y随随x增增大大,称称为为正正

5、相相关关; y随随x减减小小,称称为为负负相相关关。 肉肉眼眼判判断断,杂杂乱乱无无章章,不不存存在在直直线线关关系系。 7 0 2 4 6 8 10 051015 拉伸倍数x 强度y 8 6.2 一元回归方程的求法和配线过程一元回归方程的求法和配线过程 Y=a+bx; a-截距,截距,b-斜率。斜率。 求求计计算算值值与与实实验验值值的的误误差差 当当x为为x1,x2,xn时时,则则相相应应有有 Y1=a+bx1, Y2=a+bx2, Yn=a+bxn。 这这些些Y1,Y2,Yn是是回回归归方方程程计计算算值值, 由由于于在在实实际际测测定定过过程程中中存存在在着着实实验验误误差差 ,因因此

6、此,相相应应于于x1,x2,xn 就就有有实实际际测测定定值值 y1,y2,yn,y1,y2,yn与与Y1,Y2,Yn是是不不等等同同的的, 即即实实验验点点(x1,y1) , (x2,y2) , (xn,yn) 并并不不一一定定落落在在回回归归直直线线上上。 每每个个实实验验点点(xi,yi)相相对对于于回回归归直直线线存存在在着着误误差差 )( iiii bxayYy , 求误差平方和的最小值求误差平方和的最小值 令令Q代表各实验点误差的平方和,则有:代表各实验点误差的平方和,则有: n i i yQ 1 ( i Y) 2 = 2 1 )( i n i i bxay , 使使Q值最小,只需

7、将上式对值最小,只需将上式对a,b求偏微分,并令其为零,求偏微分,并令其为零, 0)(2 1 i n i i bxay a Q , 0)(2 1 ii n i i xbxay b Q 。 将上二式求解并简化即可求出将上二式求解并简化即可求出a,b。 n i i n i ii xx yyxx b 1 2 1 )( )( , xbya 。 若以若以L代表离差,代表离差, 2 1 )(xxL n i ixx , n i iyy yyL 1 2 )(, n i iixy yyxxL 1 )(。 xx xy L L b , xbya。 这就是说回归直线一定通过(这就是说回归直线一定通过(yx,)这一点,

8、)这一点, 即由各数据的平均值组成的点,这一点对作图是很重要的。即由各数据的平均值组成的点,这一点对作图是很重要的。 Y=a+bx 12 6.3 回归方程的相关系数 n因变量因变量y与自变量与自变量x之间是否存在相关关系,在之间是否存在相关关系,在 求回归方程的过程中并不能回答,因为对任何求回归方程的过程中并不能回答,因为对任何 无规律的试验点,均可配出一条线,使该线离无规律的试验点,均可配出一条线,使该线离 各点的误差最小。为检查所配出的回归方程有各点的误差最小。为检查所配出的回归方程有 无实际意义,可以用无实际意义,可以用相关关系相关关系,或称,或称相关系数相关系数 检验法检验法。 由由于

9、于 ii bxaY, xbay, 则则 )( ii xxbYy, )()(xxbyyYy iiii , 2 11 2 )()()( n i n i iiii xxbyyYy, 经经变变换换、化化简简, n i n i ii n i ii xxbyyYy 11 222 1 2 )()()(, n i i n i i n i i n i ii yy xx b yy Yy 1 2 1 2 2 1 2 1 2 )( )( 1 )( )( , 令相关系数令相关系数r等于下式,等于下式, yyxx xy n i i n i ii n i i n i i LL L yy Yy yy xx br 2 1 2

10、1 2 1 2 1 2 22 )( )( 1 )( )( 。 由上式可知,当由上式可知,当y与与x之间存在严格的线性关系时,所有的数据点应落在回归线上,则有之间存在严格的线性关系时,所有的数据点应落在回归线上,则有 yi=Yi,r2=1,当,当y与与x之间存在相关关系时,之间存在相关关系时,r值在值在 0 与与 1 之间,之间,r是表示是表示y与与x相关程度的相关程度的 一个系数,它的符号取决于回归系数一个系数,它的符号取决于回归系数b的符号,若的符号,若r0,则称,则称x与与y正相关,正相关,y随着随着x的增加的增加 而增加;若而增加;若r0,则称,则称x与与y负相关,负相关,y随随x的增加

11、而减小。的增加而减小。R的绝对值越接近于的绝对值越接近于 1,x与与y 的线性关系越好,当的线性关系越好,当x与与y之间没有任何依赖关系时,之间没有任何依赖关系时,r=0。 16 相关关系的检验标准 n 在实际应用中,判断在实际应用中,判断r值与值与1接近到何程度接近到何程度 时,才认为时,才认为x与与y是相关的,或者说,所配出的是相关的,或者说,所配出的 回归方程才是有意义的,需要对照相关系数临回归方程才是有意义的,需要对照相关系数临 界值表来判断,当计算的相关系数界值表来判断,当计算的相关系数r的绝对值的绝对值 大于表中显著性水平为大于表中显著性水平为0.05和相应的自由度和相应的自由度

12、f=n-2下的临界值下的临界值r0.05,f时,则表示时,则表示y与与x是显著相是显著相 关的。如显著性水平取关的。如显著性水平取0.01,r计算 计算 r0.01,f时,时, 则表示则表示y与与x有非常显著的相关关系。有非常显著的相关关系。 17 第7章 曲线拟合 n 在化工实验数据处理中,我们经常会遇到 这样的问题,即已知两个变量之间存在着函数 关系,但是,不能从理论上推出公式的形式, 要我们建立一个经验公式来表达这两个变量之 间的函数关系。 n 二元溶液的溶解热与浓度的函数关系 n 反应物的浓度与反应时间的函数关系 n 做散点图,选经验方程,曲线变直,相关 系数对比,求出常数 18 在在

13、某某液液相相反反应应中中,不不同同时时间间下下测测的的某某组组成成的的浓浓度度见见下下表表, 试试作作出出其其经经验验方方程程。 浓浓度度随随时时间间的的变变化化关关系系 时时间间 t(min) 2 5 8 11 14 17 27 31 35 浓浓度度 cA (mol/L) 0.948 0.879 0.813 0.749 0.687 0.640 0.493 0.440 0.391 、首首先先将将实实验验数数据据 tcA作作图图,图图像像表表明明,这这是是一一条条曲曲线线,不不是是 y=a+bx 型型直直线线,因因此此,对对照照样样板板曲曲线线重重新新选选型型。 19 c, t关系图 0 0.2

14、 0.4 0.6 0.8 1 010203040 t(m in) c(m ol/L) 系列1 20 21 、再选用、再选用 y=axb型作试探,将此曲线变直型作试探,将此曲线变直 y=lncA x=lnt 算得:算得: lncA lnt 的数表的数表 Lnt 0.693 1.61 2.08 2.84 2.64 2.83 3.296 3.434 3.555 lncA -0.053 -1.09 -2.07 -0.289 -0.375 -0.446 -0.707 -0.821 -0.939 作作 lnc lnt 的图,发现原来的曲线不但没变直,反而更加弯曲了。说明这的图,发现原来的曲线不但没变直,反而更加弯曲了。说明这 个类型的经验公式更不适合了。个类型的经验公式更不适合了。 lnc, lnt 关系图 -1 -0.8 -0.6 -0.4 -0.2 0 01234 lnt lnc 系列1 22 、又重新选型,选用、又重新选型,选用 y=aebx型,再试探型,再试探 y=lncA x=t 作作 t lncA的图,的图, 作出图来,是一条很好的直线,说明这组实验数据,服从作出图来,是一条很好的直线,说明这组实验数据,服

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论