机组耗水率影响因素的回归分析_第1页
机组耗水率影响因素的回归分析_第2页
机组耗水率影响因素的回归分析_第3页
机组耗水率影响因素的回归分析_第4页
机组耗水率影响因素的回归分析_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、机组耗水率影响因素的回归分析摘要数理统计是具有广泛应用的数学分支,在生产过程和科学实验中,总会遇到 多个变量,同一过程中的这些变量往往是相互依赖,相互制约的,也就是说他们 之间存在相互关系,这种相互关系可以分为确定性关系和相关关系。变量之间的 确定性关系和相关关系在一定条件下是可以相互转换的。本来具有函数关系的变 量,当存在试验误差时,其函数关系往往以相关的形式表现出来相关关系虽然是 不确定的,却是一种统计关系,在大量的观察下,往往会呈现出一定的规律性, 这种函数称为回归函数或回归方程1。回归分析是一种处理变量之间相关关系最 常用的统计方法,用它可以寻找隐藏在随机后面的统计规律。确定回归方程,

2、检 验回归方程的可信度等是回归分析的主要内容。按回归模型类型可划分为线性 回归分析和非线性回归分析。本文运用多元线性回归分析方法建立耗水率与出库流量、库水位的模 型。首先收集数据并利用MATLAB软件进行数据处理,作出散点图。分析 图发现耗水率与出库流量、库水位有明显的线性关系。在此基础上假设并 建立模型。对回归参数做点估计及区间估计,并作出显著性检验,发现显 著效果良好,然后利用残差图检验回归效果,发现异常点,进而改进模型, 最后利用回归方程做点预测和区间预测。关键词:相互关系;多元线性回归分析;线性回归方程;显著性检测目录 TOC o 1-5 h z HYPERLINK l bookmar

3、k10 o Current Document 1设计目的1 HYPERLINK l bookmark13 o Current Document 2设计原理1 HYPERLINK l bookmark16 o Current Document 2.1线性回归方程的建立1 HYPERLINK l bookmark19 o Current Document 2.2 参数估计1 HYPERLINK l bookmark69 o Current Document 2.3回归模型的假设检验2 HYPERLINK l bookmark78 o Current Document 2.4回归系数的假设检验和区间

4、估计3 HYPERLINK l bookmark87 o Current Document 2.5利用回归模型进行预测3 HYPERLINK l bookmark96 o Current Document 3设计题目4 HYPERLINK l bookmark99 o Current Document 4实现过程4 HYPERLINK l bookmark102 o Current Document 4.1回归方程的确立4 HYPERLINK l bookmark111 o Current Document 4.2回归方程显著性检验6 HYPERLINK l bookmark117 o Cur

5、rent Document 4.3模型改进74.4回归预测8 HYPERLINK l bookmark122 o Current Document 5设计总结10 HYPERLINK l bookmark125 o Current Document 参考文献101设计目的为了进一步理解概率论与数理统计的基本概念、理论和方法,基本掌握 MATLAB等具有统计分析功能软件的使用,并具备初步的运用计算机完成数据处 理的技能,实现理论与实践的结合。2设计原理2.1线性回归方程的建立设Y是一个可观测的随机变量,受到P(P0)个非随机变量因素X1,X2,Xp 和随机因素E的影响若Y与X 1,X2,.Xp有

6、如下线性关系:Y =。+p X +p X + p X +(2.1.1)01122P P TOC o 1-5 h z 其中p ,p ,p,p是固定的未知参数,称为回归系数,服从N()q 2),Y 012 p称为被解释变量,模型(2.1.1)称为多元线性回归模型4已知n个独立观测数据(y ,x,x )i = 1, ,n,n m应满足下式i i1imy = p+ p x+ p x+ + px+ 101 112 12p 1 p 1(2.1.2 )y =p+p x+ p x+ px+201 212 22p 2 p2y = p + p x + p x + + p x + n 01 n12 n 2p np

7、n其中 i(i = 1,2,.相互独立,且设i N(0q2)(i = 1,2,.,n),记一xxx )rp: )111121m01yX =1xxxp =pY =221222m1 =2:JI1xn1xn2x Jnm3 m J Jn2.2参数估计对模型中参数p0, p1,., p,使用最小二乘法进行估计 m使当p=叩=0,1,2,m时,误差平方和Q = 乙 2=8 (, -P-P 尤 P x IG.2.1)ii 01 i1m imi=1i=1达到最小。为此,令全=0, j = 0,1,2,. ., n(2.2.2)ap j整理得-|S-=-2(y - p - p x p x )=0api 01 i

8、1m im/、0i=1(2.2.3)= 28 (y p p xp x )v = 0, j =1,2,mapi 01 i1m im ijji=1整理化为正规方程组的矩阵形式XtXP = XtY(2.2.4)当矩阵X列满秩时,XTX为可逆方阵,上式的解为任=GtX )】XtY(2.2.5)将#代回原模型得到y的估计值y = p+p x1 hp x(2.2.6)而这组数据的拟合值为Y = X任,拟合误差e = Y Y称为残差,可作为随机误差 e的估计,而残差平方和(或剩余平方和)为Q = 8e 2=8 f y 注(2.2.7)i ,i i /i=1i=1 2.3回归模型的假设检验检验因变量y与自变量

9、x ,x ,x之间是否存在线性关系。显然,如果所 12m有的(j = 1,2,m)都很小,y与x ,x,x的线性关系就不明显,所以可令 j12 m原假设为H0: p . = 0( j = 1,2,., m)当H成立时由回归平方和U和残差平方和Q满足= Q 驾1)危(m, “ m 1)(2.3.1)在显著性水平a下有上a分位数,F(m, m - n-1),若F F(m, m - n-1)接受H ;否则,拒绝。 02.4回归系数的假设检验和区间估计当上面的H0被拒绝时,pj不全为零,但是不排除其中若十个等于零。所 以应进一步作如下m+1个检验( 0,1,m):H:j): p . = 0若假设成立*

10、 p,E 、 /)t / j * nn - m -1) j ,-Q (n-m-1)对给定的a,若|t.|t对P作区间估计(J = 0,1,m),在置信水平1 j(n m -1),接受 H (j);2(2.4.1)否则,拒绝。a下,p.的置信区间为(2.4.2)P -1 n-m-1C.,P +1 n-m- 1.(c.222.5利用回归模型进行预测当回归模型和系数通过检验后,可由给定的x =(x,,x )预测y,y是 0010 m00随机的,显然其预测值(点估计)为顶=B +B x + +p x(2.5.1)001 01m om给定a可以算出y0的预测区间(区间估计),结果较复杂,但当n较大且X0

11、.接近平均值x.时,yo的预测区间可简化为(2.5.2)八 八一侦专y0 +甘22其中乙a是标准正态分布的上生分位数。对yo的区间估计方法可用于给出已知数 2据残差e, = y, -*G = 1,.n)的置信区间,e.服从均值为零的正态分布,所以若某个ei的置信区间不包含零点,则认为这个数据是异常的,可予以剔除。3设计题目本文选用葛洲坝机组发电耗水率数据进行分析得到其主要影响因素为库水 位,出库流量。数据如表3.1所示,利用多元线性回归分析方法建立耗水率与出 库流量、库水位的模型。表3.1某天耗水率与出库流量、库水位的数据机组发电耗水率(立方米/万千瓦)库水位(米)出库流量(立方米)65.08

12、1560760.4665.101556560.2865.121554060.1065.171550759.7865.381553658.9165.401551958.7365.431551058.6365.471548958.4865.531543758.3165.621635557.9665.581470857.0665.701439356.4365.841429655.834实现过程4.1回归方程的确立本文采用二元线性回归模型,分析机组耗水率与其影响因素出库流量、库 水位的关系。故选用“机组发电耗水率”为应变量Y,选用“出库流量”、“库 水位”为X1,X2,对已知数据进行数据处理。运用MA

13、TLAB软件作出散点图。输入:A=65.081560760.4665.101556560.2865.121554060.1065.171550759.7865.211543259.4465.371561959.2565.381553658.9165.391551458.7665.401551958.7365.431551058.6365.471548958.48 TOC o 1-5 h z 65.531543758.3165.621635557.9665.581470857.0665.701439356.4365.841429655.83;%做散点图subplot(1,2,1),plot(A(

14、:,1),A(:,3),+)xlabel( x1(库水位)ylabel( y(耗水率)subplot(1,2,2),plot(A(:,2),A(:,3),o) xlabel(x2(出库流量)ylabel( y(耗水率)结果:从图中可以看到无论是库水位还是出库流量都与机组发电耗水率具有线性关系,因此,可以建立机组发电耗水率与库水位和出库流量的二元线性回归模型。Y =。+p X +p X +(4.1.1)01122再利用MATLAB统计工具箱中的回归分析命令6进行分析,输入:m,n=size(A);y=A(:,3);x=A(:,1:2);b,bint,r,rint,stats=regress(y,

15、ones(m,1),x);b,bint,stats并得出结果:b =373.8698-4.97590.0007bint =340.0820 407.6577-5.4642-4.48750.00040.0009stats =0.9863 468.41180.00000.0278将结果整理得下表:表4.1.1回归模型的系数、系数置信区间与统计量回归系数回归系数估计值回归系数置信区间3 0373.8698340.082 ,407.6577& 1-4.9759-5.4642 ,-4.4875 3 20.00070.0004,0.0009R 2= 0.9863,F= 468.4118,p0.0001,S

16、 2 =0.0278由此可得模型为:Ay = 373.8698 - 4.9759x + 0.0007x124.2回归方程显著性检验(1)拟合优度检验相关系数R2 = 0.9863,非常接近1,说明本模型对样本数据拟合较好,即解 释变量“出库流量”、“库水位”对被解释变量“耗水率”的绝大部分差异做出 了解释。(2)F检验由MATLAB所得数据F=468.4118,查F分布表,在显著水平a =0.005的情 况下,孔加(2,13)= 8.19,比较得F远大于8.19,说明耗水率与出库流量、库水 位间存在显著的线性关系。(3)残差分析残差分析的基本方法是由回归方程作出残差图,通过观测残差图,以分 析

17、和发现观测数据中可能出现的错误以及所选用的回归模型是否恰当;在残差图 中,残差点比较均匀地落在水平区域中,说明选用的模型比较合适,这样的带状 区域的宽度越窄,说明模型的拟合精度越高,回归方程的预报精度越高。在MATLAB界面下输入:rcoplot(r,rint);得到残差图如下:46810Case Number121416图4.2.1残差示意图4.3模型改进考虑删除异常点程序并重新建立模型。在MATLAB界面下输入:b1,bint1,r1,rint1,stats1=regress(y(1:12);y(14:m),ones(m-1,1),x(1:12,:);x(14:m,:) rcoplot(r

18、1,rint1);删除异常点后,残差示意图如下图所示,此时没有异常点,改进回归模型的系数、 系数置信区间8与统计量参见表4.3.1。4.3.1模型改进后残差图根据MATLAB所得数据整理得下表:4.3.1回归模型改进后的系数、系数置信区间与统计量回归系数回归系数估计值回归系数置信区间3 0328.4616290.6145 ,366.3087P1-4.3594-4.8880 ,-3.8308 320.00100.00073,0.0012R 2= 0.9931,F= 858.5846,p0.0001,S 2 =0.0150表4.1.1与表4.3. 1加以比较,可以发现:可决系数从0.9863提高到

19、0.9931, F统计量从468.4118提高到858.5846,由此可知改进后的模型显著性明显提高。 4.4回归预测对模型进行回归预测,在MATLAB软件10里调用“polytool”命令,输入 以下程序:x1=15607 15565 15540 15507 15536 15519 15510 15489 15437 16355 14708 14393 14296;y=65.08 65.10 65.12 65.17 65.38 65.40 65.43 65.47 65.53 65.62 65.58 65.70 65.84;polytool(x1,y,1,0.05)结果:Degree 66.4

20、66.266VValUeS 65.8 65.42165.6+/0.4921265.465.26564.8l.LLLL _ -2J_-*:rrrrri64.6EKpoit.Close1.441.461.481.51.521.541.561.581.61.621.6415325.5x 10 4X Values图4.4.1预测图输入:x2=60.4 6 60.28 60.10 59.78 58.91 58.73 58.63 58.48 58.31 57.96 57.06 56.43;y=65.08 65.10 65.12 65.17 65.38 65.40 65.43 65.47 65.53 65.62 65.58 65.7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论