已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
机组耗水率影响因素的回归分析摘 要数理统计是具有广泛应用的数学分支,在生产过程和科学实验中,总会遇到多个变量,同一过程中的这些变量往往是相互依赖,相互制约的,也就是说他们之间存在相互关系,这种相互关系可以分为确定性关系和相关关系。变量之间的确定性关系和相关关系在一定条件下是可以相互转换的。本来具有函数关系的变量,当存在试验误差时,其函数关系往往以相关的形式表现出来相关关系虽然是不确定的,却是一种统计关系,在大量的观察下,往往会呈现出一定的规律性,这种函数称为回归函数或回归方程1。回归分析是一种处理变量之间相关关系最常用的统计方法,用它可以寻找隐藏在随机后面的统计规律。确定回归方程,检验回归方程的可信度等是回归分析的主要内容。按回归模型类型可划分为线性回归分析和非线性回归分析。 本文运用多元线性回归分析方法建立耗水率与出库流量、库水位的模型。首先收集数据并利用MATLAB软件2进行数据处理,作出散点图。分析图发现耗水率与出库流量、库水位有明显的线性关系。在此基础上假设并建立模型。对回归参数做点估计及区间估计,并作出显著性检验,发现显著效果良好,然后利用残差图3检验回归效果,发现异常点,进而改进模型,最后利用回归方程做点预测和区间预测。关键词:相互关系;多元线性回归分析;线性回归方程;显著性检测目录1 设计目的12 设计原理12.1 线性回归方程的建立12.2 参数估计12.3 回归模型的假设检验22.4 回归系数的假设检验和区间估计32.5 利用回归模型进行预测33 设计题目34 实现过程44.1 回归方程的确立44.2 回归方程显著性检验64.3 模型改进74.4 回归预测85 设计总结11参考文献121 设计目的为了进一步理解概率论与数理统计的基本概念、理论和方法,基本掌握MATLAB等具有统计分析功能软件的使用,并具备初步的运用计算机完成数据处理的技能,实现理论与实践的结合。2 设计原理2.1 线性回归方程的建立设Y是一个可观测的随机变量,受到P(P0)个非随机变量因素和随机因素的影响若Y与有如下线性关系: 其中是固定的未知参数,称为回归系数,服从,Y称为被解释变量,模型(2.1.1)称为多元线性回归模型4。已知 n 个独立观测数据应满足下式其中相互独立,且设,记 2.2 参数估计 对模型中参数,使用最小二乘法进行估计,即应选取估计值,使当时,误差平方和 达到最小。为此,令 整理得 整理化为正规方程组的矩阵形式 当矩阵 X 列满秩时, 为可逆方阵,上式的解为 将代回原模型得到 y 的估计值 而这组数据的拟合值为,拟合误差 称为残差,可作为随机误差的估计,而残差平方和(或剩余平方和)为 2.3 回归模型的假设检验 检验因变量与自变量 之间是否存在线性关系。显然,如果所有的都很小,与 的线性关系就不明显,所以可令原假设为当成立时由回归平方和U和残差平方和Q 满足 在显著性水平下有上分位数, ,若 接受 ;否则,拒绝。2.4 回归系数的假设检验和区间估计当上面的 被拒绝时,不全为零,但是不排除其中若干个等于零。所以应进一步作如下 m+1个检验 :若假设成立 对给定的,若,接受;否则,拒绝。对作区间估计,在置信水平1下,的置信区间为其中。2.5 利用回归模型进行预测 当回归模型和系数通过检验后,可由给定的 预测, 是随机的,显然其预测值(点估计)为给定可以算出的预测区间(区间估计),结果较复杂,但当 n 较大且 x0i 接近平均值xi 时,y0 的预测区间可简化为 其中是标准正态分布的上分位数。对y0 的区间估计方法可用于给出已知数据残差 的置信区间,ei 服从均值为零的正态分布,所以若某个 ei 的置信区间不包含零点,则认为这个数据是异常的,可予以剔除。3 设计题目 本文选用葛洲坝机组发电耗水率数据进行分析得到其主要影响因素为库水位,出库流量。数据如表3.1所示,利用多元线性回归分析方法建立耗水率与出库流量、库水位的模型。表3.1 某天耗水率与出库流量、库水位的数据 机组发电耗水率 (立方米/万千瓦) 库水位(米)出库流量(立方米)65.081560760.4665.101556560.2865.121554060.1065.171550759.7865.381553658.9165.401551958.7365.431551058.6365.471548958.4865.531543758.3165.621635557.9665.581470857.0665.701439356.4365.841429655.834 实现过程4.1 回归方程的确立 本文采用二元线性回归模型8,分析机组耗水率与其影响因素出库流量、库水位的关系。故选用“机组发电耗水率”为应变量Y,选用“出库流量”、“库水位”为,对已知数据进行数据处理。运用MATLAB软件5作出散点图。输入:A=65.08 15607 60.4665.10 15565 60.2865.12 15540 60.1065.17 15507 59.7865.21 15432 59.4465.37 15619 59.2565.38 15536 58.9165.39 15514 58.7665.40 15519 58.7365.43 15510 58.6365.47 15489 58.4865.53 15437 58.3165.62 16355 57.9665.58 14708 57.0665.70 14393 56.4365.84 14296 55.83;% 做散点图subplot(1,2,1),plot(A(:,1),A(:,3),+)xlabel(x1(库水位) ylabel(y(耗水率)subplot(1,2,2),plot(A(:,2),A(:,3),o)xlabel(x2(出库流量) ylabel(y(耗水率)结果:图4.1.1散点图从图中可以看到无论是库水位还是出库流量都与机组发电耗水率具有线性关系,因此,可以建立机组发电耗水率与库水位和出库流量的二元线性回归模型。再利用 MATLAB 统计工具箱中的回归分析命令6进行分析, 输入:m,n=size(A);y=A(:,3);x=A(:,1:2);b,bint,r,rint,stats=regress(y,ones(m,1),x);b,bint,stats并得出结果:b =373.8698 -4.9759 0.0007bint =340.0820 407.6577 -5.4642 -4.4875 0.0004 0.0009stats =0.9863 468.4118 0.0000 0.0278将结果整理得下表:表4.1.1 回归模型的系数、系数置信区间与统计量回归系数回归系数估计值回归系数置信区间373.8698340.082 ,407.6577-4.9759-5.4642 ,-4.4875 0.00070.0004,0.0009= 0.9863,F= 468.4118,p0.0001, =0.0278由此可得模型为:4.2 回归方程显著性检验(1) 拟合优度检验 相关系数,非常接近1,说明本模型对样本数据拟合较好,即解释变量“出库流量”、“库水位”对被解释变量“耗水率”的绝大部分差异做出了解释。(2) F检验 由MATLAB所得数据F=468.4118,查F分布表,在显著水平=0.005的情况下,比较得F远大于8.19,说明耗水率与出库流量、库水位间存在显著的线性关系。(3) 残差分析 残差分析的基本方法是由回归方程7作出残差图,通过观测残差图,以分析和发现观测数据中可能出现的错误以及所选用的回归模型是否恰当;在残差图中,残差点比较均匀地落在水平区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型的拟合精度越高,回归方程的预报精度越高。在MATLAB界面下输入: rcoplot(r,rint);得到残差图如下:图.2.1 残差示意图4.3 模型改进考虑删除异常点程序并重新建立模型。在MATLAB界面下输入:b1,bint1,r1,rint1,stats1=regress(y(1:12);y(14:m),ones(m-1,1),x(1:12,:);x(14:m,:)rcoplot(r1,rint1);删除异常点后,残差示意图如下图所示,此时没有异常点,改进回归模型的系数、系数置信区间8与统计量参见表4.3.1。4.3.1 模型改进后残差图根据MATLAB所得数据整理得下表:4.3.1 回归模型改进后的系数、系数置信区间与统计量 回归系数回归系数估计值回归系数置信区间328.4616290.6145 ,366.3087-4.3594-4.8880 ,-3.8308 0.00100.00073,0.0012= 0.9931,F= 858.5846,p0.0001, =0.0150 表4.1.1与表4.3.1加以比较,可以发现:可决系数从0.9863提高到0.9931,F统计量从468.4118提高到858.5846,由此可知改进后的模型显著性明显提高。4.4 回归预测对模型进行回归预测9,在MATLAB软件10里调用“polytool”命令,输入以下程序:x1=15607 15565 15540 15507 15536 15519 15510 15489 15437 16355 14708 14393 14296;y=65.08 65.10 65.12 65.17 65.38 65.40 65.43 65.47 65.53 65.62 65.58 65.70 65.84;polytool(x1,y,1,0.05)结果:图4.4.1 预测图输入:x2=60.46 60.28 60.10 59.78 58.91 58.73 58.63 58.48 58.31 57.96 57.06 56.43 55.83;y=65.08 65.10 65.12 65.17 65.38 65.40 65.43 65.47 65.53 65.62 65.58 65.70 65.84;polytool(x2,y,1,0.05)结果:图4.4.2 预测图(其中,红线表示为数据离合区间,蓝色“ +”表示为数据散点分布,绿色表示为拟合曲线。)5 设计总结 本次课程设计,主要运用二元线性回归分析,分析耗水率与出库流量、库水位的关系,得出结论它们之间存在明显的线性关系,并对其做出显著性检验及回归预测。 通过本次课程设计,不仅加深了我对概率论与数理统计的理解,巩固了基础知识,而且更加熟练掌握了MATLAB软件。理论与实践的结合,锻炼了自己分析问题解决问题的能力。在收集数据和分析处理数据的过程中,学到了很多删选技巧。模型的建立,更是强化了书面上的基础知识。因为时间问题,做的有些仓促,我会继续努力地。参考文献1 侯亚君,刘立士等.概率论与数理统计M.北京:机械工业出版社.2011.2 王沫然.MATLAB 与科学计算M.北京:电子工业出版社,2005.3 马莉.MATLAB 数学实验与建模M.北京-清华大学出版社,2010.1.4 沈恒范.概率论与数理统计教程M.第四
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026四川宜宾汇发产业新空间投资有限公司第一批员工招聘5人备考题库及一套参考答案详解
- 2026安徽宣城广德市国信工程造价咨询有限公司社会招聘3人备考题库附答案详解(基础题)
- 2026广东珠海市金湾区红旗镇中心幼儿园代产假教师招聘2人备考题库附参考答案详解(综合卷)
- 2026浙江嘉兴市海宁许村中心卫生院招聘1人备考题库及完整答案详解一套
- 2026江苏南京林业大学教学科研岗招聘211人备考题库附答案详解(典型题)
- 2026岭南师范学院招聘二级学院院长2人备考题库(广东)附答案详解(研优卷)
- 2026广东珠海市金湾区红旗镇中心幼儿园代产假教师招聘2人备考题库附参考答案详解(典型题)
- 2026贵州黔南州贵定县面向社会招聘国有企业工作人员11人备考题库及答案详解(考点梳理)
- 2026广东广州市爱莎文华高中招聘备考题库带答案详解(突破训练)
- 自动喷水灭火系统喷头施工技术指南
- 国税局行政管理类风险点防范措施
- 不信谣不传谣不造谣谣言止于智者
- 五年级下学期数学第三单元《长方体和正方体》
- 幼儿园班本课程《蒜出精彩》
- 肿瘤学-肿瘤姑息治疗
- 房屋无偿使用协议书范本
- DB32T3916-2020建筑地基基础检测规程
- 2024中国心衰器械白皮书-沙利文
- 人事档案情况摘抄表
- 正常分娩9版妇产科学课件
- 常见的六轴关节机器人的机械结构
评论
0/150
提交评论