




已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数学建模讲稿-灰色预测模型GM(1, 1) 华北电力大学科技学院 数学教研室 张文彬灰色预测模型GM(1,1)1 预备知识灰色预测是就灰色系统所做的预测。所谓灰色系统是介于白色系统和黑箱系统之间的过渡系统,其具体的含义是:如果某一系统的全部信息已知为白色系统,全部信息未知为黑箱系统,部分信息已知,部分信息未知,那么这一系统就是灰箱系统。一般地说,社会系统、经济系统、生态系统都是灰色系统。例如物价系统,导致物价上涨的因素很多,但已知的却不多,因此对物价这一灰色系统的预测可以用灰色预测方法。灰色系统理论认为对既含有已知信息又含有未知或非确定信息的系统进行预测,就是对在一定方位内变化的、与时间有关的灰色过程的预测。尽管过程中所显示的现象是随机的、杂乱无章的,但毕竟是有序的、有界的,因此这一数据集合具备潜在的规律,灰色预测就是利用这种规律建立灰色模型对灰色系统进行预测。平面上有数据序列,大致分布在一条直线上。 y x 设回归直线为:,要使所有点到直线的距离之和最小(最小二乘),即使误差平方和最小。J是关于a, b的二元函数。由则得使J取极小的必要条件为: (*)(1)以上是我们熟悉的最小二乘计算过程。下面提一种观点,上述算法,本质上是用实际观测数据、去表示a与b,使得误差平方和J取最小值,即从近似方程中形式上解出a与b。把上式写成矩阵方程。令 ,令 ,则左乘得注意到BTB是二阶方阵,且其行列式不为零,故其逆阵(BTB)-1存在,所以上式左乘得 (2)可以具体验算按最小二乘法求得的结果(1)与(2)式完全相同,下面把两种算法统一一下:由最小二乘得结果:方程(*) 方程组改写为:令:,(*)化为 所以以后,只要数据列大致成直线,既有近似表达式当令:,则有 (2)(2)式就是最小二乘结果,即按最小二乘法求出的回归直线的回归系数a与b。推广:多元线性回归设有m个变量,每个自变量有n个值,因变量y有n个值(1)如n个人,每人有m个指标。女生:人:(体重)公斤(胸围)厘米(呼吸差)厘米(肺活量)毫升1=35=69=0.716002=40=74=2.526003=40=64=2.021004=42=74=326505=37=72=10124006=45=68=10522007=43=78=40327508=37=66=216009=44=70=302275010=42=65=32500方程组(1)是n个方程m个数据用X表示增广矩阵:n行,m+1列,其中为阶矩阵。由此可解出:注意:方程组中不知,意思是:如果线性关系成立当为多少时,到的距离之和为最小。或说,当所有到()距离之和为最小时的就是我们要求的最佳系数。2 前言为什么要讲GM(1,1)模型?80年代初,华中理工大学邓聚龙教授提出了灰色系统理论,先后发表过灰色控制、灰色预测、灰色决策、灰色系统理论等多部专著,较详细在阐述了灰色系统理论的产生、理论、方法与应用。在80年代中后期到90年代初,举行了十数次国际、国内有关灰色系统理论的研讨会,在全国形成一股灰色系统理论研究与应用热潮。邓聚龙先生因灰色系统理论方面的供献,获得国家科技进步一等奖。什么叫灰?用邓先生自己的话来讲:“完全已知的系统称作白系统;完全未知的系统称作黑系统或黑箱;部分已知、部分未知的系统称作灰色系统。”在此,已知或未知到什么程度没有具体说明。所以,“灰”的内涵不是很清楚。举个例子讲,已知某量的真值x在闭区间a, b上,不可能落在a, b之外,但具体落到区间a, b的什么位置则是完全不知道的。那么,这个量称作灰量,可具体表示为a, b,称其为区间灰数。显然,区间灰数是客观实际中存在的,除了知道真值x在a, b上,而不在a, b之外,不再有任何已知信息,这就是灰量的最基本原型。由于灰色系统理论从一开始就没有建立在严格的集合论基础之上,使之缺乏必要的数学支撑,这大大限制了灰色系统理论和应用的发展。虽然灰色系统理论在控制、预测、决策等领域有着广泛的应用;但就其精华而言,还在于GM(1,1)模型。即便是现在,在特定情况下,GM(1, 1)还有用,还在被应用,并且预测效果很好。其使用限制条件是:原始数据单调,预测背景呈现稳定发展趋势;其优势是:适用于原始观测数据较少的预测问题,由于数据量很小,无法应用概率统计方法寻找统计规律,而GM(1, 1)模型恰恰弥补了这个空白,由于GM(1, 1)算法简单易行,预测精度相对较高,所以在一些特定问题中,GM(1, 1)仍然是决策者乐于选择的预测模型。上面讲到的背景稳定的发展趋势是指下述情况:如化工设备的腐蚀量,随着使用时间的推移腐蚀不断增加,呈现出稳定的发展趋势,并且腐蚀量的测量通常比较困难(如停产才能测量),所以实际观测数据较少。这类问题很适合GM(1, 1)模型预测。3 GM(1, 1)预备知识(二)3.1回忆一阶线性常系数微分方程 (1)其解为: (2)其中a,u为给定的常数。一阶线性常系数微分方程(1)的解(2)是指数型曲线,如下图所示x(0)0 txa0x(0)u/a0 txa010 txa0图象 图象 图象3.2在预备知识中,讲述了最小二乘法:若数据点近似落在一条直线上,设这条直线为yax+b,a, b为参数。理想的直线要求:每个数据点,到该直线的距离平方和最小即最小二乘。用最小二乘法求出参数a与b,这相当于形式上的解线性方程组: (3)当令,则(3)化为,(4)由此求出,可得回归直线(5)上述形式上的求解结果,本质上是用最小二乘法求解回归参数的过程,故有下面结论。结论:一组数据点(n个),且近似线性关系则下述表达式可求出回归系数a与b。上述形式上的计算,本质是使点到直线yaxb的距离平方和最小,即是最小二乘法得来的结果。4 GM(1,1)模型G表示Grey(灰),M表示Model(模型),前一个“1”表示一阶,后一个“1”表示一个变量,GM(1, 1)则是一阶,一个变量的微分方程模型。给定等时间间隔的数据列,且设数据列单调:k表示时刻,表示tk时刻某量的观测值,不妨设,将数据列记成:表示原始数据序列。比如:。=2.874, 6.152, 9.489, 12.879, 16.558对原始数据作一次累加生成:即令得一次累加生成数序列为:在此,=2.874, 6.152, 9.489, 12.879, 16.558给定的原始数据序列已经是单增序列,经一次累加后生成的累加数序列具有更强烈的单调性。我们知道指数序列是单调的,但是,单调序列却不一定是指数型的,不过强烈的单调序列可近似看做是指数的,即可用指数型曲线进行弥合。如果用指数曲线来弥合一次累加生成序列,那么,这条指数曲线一定是某个一阶线性常系数微分方程(6)的满足某个初始条件的一条积分曲线:即(7)其中a,u是待确定的未知参数,该微分方程中的导数可用差商近似表示。为时间间隔,将时间间隔看做是单位时间间隔,并且认为时间被充分细化(秒,毫秒。微秒事实上只要单位时间内函数的增量相对很小,这个单位时间间隔也可以是日,月,年等。)此时有注意到一次累加生成数在时刻tk1与tk时的差为:而是在k, k1上某一点取值,既然是近似,索性将的值取在点k+1,即于是,一阶线性常系数微分方程可近似化为:注意到函数(t)在区间k, k+1上取值,当以中值近似时有:则微分方程近似转化为:这是一个关于参数a与u的线性近似表达式。与数据点近似满足比较知,按最小二乘原理,线性回归系数a,b满足:其中,具体到上面给定的数据且用替代,则上式化作:, 由此看出,若原始数据有n个,则一次累加生成的数据有n1个。计算由 得 ,计算得即a=0.03720,u=3.06536这样,所求的微分方程模型为:(10)其解为: 即解可表示为:(11)(11)式就是最后得到的预测模型,该模型称作GM(1, 1)预测模型。由(11)式可求,即为t6时的预测值,也可求,等等。即用观测值去检验由模型(11)算出的模型值。=3.7702, =3.9193, =4.0743。算法流程:1 得到初始数列,并按照累加生成新的数列。2 按照,计算参考矩阵B和。3 按最小二乘方法求得回归曲线的系数出a和u。4 可以得到其解。5 =即为所得的预测数列矩阵(第一个数据已知,预测是从第二个数开始的。)画出预测曲线和实际值的比较图6 残差方法检验模型: 即为所求的残差误差。4 精度检验对于任何预测模型,都要对模型的预测结果进行精度检验。GM(1, 1)有三种精度检验方式。1. 残查检验;2. 关联度检验;(略)它是灰色预测中最看重的检验方法。3. 后严差检验。 (见附表)检验方式2与3是GM(1,1)模型的主要检验方式;但是我个人对关联度的定义有保留看法,不认为关联度检验多么可靠,故舍弃;后验差检验是基于概率统计原理的基本检验方法,因GM(1, 1)的应用前提是小样本数据,而小样本数据通常不具有统计特征,故认为,当对仅有5个原始数应用GM(1, 1)预测时,不具有统计特性,故对该例若用后验差检验,其检验结果将难令人相信,但不否认,当数据较多时,后验差检验仍是精度检验的基本方法。所以对GM(1, 1)只讲述残差检验。这是一种简单的直观检验方法。由于后验查检验是一种成型方法,在此用虽不合适,当原始数据较多,基本上能体现数据的统计特性时,后验差检验仍是预测精度检验的一般方法,故列在附录中。残差检验方法:1、由预测模型计算 k2,3,4,52、设实际数据为 k2,3,4,5注意到,模型是对一次累加数求的预测值,故还应该将一次累加的模型值还原成要求的数据。将模型计算数据和实际数据还原得=, k=2,3,4,53、计算残差 q(k)实际值模型值 误差 相对误差若则认为预测模型good,为相对误差限是决策者按精度需求预先确定的阈值。本例的残差检验结果如下:模型计算数据:实际数据: 还原数据:实际数据:由此得残差认为残差估计满意,模型good。通常情况下,残差估计不超过5,则认为模型good。当然,不同问题预设的阈值有所不同。附录:1. 后验差检验方法后验差检验是一种常用的基于概率统计的基本检验方法。它以预测误差为基础,根据的大小,考察预测误差较小的点出现的概率,以及与预测误差的方差有关指标的大小。第i级预测误差 被定义为:其中为第i种观测数据,为第i级预测值。后验差检验所依据的数据有:(1). 观测数据均值与均方差(标准差),(1)其中N为观测数据的个数。(2). 预测误差均值与预测误差的均方差(标准差),(2)其中n为预测数据的个数,一般nN。(3). 后验差比值C与小误差频率P定义为:,对于外推性好的预测来说,比值C必须小。因为C小说明小大,即预测误差离散性小,而观测数据摆动幅值大即原始数据规律性差,而预测数据规律性较好。因此,一个好的预测要求在较大情况下尽可能的小。作为预测指标来说c越小越好,一般要求 C0.950.80.70.70.350.50.650.65 二、练习算例例1、有一台空压机,其轴向止推轴承套磨损量如表:测试日期7月30日8月10日8月20日8月30日9月10日9月20日9月30日10月10日磨损量0.11680.12450.13460.14990.17270.19300.21840.2489试按GM(1, 1)建模,预测,画出预测曲线图,并做残差检验。例2. 某压力容器,因受腐蚀器壁变薄泄漏而失效。已知10台压力器器壁腐蚀量数据为:表2 10台容器壁腐蚀量被测器号12345678910t=12.3382.2612.2862.3372.1842.2612.2862.3112.3112.235t=2(100h)2.3352.2112.2802.2772.1192.2232.2462.2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2023-2029年中国威士忌酒行业市场发展现状及投资策略咨询报告
- 刻字笔行业深度研究分析报告(2024-2030版)
- 中国红外线夜视摄录机行业市场发展监测及投资策略研究报告
- 中国法式门冰箱行业市场运营现状及投资方向研究报告
- 品字尾输出公插项目投资可行性研究分析报告(2024-2030版)
- 瓷砖检测培训课件
- 中国毛绒收纳桶行业市场发展前景及发展趋势与投资战略研究报告(2024-2030)
- 网络运营培训课件
- 中国桩用螺旋焊钢管行业市场前景预测及投资价值评估分析报告
- 快切培训课件
- 2024年浙江杭州萧山区城市社区工作者招聘笔试冲刺题(带答案解析)
- 金融数据分析智慧树知到期末考试答案2024年
- 2024年安徽合肥东方英才人才限公司招聘5人历年高频考题难、易错点模拟试题(共500题)附带答案详解
- 口腔门诊纳入定点后医疗保障基金的预测性分析报告
- 乳牙疾病的治疗与预防
- 质量管理体系的智能化与数字化转型
- 肾绞痛的护理
- 《麦肯锡金字塔原理》课件
- 《自动控制原理》说课
- 《内部控制》ppt课件完整版
- 文化产业赋能乡村振兴
评论
0/150
提交评论