第二章预测模型_第1页
第二章预测模型_第2页
第二章预测模型_第3页
第二章预测模型_第4页
第二章预测模型_第5页
免费预览已结束,剩余14页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章预测模型预测问题一般要求是分析过去已有数据的内在趋势,并据此对未来的数据进行预测,以便指导以后的工作 .预测问题是一类数学建模竞赛中经常出现的问题,如 2005 年全国赛A题长江水质的预测问题,2006年B题艾滋病疗效的预测等.本章主要介绍三种比较常用的预测模型:灰色预测模型,马氏链预测模型,数据的拟合和插值,以期 帮助大家了解不同背景下不同预测方法的应用 2.1灰色预测模型灰色系统是介于白色系统和黑色系统之间的一种系统.灰色系统内的一部分信息是已知的,另一部分信息是未知的,系统内各因素间具有不确定的关系.灰色系统建模方法是通过处理灰信息来揭示系统内部的运动规律,它利用系统信息,使抽象概

2、念量化, 量化概念模型化,最后进行模型优化.目前,灰色系统建模方法主要用于灰色预测和决策,取得了良好的效果.灰色预测是一种对含有不确定因素的系统进行预测的方法.灰色预测通过对原始数据进行生成处理来寻找系统变动的规律, 生成有较强规律性的数据序列, 然后建立相应 的微分方程模型,从而预测事物未来发展趋势的状况 一、灰色序列数据处理由于系统中各因素的物理意义不同,或计量单位不同,从而导致数据的量纲不同, 为了便于分析就需要在各因素进行比较之前对原始数据进行处理.常用的数据处理方法有:初值化、均值化、中值化、区间化、归一化等.下面对初值化和均值化处理方法进行介绍.(1)初值化处理设有原始数据列x0)

3、=1x),x(0)(i) -0,i =1,2|ln对x( 1 乍初值化处理后得 X。),则x( 1 )= ,i =1,2,n ,其中x)=l xQk)n k i二、灰色序列生成方式灰色系统理论认为由于环境对系统的干扰,使系统行为特征值的离散函数数据出现紊乱,但是系统总是有整理功能的,因此必然蕴涵着某种内在规律,通过对原始数据的整理来寻求其变化规律和灰色过程生成对原始数据的处理,可得到随机性弱化和规律性强化了的序列.下面介绍灰色系统建模的几个有关概念.生成:将原始数据列 (0 中的数据xf依版某种要求作数据处理或数据变换.生成数:用“生成”的方法,求得随机性弱化和规律性强化了的新数列,此数列的

4、数据称为生成数.灰色系统中常用的生成方式有三类:累加生成、累减生成和均值生成累加生成数列(AGO):原始数据列中的第一个数据维持不变,作为新数据列的第 一个数据,新数据列的第二个数据是原始数据列的第一个数据与第二个数据之和,新数据列的第三个数据是原始数据列中第一个、第二个与第三个数据之和,依次类推.设有原始数据列立且X0七庐0,i =1,2,,n ,如果小(11,与以夕之间满足下述关系,即kx1 ik )=工 x,m ),m 1则称数列&9为数列&(0|,的一次累加生成数列.显然,r次累加生成数列有下述关系:x(r k )= x(r Ik -1)+ x(r k ).例1设原数列x= 35,1,

5、2,7,求x(0加一次累加数列x(1).k.解:根据 xtk)=N x,Im ),可得 x)= 3,8,9,11,18)m 1累加生成可以使本来没有什么规律的序列变成有明显规律的序列累减生成数列(IAGO )将原始数据列前后两个数据相减而得到的新的数据列设x(r衣户r次累加生成数列,若对 x(r k作累减生成,其基本关系式为A()Xr k 丫= x(r )k ,k =1,2,n ,.-:1 xr k LT xr k l-.-:0 xr k-1 1,.:2 Xr k L.-.1 Xr k 1-./ Xr k-i 1, r Xr kXr k 】Xr k-i 1式中,次)Xf *k M x(r k

6、)的0次累减生成,其余类推.由r次累加生成关系式计算, 可得累减生成数列关系式如下:x rd k =xr k -xr k-1 = 1 xr k 1,xr k =xr,k -xrk -1 = 2 xr k 1,x( k )= x(1 tk )- xOk -1 )=及)i(r tk )1例2求x2 )为灰色微分方 程.四、GM (1, 1)模型的建立GM(1,1)模型是最常用的一种灰色预测模型,它是由一个包含单变量的一阶微分方 程构成的模型.设有变量x(0)(k)之0的原始数据系列为x(0) =(x(0) (1),x(0) (2),|x(0)(n),x( 1k 墀 xjk )的 1-AGO 序列x

7、1)=(x(1H)xQ*2.,x(1tn ),z( k )是xO(k )午紧邻均值生成序列z(k)=(z(1),z(2),|z(k)Hlz(n),将数据代入灰色微分方程x(0) (k) + ax(1) (k) = b ,得到x0 2 az1 2 =bx( b )+az0 13 )= b x(0 *n )+az Xn )= b写成矩阵形式有 Y =日,其中-z(1)(2)-z(1)(3)2个,因此,方程组无解,但可用最小二乘法得到最小二乘解由此可得误差序列八E =Y -68 ,fa ST ra、设s = ete = y 6a y e i,目标是使s最小,可得I) k)a/T =(6T)ty ,卜

8、dx(1)称 +ax() =b为灰色微分方程的 白化方程(影子方程),其中a称为发展灰数,bdt称为内生控制灰数;白化方程的解x1 t = x1 0 -beb, a a称为周期响应函数.离散化得到x。1k +1 )= .x(1 %)b e-ak + b , k =0,1川 n -1 , a_ a称为GM(1,1)灰色微分方程的时间响应序列,其还原值为x( Ik +1 )=x0 Ik +1 )x(Qk )k =1,2,n .五、模型精度检验(1)残差检验设原始数据列和预测数据列分别为x(0) =(x(0) (1)x(0) (2川 Ix(0)(n), AAAAx0=(x0(1)x0(2)|x0(n

9、), Aa)定义残差为 式k) =x(0)(k)x(k);则残差序列为名=(s(1)s(2)|11s(n);b)称Ak = 孚)-为在k点的摸拟相对误差;称屋工 k为平均模型相对误差; x(0)(k)Xc)称1 -为平均相对精度;1 -Ak为k点的模拟精度;d)对于给定a ,若Ak a且Aca ,称模型为残差合格模型.(2)后验差检验设原始数据列和预测数据列分别为x(0) =(x(0) (1)x(0) (2)111 x(0)(n), AAAAx0 =(x(1)x(2)川 x0(n),1 n1 na)计算x(0)的均值 x = x(0)(k);x(0)方差s2= (x(0)(k)-x) ;-0)

10、的均n kwn kdnn_/古. _ 1 v .(0)(0)-* 2 _ 1(0)值 e 乙(k) , e 方差 S2 乙(e (k)8), n kdn kwb)记c =豆,对于给定的c0,若c co称模型为均方差合格模型;c)记p = p(ak) &) p0,称模型为小误 差概率合格模型.(3)关联度检验设原始数据列和预测数据列分别为x(0) =(x(0) (1)x(0) (2川|x(0)(n),AAAAx0 =(x(1)x(2)川 x0(n),a)计算绝对关联度1 + So + SoZ 二AA ,1 十 | S 十 So So Son-1 z (o)八 (o)小 _ 1 / (o) / (

11、o)小 ISo =必(x (k)-x )+ %(x (n)-x (1),k=22b)对于给定的 % ,若8的称模型为关联度合格模型表2.1.1模型检验等级参照表精度叠了出逆.受倬_相对误差:关联度;o均方差比值Co小概率误差po一级(好)Q.Q1o.9oo.35o.95二级(合格)Q.Q5o.8oo.5oo.8o三级(勉强)o.1oo.7oo.65o.7o四级(不合格)o.2oo.6oo.8oo.6o例3:某公司产值(单位:千万)20062007200820092334试预测第2。1。、2。11、2。12年该公司产值六、模型的推广定义2.1设序列x=(x(o)x(o)(2)|x(o)(n),将

12、x(tn四为时间轴的原点,则称 tn为过去,t=n为现在,t a n为将来.定义2.2设序列xo =(x(o) (1)x(o) (2)lllx(o)(n),A ox (k+1)=(1 ea k(o%1)%)*为其GM(1,1)时间响应式的累减还原值,则(1)当t En时,称x为x(o)模拟值;(2)当t A n时,称x0为x的预测值.建模的主要目的是预测,为提高预测精度,首先要保证有充分高的模拟精度,尤其是t = n时的模拟精度.因此,建模数据一般应取包括x(0 ny户内的一个等时距序列.定义2.3设原始数据序列x=(x() x(0)(2)|x(0)(n),1)用x =(x(0)(1)x(0)

13、 (2)111 x(0) (n)的全部数据建立的 GM(1,1)模型,称为全数据GM(1,1);2)用(xORNxeyk+DllixOs)建立的 GM(1,1)模型,称为部分数据 GM(1,1);3)将 x()(n+1)注入 x(0)中,用(x(0)(1)|x(0)(n+1)建立的 GM(1,1)模型,称为 新信息GM(1,1);4)置入最新信息x(0) (n +1),去掉最老信息x9*1),用(x(0) (2) |x(0) (n +1)建立的GM(1,1)模型称为新陈代谢 GM(1,1).注:a| *2是a的禁区;当a 2时灰色预测模型有意义,但是,随着a的不同取值,预测效果也不同.有如下结

14、论:1)若-a 0.3, 一步精度可达 98%,二步到五步可达 95%,(用作短,中,长期 预算);2)若0.3 -a E0.5 , 1步和2步精度90%以上,可用作短期预测;3)若0.5 -a 0.8 ,短期预测慎重考虑;4)若0.8 -a 0.定理2.2.2 (正则链的性质)正则链二三w, a(n)T w(nT8),w为稳态概率,满足wP = w.0.8 0.2例1已知转移矩阵P = |,求稳态概率 w._0.7 0.3定义2.2.1从状态i出发经n次转移第一次达到状态 j的概率,称为i到j的首达概率,记作fj (n).QO定义2.2.2称6 = nfj (n为由斗犬态i第一次到达状态j的

15、平均转移次数,特别 n 1地,L是状态i首次返回的平均转移次数.定理2.2.3对于正则链Nii = 17 .iiwi吸收链:存在吸收状态(一旦到达就不会离开的状态i, pii =1),且从任一非吸收状态出发经有限次转移能以正概率到达吸收状态(如情况二)吸收链的转移矩阵可以写成简单的标准形式,如有r个吸收状态的吸收链的转移概 率阵标准形式为p = |Ix 01:RQ-0.8例 2 将 p = 0.65 00.18 0.020.250.1写成标准形式0100定理2.2.4对于吸收链P的标准形式,(I -Q )可逆,且M = (I Q)=2 Qs .s ZZ0定义2.2.3称M =(I -Q)为吸收

16、链P的基矩阵,其中的元素表示从每一个非吸收状态到达另外每一个非吸收状态的平均轻移次数令y = Me , e =(1,1,1 T ,则yi表示从第i个非吸收状态出发,被某个吸收状 态吸收前的平均转移次数.设状态i是非吸收状态,j是吸收状态,那么首达概率fj(n)实际上是i经过n次cd转移被j吸收的概率,而 = nfj (n )则是从非吸收状态i出发终将被吸收状态j吸 n 1收的概率.定理2.2.5设吸收链的转移矩阵P已表示为标准形式,记F =MR.例3甲乙两队进行抢答竞赛.规则规定开始时甲乙各记 2分,抢答后,甲答对一题得一分,乙减一分,反之一样,还规定某队能首先得4分比赛结束,问(1)甲获胜的

17、概率;(2)从开始到结束平均转移次数;(3)甲得到1, 2, 3分的平均次数.解:设甲答对题的概率为 p,过程中甲得分可能为0, 1, 2, 3, 4记为甲的五种i0000 i0000、i -p0p000i000P =0i-p0p0,变形得P =i-p00p000i -p0p00i-p0p 000i-pi J 0p0i - p00、0 01 - p记R=0、00p ,0im =(i 则=p-i、0-p ip -ii i-2pq1 - pqq2q2、p pi p q i-pq因此,甲i, 2, 3分的平均次数为一,一,;y = Meii -2pq2i _ pq + p + pq +i + pp=

18、polyfit(handicap,Ave,1);下一步我们需要提取出MATLAB求得的系数,一般来说,MATLAB会以下面的方式产生多项式的系数:p x )= pxnp2xn,pnx2pxpn 1.现在我们产生一个函数绘出y=mx+b的直线.第一步我们需要建立x轴:x=6:0.1:24;我们可以创建绘制直线的函数了:m=p1;b=p2;y=m*x+b;我们也沿着直线把实际数据给画出来,它们将各自以独立的点显示出来.使用下面的命令,我们把这些数据用小圆圈给表示出来:subplot(2,1,2);plot(handicap,Ave,o,x,y),xlabel(差点),ylabel(平均成绩)图区次

19、 1,2.3. 1中产生的最小二乘法拟合线及数据的图象.结果如图所示.不过拟合并不完美,很多数据点分布在我们产生的直线较远的地方.让我们看看本例中由拟合直线对特定的差点所预计的成绩值的情况,这可以通过执行下面的命令计算做到:w=m*handicap+bw=Columns 1 through 63.8616 3.9399 4.0182 4.0965 4.1748 4.2532Columns 7 through 104.3315 4.4098 4.4881 4.5664回头看刚才的原始数据表格,我们看到这些数据还是相当接近的.由于这些数据是使用平滑直线y=mx+b产生的,因此 w中保存的数据通常称

20、为平滑数据.现在让我们了解一下拟合达到了什么程度.我们可以通过计算误差来评估拟合程度第一项可以用来了解拟合程度的是残差.假设我们要把函数 f(x总数集ti进行拟合,残差平方的总和计算公式是:NA = f(xi)-ti2 ,i 1现在用t表示数集的平均值.数集与平均值偏差的平方和计算公式是:N_S= Xi -t2 ,i 3那么r平方值就是:=1-2S如果r2 =1 ,那么函数将与数据完美拟合,因此r2越接近1拟合就越好.在MATLAB ,我们可以相当简单地实现这些公式.首先,我们计算这些数据的平均值,共有10个数据点,因此:N=10;MEAN=sum(Ave)/N MEAN=4.2140我们可以

21、使用 MATLAB的内置函数计算在数组中的数据的平均值: mean(Ave) ans=4.2140然后:S=sum(Ave-MEAN),2)S=0.7332现在我们计算 A,此时需要相关数据点的拟合值一一我们前面创建的数组w就是它了,因此:A=sum(w-Ave).A2) A=0.2274现在我们计算r2r2=1-A/S r2=0.68992结果r并不怎么接近1,因此并不是很完美的拟合,不过也不太差,因此与0相比它更接近1.二、讨论题1.下面的表格列出了一组房子的平方英尺数与其对应的平均售价.试用二次多项式拟合这些数据并评估它的拟合程度.12001500175020002250平均售价(千)$135$142$156$165$170

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论