数学建模——世博会影响力——预测_第1页
数学建模——世博会影响力——预测_第2页
数学建模——世博会影响力——预测_第3页
数学建模——世博会影响力——预测_第4页
数学建模——世博会影响力——预测_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数学建模综合设计题目:2010年上海世博会影响力的定量评估学院(直属系): 数学与计算机学院 年级、 专业: 2010级信息与计算科学 姓 名:杨尚安 :刘 洋 :谭 笑 指 导 教 师: 詹亮 完 成 时 间: 2012年 3 月 20 日 摘要本文通过对2009年一月至2010年六月国际旅游入境上海的数据进行分析,研究了上海世博会对上海旅游业的影响。并得到了较为合理的预测结果。针对本问题,本文一共建立了三种不同的预测模型,分别对上海世博会对上海旅游业影响进行定量分析。第一种灰色预测模型。通过对2009年一月至2010年八月各月国际旅游入沪人数和国内旅游入沪人数进行分析,运用了灰色预测方法,

2、建立了灰色预测模型,利用mtalab软件求解模型,得到了较为合理的预测结果。第二种BP神经网络预测模型。首先将网络数据分为训练样本和测试样本,然后利用最大最小方法将2010年1月以前的训练样本数据作归一化处理,建立3-5-1BP神经网络模型,再利用matlab软件对建立的模型进行学习、测试数据的预测及误差分析。最后得到了在误差允许范围内的BP神经网络预测模型,并利用该模型对以后10个月的数据进行了合理的预测。第三种时间序列模型。首先利用2009年至2010年23个月的数据组成一个时间序列,在利用时间序列中的加权移动平均进行预测,并利用matlab建立模型,并得出预测数据和相对误差。关键词:灰色

3、预测 BP神经网络预测 时间序列一、问题重述2010年上海世博会是首次在中国举办的世界博览会。从1851年伦敦的“万国工业博览会”开始,世博会正日益成为各国人民交流历史文化、展示科技成果、体现合作精神、展望未来发展等的重要舞台。请你们选择感兴趣的某个侧面,建立数学模型,利用互联网数据,定量评估2010年上海世博会的影响力。二、模型假设本文收集的数据真实有效,具有代表性;假设在世博会期间没有突发重大灾难;假设所收集的上海出入境人数主要是由世博会影响的。三、符号说明 表示相对残差 表示原始数列 表示一阶累加生成得到新的数列 表示估计模型参数 input_train:输入的训练数据output_tr

4、ain:输出的训练数据input_test:输入的测试数据output_test:输出的测试数据:第t个月预测数据:第t个月的数据四、问题分析本文讨论的是上海世博会对上海旅游业的影响,而上海旅游业又是通过上海的总出入境人数的多少得以体现的。由于要对未来情况进行一个合理的预测,因此考虑使用第一种灰色预测方法,建立灰色预测模型,利用matlab软件,将2009年1月至2010年8的数据代入模型,经过残差分析,得出模型较为合理,可进一步预测2010年9月及以后的入沪人数,并与已查询到的相关数据进行比较,得出最优方案。由于要对未来出入境情况进行分析,因此使用第二种BP神经网络预测模型,将已有数据分为训

5、练数据和测试数据,利用训练数据及matlab软件得到newff函数。在利用测试数据得出相对误差。经误差分析合理后利用sim函数对以后数据进行合理的预测。由于要对未来出入境情况进行分析,因此使用第三种时间序列预测方法,由于世博会期间和世博会之前出入境情况从主观上看会有很大的差别,简单移动平均法只适合做近期预测,而且是预测目标的发展趋势变化不大的情况。如果目标的发展趋势存在其它的变化,采用简单移动平均法就会产生较大的预测偏差和滞后。因此在这里采用加权移动平均进行预测。预测的结果和实际值虽有偏差,但都在允许的误差范围内。五、模型建立与求解5.1数据分析由于本论文利用上海出入境人数进行预测分析世博会对

6、上海旅游业的影响,所得数据从2009年1月到2010年7月,首先利用matlab将这些数据绘制成图(如下图)(代码见附录1),在医用这些数据建立合理的模型进行以后几月的预测。由于本文属于海量数据类型文章,我们将采用列表法以及图像法法将有关数据合理的表示。 5.2模型建立与求解5.2.1灰色预测1.1灰色预测模型的建立设原始数列共有n个观察值,即= (原始数列数据)对作一阶累加生成得到新的数列,其元素的表达式为 即= (1阶(累加)生成数列)将上式按展开,可以得原始数列与生成数列的关系:对一阶生成数列,建立预测模型GM(1,1)形式的白化微分方程方程:令初始值,则其时间响应函数式的解为:为使模型

7、便于理解,将两个估计模型参数表示成向量形式,即 对上述展开的离散方程组,根据多元线性回归的参数估计方法,用最小二乘法求解,可得其中: (用原始数列构造)将求得代入预测模型中的方程中,并解微分方程,就可得到预测模型为: 从理论上说,该模型可以从初值x(0)(1)一直延伸到未来的任何一个时刻,不过对于本征性灰色系统,随着时间的推移,未来的一些扰动因数,将不断地相继计入系统造成影响,因此作为GM(1, 1)模型有预测意义的数据仅仅是数据以后的一两个数据,更远的数据不是预测数据而是规划性数据。其中 为了将不断地相继地进入系统的扰动因素考虑进去,故采用新陈代谢数列,即将每一个新得到的数据送入原x(0)数

8、列中,同时去掉一个最老的信息,以维持数据的个数。因此对上式作出修改:将初始值取为最新的一个数据,求出特解:从而可以求出预测公式: 1.2灰色预测模型的求解(代码见附录2)将2009年1月至2010年8月的国际旅游入沪人数代入,求出的值:即GM(1,1)预测模型为:1.3灰色预测模型的检验首先计算出,再对累减还原计算(原始数列模型计算值):然后计算相对残差:代入数据得到的取值范围为:灰色预测的效果较好,模型合理。故进而预测出2010年9月及以后的国际旅游入沪人数:(代码见附录3)2010.92010.102010.1175.998978.010780.0757将预测值与真实值进行对比,如图:5.

9、2.2 BP神经网络预测(全过程代码见附录4)2.1 BP神经网络预测模型的建立利用已有数据的测试数据,找出训练数据input_train,output_train以及预测数据input_test,output_test,再将利用最大最小法将数据做归一化处理,inputn,inputps=mapminmax(input_train);outputn,outputps=mapminmax(output_train);在利用matlab库函数newff进行训练。得到相信图像如下:2.2 BP神经网络预测模型的求解利用上述建立的模型将2010年4、5、6月的数据代入预测出第7月数据为74.45,在利

10、用5、6、7数据预测出第8月数据为74.75,如此得出以后几月结果如下图所示:2010.72010.8201092010.102010.112010.122011.12012.274.4574.7576.2979.9880.01848789.5479.632.3 BP神经网络预测模型的检验利用测试数据得到测试结果:其误差百分比情况如下:5.2.3时间序列预测模型3.1模型建立 移动平均公式中,每期数据在求平均时的作用是等同的。但是,每期数据所包含的信息量不一样,近期数据包含着更多关于未来情况的信息。因此,把各期数据等同看待是不尽合理的,应考虑各期数据的重要性,对近期数据给予较大的权重,这就是加

11、权移动平均法的基本思想。 设时间序列为加权移动平均公式为式中为t期加权移动平均数,为的权数,它体现了相应的在加权平均数中的重要性。利用加权移动平均数来做预测,其预测公式为 即以第t期加权移动平均数作为第t+1期的预测值。3.2模型求解取, ,按预测公式计算三个月加权平均预测值,其结果列于下表则2010年12月的预测值为这个预测值偏低,但是可以修正。其方法是:先计算各月预测值与实际值的相对误差,例如2009年4月为 将相对误差列于下中,再计算平均相对误差。由于总预测值的平均值比实际值低4.16%,则10年12月修正值为月份本月三月加权移动平均值相对误差20090141.4820090246.87

12、20090351.0620090454.9351.320.12492009054948.95330.067320090646.9350.9250.093520090754.2353.84330.097320090855.8954.06330.088820090952.7957.77670.0220091061.7361.460.124220091164.1756.59830.099620091249.8461.460.233120100154.156.59830.046220100247.9254.35830.134420100369.4350.30.275520100467.7659.705

13、0.118920100571.3765.010.089120100675.6669.84330.076920100774.9372.91330.026920100874.8574.580.003620100988.8675.01170.155820101092.1181.86830.111220101173.8588.150.19363.3模型分析 在加权移动平均法中,的选择,同样具有一定的经验性。一般的原则是:近期数据的权数打,远期数据的权数小。至于大到什么程度和小到什么程度,则需要按照预测者对序列的了解和分析来确定。5.2.4三种方法最优结果 根据三种模型的计算结果及计算过程的误差分析可得

14、2010年上海世博会对上海旅游业影响的最佳结果为:2010.72010.8201092010.102010.112010.122011.12012.274.4574.7575.0179.9880.01848789.5479.63 六、模型评价与推广6.1模型的优点通过收集收集09、10年入境上海的旅游人数等数据,通过三种预测模型(即色预测,BP神经网络,时间序列),对未来上海入境人数做了预测,三种模型通过合理的预测分析和误差分析,使预测结果具有说服力。6.2模型的缺点本模型在建立过程中由于只考虑了入境人数。且数据量比较少,因此预测结果会与真实值之间存在一定的差距。在忽略一些重大变动因素的情况下

15、得到的结果肯定会与现实不符。6.3模型的改进针对模型存在的问题,若将入境人数的数据量增大,并考虑09、10年上海GDP的变化情况,酒店入住率情况等,会使预测结果更加准确。6.4模型的推广通过建立灰色预测模型,对长期的,随机波动性较大的预测问题有很好的效果。BP神经网络预测作为目前应用最为广泛的神经学习算法,可以推广到预测各类信息,其强大之处可见一斑。时间序列中的加权移动平均法,可以推广到预测各类远期数据变化明显低于近期数据变化的问题。七、 参考文献1景振毅,张泽兵.MLATLAB7.0实用宝典.北京:中国铁道出版社,2008.2姜启源,谢金星.数学建模(第三版).北京:高等教育出版社,2003

16、.3林军,陈翰林.数学建模教程.北京,科学出版社,2011.4刘希强,王照明.灰色经济预测模型及其应用.济南,黄河出版社,1996.5佚名.GDP,CPI,A股上市公司数量,银行利率百度百科. 八、 附录附录1. x=1:20;y=41.48 46.87 51.06 54.93 49 46.93 54.23 55.89 52.79 61.73 64.17 49.84 54.1 47.92 69.43 67.76 71.37 75.66 74.93 74.85;plot(x,y)xlabel('时间(月)')ylabel('国际旅游入沪人数(万人次)')附录2.f

17、unction GM11(x)x=41.48,46.87,51.06,54.93,49,46.93,54.23,55.89,52.79,61.73,64.17,49.84,54.1,47.92,69.43,67.76,71.37,75.66,74.93,74.85;n=length(x);x0=x;for i=2:n x0(i)=x(i)+x0(i-1);endx1=x;for i=2:n x1(i)=0.5*x0(i)+0.5*x0(i-1);endy=ones(n-1,1);for i=2:n y(i-1)=x(i);endx2=y;for i=2:n x2(i-1)=x1(i);endX

18、=-x2 ones(n-1,1); A=Xy;a=A(1)b=A(2)x0_L=x;for i=2:nx0_L(i)=(x(1)-b/a)*exp(-a*(i-1)*(1-exp(a);endx0e=abs(x0_L-x);mx=mean(x);sx=0;for i=1:nsx=sx+(x(i)-mx)2;endsx=sx/n;me=mean(x0e);se=0;for i=1:nse=se+(x0e(i)-me)2;endse=se/n;c=se/sx;k=0;for i=1:n if abs(x0e(i)-me)<=0.6745*sx k=k+1; endendp=k/n; if n

19、argin=1 returnend附录3.function XY=GM1_1(X0) clc;X0=47.4092 48.6684 49.9609 51.2878 52.6499 54.0483 55.4837 56.9573 58.4700 60.0229 61.6170 63.2535 64.9334 66.6579 68.4283 70.2456 72.1113 74.0264 75.9925 78.0107;m,n = size(X0); X1 = cumsum(X0); YN = X0(2:n);for i=1:n-1 B(i) = -(X1(i)+X1(i+1)/2; endQ=o

20、nes(n-1,1); B = B;Q' B = B' A = inv(B'*B)*B'*YN' a = A(1);u = A(2);qi = X0(1)-u/a; for i=0:n X2(i+1) = qi*exp(-(a*i)+u/a; endfor i=1:n XY(i) = X2(i+1)-X2(i) ; endXY; XY0 = X2(1) XY;for i=n:-1:2 e(i) = X0(i)-XY0(i); o(i) = e(i)/X0(i); endsums = 0; for i=2:n sums = abs(o(i)+sums; e

21、ndp = 1-sums/(n-1); o; chancha = sort(o);function huiseyuce(x) clc; m,n = size(x); x; for i=1:250 i XY = GM1_1(x); x = x(2:n) XY(n); endx'附录4input_train=41.48 46.87 51.06;46.87 51.06 54.93;51.06 54.93 49;54.93 49 46.93;49 46.93 54.23;46.93 54.23 55.89;54.23 55.89 52.79;55.89 52.79 61.73;52.79 61

22、.73 64.17;61.73 64.17 49.84;64.17 49.84 54.1'input_train = Columns 1 through 8 41.4800 46.8700 51.0600 54.9300 49.0000 46.9300 54.2300 55.8900 46.8700 51.0600 54.9300 49.0000 46.9300 54.2300 55.8900 52.7900 51.0600 54.9300 49.0000 46.9300 54.2300 55.8900 52.7900 61.7300 Columns 9 through 11 52.7

23、900 61.7300 64.1700 61.7300 64.1700 49.8400 64.1700 49.8400 54.1000>> output_train=54.93;49;46.93;54.23;55.89;52.79;61.73;64.17;49.84;54.1;47.92' output_train = Columns 1 through 8 54.9300 49.0000 46.9300 54.2300 55.8900 52.7900 61.7300 64.1700 Columns 9 through 11 49.8400 54.1000 47.9200&

24、gt;> input_test=49.84 54.1 47.92;54.1 47.92 69.43;47.92 69.43 67.76;69.43 67.76 71.37'input_test = 49.8400 54.1000 47.9200 69.4300 54.1000 47.9200 69.4300 67.7600 47.9200 69.4300 67.7600 71.3700>> output_test=69.43;67.76;71.37;75.66'output_test = 69.4300 67.7600 71.3700 75.6600>&

25、gt; inputn,inputps=mapminmax(input_train);outputn,outputps=mapminmax(output_train);>> net=newff(inputn,outputn,5 5);>> net.trainParam.epochs=100;net.trainParam.lr=0.1;net.trainParam.goal=0.00004;>> net=train(net,inputn,outputn);>> inputn_test=mapminmax('apply',input_t

26、est,inputps);>> an=sim(net,inputn_test);>> BPoutput=mapminmax('reverse',an,outputps);>> figure(1)plot(BPoutput,':og')hold onplot(output_test,'-*');legend('预测输出','期望输出')title('BP网络预测输出','fontsize',12)ylabel('函数输出','fontsize',12)xlabel('样本','fontsize',12)>> error=BPoutput-output_test;>> figure(2)plot(error,'-*')title('BP网络预测误差','fontsize',12)ylabel('误差','fontsize',12)xlabel('样本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论