2010年数学建模B题—上海世博会影响力的定量评估_第1页
2010年数学建模B题—上海世博会影响力的定量评估_第2页
2010年数学建模B题—上海世博会影响力的定量评估_第3页
2010年数学建模B题—上海世博会影响力的定量评估_第4页
2010年数学建模B题—上海世博会影响力的定量评估_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2010年上海世博会影响力的定量评估摘要上海世博会的举办对中国乃至世界的快速发展都产生了深远的影响。本文着眼于上海世博会促进旅游业这一侧面,提出并解决三个重要的问题。一:上海世博会对上海入境人数的贡献旅游业发展具有趋势性、周期性、随机性,根据这一规律建立入境人数本底趋势模型,使用内插法处理过的2007年7月至2010年3月数据拟合出本底趋势线,进而求出2010年4、5、6、7月的本底值,与实际人数相比得到世博会对入境人数平均贡献率为22.41%。二:未来几个月上海入境人数走势利用第一问模型得出08-11月世博会给上海带来544815人的额外入境人数。三:世博会给上海带来的直接利益通过对已知的世博会入园人数进行分析,建立每天入园人数的时间序列分析模型,由于人员的变动性,故采用时间序列分解法求解。运用趋势外推法加权拟合出长期趋势直线,综合考虑影响参观人数的随机因素,预测出上海世博会最终入园人数为7010.82万人。门票总收入达103.88亿元。关键字:本底趋势线 内插法 定量评估 时间序列分析模型 趋势外推法一、问题重述题目背景:2010年上海世博会是首次在中国举办的世界博览会。从1851年伦敦的“万国工业博览会”开始,世博会正日益成为各国人民交流历史文化、展示科技成果、体现合作精神、展望未来发展等的重要舞台。请你们选择感兴趣的某个侧面,建立数学模型,利用互联网数据,定量评估2010年上海世博会的影响力。问题提出:上海世博会促进旅游业这一侧面,提出了三个重要的问题。问题一:上海世博会期间,上海的入境人数有什么变化,给出相应的数学模型,并计算世博会对入境人数的平均贡献率。问题二:未来几个月上海入境人数走势。问题三:从互联网获取每天入园参观人数,建立每天的参观人数的预测模型,并预测最终入园人数并估算世博会的门票总收入。二、符号约定时间t月入境人数入境人数发展动态趋势项入境人数发展动态周期项过境人数发展动态随机项内插公差值内插修正值内插起始点内插终止点内插起始点入境人数内插终止点入境人数循环指数季节指数入园参观人数随机值平均参观人数长期趋势离差平方和趋势值三、模型假设1、忽略国家政策、军事、节假日等方面对上海入境人数的影响。2、将世博会期间的天气情况影响限制在一定波动范围内。3、假设世博会每天不限制入园的人数。4、与往届世博会趋势相似,世博会结束前出现高峰期。5、忽略世博期间的交通以及住宿情况造成的影响。四、问题分析世博会给上海旅游业和经济造成了很深远的影响,我们应该认真的完成这一分析。任务一:数据的收集、分析与处理,采取筛选变量原则选取量纲,并量化。任务二:对入境人数建立本底趋势模型,拟合出本底趋势线。任务三:通过本底趋势模型进行推广,进而分析接下来几个月上海入境人数的变化趋势。任务四:对9月10日前(含)的世博会入园人数进行分析,建立时间序列分析模型,根据模型估测出最终入园人数以及世博会总收入。五、建模前准备为了后面建模与程序设计的方便,在建立此模型前,我们有必要做一些准备工作。 5.1 变量的确定:选择变量的原则。可供选择的变量很多,但从实际应用的角度出发,应当依据下列原则进行适当筛选。 (1) 可定量性。所选择的变量将用于本底趋势模型和时间序列分析模型的求解,必须有确定的定量数值方可通过计算得出定量的结论。(2) 权威性。数据的来源应当具备较强的权威性,其计算结果才能够具有说服力。 (3) 公开性。所选择的数据应当具有公开性,使建模中的结果更具有真实性。5.2 数据的收集与处理:根据对题目的理解,我们从世博会官方网站上收集到了每日世博会入园参观人数,从上海2008-2010年年鉴和上海市旅游局官方网站中,收集到上海每月的入境人数。建立旅游本底趋势线,需要对因突发事件所造成统计数据的异常变化进行订正统计数据的订正采用了直线内插法,具体方法是:(1)用原始统计数据作出长期变化的统计线;(2)根据目视观察从统计线上找出需进行订正的时间区段,并确定适合直线内插的起始点()和终止点();(3)用内插公式1订正异常区统计数据在该公式中,d为进行内插的公差值,其计算公式为:2根据图形确定内插区段、内插方程和内插修正值如表 1 所示。表 1 内插区间、内插方程、内插修订值序列名称内插区间公差值修正公式修正值080408050806080709070908入境人数08年0308年08-22950.6553110530160507210484260入境人数09年0609年0929844.3499190529030*客流量单位:人次入境人数处理前后如图 1所示图 1 内插前后入境人数对比六、模型的建立与求解模型一 入境人数本底趋势模型量化上海世博会对上海入境人数的影响力6.1.1入境人数本底趋势基本形式入境人数的发展趋势可预报的,而各年增长率的变化却是随机和不可预报的入境人数发展的本底趋势线可归结成统一方程3入境人数可分解为趋势项、周期项随机项三个项。其中,趋势项选用曲线方程4来反应,周期项选用三角函数5来反应,由于本模型的主要目的在于建立上海入境人数的本底趋势线方程,着重分析其趋势项和周期波动项,这里略去随机波动项。6.1.2计算机程序求解本底趋势方程根据以上分析本底趋势方程可表示为6于是根据附录5中的数据拟合出相应系数:(程序见附录1) 相关系数:入境人数本底趋势方程:7为了更直观理解上述本底趋势线提供了一个窗口,更为重将本底线与统计线相比较,定性的同时也定量的拟合结果。图 2 入境人数内插后趋势及本底趋势图本底线的预测功能,对旅游业的未来发展趋势提供一个直观的估计。所以代入年月份得到2010年3月到2010年7的本底值,根据公式8可以求出上海世博会的贡献率如下表:表 2 入境人数本底值、实际值及贡献率一览年月实际值(人)本底值(人)贡献率(%)10-0369437259851416.0110-046775866379226.2110-0571369961875715.3410-0675660056468733.9810-0774932753324740.52平均贡献率22.416.1.3 预测根据这一平均值我们可以大胆的假设在以后的几个月中基本满足22.41%率,于是若求出接下几个月的本底值可以确定其实际值表 3 预测10年的入境人数年月本底值预测值10-0855793368296510-0961436775204610-1064446578888910-11614358752035总计24311232975938从表中可以看出这四个月相当于世博会给上海带来了人的额外入境人数。模型二 时间序列分析模型预测世博会每日入园人数6.2.1时间序列分析模型的基本形式使用matlab软件画出世博会每日入园人数示意图如图3所示图 3 世博会每日入园人数图观察图形可知,参观人数与日期之间不存在明显的函数关系。同时我们发现,参观人数呈现一定的周期性,即每隔若干个星期,参观人数的变化出现相同的规律,即参观人数具有周期性。在剔除星期规律之后,从长期趋势来看,参观人数随时间的变化存在线性关系。根据对图标中数据的观察和资料的查询,于是用时间序列分析模型分析,发现参观人数呈现周期性变化(特别是在每星期的周六的人数相对最多)等,我们用时间序列分解法求解。时间序列因素包括长期趋势因素T,季节变动因素S,循环变动因素C,不规则变动因素I;我们用乘法模式进行求解:9其中,与有相同量纲,为季节指数,为循环指数,二者皆为比例数,为独立随机变量序列。由图像和数据发现,该观测值有明显的长期趋势与季节变动。由于季节周期变化,我们引入一个新的符号。作为参观人数的平均值,消除了季节因素所造成的影响。因为一周中周六的参观人数最大,因此我们定季节周期N=7,所以,求N=7的一次平均序列,10表示1-7期的这一周平均每天的参观人数,因为是连续7天的平均,所以中消除了季节因素。同理有:1112将,记作;由于随机影响总是围绕某一中间值上下波动,所以进过算数平均后,也可认为,随机性的因素也被消除了,而长期趋势和周期波动则仍存在于移动平均值序列的中。则可知可表示如下:13季节性指数也可以进行如下转化:14然而当原始序列不呈现水平模式,若以递增的形式模式时,移动平均值序列与原始序列会出现滞后现象,的值比的值要小,为了消除这种差距,需要移动的位置。将向前移动=3期,这样就消除了序列对序列长期趋势的偏离。将观察值除以移动平均数得到的比值只包含季节性和随机性。如果某个比值100%,意味着实际值比移动平均数要大。下面表格为季节性观察值部分数据以及居中平均值和季节性指数的结果:表 4 世博会期间每日居中平均值、季节性相关数据周号季节序号观察值()一次移动平均值M(N=7)剧中平均值()1120.69222313.17414.8615.2097.7658.8915.2458.33612.0214.1684.91714.7715.2014.60101.142120.9815.2415.06139.34214.414.1616.3688.02316.314.6017.7291.98418.0415.0619.0494.73518.0116.3620.8486.43621.5517.7222.2396.94724.0319.0424.28103.23 18152.7547.1940.41130.52239.7245.8826.83107.84327.0843.5233.0381.98420.0740.4129.5367.97518.1736.8327.2766.64622.6533.0325.7587.97726.2529.5325.17104.2819136.9327.2725.69143.74229.0825.7556.67109.04323.0525.1726.9985.40423.7125.6928.1284.33525.0156.67624.9026.99734.1328.12根据表4可以了解到包含季节性和随机性的相关数据,从而做出()随时间变化的图像。图 4 季节性随时间变化的图像将季节性指数根据星期排列出来,如表 5所示,即可看出星期性的规律。表 5 季节性指数按照星期的统计星期一二三四五六日197.7658.3384.91101.14139.3488.02291.9894.7386.4396.94103.23137.1892.81386.9892.1100.8899.43106.22112.4494.391792.7987.4691.64107.37116.69130.52107.841881.9867.9766.6487.97104.28143.74109.041985.484.33合计1737.37 1848.69 1643.54 1719.57 1823.79 2134.33 1727.47 季节指数(%)96.52 97.30 91.31 95.53 101.32 118.57 95.97 很明显,跟实际情况相符,周六人数相对较多,而平日里的入园人数相对较少。利用MA(7)得到的包含了长期趋势和循环变动两部分(TC)的数据图如图 5 所示:图 5 居中平均值随时间变化的图像在考虑到5月份的人数变动较大时,本着重今轻远的原则,我们采用加权拟合直线方程法来求解。对离差平方和进行加权,然后利用最小二乘法,使离差平方和达到最小,求出加权直线拟合方程。由近及远的离差平方和的权重分别为;其中,说明对最近数据赋权值为1,而后由近及远按比例递减。综合考虑直线拟合情况,在这里赋=0.97,设加权直线拟合方程为,则离差平方和:15对进行求导,令其等于0,并计算:1617用MATLAB编程解得:18即:19可以推测出其长期的趋势,如下图所示:图 6 参观人数长期趋势随时间的变化根据20可求得循环因子。如下图所示:图 7 循环指数C随时间变化的图像循环因子的值大于100的表明该季度参观人数高于所有季度的平均值,而小于100则相反。对于循环指数C拟合出随时间变化的图像,然后可以估算出每一天的循环指数C。用分解法确定了季节指数、趋势值和循环指数之后,就可以进行预测。现在,已知每一季度的季节指数S,循环因子C,由可得趋势值T,由21可以对后期的进行预测。由于随机性无法直接进行预测,在这里我们假设由于8月低到9月初上海市受台风等恶劣天气影响,直接影响到参观人数的多少。我们以9月1号的人数假设天气影响的随即因素程度以恢复性回升。另外,7、8月份为暑假期,学生参观人数较多,而到九月份后学生参观人数减少;由于节假日(国庆节等)、闭幕前时期的人流量会较多。在这,我们假设随机性I的值(假设各个随机性的值相互不影响),下表所示:表6 随机性I的规定随机性天气影响节假日影响假期影响闭幕前I(%)0.6-1.3从9月11日至10月31日世博会结束的每日入园参观人数见附录7。可知,世博会期间,全部入园参观人数达到7010.82万人次。这和官方公布的预计7200万人次的数据的相对误差仅2.63%,小于5%的误差,考虑到诸多随机性的影响,此次的预测还是比较精确可行的。然后根据所预测的数据,来预估上海世博会门票收入。由于世博期间指定日为17天,平日为167天,给每一种票的使用的人数附加权重,计算出上海世博会平均门票价格为148.1743元。于是,上海世博会仅在门票收入上就达到了22七、模型分析与优化7.1 模型分析缺点:模型一:由于忽略了节假日和活动对上海入境人数的影响,而实际上这些因素的影响也是很明显的,所以在拟合的时候很难达到误差极小的拟合。模型二:对于天气以及人为等的不确定因素采用综合随机估计、取平均等方法,使得数据某些特殊时间点的预测数据不太符合实际。平均门票受到诸多因素的影响,这里只考虑权重的附加做出来的平均门票价格是不够准确的。优点:模型一:与以往单纯的直线模拟 、灰色建模 、时间序列模拟 相比较,这种时域组合模式经济意义明确、包含时问序列的信息量丰富,更能精确地反应旅游业发展的动态变化规律。模型二:采用赋权拟合直线方程,(5月份刚开园,人员波动较大)较合理。在时间序列分析模型中采用时间序列分解法进行计算,使星期性因素和长期预测趋势分解开来,更好的拟合出已知人数,从而更好的预测未来的入院人数。的移动有效地避免的星期性因素所造成的误差,是模型更加准确。7.2 模型优化模型一:根据实际入境人数的变化趋势图我们发现实际上其周期项并非规格地服从23所以可以加入时间因素来影响周期变化,即:24这样就减小了模型在拟合中的误差。模型二:由于天气等不确定因素的影响,我们发现,某些特殊天气情况下的预测值与真实入园人数不符,天气的随机性指数只是按照大规模的天气变化确定。优化时可以将近两个月来的天气根据往年或者是天气网站上公布的天气情况进行比对,确定每天的随机性指数I,这样可以更加精准的预测每天的入园人数,减少不确定因素所造成的误差。八、参考文献1韩中庚,数学建模方法及其应用,北京:高等教育出版社,2009-6:21-232苟小东 孙根年,上海市入境旅游本底趋势线的建立及其应用,陕西师范大学学报,第28卷第2期,2000-63乔睿,世博影响下的上海入境旅游人数趋势预测,现代商贸工业,2010年第5期4戴光全 保继刚,昆明世博会效应的定量估算,地理科学,第27卷第3期,2007-65上海市旅游局(/)2010-9-106上海市年鉴2007-2010,上海市统计局(),2010-9-107上海世博会官方网站(/),2010-9-108谭赟,时间序列分析模型构建于MATLAB实现,科技资讯,2009年26期附录1:上海市入境人数本底趋势方程拟合程序clct=1:32;p=540696,551259,546671,651110,602067,517414,517640,528780,576064,553110,530160,507210,484260,461311,504473,627675,599271,419753,414747,468685,510617,549291,490005,469343,499190,529030,558876,617274,641675,498374,541019,479208;fun=inline(b(1)+b(2)*t.4+b(3)*t.3+b(4)*t.2+b(5)*t+b(6)*sin(b(7)*t+b(8),b,t);ba=608000,-3,30,100,3,570000,0.8,0.9; rj,resnorm=lsqcurvefit(fun,ba,t,rj)d=rj(1)+rj(2)*t.4+rj(3)*t.3+rj(4)*t.2+rj(5)*t+rj(6)*sin(rj(7)*t+rj(8);plot(t,p,t,d,g-)t=33:37;d=rj(1)+rj(2)*t.4+rj(3)*t.3+rj(4)*t.2+rj(5)*t+rj(6)*sin(rj(7)*t+rj(8)程序调试结果rj = 1.0e+005 * Columns 1 through 5 5.91962492860043 -0.00000578476073 0.00041491109041 -0.00653715005402 -0.03342567997756 Columns 6 through

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论