指数平滑模型和回归分析预测在铁路客运量预测中的运用和比较_第1页
指数平滑模型和回归分析预测在铁路客运量预测中的运用和比较_第2页
指数平滑模型和回归分析预测在铁路客运量预测中的运用和比较_第3页
指数平滑模型和回归分析预测在铁路客运量预测中的运用和比较_第4页
指数平滑模型和回归分析预测在铁路客运量预测中的运用和比较_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 指数平滑模型和回归分析预测在铁路客运量预测中的运用与比较 作业 指数平滑模型和回归分析预测在铁路客运量预测中的运用与比较 姓 名: 学 号: 班 序 号: 专 业: 指导教师: 年 月目录1.铁路客运量预测概述································&#

2、183;··························21.1 客运量预测的概念·····················&

3、#183;·································21.2 预测的思路步骤··············&

4、#183;··········································21.3 影响铁路客运量的因素····

5、3;··············································22.指数平滑模型在铁路客运量预测中应用&#

6、183;··········································32.1 指数平滑模型介绍·····&

7、#183;·················································3

8、2.2 三次指数平滑模型的应用实例·············································42.3 指数平滑模型结果

9、分析·················································

10、3;·53.回归分析模型在铁路客运量预测中的应用·········································63.1 回归分析模型介绍··

11、··················································

12、···63.2 回归分析预测的应用实例············································&#

13、183;····63.3 回归分析预测结果分析···········································

14、;·······104.指数平滑模型和回归分析预测在铁路客运量预测中的比较··························115.结论与建议··········

15、83;·················································

16、83;·····11附录一 三次指数平滑模型应用在铁路客运量预测中的MATLAB代码以及运行结果·····12附录二 回归分析模型导出结果数据······························

17、;················13附录三 部分中国统计年鉴2013 ······························

18、3;················· 15参考文献·······························

19、83;·····································16指数平滑模型和回归分析预测在铁路客运量预测中的运用与比较1.铁路客运量预测概述 1.1 客运量预测的概念 客运量又称客运运输量,是指在一定的运输供

20、给条件下所能实现的人的空间位移总量,是运输需求与供给、运输需求与运输服务水平相互作用的反映,是在一定运输能力下所实际完成的运输需求量。客运量的预测主要内容包括各种运输方式的总客运量和旅客总周转量等3。客运量是评价运输组织效果的指标,是衡量旅客运输生产劳动量的尺度,是统计期内运送的旅客数量,其实质体现了运输部门的绝对成果和运输组织方式满足社会客运需要程度的大小4。对未来若干年的客运量及其发展趋势进行预测,可以有效地计划和组织旅客运输,为客运系统的规划布局提供依据,以达到促进旅客运输的经济效益和社会效益,满足国民经济快速增长和人民生活水平日益提高需要的目的,对于客运的管理和决策具有重要的意义。1.

21、2 预测的思路步骤进行客运量预测,必须根据社会经济的发展和综合交通系统的特点采用科学的方法进行预测,以保证预测的精度,客运量预测工作一般应遵循以下步骤:5(1)确定预测目标;(2)分析影响客运量的主要因素;(3)收集所需资料;(4)选择预测方法!建立预测模型;(5)误差分析;(6)采用定性与定量分析相结合的方法确定最终预测结果。1.3 影响铁路客运量的因素综合分析影响客运量的因素,是进行预测工作的前提,对建立有效的数学模型,提高预测的精度具有重要的理论意义和实用价值。交通系统是社会经济大系统下的一个子系统,运输量是在一定运输装备条件下,社会经济发展对交通运输需求的集中体现,直接受规划区域社会经

22、济发展的影响。社会经济的发展是影响客运量的直接因素,一般来说,客运量的增长受经济发展水平、运价水平、服务质量、国家经济体制、居民消费水平、人口及城市化程度等因素的影响。另一方面,综合交通系统又是一个由多种交通方式构成的复杂大系统,系统内的各种交通方式相互制约和促进,任一交通方式的客运量又受到其他交通方式发展的影响。在综合交通系统中,客运量主要受以下因素影响:5(1)区域社会经济发展及经济结构6;(2)区域人口数量与结构4;(3)人均收入与消费水平;(4)宏观经济政策;(5)路网规模与服务水平;(6)综合交通系统的影响;(7)突发事件的影响。2.指数平滑模型在铁路客运量预测中应用运量预测在铁道工

23、程建设中处于十分重要的地位,是铁路项目立项的依据,设计工作的起点,建设规模和运营经济评价的基础,项目风险评价的关键要素。铁路客运量是一组按时间顺序排列的数据序列,即时间序列。而指数平滑是一种重要的时间序列预测法,它可以消除时间序列的偶然性变动,提高近期数据在预测中的重要程度。2.1 指数平滑模型介绍指数平滑预测法是在移动平均预测法的基础上发展起来的,常采用一次指数平滑预测、二次指数平滑预测以及三次指数平滑预测。下面简要介绍指数平滑计算思路:第t期一次、二次、三次指数平滑值分别用(1)、(2)、(3)求得,式中是第t期指标实际值,是平滑系数()。 (1) (2) (3) 一次指数平滑法适用于历史

24、资料数据显示较为平稳的数据的时间预测,其基本思想是以第t期的一次指数平滑值作为第t+1期的预测值。一次指数平滑模型为第t+1期的预测值等于第t期一次指数平滑值,即: (4)二次指数平滑模型是把一次指数平滑值作为原始数据,再进行一次指数平滑,并利用一次指数平滑值及二次指数平滑值建立预测数学模型。它可降低当时间序列呈一定直线上升或下降趋势时,一次指数平滑值具有的滞后误差。其模型方程为: (5)其中, 为第t期之后第N期的预测值。三次指数平滑模型则是在时间序列具有曲线变化趋势时,通过高次平滑处理,降低预测误差所采用的预测模型。它是在二次平滑的基础上,在进行一次指数平滑处理,并建立二次多项形式的数学模

25、型。故本文对铁路客运量预测采用三次指数平滑预测模型。其模型方程为: (6)其中,。2.2 三次指数平滑模型的应用实例下面以1996-2009年间的铁路客运量为建模样本,2010-2012年的铁路客运量数据为预测样本。表1 1996-2009年我国铁路客运量(万人)年份1996199719981999200020012002客运量947979330895085100164105073105155105606年份2003200420052006200720082009客运量97260111764115583125656135670146193152451应用三次指数平滑法进行预测时,须先估算初始值

26、。由于本次收集的铁路客运量资料是从1996年开始的,从表1看出1996年到1999年的铁路路客运量波动较大,故不能忽略初始平滑值对预测值的影响,所以取前1996-1998年间3个数据的平均值作为一次指数平滑的初始值,即:应用指数平滑法进行趋势预测时,还需要合理确定平滑系数的值。值较大,意味着下期指数平滑值较多的依赖于下期实际值(或者下期前次指数平滑值);较小,则下期指数平滑值较多的依赖本期本次的指数平滑值,而本期本次平滑值又取决于上期又与上上期有关,故较小意味着本期以前的数据起较大的作用。下面采用MATLAB编写程序,通过计算不同所对应的样本均方标准误差见表2,取均方标准误差最小所对应的为0.

27、5。平滑数据见表3,预测结果见表4,并以建立三次指数平滑预测模型为:表2 不同对应的样本均方标准误差0.100.200.300.400.500.600.700.800.90RMSE129891100010261994897719893111321437018647表3 三次指数平滑数据年份199694400944009146000019979385094120942609344061268.047119989447094300942809479055777.04171999973209581095040995703375372.968820001011909850096770104850510

28、7482.54172001103170100840988001058203097152.02862002104390102610100710106040145564.17972003100830101720101210985304393699.785820041062901040101026101094704515445.584620051109401074701050401154406053517.381320061183001128901089601252009139745.2853200712698011993011445013560010959781.90252008136590128

29、26012136014634011879710.375020091445201363901288701532609658305.7338表4 预测结果预测年份201020112012预测值(万人)153590164160165670实际值(万人)167609186226189337相对误差(%)9.1212.9314.292.3 指数平滑模型结果分析 从预测结果来看,预测有些保守,而且相对误差逐渐增大,不满足工程预测误差标准(10%),故该模型用于铁路客运量预测中是有待改进的。将1996-2012年的铁路客运量的实际值与预测值通过MATLAB绘制在如下图中:图1 1996-2012年铁路客运量

30、的实际值与预测值的比较 从如上所示的图中,我们不难发现,从总的趋势来看,预测值始终小于实际值,除了2003年的非典事件对交通运输业造成一定影响。而且从2010年开始,铁路客运量增长趋势逐渐增大,这是指数平滑模型所无法预测到的。这种方法的主要优点是需要数据少简便,只要所研究的运量时间序列的趋势没有大的波动,预测效果较好。但是它无法反映出运量变化的原因,对于影响于影响运量变化的外部因素变化,如调整经济政策和发展速度而引起的运输需求的变动无法反映,因而就产生了本实例中2011年和2012年的误差较大的预测值。故在做计划或决策时,有必要进行一些定性分析,使预测结果能更加切合实际。3.回归分析模型在铁路

31、客运量预测中的应用 在交通领域,运量预测已成为一项专题研究、评审的课题。常用客运量预测法有时间序列法和影响因素法。时间序列法无法反映出运量变化的原因,而影响因素法通过细致地分析其最主要的影响因素,设法将其用量化指标反映出来。通过对过去和现在的指标数据进行分析研究,可以找出运输需求与相关经济量的关系,回归预测就是典型代表。 3.1 回归分析模型介绍 回归分析预测模型的基本思想是根据相关性原则找出影响客运量的各影响因素,用数学的方法找出这些因素与客运量之间的函数关系的近似表达,并利用样本数据估计模型参数及进行误差检验。 回归分析模型根据影响因素的多少可分为一元回归预测模型、二元回归预测模型和多元回

32、归预测模型。按影响因素与因变量之间的关系可分为线性回归预测模型和非线性回归预测模型。 回归分析预测模型通过系统的相关分析了解综合交通系统内各要素之间相互依存的紧密程度,揭示了客运量与其主要影响因素之间的定量关系,只要明确影响因素(自变量)的值就能通过模型直接得到客运量(因变量)的值。因此,回归分析预测方法可对交通运输系统的结构进行描述和分析,使决策者能从模型中了解影响客运量的主要原因,从而为科学的决策提供全面的依据。 3.2 回归分析预测的应用实例铁路运输涉及诸多因素,预测要科学分析这些因素。本文在参考其他文献的基础上国民生产总值(亿人)、全国人口数量(万人)、农村居民消费水平(元)、公路客运

33、量(万人)、民航客运量(万人)、旅游人数(百万人次)、铁路客运周转量(亿人公里)、铁路通车里程(万人)为主要影响因素。下表为我国1996-2009年间的相关数据:从附录三的表格看出我国铁路客运量从1996年后基本处于上升趋势(除了2003年受非典冲击外)。为使预测更能有效反应客运量历史走向对未来趋势的影响,这使得客运量随时间的发展趋势不明朗,所以以用差值法对其矫正为111510万人。然后再对校正后的1996-2009年间数据建模预测。用SPSS软件分别计算八项主要因素与铁路客运量的相关系数和偏相关系数见下表5:表5 铁路客运量与八项主要因素的相关分析国内生产总值全国人口数农村居民消费水平民航客

34、运量公路客运量旅游人数铁路旅客周转量铁路通车里程铁路客运量相关系数0.9830.9140.9900.9770.9820.9830.9740.964显著水平0.0000.0000.0000.0000.0000.0000.0000.000从这个结果可以看出,这八项因素都与铁路客运量密切相关,但是我们不能把这八个变量全部用上,这样不仅使用不便,而且可能会影响预测精度。因而下面如何选择适当的变量将是至关重要的。在最优的方程中,所有变量对因变量的影响都应该是显著的,而所有对因变量影响不显著的变量都不包含在方程中。选择方法主要有:逐步筛选法(STEPWISE)、向前引入法(FORWARD)、向后剔除法(B

35、ACKWARD)等。下面将采用逐步回归法,其基本思路和步骤如下图: 图2 逐步回归分析法的基本思路和步骤 具体步骤如下:(1) 初步分析。按照“图形旧对话框散点/点状”顺序展开对话框;然后将“铁路客运量”选入Y轴,将其与变量逐个选入X轴:绘出散点图,观察时候适宜用线性方程来拟合。图3 首先初步分析,绘制散点图图4 简单散点图中因变量与自变量设置 图5 铁路客运量与国内生产总值散点图(2) 回归模型的建立。按“分析回归线性(Linear)”顺序展开对话框;将“铁路客运量”选入因变量框(Dependent),然后将其与变量选入自变量框(Independent)中;方法框中选“逐步(Stepwise

36、)”作为分析方式;单击“统计量(Statistics)”按钮,进行需要的选择,单击“确定”按钮执行。 图6 线性回归模型因变量与自变量设置(3) 得到结果。如下表所示。 表6 解释变量筛选的过程 表7 回归模型拟合优度评价输入移去的变量a模型输入的变量移去的变量方法1国内生产总值.步进(准则: F-to-enter 的概率 <= .050,F-to-remove 的概率 >= .100)。a. 因变量: 铁路客运量模型汇总b模型RR 方调整 R 方标准 估计的误差1.993a.986.9852339.210a. 预测变量: (常量), 国内生产总值。b. 因变量: 铁路客运量由表6

37、可以得出自变量为国内生产总值,其余自变量全部剔除。由表7中复相关系数R=0.993,说明该预测模型高度显著,可用于铁路客运量的短期预测。表8 回归系数估计及其显著性检验系数a模型非标准化系数标准系数B标准 误差试用版tSig.1(常量)80012.5851328.11860.245.000国内生产总值.210.007.99329.128.000a. 因变量: 铁路客运量 得到回归方程为:,其中,x为当年份的国内生产总值,y为同年份铁路客运量。据此模型的预测结果见表9。表9 回归分析模型对2010-2012年铁路客运量的预测结果年份201020112012预测值164330.273179364.

38、425188990绝对误差(万人)-3278.727-6861.575-346.574相对误差(%)-1.995-3.825-0.1833.3 回归分析预测结果分析表10 回归分析模型对1996-2009年铁路客运量的预测结果年份1996199719981999200020012002预测值94959.67196596.91597737.06898844.776100847.651103040.177105282.452绝对误差162.6713288.9152652.068-1319.224-4225.349-2114.823-323.548相对误差0.1713.4042.713-1.334-

39、4.189-2.052-0.307年份2003200420052006200720082009预测值108535.373113587.028118849.439125438.609135832.748145962.119151602.173绝对误差-1823.0283266.439-217.391162.748-230.881-848.827相对误差-1.6052.748-0.1730.119-0.158-0.559从表9和表10的预测结果来看,经过预测结果的检验与分析,证明回归预测是一种可行的铁路客运量预测方法。这类预测方法在数据量足够多的情况下,常可获得较好的精度,并提供运量变化原因方面的

40、信息。其缺点是外在变量的选择,本身就带有预测性,影响预测的准确程度。故在做计划或决策时,可和其他预测方法结合形成组合预测,提高预测精度。4.指数平滑模型和回归分析预测在铁路客运量预测中的比较基于指数平滑模型和回归分析模型对2010-2012年间铁路客运量的预测中的汇总结果如下表。表11 两种模型对2010-2012年预测结果汇总年份201020112012三次指数平滑模型预测值(万人)153590164160165670绝对误差(万人)-14019-22066-23667相对误差(%)-9.12-12.93-14.29回归分析预测模型预测值(万人)164330.273179364.425188

41、990绝对误差(万人)-3278.727-6861.575-346.574相对误差(%)-1.995-3.825-0.183 从对不同的预测模型的预测结果和检验比较可以看出: (1)在客运量预测中,指数平滑预测法通过指数进行加权平均,对未来趋势进行预测。这种方法的优点是克服了移动平均法需要数据存储大的缺点,保持了移动平均法的优点,它只需要最近一期的投资需求预测数实际值可预测下一期的数值。因此比较适用于短期预测。而且,只考虑时间对客运量的影响,在某些情况下不能反映实际情况。忽略了铁路客运量的预测是众多因素“合力”的作用,同时,这些因素又处在不断的变化过程当中。首先,国家宏观政策的作用,国家做出对

42、铁路部门的政策性倾斜和支持,将吸引更多旅客选择铁路出行。其次,重大事件的影响。如2003年突发非典及2008年年初的冰雪灾害天气,都对铁路客运量产生了重大影响。举世瞩目的2008年北京奥运会和2010年哈尔滨冬奥会,将吸引世界各地的大量客流,铁路作为五大运输方式中的主要方式,其客运量必然增加。最后,新增基础设施的影响,以及我国交通建设发展速度较快,使得铁路客运量大幅增加。 (2)回归分析预测法充分考虑了影响客运量的众多因素,预测结果也更为可靠。对历史数据要求高,回归预测模型的建立需要大量的数据样本且样本要求有较好的分布规律,但在客运量预测中,常常由于没有足够数量且准确的历史数据样本,影响了模型

43、的建立,降低了预测的精度。5.结论及建议客运量是在一定运输装备条件下社会经济发展对交通客运需求的一个客观反映量,科学准确的进行预测是运营管理部门正确决策的前提和依据,也是进行交通规划的关键内容之一。在预测中,预测方法的选取与运用是预测成功的关键,但目前在客运量的预测工作中,存在预测精度不高!预测结果不理想等问题。近年来,随着我国社会经济的不断发展,综合交通系统不断完善,为更加科学地探寻客货运输的发展变化规律,迫切需要在客运量的预测中引入新的预测理论与方法,将大大提高预测结果的精度。本文主要结论如下: (1)对三次指数平滑预测模型和回归分析预测模型以及优缺点,通过具体的实例进行了完整的分析和论述

44、,并针对在客运量预测工作中,探讨了影响客运量的因素的因素是多方面的和预测思路。(2)如果预测对象的历史数据比较平稳,并且预测对象的相关影响因素变化不大,无大的波动,那么可以考虑应用时间序列分析法来进行预测;如果预测对象的某个影响因素出现大的变化,那么必须采用基于影响因素的预测方法,如多元回归分析法。在实际预测运用中,可以比较不同方法优点,使得预测能更准确地把握未来发展趋势,使预测结果更接近客观现实,从而做出实事求是的预测结论。附录一 三次指数平滑模型应用在铁路客运量预测中的MATLAB代码以及运行结果 三次指数平滑模型的MATLAB代码:%三次指数平滑,线性趋势预测模型.%输入时间序列x,平滑

45、系数初值L0,步长L1,终值L2.%输入判断误差是否为随机误差时必须计算的自相关系数个数m,显著性水平alpha.function ESM3=funesm3(x,L0,L1,L2,m,alpha)T=input('T=')s1=zeros(round(L2-L0)/L1),length(x);s2=zeros(round(L2-L0)/L1),length(x);s3=zeros(round(L2-L0)/L1),length(x)a3=zeros(round(L2-L0)/L1),length(x);b3=zeros(round(L2-L0)/L1),length(x);c3

46、=zeros(round(L2-L0)/L1),length(x);y=zeros(round(L2-L0)/L1),length(x)+T);e3=zeros(round(L2-L0)/L1),length(x);MAD3=zeros(1,round(L2-L0)/L1);k=0;for a=L0:L1:L2 k=k+1; s1(k,1)=mean(x(1:3); s2(k,1)=s1(k,1); s3(k,1)=s1(k,1); for i=2:length(x) s1(k,i)=a*x(i)+(1-a)*s1(k,i-1); s2(k,i)=a*s1(k,i)+(1-a)*s2(k,i-

47、1); s3(k,i)=a*s2(k,i)+(1-a)*s3(k,i-1); a3(k,i)=3*s1(k,i)-3*s2(k,i)+s3(k,i); b3(k,i)=0.5*a/(1-a)2*(6-5*a)*s1(k,i)-2*(5-4*a)*s2(k,i)+(4-3*a)*s3(k,i); c3(k,i)=0.5*a2/(1-a)2*(s1(k,i)-2*s2(k,i)+s3(k,i); y(k,i+T)=a3(k,i)+b3(k,i)+c3(k,i)*T2; if i+T<=length(x) e3(k,i+T)=x(i+T)-y(k,i+T); end end 's1:&

48、#39;,s1(k,:),'s2:',s2(k,:),'s3',s3(k,:), 'a3:',a3(k,:),'b3:',b3(k,:),'c3:',c3(k,:),'y:',y(k,:),'e3:',e3(k,:), funcoef(e3(k,:),m,alpha); MAD3(k)=mean(abs(e3(k,:);endMAD3;MAD3,k=min(MAD3);a=L0+L1*(k-1),y(k,length(x)+T)end运行结果:附录二 回归分析模型导出结果数据描述性统

49、计量均值标准 偏差N铁路客运量114143.9319030.83814国内生产总值162224.49389819.622714全国人口数128513.213497.22214农村居民消费水平2441.07841.19414民航客运量11245.005916.58514公路客运量1659791.21521874.15014旅游人数1064.71431.17914铁路旅客周转量5369.24291533.7393914铁路通车里程7.2750.5996414相关性铁路通车里程Pearson 相关性铁路客运量.964国内生产总值.964全国人口数.961农村居民消费水平.956民航客运量.972公路客运量.942旅游人数.965铁路旅客周转量.971铁路通车里程1.000Sig. (单侧)铁路客运量.000国内生产总值.000全国人口数.000农村居民消费水平.000民航客运量.000公路客运量.000旅游人数.000铁路旅客周转量.000铁路通车里程.N铁路客运量14国内生产总值14全国人口数14农村居民消费水平14民航客运量14公路客运量14旅游人数14铁路旅客周转量14铁路通车里程14Anovab模型平方和df均方FSig.1回归4.643E914.643E9848.440.000a残差6.566E7125471905.428总计4.708E913a. 预测变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论