组合预测在港口吞吐量预测中的研究.doc_第1页
组合预测在港口吞吐量预测中的研究.doc_第2页
组合预测在港口吞吐量预测中的研究.doc_第3页
组合预测在港口吞吐量预测中的研究.doc_第4页
组合预测在港口吞吐量预测中的研究.doc_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

组合预测在港口吞吐量预测中的研究摘要:结合现有的港口吞吐量预测方法,选取1994年2012年天津港口吞吐量为原始数据,将非线性回归、三次指数平滑、灰色GM(1,1)模型结合起来,采用最优权重系数法确定组合权重,对天津港口2013年2017年吞吐量进行了组合预测。关键词:三次指数平滑 非线性回归 灰色GM(1,1)模型 吞吐量0 引言港口吞吐量是港口最基本的生产指标,是衡量其发展的重要依据,是组织其生产、编制发展规划和进行建设的重要条件。同时,港口吞吐量的多少可反映港口所在城市及其腹地范围的经济状况和发展水平。吞吐量预测是港口发展战略研究的重要内容,其结果的正确性和合理性,对于科学的港口布局、基本设施投资规模、营运策略、发展战略以及与集疏运相关的综合运输的规划是十分重要的。1 组合问题预测的提出据不完全统计,目前已有预测方法近200种,各种预测方法在具有各自优点的同时,本身也存在一些无法避免的问题或缺陷,比如每种预测模型的建立往往需要依托一定的假设条件,模型的建立才能成立。一旦预测对象所处的环境发生变化,某些假设条件将不再成立,这样建立起来的预测模型的性能将变得很差,进而失去预测的意义。然而预测总是在不确定并且往往是不稳定的环境下进行的。通常采用两种方法来减少模型的不确定性,从而降低预测风险。第一种方法是通过从理论和实证两方面更深入地分析实际过程的特征,从而建立更准确反映实际演变模式的模型。然而对模型假设高度敏感的单个精巧的或复杂的模型面临模型设定错误的风险。第二种方法是承认构造真实模型的困难,通过考虑基于不同假设和信息来源的多个模型达到信息集成,从而降低不确定性的目的。由美国加利福尼亚大学Bates和Granger提出的组合预测思想和方法即是后一种途径的具体体现。正因如此,本文将以天津港口吞吐量为研究对象,拟采用的预测方法是通过将多种预测方法综合而成为一种的组合预测方法,该方法将基于不同假设和信息来源的多个预测模型进行信息集成,进而降低预测目标的不确定性,以此来提高预测的准确性。2 港口吞吐量预测方法与模型选择 本文选择时间序列法中的非线性回归和三次指数平滑法、灰色GM(1,1)模型,探讨其建模过程和检验方法,分析模型参数的选择,比较各种模型的适用范围,并采用组合预测技术来消除各单项模型中存在的随机误差。2.1 非线性回归预测非线性回归是一种常用的预测方法,是在寻求事物随时间变化规律的基础上,利用历史状况和现实数据,进而推测其未来发展状况。如若能找到一个合适的函数曲线,来反映预测对象因时间变化而呈现出的某种上升或下降的趋势时,则可以利用非线性回归。该方法对模型进行选取时,常用差分法计算及散点图的描绘,具有定量估计及揭示事物未来发展状况的特性。该方法要求至少拥有 5 年的原始数据,适用于中长期预测,常用的非线性回归有指数、龚珀兹等曲线模型,这里采用指数曲线模型。若时间序列在总体趋势上遵循某种指数曲线的增长规律时,可利用指数曲线模型。指数曲线预测的模型为:在两边取对数后,可得令,则有,即把指数曲线模型转化成直线模型,参数a,b利用最小二乘法估计可得: (2-1)2.2 三次指数平滑法指数平滑法是对反映变量历史变化情况的统计数据(时间序列),加以大致修匀平滑,以便分析变量的演变趋势,此法可处理不规则数据。指数平滑法有一次指数平滑法、二次指数平滑法和三次指数平滑法。指数平滑法的预测模型为: (2-2) 其中:X(t)是第t 期的实际值;Y(t)是第t 期的预测值; 是平滑系数。在Excel 中,阻尼系数为。设时间序列为X1, X2,X3,Xn;用表示指数平滑值,第t 期一次指数平滑值记为,二次指数平滑值记为 ,三次指数平滑值记为。则指数平滑值计算公式为: (2-3)对预测周期为T年、基年为第t年的指标预测值Yt + T ,其三次指数平滑法的数学模型为: (2-4)式中,均为平滑系数,计算公式为 (2-5)2.3 灰色GM(1,1)模型(1) 级比检验建立上海市水平综合评价时间序列如下: 求得求级比 由于所有的,故可以用作满意的GM(1,1)建模。 (2) GM(1,1)建模 1) 对原始数据作一次累加,得到 2) 构造数据矩阵及数据向量 3) 计算 4) 建立模型 计算出相应的时间序列函数。 5) 求生成数列值及模型还原值。3 天津港口吞吐量预测模型表3-1给出了1994年2012年天津港货物吞吐总量作为模型拟合和预测的基础数据。表3-1 1994年2012年天津港货物吞吐量年份1994 1995 1996 1997 1998 1999 2000 200120022003 货物吞吐量4652.0 5787.0 6188.3 6789.3 6818.4 7297.7 9566.3 11369.1 12906.4 16181.7 年份2004 2005 2006 2007 2008 2009 2010 2011 2012 货物吞吐量20619.0 24068.8 25760.0 30946.0 35593.2 38111.0 36946.0 45338.0 43744.0 3.1 非线性回归模型 图 3-1 港口吞吐量添加指数趋势性效果图 取1994-2012 年的原始数据,从上图3-1中可以看出,除各别年份外,原始数据总体上还是呈现出一定的指数关系,因而可以利用该模型进行预测,MATLAB计算结果如下:General model Exp1: f(x) = a*exp(b*x)Coefficients (with 95% confidence bounds): a = 7.413e-101 (-2.195e-99, 2.343e-99) b = 0.12 (0.1047, 0.1352)Goodness of fit: SSE: 1.362e+08 R-square: 0.9623 Adjusted R-square: 0.9601 RMSE: 2830利用公式(2-1)计算可得:得到的指数预测模型为:,拟合值如下:表3-2 非线性回归拟合值与真实值对比年份实际值拟合值偏差相对误差1994 4652.0 5878.1677881226.1677880.263578631995 5787.0 6627.615674840.6156740.1452593181996 6188.3 7472.6158061284.3158060.2075393571997 6789.3 8425.3507941636.0507940.2409748861998 6818.4 9499.5564942681.1564940.3932237031999 7297.7 10710.720043413.0200380.4676843442000 9566.3 12076.303122510.0031210.2623797212001 11369.1 13615.993752246.8937480.1976316292002 12906.4 15351.990082445.5900820.1894866182003 16181.7 17309.320481127.6204830.0696849212004 20619.0 19516.20435-1102.795652-0.0534844392005 24068.8 22004.45896-2064.341043-0.0857683412006 25760.0 24809.95819-950.0418057-0.0368805052007 30946.0 27973.14975-2972.850248-0.0960657352008 35593.2 31539.63827-4053.561726-0.1138858472009 38111.0 35560.84285-2550.157146-0.0669139392010 36946.0 40094.738363148.7383570.085225422011 45338.0 45206.69126-131.3087373-0.002896218MSE=2830由上表3-2可知,前面部分误差较大,后面越来越小,越接近拟合值,2006年以后的相对误差大多数都小于5%,MAPE为4.63%5%,说明真实值与预测值间的拟合状况较好,其预测值可以作为参考。2013-2014年的数据预测如下表3-3所示。表3-3 非线性回归的预测值年份20132014201520162017港口吞吐量57468.97 64796.08 73057.38 82371.96 92874.13 3.2 三次指数平滑法图 3-2 给出了天津港 1994-2012 年的吞吐量发展趋势曲线图。 依据图3-2,可以看出天津港的吞吐量发展趋势是曲线型的,因此采用三次指数平滑法,分为三个步骤:1. 确定初始值,取任意一个值进行计算拟合值、均方差、预测误差;2. 建立优化模型,求解最优化值;3. 运用最优化值进行三次指数平滑对未来五年的吞吐量进行预测。第一步:确定初始值,任取一个值计算拟合值、均方差、预测误差等参量取时,确定初始值,由于本例中数据20,故取时间序列中前3个数据的平均数作为初始值,即: 拟合吞吐量: 均方误差MSE: 计算过程如下表3-4所示:表3-4 三次指数平滑法参数计算年份货物吞吐量(万吨)St(1)St(2)St(3)拟合吞吐量1994 4652.0 5542.4 5542.4 5542.4 1995 5787.0 5008.2 5221.9 5350.1 4709.0 -673.1 -160.3 1996 6188.3 5475.5 5374.0 5364.4 5668.8 531.1 172.2 3875.6 1997 6789.3 5903.2 5691.5 5560.7 6195.7 650.9 151.6 6372.1 1998 6818.4 6434.8 6137.5 5906.8 6798.8 720.7 124.9 6998.1 1999 7297.7 6665.0 6454.0 6235.1 6868.1 283.9 -14.8 7644.4 2000 9566.3 7044.6 6808.4 6579.1 7287.8 383.0 13.0 7137.2 2001 11369.1 8557.6 7857.9 7346.4 9445.5 1825.7 352.8 7683.8 2002 12906.4 10244.5 9289.9 8512.5 11376.4 2163.1 332.3 11624.0 2003 16181.7 11841.6 10820.9 9897.6 12959.7 1932.5 182.5 13871.8 2004 20619.0 14445.7 12995.8 11756.5 16106.2 3043.6 394.9 15074.7 2005 24068.8 18149.7 16088.1 14355.5 20540.1 4449.1 616.7 19544.7 2006 25760.0 21701.1 19455.9 17415.7 24151.4 4213.5 384.4 25605.9 2007 30946.0 24136.5 22264.2 20324.8 25941.5 2531.2 -126.0 28749.4 2008 35593.2 28222.2 25839.0 23633.3 30782.9 4307.0 332.8 28346.6 2009 38111.0 32644.8 29922.5 27406.8 35573.8 4935.9 387.5 35422.7 2010 36946.0 35924.5 33523.7 31077.0 38279.4 3411.7 -86.1 40897.2 2011 45338.0 36537.4 35331.9 33629.9 37246.4 -239.9 -931.0 41605.0 2012 43744.0 41817.8 39223.4 36986.0 44769.0 5363.9 669.3 36075.6 均方误差MSE=3728.2 2012年预测误差第二步:求解最优化平滑系数选取19942011年的数据进行分析验证,考虑到要取得最合适的平滑系数,才能确保接下来的预测的准确性,从两个方面考察平滑系数的合理性(均方误差和预测误差),建立如下优化模型:目标函数: Min Z=约束条件 式中分别均方误差和预测误差的权重,MSE为19942011年的偏差的均方误差,反映了模型与实际的拟合程度;为2012年的预测误差,反映模型对未来预测的精准程度,分别选取。运用matlab进行编程求解,首先选取,大致确定可能的区域,计算结果如下表3-5所示:表3-5 值粗略估计范围0.10.20.30.40.50.60.70.80.9MSE7895.94353.23342.53165.73373.93728.24109.44454.34724.95511.153.41285.13602.25784.57668.4923610437.111226.7Z6465.01773.32108.13427.64820.36092.37185.48044.08626.0 由上表可知,的最佳值0.10.3之间,运用采用粒子群算法(PSO)来求解平滑系数的迭代次数和最优解如下图3-3所示。得到的最优化平滑系数:第三步:预测对未来五年天津港的吞吐量对预测周期为T年、基年为第t年的指标预测值Yt + T ,其三次指数平滑法的数学模型为: (3-1)将计算得到的参数带入式(3-1)中,选取2012年的数据往后预测5年,预测的值如下表3-6所示。表3-6 三次指数平滑预测未来五年天津港口的吞吐量年份20132014201520162017吞吐量预测值(万吨)48908.354230.660390.367387.675222.5最后,运用三次指数平滑,取得到的19942017年天津港的吞吐量,如下图3-4所示。图3-4 三次指数平滑法预测19942017年天津港的吞吐量3.2 灰色GM(1,1)模型根据前面对GM(1,1)模型的分析,结合天津港2000年至2012年货物总吞吐量的历史数据对天津港货物吞吐量进行建模。经过计算求得累加数据序列的预测模型为: (3-2)由模型得到的预测值与实际值的误差检验如下表3-7所示。表3-7 GM(1,1)模型检验表年份原始值模型值残差相对误差精度%20009566.3 9566.3 00100200111369.1 14946.0 -3576.9 -0.3168.54 200212906.4 16651.7 -3745.3 -0.2070.98 200316181.7 18552.2 -2370.5 -0.1585.35 200420619.0 20669.5 -50.5 -0.00299.76 200524068.8 23028.4 1040.4 0.043295.68 200625760.0 25656.6 103.4 0.00499.60 200730946.0 28584.7 2361.3 0.07692.37 200835593.2 31847.0 3746.2 0.10589.47 200938111.0 35481.6 2629.4 0.06993.10 201036946.0 39531.0 -2585.0 -0.07093.00 201145338.0 44042.6 1295.4 0.02897.14 201243744.0 49069.0 -5325.0 -0.1287.83 平均精度后验差比值小误差频率均方误差MSE=2728.4图3-5 GM(1,1)模型的预测值和原始值对比3.4 组合预测模型 本文采用“以组合预测误差平方和最小为优化准则的不变权重最优线性组合预测模型”,其形式为: 为吞吐量组合预测值;为第中单项预测模型获得的港口吞吐量预测值;为第中单项预测方法在组合预测模型中的权重,;为组合预测模型第年的拟合偏差,为第种单项预测方法第年的预测偏差,第种单项预测方法的预测误差向量为。 式中,;E 为预测误差矩阵。 根据组合预测误差平方和最小的优化准则,可以建立最优权重的数学模型:根据二次规划算法,可得组合预测模型的组合权重向量为。代入计算,得到组合预测模型吞吐量拟合效果见(图3-6),及组合预测的拟合结果见(表3-8)。图3-6 组合预测模型吞吐量拟合表 3-8 组合预测的误差分析年份实际值组合预测相对误差绝对值1994 4652.0 2816.79 0.069 1995 5787.0 3390.76 0.038 1996 6188.3 3593.85 0.006 1997 6789.3 3897.89 0.014 1998 6818.4 3912.83 0.072 1999 7297.7 4155.35 0.101 2000 9566.3 5302.36 0.007 2001 11369.1 6213.91 0.132 2002 12906.4 6991.25 0.132 2003 16181.7 8647.15 0.025 2004 20619.0 10890.44 0.091 2005 24068.8 12634.54 0.113 2006 25760.0 13489.68 0.050 2007 30946.0 16111.44 0.100 2008 35593.2 18460.83 0.124 2009 38111.0 19733.81 0.077 2010 36946.0 19145.14 0.073 2011 45338.0 23387.53 0.026 2012 43744.0 22581.99 0.104 平均误差0.065MSE7463.5 分析比较 为了方便比较,将以上四种预测模型的拟合误差项列于表 3-9。从表 3-9相对误差绝对值的均值和标准差可以看出,灰色GM(1,1)的拟合精度在单项模型中是最优的,这也体现其全局优化的优势。两种时间序列法(三次指数平滑和非线性回归)的拟合精度相差不多,后一段时刻的效果较好(10%),这可能是由于它们的原理都是基于吞吐量时间序列的趋势外推,而且拟合过程中都包含了“赋予时间越近的数据越高权重”的思想。组合预测模型的拟合误差在本文所采用的五种模型中最低,这体现了组合模型“融合各单项预测方法的思路和信息,减少随机性,提高预测精度”的优点。表 3-9 相对误差绝对值的均值和标准差年份非线性回归相对误差三次指数平滑相对误差灰色GM(1,1)相对误差组合模型相对误差吞吐量拟合值相对误差的绝对值1994 0.264 0.000 0.000 0.069 1995 0.145 0.000 0.000 0.038 1996 0.208 0.205 0.000 0.006 1997 0.241 0.208 0.000 0.014 1998 0.393 0.130 0.000 0.072 1999 0.468 0.089 0.000 0.101 2000 0.262 0.264 0.000 0.007 2001 0.198 0.336 0.315 0.132 2002 0.189 0.275 0.290 0.132 2003 0.070 0.287 0.146 0.025 2004 0.053 0.337 0.002 0.091 2005 0.086 0.297 0.043 0.113 200

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论