基于聚类的港口吞吐量预测方法及其适用性分析.doc_第1页
基于聚类的港口吞吐量预测方法及其适用性分析.doc_第2页
基于聚类的港口吞吐量预测方法及其适用性分析.doc_第3页
基于聚类的港口吞吐量预测方法及其适用性分析.doc_第4页
基于聚类的港口吞吐量预测方法及其适用性分析.doc_第5页
免费预览已结束,剩余14页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于聚类的港口吞吐量预测方法及其适用性分析第32卷第3期2011年6月水道港口JournalofWaterwayandHarborVol_32No.3Jun.2011基于聚类的港口吞吐量预测方法及其适用性分析秦芳,周鹏飞,魏晓晓,樊义忠z(1.大连理Z-大学土木水利学院,大连l16024;2.重庆公用工程建设监理公司,重庆400020)摘要:在统计分析历史数据的基础上,选取港口吞吐量,GDP值等指标,采用SPSS统计分析软件中的层次聚类分析法,将我国具有代表性的港口按照吞吐量增长规律分成平稳增长型,加速增长型和波动增长型3类.然后选择时间序列法,回归分析法,灰色模型理论和神经网络模型法,对不同类型的港口吞吐量预测的适用性进行了理论分析.最后以上海港和镇江港为实例进行计算,并对不同预测方法的适用性进行了验证.关键词:港口吞吐量;聚类分析;预测模型中图分类号:U652.1+4;0411_3文献标识码:A文章编号:10058443(2011)03022306国内港口的基础设施,服务水平,口岸环境,腹地经济发展水平等条件参差不齐,可以采用聚类分析方法对若干具有代表性的港口进行分类.预测的方法有很多,但不是每一种方法都适合所有的港口.本文在对港口进行聚类分析的基础上,寻找到一种相对更符合不同类型港口吞吐量的预测方法,为港口的预测工作提供意见参考.l港口规模聚类指标与代表性港口的选择1.1聚类指标的选择影响港口规模的因素很多,主要有自然地理条件,经济环境,政策环境,经营管理能力,服务水平,信息化水平以及创新能力等,港口与城市之间的经济联系密不可分.为了达到较好的聚类效果,本文选取能体现港口规模的显性因素,并且相应地选取部分城市指标.其中,港口指标为:货物吞吐量,外贸量,内贸量,集装箱吞吐量;城市指标有:GDP值,第一产业产值,第二产业产值,第三产业产值,进出口总额,人口,面积,综合竞争力.1.2代表性港口的选择我国沿海港口主要集中在5大港口群:长三角港口群,珠三角港口群,渤海湾港口群,东南沿海港口群和西南沿海港口群.为了更全面的统计我国港规模发展规律,分别从每个港口群选择典型港口进行分析.本文从长三角港口群选择上海港,宁波港,南京港,连云港港,南通港,镇江港;珠三角港口群选择深圳港,广州港,汕头港;渤海湾港口群选择大连港,天津港,青岛港,营口港,秦皇岛港,日照港;东南沿海港口群选择福州港;西南沿海港口群选择海口港.另外,在长江流域的内河港中,选择武汉港,重庆港,九江港为代表l2.2港口吞吐量增长规律的聚类分析以20个港口11a(19952005年)的港口货物吞吐量为基础数据,采用统计分析软件SPSS中的层次聚类分析工具进行分析.数据的单位一致,但为了避免某些货物吞吐量数据较大而影响聚类分析结果,需要对收稿日期:20100925;修回日期:20101229基金项目:教育部博士点基金(200801411105);辽省高等学校科研计划项目(2008Z056)作者简介:秦芳(1986一),女,辽宁省大连市人,主要从事港r=1物流管理研究.Biography:QINFang(1986一),female.224水道港口第32卷第3期这些数据做标准化处理即用某年吞吐量除以本港所选数据中的最大值,处理后的变量最大值为1.按照吞吐量的增长类型将20个港口分为3大类,第一类为平稳增长型,增长趋势近似于线性增长,发展速度较为稳定,这类港口包括大连港,秦皇岛港,青岛港,上海港,汕头港和南京港;第二类为加速增长型,增长趋势近似于指数增长,近年发展速度较快,这类港口包括营口港,天津港,日照港,连云港港,宁波港,福州港,深圳港,广州港,海口港,南通港,镇江港和武汉港;第三类为波动增长型,发展总趋势是增长的,但过程中有较多曲折,有明显的低谷,这类港口包括九江港和重庆港.3港口吞吐量预测模型的适用性分析3.1预测模型分析港口规模预测模型很多,本文仅对时间序列法,回归分析法,灰色模型理论以及神经网络模型4种模型加以分析.(1)时间序列法相对简单方便,假定过程是渐变的,但是只能用于预测平稳增长型港口,用历史数据构造时间序列模型,然后采用外推计算预测未来发展l4.(2)回归分析法需要的数据比较多,过程较麻烦,成本高,但是对拐点有很好的拟合度.可以用来预测平稳增长型和加速增长型港口l5.(3)灰色模型理论准确性好,建模需要的数据少,但是对增长曲线光滑程度有要求,对有拐点的港口预测不准确.(4)神经网络模型是一种非线性映射关系,精确度高,无需事先建立模型,容错性和稳定性好,适合任何增长规律的港口,但是选择输入变量很关键,选择的不好,会引起建模失败.4种方法的优缺点对比分析详见表2.3.2三种增长类型港口的预测模型选择4种方法均适用于平稳增长型港口;对于加速增长型港口,除时间序列法外都可以,这是由于时间序列法假设数据是渐变的,而加速增长型的数据是跳跃式的;对于波动增长型港口则适合采用神经网络模型.4案例计算与分析4.1平稳增长型港口的预测本文选取上海港作为平稳增长型港口的例子,分别用时间序列法8,回归分析法9,灰色模型法o一对其进行预测;神经网络法也适用,因其过程复杂以及篇幅所限,本文不做研究.4.1.1时间序列法(1)建立模型表1是上海港19982005年的货物吞吐量数据.以年份差值为自变量,港口的货物吞吐量为因变量Y,利用表中的数据建立回归分析方程.(2)吞吐量预测表1上海港货物吞吐量Tab.1ThroughputofShanghaiport万t序号年份吞吐量Y序号蕾年份吞吐量Y11998l6388520o226384219991864】62003316213200020440720043789642001220998200544317采用19982005年的货物吞吐量为基础数据进行预测分析,结果如下=36,yi=217786,Zx,y=l144840,2=204,yi2=661831922;则=xi=36/8=4.5,),=_l_yf:217786/8=27223.25,b=掣=165642.25/42=4130.5,凡n己PCi一n,.a=ybx=27223.25-3943.86x4.5=9475.9预测模型为y=4130.5x+9475.9(万t),相关系数r=O.93,2007年预测值为5.49亿t;2010年预测值为6.32亿t.同样采用20002005年的货物吞吐量为基础数据进行预测分析,得到的预测模型为y:4914.6613258.19(万t);2007年预测值为5.26亿t;2010年量预测值为6.73亿t.据统计,2007年上海港完成货物吞吐量5.6亿t,采用8a和6a基础数据预测得到的2007年吞吐量误差值分别为2.0%和一6.1%,吻合度均较好.2011年6月秦芳,等基于聚类的港口吞吐量预测方法及其适用性分析2254.1.2回归分析法(1)建立模型表2为上海市15a(19982005)地区生产总值GDP与港口货物吞吐量统计表.以地区生产总值GDP为自变量x,港口的货物吞吐量为因变量Y,利用表中的数据建立回归分析方程.表2上海市19912005年GDP和港口吞吐量统计Tab.2StatisticsofGDPandthroughputofShanghaiportfrom1991to2005年份货:量年份地G区DP生(1产L总值)货物(T吞f量1991893.771467919994188.73186411992ll14-32l6,7:9720004771.172O44019931519.2316423200l52lO.122209919941990.86165:0020025741.O32638419952499.431656720036694.233l62119962957.55l640220048072.83789619973438.791639720059164.14431719983801.9016388(2)吞吐量预测采用19982005年的货物吞吐量数据,计算结果如下=62058.03,yi=331051,=2.70E+09,=6.46E+08,Eyf-8.89E+09,=21450.4,(yi-yc)=320478;求回归系数,则v:331051/15:22070.07.:兰:62058/15:4137.2b=【二圣筮一:Z:二垒!:三三Q三L2鼍一6.46x1084137.2x62058.03:3.42.a=ybx=22070.073.42x4137.2=7920.85预测模型为y=a+bx=7920.85+3.42x(万t),相关系数r=0.9941,由此可见,本实例中的生产总值与港口货物吞吐量之间存在高度线性相关,说明回归分析法具有较好的适应性.据上海市统计局公告,2007年上海市国内生产总值为13055.6亿元,预测2010年上海市的国内生产总值为21000亿元,则可得到2007年上海市港口货物吞吐量预测值为5.26亿t;2010年预测值为7.97亿to2007年的预测误差为一6.1%,吻合度较好.同样采用20002005年基础数据进行预测,得到预测模型为y=a+bx=一5363.03+5.42x(万t),2007年预测值为6.54亿t;2010年预测值为10.85亿to2007年预测误差为16.78%,误差偏大,原因是上述算例中部分年份数据波动较大,建议预测前首先进行基础数据分析.4.1.3灰色模型理论根据灰色理论预测模型的特点,选取20002005年的数据进行预测,基础数据见表1.各年的货物吞吐量构成的序列为=(1),(2),(6)=(2.04,2.21,2.64,3.16,3.79,4.43)(1)求级比由)=得(.=(2),(3),O-(4),(5),(6)=(1.083,1.195,I.197,1.199,1.169)(2)级比判断原序列数据数目=6,查资料可知(,)的可容覆盖为0.7515,1.3307,上述计算表明原序列的级比全部落人此区间,原序列满足GM(1,1)建模条件.(3)GM(1,1)建模226水道港口第32卷第3期GM(1,1)建模序列:X.=(1),X.(2),X.(6)-(2.04,2.21,2.64,3.16,3.79,4.43)o的AGO序列,由()=.(m),m=l,2k得X=(1),X(2),(6)=(2.04,4.15,6.79,9.95,13.74,18.17)的均值序列(MEAN),由Zl()=0.sex()+(一1)得Zj=(2),(3),(4),(5),zl(6)=(3.095,5.470,8.370,11.845,15.955)求中间参数C=()=(3.095+5.470+8.370+11.845+15.955)=44.735D=Zx.()=(6)一X(1)=16.13E=zl().()=3.095x2.21+5.47x2.64+8.37x3.16+11.845x3.79+15.955x4.43=163.30()2=504.423计算GM(1,1)的参数0,b一CD-(n-1)E:鱼:兰二鱼二鱼:三一0.193410一(n一1)Fc2一(61)x504.42344.7352一h-DF-CE一16.13x504.423-44.735163.303-10一(一1)Fc2一(61)x504.42344.7352一建立GM(1,1)的白化响应式Xl(k+1)=(.(1)一)e+=10.2867e93眦一8.2467,X.(+1)=X(+1).X()“U参差检验并判断模型精度由残差检验值表(表3)可得,平均残差avg=0.7%,平均精度P0=99.3%.从港口货物吞吐量预测值与真实值的对比可以看出,它们有很好的拟合度,说明本预澳模型具有较高的可靠性,预测的计算式满足要求,其预测结果有一定的实用价值.从上海港港口预测结果(表4)可知,2010年上海港表3残差检验计算值Tab.3Residualerrorvalues的货物吞吐量将超过10亿t,2012年将超过15亿t,增长迅速.预测值与实际值误差为1.4%,吻合度较好.表420062012年上海港吞吐量预测值Tab.4PredictionvaluesofthroughputforShanghaiportfrom2006to2012亿t上述分析可以看到,3种预测方法均能控制在较小范围,能够满足平稳增长型港口吞吐量的预测要求,其中灰色模型理论预测模型最为接近.4.2加速增长型港口的预测选取镇江港作为加速增长型港口的例子,采用回归分析法和灰色模型法对其货物吞吐量进行预测.4.2.1回归分析法采用回归分析法来考察镇江市的地区生产总值(GDP)与港口货物吞吐量之间的相关程度,并依次预测未来数年内港口货物吞吐量的发展状况.(1)建立模型以地区生产总值GDP为自变量,港口的货物吞吐量为因变量Y,利用表5的数据建立回归分析方程.(2)吞吐量预测采用19952005年的货物吞吐量数据,计算结果如下产5598,Yyi=29164,Yxiyi=17412049,=3202491,y/2=97571824,.=1742.2,(一%)=973;2011年6月秦芳,等基于聚类的港口吞吐量预测方法及其适用性分析227表519952005年镇江市地区生产总值GDP与港口吞吐量统计表Tab.5StatisticsoflocalGDPandthroughputforZhenjiangportfrom1995to2005年份躯GDPt量年份(亿兀)货万)量(亿兀)(乃)1995285.8616322001502.7022161996335.1117082002560.9026301997360.5417112003641.1030461998390.5616802004781.00483919994l6.5017022005871.7058472000452.032153则:丝:29164/11=2651.27,:5598/11:508.916:l7l4l20499164:7.24,一b:2651.277.24508.91:一1033.24320249150891一一.x5598一.预测模型为y=a+bx=一1033.24+7.24x(万t),相关系数r=0.99,可见镇江市地区生产总值与港口货物吞吐量之间存在高度线性相关,说明模型具有较好的适应性.据镇江市统计局公告,预计2007年镇江市地区生产总值为1213亿元,2010年镇江市的地区生产总值为1250亿元,则可做如下预测2007年镇江港货物吞吐量预测值y一1033.24+7.24xl213=7748.88(万t)2010年镇江港货物吞吐量预测值一1033.24+7.24xl250=8016.76(万t)据统计,2007年镇江港完成货物吞吐量7824.2万t,预测值与实际值误差为0.96%,吻合度非常好.4.2.2灰色模型理论现以镇江港20002005年港口货物吞吐量统计资料(表6)为预测依据,进行分析.表620002005年镇江港吞吐量统计Tab.6StatisticsofthroughputforZhenjiangportfrom2000to2005各年的货物吞吐量构成的序列为=(1),(2),(6)=(0.22,0.22,0.26,0.31,0.48,0.58)(1)求级比由():得Or(0)=(0(2),0-(.(3),(4),.(5),Or”(6)=(1,1.182,1.192,1.548,1.208)(2)级比判断原序列数据数目n=6,查资料可知(,)的可容覆盖为0.7515,1.3307,上述计算表明原序列的级比不完全落入此区间,因此原序列不满足GM(1,1)建模条件.如果建模计算则残差值会非常大,所以镇江港不宜采用这种方法,可以采用更复杂的神经网络模型进行预测.4.3波动增长型港口的预测波动增长型港口增长曲线较为复杂,有明显的低谷.神经网络模型比较适合用于该类型港口的预测,但因其模型较为复杂,篇幅所限,本文不做讨论.5结语本文运用聚类分析法,根据所选取的港15I指标和城市指标,将具有代表性的2O个港口按照吞吐量增长规律分为平稳增长型,加速增长型和波动增长型;然后选择时问序列法,回归分析法,灰色模型理论和神经网络模型法,对不同类型的港口吞吐量预测的适用性进行了分析;最后以上海港和镇江港为实例进行计算,不同预测方法的适用性验证分析表明:灰色模型理论最适合平稳增长型港V1,回归分析法比较适合快速增228水道港口第32卷第3期长型港口.在后续研究中将考虑定性指标,并采用新近年份的数据.参考文献:1于汝民.港口规划与建设M.北京:人民交通出版社,2003.2高鸿丽.长江三角洲地区港口与区域经济关系及港口群合理定位的研究D.上海:上海海运学院,2002.3张强.聚类分析理论在港口规模确定中的应用研究D.上海:上海海事大学,2007.4黄荣富,綦化乐,蔡军.三次指数平滑法在港口吞吐量预测中的应用研究J.水运工程,2007(6):384O.HUANGRF,QIHL,CAIJ.ResearchandApplicationofThreetimeExponentialSmoothinginForecastingofPortSHandlingCapacityJJ.Port&WaterwayEngineering,2007(6):38-40.5苏兴,王思丽,韩超.学习曲线中系数的回归分析确定及成本预测J.硅谷,2009(2):46.suX,WANGSL,HANC.ThedecisionofcoefficientsinlearningcurvesusingregressionanalysisandthecostestimationJ.SiliconValley,2009(2):46.6邓聚龙.灰预测基础M.武汉:华中科技大学出版社,2002.7林强,陈一梅.神经网络模型在港口吞吐量预测模型中的应用与误差分析J冰道港口,2008(1):7276.LINQ,CHENYM.NeuralnetworkmodelapplyinginportthroughputforecastinganderroranalysisJ.WaterwayandHarbor,2008(1):7276.8洪承卒L.港口规划与布置M.北京:人民交通出版社,1999.9黄荣富,李霞明,顾宏余.利用回归预测技术进行港口吞吐量预测的方法研究J.水运工程,2004(4):1214:HUANGRF,LIXM,GUHY.ResearchonporthandlingcapacityforecastingmethodbyregressionforecastingtechnologyJ.Port&WaterwayEngineering,2004(4):1214.10孙永明,郑光平.基于灰理论的港口吞吐量预测研究J.中国水运,2007,5(4):160162.SUNYM,ZHENGGP.ResearchonforecastingofportthroughputcapacitybasedongreytheoryJ.ChinaWaterTransport,2007,5(4):160162.11WangMH,HungCP.NovelgreymodelforthepredictionoftrendofdissolvedgasesinoilfilledpowerapparatusJ.ElectricPowerSystemsResearch,2003(67):53

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论