(道路与铁道工程专业论文)基于遗传算法和BP神经网络的铁路客运量预测研究.pdf_第1页
(道路与铁道工程专业论文)基于遗传算法和BP神经网络的铁路客运量预测研究.pdf_第2页
(道路与铁道工程专业论文)基于遗传算法和BP神经网络的铁路客运量预测研究.pdf_第3页
(道路与铁道工程专业论文)基于遗传算法和BP神经网络的铁路客运量预测研究.pdf_第4页
(道路与铁道工程专业论文)基于遗传算法和BP神经网络的铁路客运量预测研究.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

(道路与铁道工程专业论文)基于遗传算法和BP神经网络的铁路客运量预测研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西南交通大学硕士研究生学位论文第l 页 于葡芰 近年来我国铁路事业迅猛发展,在建的铁路项目很多,陆续还有更多的项目上马。 运量预测工作在交通工程建设的前期工作中处于十分重要的地位,准确的客运量预测 是进行交通规划和管理的主要依据之一。 预测方法的选择直接影响预测结果的精度,本文旨在把遗传算法和b p 网络结合 g a b p 方法引入铁路客运量预测领域,并以高精度为目标,研究g a b p 方法的铁路客 运量预测。 论文首先分析了客运量预测的重要性,总结了铁路客运量预测的方法,如时间序 列的移动平移法、指数平滑预测模型、灰色g m ( 1 ,1 ) 模型等、影响因素法的线性 回归模型,并分析了各种常用方法的适用范围和优缺点。 其次探讨了铁路客运量的发展趋势及影响因素。根据预测铁路客运量时选择影响 因素的准则,确定了本文用于影响因素法预测的八个影响因子。 接着选择遗传算法优化b p 网络阀值和权值形成的g a b p 算法作为本文的主要预 测手段。分别建立了多影响因子的g a b p 模型、时间序列的g a b p 模型预测。 另外比较多影响因子的g a b p 和b p 的预测结果,验证了前者改良了后者的局限 性并提高了预测精度;比较多影响因子的g a b p 模型和三次指数平滑模型、一元线性 回归模型、灰色g m ( 1 ,1 ) 模型的预测结果,验证了多影响因子的g a b p 模型预测 的有效性;比较时间序列的g a b p 模型与多影响因子的g a b p 和b p 模型的预测结果, 显示时间序列的g a b p 模型预测我国铁路客运量不可靠。 最后,对应用g a b p 网络预测铁路客运量的若干要点和局限性做了说明,并对进 一步工作的方向进行了简要讨论。 关键词:铁路客运量遗传算法b p 神经网络多影响因子时间序列预测 西南交通大学硕士研究生学位论文第l l 页 a b s t r a c t i nr e c e n ty e a r s ,r a i l w a yt r a n s p o r t a t i o no fc h i n ah a sd e v e l o p e dr a p i d l y , n u m b e r so f r a i l w a ye n g i n e e r i n gp r o j e c t sa r eu n d e rb u i l d i n go ra r eg o i n gt ob ec a r r i e do u ti ns u c c e s s i o n f o r t u n ec a p a c i t yf o r e c a s t i n gw o r ki si nt h ev e r yi m p o r t a n tp o s i t i o ni nt h ee a r l i e rs t a g ew o r k o ft r a f f i ce n g i n e e r i n gc o n s t r u c t i o n a c c u r a t ec o n s e q u e n c eo fp a s s e n g e rt r a f f i cv o l u m e p r e d i c t i o ni so n e o fm a j o rb a s i s e sf o rt r a f f i cp l a n n i n g p r e d i c t i o na c c u r a c yi sa f f e c t e db yp r e d i c t i o nm e t h o d t h ea i mo ft h i sp a p e ri st oa p p l y g a b po nr a i l w a yp a s s e n g e rt r a f f i cv o l u m ep r e d i c t i o nw h i c hi sf o r m e db yg e n e t i c a l g o r i t h ma n db pn e u r a ln e t w o r k t h eg o a lo ft h i sp a p e ri st of i n do u tt h ew a y t oi n c r e a s e a c c u r a c yo fp r e d i c t i o na n ds t u d yt h ep r e d i c t i o nm e t h o do fg a b pa l g o r i t h m t h i sp a p e rf i r s t l yi n t r o d u c e st h ei m p o r t a n c eo fr a i l w a yp a s s e n g e rt r a f f i cv o l u m e p r e d i c t i o na n da n a l y z e st h em e t h o d so np r e s e n ta n ds o m en e wp r e d i c t i o nt h e o r i e s ,s u c ha s p r i o rm o v i n ga v e r a g em o d e l ,e x p o n e n ts m o o t hm o d e l ,g m ( 1 ,1 ) m o d e lw h i c hb e l o n gt o t i m es e r i e s ,r e g r e s s i o na n a l y s i sm o d e lw h i c hb e l o n gt oi n f l u e n c ef a c t o r sm o d e la n da l s o a n a l y z e st h ea d v a n t a g e s ,d i s a d v a n t a g e sa n dd i f f e r e n ts c o p eo fa p p l i c a t i o n s e c o n d l yt h i sp a p e rs t u d i e sc h i n a sr a i l w a yp a s s e n g e rt r a f f i cv o l u m et r e n d sa n d a n a l y z e st h ei m p a c to fr a i l w a yp a s s e n g e rt r a f f i cv o l u m e r e l a t e d w h a t sm o r e ,t h ea r t i c l e p o i n t so u te i g h tf a c t o r sw h i c ha f f e c tt h er a i l w a yp a s s e n g e rt r a f f i cv o l u m ea c c o r d i n gt ot h e c o r r e l a t i o nc o e f f i c i e n ta n dt h es e l e c t i o nc r i t e r i a t h e n ,i nt h i sp a p e rt h eg e n e t i ca l g o r i t h mi su s e dt oo p t i m i z et h ec o n n e c t i o nw e i g h t so f b pn e u r a ln e t w o r kt of o r mg a b pa l g o r i t h ma sm a i np r e d i c t i o nm e t h o d m o r eo v e rt h e a r t i c l ec o n s t r u c tt h em o d e lo fc a u s a lr e l a t i o n s h i pa n dt i m es e r i e s f o l l o w e dt h a t ,b yc o m p a r i n gt h ep r e d i c t i o nr e s u l to fc a u s a lr e l a t i o n s h i pg a b p m o d e lw i t hb pm o d e l ,t h er e s u l t ss h o wg a b po v e r c o m e st h es h o r t c o m i n g st h a tb p a l g o r i t h mi su s u a l l yt r a p p e dt oal o c a lo p t i m u ma n di sa f f e c t e db yt h ei n i t i a l i z i n gw e i g h t s a n di n c r e a s e st h ea c c u r a c yo ft h ep r e d i c t i o n b yc o m p a r i n gt h ep r e d i c t i o nr e s u l to fc a u s a l r e l a t i o n s h i pg a b pm o d e lw i t hc o m m o np r e d i c t i o nm e t h o ds u c h 弱e x p o n e n ts m o o t h , r e g r e s s i o na n a l y s i s ,g m ( 1 ,1 ) ,t h er e s u l t si n d i c a t et h a te r r o rp r e c i s i o no fg a b pa l g o r i t h m i ss u p e r i o ra n dg a b pa l g o r i t h mi saa v a i l a b l em o d e lp r e d i c t i o nm e t h o d b yc o m p a r i n gt h e p r e d i c t i o nr e s u l to ft i m es e r i e sc a u s a lg a - b pm o d e l w i t hr e l a t i o n s h i pg a - b pm o d e la n db p m o d e l ,t h er e s u l t ss h o wt h a tt i m es e r i e sc a u s a lg a - b pm o d e ld i s a g r e ew i t ht h ep r e d i c t i o no f c h i n a sr a i l w a yp a s s e n g e rt r a f f i cv o l u m e 、 i nt h ef i n a l i t y , s o m ep o i n t sa n dt h el i m i t a t i o n so fp r e d i c t i o no fg a b pm o d e la l o n g w i t hf u r t h e rs t u d i e sa r ed i s c u s s e d k e yw o r d s :r a i l w a yp a s s e n g e rv o l u m e ;g e n e t i ca l g o r i t h m ;b pn e u r a ln e t w o r k ; c a u s a l r e l a t i o n s h i p ;t i m es e r i e s ;p r e d i c t i o n 西南交通大学 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保 留并向国家有关部门或机构送交论文的复印件和电子版,允许论贰如查阅和借阅。 本人授权西南交通大学可以将本论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复印手段保存和汇编本学位论文。 本学位论文属于 1 保密口,在年解密后适用本授权书; 2 不保密留使用本授权书。 ( 请在以上方框内打“”) 学位论文作者签名:讶轴、p 、 日期:弘7 0 印- 7 西南交通大学学位论文主要工作( 贡献) 声明 本人在学位论文中所做的主要工作或贡献如下: 1 尝试将遗传算法优化b p 网络权值而形成的g a b p 算法应用于铁路 工程的运量预测当中。进行了多影响因子的g a b p 模型预测和时间序列的 g a b p 模型预测。预测结果验证了多影响因子g a b p 模型的有效性,而时间 序列的g a b p 模型由于铁路客运量趋势多变,预测结果不理想。 2 在对比多影响因子的g a b p 模型和和其它常用预测方法的预测结果 时,一元线性回归模型建立前不仅仅考虑了影响铁路客运量的主要因素和铁路 客运量之间的相关系数,也考虑了它们之间的偏相关系数,选择相关系数和偏 相关系数都满足条件的影响因素作为回归因子。 本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作所得的成 果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰 写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中作了明确说明。 本人完全了解违反上述声明所引起的一切法律责任将由本人承担。 学位论文作者签名:谢i 、沙j 日期:为。氓7 西南交通大学硕士研究生学位论文第1 页 1 1 研究背景和意义 1 1 1 论文研究的背景 第1 章绪论 铁路是现代交通运输体系主要的运输方式。我国铁路面临的主要问题是运输能力 远不适应国民经济和社会发展的需求。为解决经济增长周期中铁路“瓶颈”制约日益突 出的问题,要求铁路加快发展。中长期铁路网规划2 0 0 8 年调整确定到2 0 2 0 年,我 国铁路营业里程将达到1 2 万k m ,其中客运专线1 6 万k m 以上;规划建设新线调4 1 万公里。为了提高铁路投资的准确性,在建设的前期必须对运量进行可靠的预测。预 测的准确性很大程度上取决于方法的选择。常规运量预测的方法虽很多,但各自都存 在局限性。为了提高预测的准确性,有必要探索新的预测方法。 1 1 2 论文研究的意义 运量预测在铁道工程建设中处于十分重要的地位,已成为一项专题研究、评审的 专项课题。 在预可行性研究中,若调查与预测的运量偏大,建设项目计算的效益固然较好, 但投资数额也会偏高,假如运营时实际运量偏小,则将造成资金积压,能力闲置,实 际的经济效益也将下降:若调查与预测的运量偏小,则建设项目的能力会很快饱和, 引起铁路的过早改建,甚至会因标准过低而项目起不到应有的作用,损失也是很大的。 在设计阶段,客货运量是选定设计线主要技术标准,并用以确定铁路能力的依据, 设计的近、远期铁路能力不应小于调查和预测的运量。有了确切可靠的运量逐年增长 资料,才能合理拟定分期加强方案,节约初期投资。 客货运量也是评价经济效益的基础,设计线运输成本的高低,运输收入的多少, 是盈利还是亏损,以及投资回收期的长短,都由客货运量的大小决定。客货运量的大 小,还影响线路方案经济比较的结果。运量的大小不仅影响方案的正确选取,并且影 响工程造价。 由此可见准确预测运量的重要性。为了提高预测的精度,相关工作者不断寻求新 的方法,神经网络、遗传算法、支持向量机等知识已被尝试运用到铁路运量预测领域。 本文将遗传算法优化b p 神经网络而形成的g a b p 算法运用到铁路运量预测中,旨在 寻求提高预测精度的途径,希望这种新的方法和思路能为铁路运量预测工作提供有效 参考。 西南交通大学硕士研究生学位论文第2 页 1 2 运量预测国内外研究现状 运量预测的头绪很多、范围很广,根据预测的目的、角度和其他特性,可以把运 量预测分为不同的类别。按照预测的对象,可首先分为货运预测和客运预测。按照预 测的层次,又可分为全国运量预测、国民经济各部门运量预测、各地区运量预测和各 种运输方式的运量预测。按照预测的内容,还可分为发送量预测、到达量预测、周转 量预测和平均运程预测。按照预测的对象,分为货运预测和客运预测。 本论文主要针对铁路客运量进行预测,运用科学的思维、理论和方法,比较准确 的认识、掌握铁路客运量的发展规律,并及时地了解铁路运输市场状况和发展态势, 期为铁路建设和改造提供参考依据,为铁路发展战略的调整提供有效参考。 1 2 1 客运量预测常用方法 客运量又称客运运输量,是指在一定的运输供给条件下所能实现的人的空间位移 总量,是运输需求与供给、运输需求与运输服务水平相互作用的反映,是在一定运输 能力下所实际完成的运输需求型1 0 j 。客运量是评价运输组织效果的指标,是衡量旅客 运输生产劳动量的尺度,是统计期内运送的旅客数量,其实质体现了运输部门的绝对 成果和运输组织方式满足社会客运需要程度的大小。对未来若干年的客运量及其发展 趋势进行预测,可以有效地计划和组织旅客运输,为客运系统的规划布局提供依据, 以达到促进旅客运输的经济效益和社会效益,满足国民经济快速增长和人民生活水平 日益提高需要的目的,对于客运的管理和决策具有重要的意义。 目前,世界上现有的预测方法与技术有上百种之多,而在运量预测中常用的预测 方法也有十几种。按预测方法的性质,大体上可将之划分为两大类:定性预测方法与 定量预测方法i 引。 定性预测方法是主要以预测人员的经验判断为依据而进行的预测。预测者根据自 己掌握的实际情况、实践经验、专业水平,对未来货运发展前景的性质、方向和程度 做出判断。其特点为:需要的数据少,能考虑无法定量的因素,比较简便可行。目前 常用的定性预测方法包括有:运输市场调查法d e l p h i 法、类推法、专家预测法、头脑 风暴法、主观概率法以及情景分析法等。但这种方法往往在很大程度上取决于参加预 测的人员的经验、专业理论水平以及所掌握的实际情况,因此存在片面性,准确性不 高的缺点【1 1 。 定量预测方法则是以历史统计资料和有关信息为依据,运用各种数学方法来预测 未来客运市场需求情况,即未来的运量。定量预测方法最大的优点就是客观性,这类 方法的预测精度和可靠性在很大程度上取决于数据的准确性和预测方法的科学性。随 着社会经济的不断发展,对预测的数字化要求越来越高,定量预测方法在运量预测中 的应用也越来越广泛。目前在客运运量预测中常用的定量预测方法有时间序列法和影 西南交通大学硕士研究生学位论文第3 页 响因素法。 ( 1 ) 时间序列法【2 】【3 l 一从时间序列的角度对运量进行预测 时间序列分析预测法是一种依据客运量的历史变化趋势,找出其随时间变化的规 律,并通过数学模型来表示,然后根据模型来进行预测的方法。时间序列预测法得以 建立的基础就是事物的发展变化的延续性,即惯性。因此可以采用时间序列趋势外推 的方法对客运量进行预测。即根据客运量从过去到现在的运动变化规律,推测未来运 量。这种方法的主要优点是需要数据少、简便,只要所研究的运量时间序列的趋势没 有大的波动,预测效果较好。 这类方法的缺点是无法反映出运量变化的原因,对于影响运量变化的外部因素变 化,如调整经济政策和发展速度而引起的运输需求的变动无法反映。 时间序列趋势外推的方法很多,其关键是趋势的识别与拟合是否准确。常用的方 法有:移动平均法、指数平滑法、月度比例系数法、鲍克斯詹金斯法( b o x j e n k i n s 法) 、普查i i 法( c e n s u si i 法) 等。 移动平移法【3 】【4 】是把原来时间序列的时距扩大,从用逐项类推移的方法来计算 序时平均数,其目的在于清除原来序列时距较短受偶然因素影响所引起的波动,从而 使现象的发展趋势更明显地表现出来 m j = 墨墨= l 墨= 2 :墨= 丛二墨= 筮:墨= ! 墨= 2 :墨= 型+ 墨= 墨= 世 nnn = 蚝+ 与竽( 1 - 1 ) 式中:叫为t + 1 期的预测值,五,墨一分别为t - n 期到t 一1 期的实际客运量值, n 为移动平均计算中包括的过去的观察值的实际个数。 移动平均模型的优点就是简单易行。由于模型是用过去几期的平均值作为下一期 的预测值,当需要预测大量的数值时,数据存贮量较大,并且预测值仅与过去n 期的 实际值有关,因而期数n 的选择对预测值影响很大。实际应用中模型预测精度不是很 高。 指数平滑预测澍3 】1 5 】【6 1 是在移动平均预测法酌基础上发展起来的一种预测方法 通常采用一次指数平滑预测模型,二次指数平滑预测模型以及三次指数平滑预测模型。 指数平滑计算基本公式为: s ( 1 ) = a x 。+ ( 1 一a s 巴) ( 1 - 2 ) s 1 2 ) _ a s :1 ) + l a s ( 1 3 ) s 1 3 ) = a s l 2 ) + ( 卜a s 出) ( 1 4 ) s 表示指数平滑值,第t 期一次指数平滑值记为s l ,二次指数平滑值记为s :2 1 ,三 次指数平滑值记为s :3 1 。x t 是第t 期指标实际值,a 是平滑系数( 0 a 1 ) 。 一阶指数平滑法适用于历史资料数据显示较为平稳的数据的事件预测,其基本思 西南交通大学硕士研究生学位论文第4 页 想是以第t 期的一次指数平滑值作为第t + l 期的预测值 一次指数平滑模型为: x t + l = s l ” ( 1 5 ) 文。+ 。为第t + l 期的预测值。 二次指数平滑模型就是把一次指数平滑值作为原始数据,再进行一次指数平滑, 并利用一次指数平滑值及二次指数平滑值建立预测数学模型。它可降低当时间序列呈 一定的直线上升或下降趋势时,一次指数平滑值所具有的滞后误差。其模型方程为: x t + n = a 。+ b t t( 1 - 6 ) 其中: a 。= 2 s l 一s l ”b 。= ( s 【1 ) 一s 1 2 ) x t + n 为第t 期之后第t 期的预测值 三次指数平滑模型则是在时间序列具有曲线变化趋势时,通过高次平滑处理,降 低预测误差所采用的预测模型。它是在二次平滑的基础上,再进行一次指数平滑处理, 并建立二次多项式形式的数学模型。 其模型方程为:x 。+ n = a 。+ b 。t + c 。t 2 ( 1 7 ) 其中: a = 3 s l 一3 s :2 ) + s 1 3 b。熹【(65)sl一2(54a)s12+(43)s131a 4 aa 2 = o 一 一一 7 + iq j , 1 ( 1 一a ) l 、7 。 2 c 。= 竺百t s l 一2 s 2 + s :3 ) 】 c = 了一z 3 :十3 :l 2 ( 1 一a 1 2 。 指数平滑模型采用递归式计算,对数据的存储要求较低,只需存储前一个估计值 和过滤参数,计算比较简单,不需要训练,因此早期应用较多。 月度比例系数法的基本思路是运量的月度波动具有一定的循环特征和规律性。 因此,可以通过这种规律性的把握,去预测未来月份的客货运量。 鲍克斯詹金斯( b o x j e n k i n s ) 法,也称为自回归分析方法。它是通过分析 时间数列的不同自相关系数来选择适当的预测模型。当时间数列内的数值在某一固定 间隔期具有较高的相关系时,就可以应用自回归模型进行预测。 普查i i ( c e n s u s l i ) 法是由美国商业部普查局开发的,其法基础是对移动平均之比 的典型分解方法。经过大量计算,将时间数列分解成趋势、循环、季节及不规则变动 四项,用于预测。 ( 2 ) 影响因素法 影响总运输需求的主要因素有很多,但具体的预测目标类型、范围是不同的,必 须细致地分析其最主要的影响因素,设法将其用量化指标反映出来。通过对过去和现 在的指标数据进行分析研究,可以找出运输需求与相关经济量的关系,用于对运量进 行预测。 这类预测方法在数据量足够多的情况下,常可获得较好的精度,并提供运量变化 西南交通大学硕士研究生学位论文第5 页 原因方面的信息。其缺点是自变量、外在变量指标未来值的选择,本身就带有预测性, 影响预测的准确程度。常用的方法有:回归预测、经济计量模型、投入产出模型、乘 车系数、产值系数法、产运系数法、产销平衡法、比重法等。 回归预测的方法是回归分析。在分析时,选择一个因素作为因变量,其余视为 自变量。回归分析就是确定自变量与因变量之间关系形式的分析方法。它是要确定一 个合适的数学模式,来近似地表达变量之间的平均变化关系。如果因变量在表达式中 表现为自变量的一次函数,称为线性回归方程,否则称为非线性回归方程式。回归预 测可以考虑多种可能对运量产生影响的因素。 经济计量模型由一组联立方程组成。应用经济计量模型进行预测正是通过拟定 的方程式表达社会经济活动中各种变量及它们之间的关系,而后再联立求解这些方程 得出关键变量的预测值。对于像运量变化这样较复杂的经济现象,单一方程模型往往 不能很好描述和预测。应用多个方程组成的联立方程模型即经济计量模型进行分析预 测,效果较好。 投入产出模型是应用比较广泛的经济模型,它可以反映在区域性的经济及其市 场中,所有商品与服务在产业间或区域间的各种流动情况。利用区域间客货的o d 建 立模型,可以对区域间运量进行预测。 - 乘车系数法是以总人口和平均每人乘车次数预测旅客发量的方法。 产值系数法是根据预测期国民经济的总量指标和确定的每单位产值所引起的货 运量或客运量去预测总运量的方法。 产运系数法是根据某种货物的运量随其生产总量发生变化的规律性,预测货运 量的方法。 产销平衡法是通过产销平衡计算,推算出该种货物在一个车站、一个枢纽、一 条线路或一个地区的发送量和到达量。 比重法是在总运量已用某种方法预测出,进而估算其中部分运量的方法。 1 2 2 新预测理论与方法在客运量预测中的运用 随着近代基础科学,计算机技术的迅猛发展,预测理论新的研究成果也在不断涌 现。这就为我们探索新的运量预测方法提供更多的途径。目前,对新的预测方法的研 究己取得了一些成果,如将灰色系统理论、神经网络理论、遗传算法理论、支持向量 机理论及组合方法引入到客运量预测中。 ( 1 ) 灰色系统理论【1 u 旧:灰色系统理论是1 9 8 2 年由我国学者邓聚龙教授创立的。 灰色系统理论以“部分信息己知,部分信息未知”的“小样本”、“贫信息 不确定性 系统为研究对象,主要通过对“部分已知信息的生成、开发,提出有价值的信息, 实现对系统运行行为、演化规律的正确描述和有效控制。灰色系统认为一切随机量都 是在一定范围内、一定时段上变化的灰色量和灰过程。对于灰色量的处理不是寻求它 西南交通大学硕士研究生学位论文第6 页 的统计规律和概率分布,而是将杂乱无章的原始数据列,通过一定的方法处理,变成 比较有规律的时间序列数据。即以数找数的规律,再建立动态模型。这就弥补了概率 统计方法的不足。 灰色系统理论以灰色序列生成为基础方法体系,以灰色模型( g r e y m o d e l ,g m ) 为 核心模型体系。使用最广泛的是g m ( 1 ,1 ) 模型,它是单序列一阶线性动态模型,适合 对单调变化的数列建模。步骤如下: 给定原始时间数列x 0 = ( 硪,x 、t 2 ) ,o ) ,础) ( 1 8 ) 将原始数据列进行一次累加生成,获得新的数列 x 1 ) _ ( 碟? ,劳,掣暑) ( 1 9 ) f 其中, 础= x 器j = 1 ,2 ,刀 k = l 以新生成的数列x ( 1 为基础的g m ( 1 ,1 ) 代表一个白化形式的微分方程 j 1 厂( 1 1 竺+ 口x ( 1 ) = u 式中口,u 是需要通过建模要求得到的参数,z 1 是原始数据, d f x ( o 的累加生成值。 构造数据矩阵和数据向量 对g m ( 1 ,1 ) ,其数据矩阵b = 1 2 x 曷+ x 跚 1 2 x 肾x 踟 ; 1 2 x l l ;+ x 】 数据向量 y n = x 品x 品,x 器 t 作最小二乘计算,求g m ( 1 ,1 ) 的参数口,u 盆= l 三j = ( b t b ) 一b t y n 建立时间响应函数,即求白化形式微分方程的解为 文;:;:( x :;- ) e - a ( i - 1 ) + 将文出计算值作累计还原,即可得到原始数据的估计值。 一文岔= 文出一文出 ( i = 1 ,2 ,n ) 预测精度的检验 灰色系统理论对模型的检验提出残差检验和后验差检验方法。 记i 时刻残差为e 嚣= i x 留一文圳 i = l ,2 ,n 残差均值百= = l - 嚣 凸( o ) 相对残差( f ) = 专苦 ( 1 1 0 ) ( 1 1 1 ) ( 1 1 2 ) ( 1 - 1 3 ) ( 1 1 4 ) ( 1 1 5 ) ( 1 1 6 ) 西南交通大学硕士研究生学位论文第7 页 残差检验的指标:模型的平均模拟相对误差五5 寺善l ( f ) i ( 1 - 1 7 ) 方差均值s ;5 吉副1 1 :;) - _ ) 2 0 - 1 8 ) 原始数据均值又2 吉p 嚣( 1 - 1 9 ) 原始数据方差s ;= 二( x 篙一又) 2 ( 1 - 2 0 ) 一厶一、1 j 、 后验差检验指标有:后验差比值c = ( 1 - 2 1 ) 小误差概率p = p i e :j ) 一叫 o 6 7 4 5 s :) ( 1 2 2 ) 表1 1 精度检验等级 灰色理论中灰色预测方法的优点是算法简单,运算速度快,对于短期预测能给出 很好的预测效果,但是对于具有波动性的系统预测的效果不是很理想。交通流本身具 有很多不确定性的因素,受环境因素、突发事件的影响比较大,具有很强的波动性, 因此在短期交通流预测中预测的精度往往不高。文献 1 3 1 4 1 5 都应用了灰色理论来 预测客运量。 像其他任何数学模型一样,g m ( 1 ,1 ) 模型也存在着一定的局限性。从公式( 1 1 2 ) 可 知,g m ( 1 ,1 ) 模型是一种呈指数增长的预测模型,主要适用于按单一指数规律增长的数 列。有专家对g m ( 1 ,1 ) 模型的使用范围进行了研究,并按照发展系数的阀值,明确界定 了g m ( 1 ,1 ) 模型的有效区、慎用区、不宜区和禁区,并得出以下结论: 表1 - 2 口值与g m ( 1 ,1 ) 模型的使用范围 h 的取值g m ( 1 ,1 ) 模型的使用范围 h 0 3 o - 3 川o 5 o 5 h o 8 0 8 1 l o r l 2 g m ( 1 ,1 ) 可用于中长期预测 g m ( 1 ,1 ) 可用于短期预测,中长期预测慎用 g m ( 1 ,1 ) 短期预测慎用 g m ( 1 ,1 ) 应采用残差修正 g m ( 1 ,1 ) 不用采用 g m ( 1 ,1 ) 无意义 ( 2 ) 神经网络理论与遗传算法理论 西南交通大学硕士研究生学位论文第8 页 人工神经网络与遗传算法是人工智能的两大分支。人工神经网络 ( a r t l f i c i a l n e u r a l n e t w o r k ,简写为a n n ) 是在现代神经科学研究成果的基础上提出的反 映人脑功能的基本特征。网络的信息处理是由神经元间的相互作用来实现,知识与信 息的存贮表现为网络元件互相联结分布的物理联系,网络的学习和识别决定于各神经 元连接权系数的动态演化过程。a n n 作为一种新型的信息描述和处理方式,以其独特 的优点引起了人们的关注。 遗传算法( g e n e t i c a l g o r i t h m ,简写为g a ) 是一种基于自然选择和基因遗传学原 理的优化搜索方法。它将“优胜劣汰,适者生存”的生物进化原理引入待优化参数形 成的编码串群体中,按照一定的适配值函数及一系列遗传操作对各个体进行筛选,从 而使适配值高的个体被保留下来,组成新的群体,新群体中各个体适应度不断提高, 直至满足一定的极限条件。 在预测应用中常常把遗传算法与神经网络结合起来,利用各自的优点,弥补各自 的不足,从而使预测效果更加科学、准确。文献 1 6 1 7 】【1 8 】 1 9 2 0 2 1 都是g a 和 a n n 相结合建立的预测模型在各个领域的运用。 ( 3 ) 支持向量机 支持向量机( s u p p o r tv e c t o rm a c h i n e ,s v m ) 是数据挖掘中的新方法,它是建立在 统计学习理论( s t a t i s t i c a ll e a r n i n gt h e o r y ,s l t ) 基础之上的通用学习方法。 文献 2 2 1 支持向量机被成功地应用于时间序列的预测研究,文献 2 3 把支持向量机 运用在非线性建模与预测。 3 论文的主要方法 运量预测的常用方法及灰色模型法都需要建立确切的模型,但客运量的预测中往 往是可用样本数据较少。尤其是当前社会经历着日新月移的变革,运输结构随之也发 生了很大变化,突发事件也严重影响客运量的走向,各种影响客运量的因素未来发展 趋势与历史发展趋势可能存在很大的差别;而且交通系统是一个有人参与的、时变的、 复杂的非线性系统。但建模的方法都需要大量有规律的历史数据,这就造成预测的结 果很不理想。 神经网络预测方法具有良好的稳定性、适应性和非线性识别能力,这就不同程度 地克服了传统预测方法在解决非线性、不确定、时变系统预测上的不足,使预测趋于 准确。鉴于此,神经网络预测方法适用于铁路客运量预测。 神经网络发展至今最为成熟的模型是b p 神经网络,在人工神经网络的实际应用 中,绝大部分的神经网络模型是采用b p 网络和它的变化形式。它是前馈网络的核心部 分,也是人工神经网络的精华部分。但b p 网络存在局部最优的问题,并且训练速度慢, 效率低。因此如何有效地克服局部最优问题,以及如何提高它的训练速度的研究越来 西南交通大学硕士研究生学位论文第9 页 越得到重视。而遗传算法作为人工智能的另一个分支在搜索过程中不易陷入局部最优, 其本质是一种求解问题的高效全局搜索方法,它能在搜索过程中自动获取和积累有关 搜索空间的知识,并自适应地控制搜索过程以求得最优解。这样就可以结合g a 和b p 两者的特点,用遗传算法优化b p 神经网络。本文主要采用遗传算法( g e n e t i c a l g o r i t h m - - g a ) 改进b p 人工神经网络( a n n ) 的思路,把g a b p 算法运用到铁路客运量预测领 域。 铁路客运量是一组按时间顺序排列的数据序列,即时间序列。无论何种预测,一 般都表现为运量随时间序列的变动。但铁路运输涉及诸多外部和内部相关因素,科学 的客运量预测要分析这些因素。基于此,本文分别从时间序列的角度和影响因素角度 入手对运量进行预测。 4 论文主要内容与技术路线 1 4 1 论文的主要内容 本文的主要研究内容如下: 1 分析铁路运量预测的重要性,总结铁路运量预测方法的研究现状。选择遗传算 法优化b p 神经网络的方法作为本文的研究手段,结合铁路客运量的特点确定从时间序 列和影响因素两方面进行研究。 2 总结铁路运输国外和国内的发展情况,分析影响铁路客运量的因素,确定本文 主要影响铁路客运量的因素,为第4 、5 章预测模型的建立奠定了基础。 3 探讨b p 神经网络和遗传算法g a 的理论基础,总结遗传算法结合b p 神经网 络的不同途径,选择遗传算法优化b p 网络阀值和权值的方法作为本文的预测方法。这 一部分是本文的理论基础,为后面g a b p 算法在铁路客运量预测领域的运用研究做好 准备。 4 利用我国1 9 8 8 2 0 0 7 年间的有关数据,用m a t l a b 语言编写代码,实现多影 响因子的g a b p 模型和b p 模型预测、三次指数平滑模型预测、时间序列的g a b p 模 型预测,利用s p s s 软件分析出了一元线性回归预测模型,利用灰色系统分析软件实现 了灰色g m ( 1 ,1 ) 模型预测。并分析比较各种方法的预测结果。 1 4 2 论文的技术路线 西南交通大学硕士研究生学位论文 第1 0 页 图1 1 论文的技术路线 西南交通大学硕士研究生学位论文第1 1 页 第2 章铁路客运量需求及影响因素分析 7 2 1 运输结构与铁路客运的发展趋势 2 1 1 运输结构与运输量 运输结构是指运输部门内外部相互联系的各个方面和环节的有机比例和构成,大 体上可分为宏观、中观和微观三个层次。中观层次的运输结构是从运输行业内部考察 各种运输方式的构成,以及为了实现合理分工协作所需的比例关系,如各种运输方式 的线网规模与地区分布,运输能力比例,实际完成的客货运量按运输种类别、批量别、 距离别的比例等等。 以各种运输方式的运输量比重来考察运输结构,可以较全面反映运输结构的演变 过程。通常情况下,某种运输方式在一定时间内完成的运输量大小及其比重,常用以 反映该种运输方式在运输系统中的地位与作用,也可以反映某种运输方式的发展状况。 2 1 2 铁路运输的发展 从发达国家交通运输发展史看,铁路运输在1 9 世纪末直到2 0 世纪二十年代,是 铁路运输的黄金时代。以后由于公路运输的现代化和航空运输的发展,客运量锐减。 发达国家运输产业在其成长过程中,其内部产业结构关系的演进趋势主要表现为: 经济发展的初期阶段,铁路运输往往在客运和货运中占有主导地位;前中期阶段, 在客运方面,铁路运输的主导地位受到来自公路运输和航空运输的挑战,甚至出现公 路运输成为客运主体;在货运方面,公路运输、水运也发展较快,大量替代铁路运输 的货运份额;发展中后期阶段在客运方面,公路运输和航空运输大量替代铁路运输 所占的份额,铁路运输客运份额降低到很低的水平;在货运方面,公路运输、水运进 一步发展,铁路运输在货运中占有的份额进一步降低后,保持在某个稳定的水平上。 我国的客运产业有铁路、公路、水运和民航四种运输方式。虽然我国铁路运营里 程在总量上尚处于短缺状态,路网结构对国土的覆盖性尚有较大的差距,但在各种运 输方式组成的交通运输体系中,铁路运输始终处于骨干地位,对国民经济发展起到了 强有力的支持作用。下表是建国来旅客周转量【2 5 】【2 6 】【2 7 】: 根据表2 1 绘制旅客周转量变化过程图2 1 、各种运输方式客运分担率的变化图 2 2 及铁路客运量图2 3 。 从图2 1 看出建国以来我国铁路客运的发展大概经历了三个阶段:1 9 4 9 6 2 年, 1 9 6 3 8 9 年,1 9 9 0 至今。但铁路客运的总体呈上升趋势。 西南交通大学硕士研究生学位论文第12 页 表2 11 9 4 9 2 0 0 7 年铁路客运量、旅客周转量和客运分担率 西南交通大学硕士研究生学位论文第1 3 页 l m_mm 续表2 11 9 4 9 2 0 0 7 年铁路客运量、旅客周转量和客运分担率 从图2 2 看出建国以来各种运输方式的客运均得到了不同程度的发展,民航和公 路客运增长速度较快,水路客运的增长最慢。1 9 4 9 8 9 年铁路客运年均增加量较大,仍 占主导地位。9 0 年以后公路快速发展超过铁路,成为客运量最大的交通方式。 垒重至塑查兰堡圭至圣兰兰堡丝圣重! ! 至 14 。 12 。 n 0 5 2 ( 1 8 ) , 故回归模型显著,建立一元回归模型矿= 8 0 9 8 1 0 3 7 + 5 9 8 8 x ,式中x 一铁路旅客周转 量。据此模型的预测结果见表4 1 0 。 3 ) 灰色预测模型 1 2 2 中介绍了灰色预测模型的典型代表g m ( 1 ,1 ) ,该模型的最大特点是少数据建 模,最小只需四个数据就可建立预测模型,因此实证时,常取用不同的长度的数列建 模并进行比较,从而建立预测精度较高的灰色模型。笔者通过多次实验,发现取5 个 数据预测效果较好。本文运用灰色系统分析软件,根据表2 1 中1 9 9 1 2 0 0 7 年铁路客 运量数据,分别以1 9 9 1 年到1 9 9 5 年的客运量作为样本数据,对1 9 9 6 年的民航客运量 进行预测,再以1 9 9 2 年到1 9 9 6 年的旅客运输量作为样本数据对1 9 9 7 年的民航客运量 进行预测,以此类推,预测1 9 9 6 - 2 0 0 7 年间的铁路客运量。下表为每一个g m ( 1 ,1 ) 的精 度检验。 西南交通大学硕士研究生学位论文第4 5 页 表4 - 9g m ( 1 ,1 ) 模型的精度检验 4 1 0 。 表中结果表明1 2 个模型的精度都达到三级以上,故都能用来预测。预测结果见表 表4 1 0g a b p 和常用模型的预测结果 根据上表中数据绘制各种模型的预测结果趋势如下图: 西南交通大学硕士研究生学位论文第4 6 页 1 3 0 0 0 0 詈,z ( 3 0 。 v d 1 1 0 0 0 0 1 目 萎,。o o o o 誊 1 9 9 61 9 8 82 0 0 02 0 0 22 0 0 42 0 0 62 0 0 8 年份 图4 7 各种模型的预测结果趋势 4 ) 预测结果比较 为了使结果比较目了然,在下表4 i l 中列出了各方法预测结果的绝对误差( 万 人) 和相对误差( ) 。 表4 l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论