




已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
深度学习在城市交通流预测中的实践研究 尹邵龙,赵亚楠 (华北计算技术研究所,北京100086) 摘要:短时交通流状态预测对于实现城市智能交通系统至关重要。在过去,很多神经网络模型被提出来用以预测交通流,但是效果并不是很显著。究其原因,是因为大多数都是利用浅层模型在学习,浅层模型由于容易陷入局部极值而且不能模拟更复杂的数学运算,所以并不适合于模拟现实的交通状况。深度学习作为机器学习的新兴学科,在语音与图像处理方面取得了显著的成效,它能够非监督地从数据中学习出有效的特征用以预测,故在此利用深度学习进行建模用以城市主干道交通流预测。实验表明,模型取得了不错的交通流预测效果。 关键词:深度学习;交通流预测;神经网络;机器学习 :TN915.5?34;TP183:A:1004?373X(xx)15?0158?05 :xx?01?07 0引言 随着社会的快速发展和机动车数量的急剧增加,城市交通日益趋向于拥堵,交通事故与空气污染也进一步加剧。在我国,北京、上海这样的大城市在中心市区的平均车速在高峰时期不足20km/h,交通拥堵又进一步导致了能耗加剧与环境污染。研究结果表明1,当车速由40km/h降低至10km/h时,能量损耗量会增长1倍,环境污染量会增加3倍以上。北京市汽车排放的氮氧化物、一氧化碳对环境分别占到46%和63%。所以,智能交通系统(IntelligentTransportationSystems,ITS)成为解决城市拥堵问题的关键途径。智能交通系统有效地利用当前先进的硬件和软件,对交通进行有效的综合管理。短时交通流状态预测(Short?termTrafficStateFore?casting)作为智能交通系统的核心技术,它利用现有数据对交通流状况进行预测,进而帮助出行者进行路径规划,实现交通流诱导,从而缓解了交通拥挤,减少了环境污染。人们针对交通流预测,提出过不同的预测模型;但是由于城市交通流时间与空间上的复杂性,给预测结果的准确率带来了挑战。 深度学习作为机器学习的新兴学科,一经提出便受到了广泛的关注,像Google、微软、百度,都在研究与利用深度学习。它被成功地应用到了分类任务、自然语言处理、降维、图像识别等等方面。深度学习通过利用多层体系架构来有效地、非监督地提取出底层数据的潜在的典型特征,进而提供给高层进行分类与回归。交通流本身就是一个复杂的过程,深度学习架构能够帮助我们无先验知识却能有效地学习与抓住其中内在的复杂特征,进而有效地进行交通流预测。 本文提出了一个基于深度学习的交通流预测模型,通过训练并加以实现。实验结果表明,这种方法在交通流预测当中取得了不错的准确率。 1背景介绍 1.1交通流预测 交通流预测一直都被认为是实现城市智能交通系统(ITS)的关键技术问题。它利用以往历史数据对未来某段时间内交通流量进行预测。预测时段一般为530min。 令Xti表示第i个交通道路在第t时间的交通流量,那么给定一个观察得到的交通流序列,i=1,2,m;t=1,2,T,那么交通流预测即是根据这以往的交通流序列对于某条道路T+t时间段进行预测。其中t可以进行调节。 交通流预测模型一般包括两步,即特征学习与模型学习。特征学习即非监督学习,通过训练可以得到代表以往历史交通时间序列的一个特征代表模型h。经过特征训练后,以往的交通流序列X即可通过h转化为另外的一个特征空间Y,即h(x)Y;模型学习即监督式学习,给定一组特征Y与目标任务Z的配对组(Y1,Z1),(Y2,Z2),(Yn,Zn)学习预测模型Zn+1=g(Y),通过最小化目标损耗函数L,得到预测模型的适合的参数W: 尽管预测模型之间互有差别,但是目标损耗函数大多数都是一样的。以往的预测模型可以分为三类2: (1)基于以往历史数据的时间序列法。自回归整合滑动平均模型3(ARIMA)就是通过找到交通流随时间变化的模式,从而实现预测。相似的还有子集ARIMA4,表达变量ARIMA(ARIMAX)5,向量自回归移动平均(ARMA)和基于时间与空间的ARIMA6,还有季节性的ARIMA(SARIMA)7,卡尔曼滤波方法8等。 (2)基于概率图模型的方法。通过概率图的方法对交通流进行建模与预测,常见的方法有:贝叶斯网络9,马尔可夫链,马尔可夫随机场(MRFs),模糊逻辑10等。 (3)非参数统计方法。由于这种方法能够很有效地模拟交通流不确定、复杂性和非线性等特点,所以它比其他方法取得的效果更好。例如神经网络(NNs),支持向量回归(SVR),局部加权学习(LWL),k?NN11方法,支持向量机(SVR)12,随机微分方程13等。 总体说来,随着智能交通的发展,很多预测模型都被提出来了。但是,很难说某个具体的方法在所有交通流领域强于另外一个方法。因为这些方法大多数都是基于某些特定的数据进行建模的,并且预测结果也依赖于采集数据的准确性。然而神经网络(NN)由于能够有效利用历史数据与数据之间的关系,所以能够获得更好的健壮性与预测结果。可是现有的神经网络大多数都是基于浅层体系架构,当建立多层架构时,基于梯度下降的方法就不能有效地进行参数调节。深度学习作为一种新兴的神经网络,它解决了传统NN的训练问题,获得了比传统神经网络更好的实验效果。所以利用深度信念网络(DBN)可以对交通流模型进行预测与改进。 1.2深度信念网络 深度信念网络(DBN)作为深度学习模型中最常见的一种模型,它是通过一系列的RBM堆积而成。每一层的RBM都只有一个隐藏层,每一层的输出作为下一层的输入。Hinton等人提出了一种可以快速的每次逐层训练DBN的方法14,即每次训练一层。 RBM即限制玻尔兹曼机,它是马尔可夫随机场(MRFs)的一个特例。若一个二分图,每层节点互相之间没有连接,一层是可视层(visible),另外一层是隐藏层(hidden),且假设所有节点都是随机的、二值分布的,二层之间通过对称矩阵进行连接,并且概率分布满足玻尔兹曼分布,那么这就是RBM。可视层对应于输入,因为它们的状态已经被观察得到;隐藏层对应于特征探测,它们的联合组态能量方程(v,h)为: 式中:vi和hj是输入i和特征j;bi和aj分别是他们的偏移量;wij为它们之间的权重矩阵。因为隐藏层之间是相互条件独立的,即: 那么当v或者h给定时,便可以计算出它们的条件概率分布: 那么当给定一组训练集Vc|c1,2,?,C时,其目标就是最大化这个模型的对数似然函数: 一般都是通过梯度下降法求得参数wij,bi和aj,但这里可以用吉布斯采样法近似求得,即可视层V根据指定的规则采样出隐藏层H,然后再反过来采样出可视层V,这个过程可以重复很多次。经过多次的迭代,模型会忘记它的初始起点,这样就可以从它们的平衡分布中进行采样。最终,函数期望利用对比分歧(CD)方法在有限次内便可以得到近似值。把N+1次采样的算法标记为CD?N。实践中,一般用CD?1就可以得到合适的值。那么就可以得到权值wij的更新规则: 式中:为学习速率;Edata是根据初始模型分布当可视层输入的时候,隐藏层的期望输出;Emod是通过CD算法估计出来的期望输出。同理,bi和aj的更新规则与wij相类似。 1.3高斯?伯努利GBRBM 在普通的限制玻尔兹曼机(RBM)中,可视层的输入限制为0或1,这样对于模拟现实中像交通流这样的连续值是很不方便的。于是,可以通过高斯?伯努利GBRBM15来模拟真实数据。它通过加入高斯噪音的连续值来模拟真实的数据,进而替代了普通RBM的二进制的可视层输入,其能量函数改为: 式中:vi表示可视层第i个真实值;是高斯函数的标准方差。通过方程就能让可视层表达获得某个特定连续值的优先权,根据能量方程16,得到它们的条件概率分布为: 它的训练调参过程与普通的RBM没什么区别,都可以利用CD过程对参数进行调节。 2体系架构 在此,建立了深度架构,底层是由GBRBM与RBM组成的DBN的架构,用于非监督的特征学习;顶层加入了一个回归层用作预测,当然顶层也可以替换为支持向量机(SVM)。建立的模型如图1所示。 在DBN预训练以后,顶层再通过有标签的数据进行BP算法去做参数调整。这种方法要强于以往传统神经网络直接用BP算法做梯度下降调整,直观的原因为:DBN预训练后的参数已经接近于训练好,那么再做BP算法,只需要在已知参数里面进行一个局部的搜索,无论训练与收敛速度都快很多。此模型的训练步骤如下: (1)把交通流数据进行归一化到0,1之间,那么输入向量X便可以表示为: 式中:Xti表示为第i条道路在第t时间的归一化后的数据。初始化训练次数、学习速率。 (2)把向量X作为输入,通过CD过程训练第一层的GBRBM。 (3)把GBRBM的输出作为上层的RBM的输入,训练RBM。 (4)把RBM的输出作为上层的RBM的输入,训练RBM。 (5)重复执行第(4)步直到执行完给定的层数。 (6)最后一个RBM的输出作为顶层回归层的输入,随机初始化其参数。 (7)通过监督式BP方法微调这个架构的参数。最后通过训练得出的模型就可以作为预测模型,当给定一组输入向量后,便得到对应道路的预测输出。 3实验及结果分析 3.1实验数据描述 实验使用的交通流数据英国官方交通流数据中心。数据集提供了每隔15min的交通平均路途消耗时间、速度与交通流量,并且数据覆盖了英格兰地区的高速公路与A级道路(即城市主干道)。实验选取了英格兰的纽卡斯尔市与森德兰市之间的5条主要城市道路AL1065,AL1596,AL566,AL543,LM69。选取其中xx年9月份的数据,共有30天数据。其中前29天的数据用以训练模型,后1天的数据用以测试。 3.2性能指标 两个最常见的性能指标参数为:绝对平均误差(MAE)和相对平均误差(MRE),定义如下: 式中:Zi为实际的交通流数值;Z?i为预测值。在这里选择了MAE与MRE作为衡量标准。 3.3架构实现 在深度体系架构中,需要决定其输入层的大小,隐藏层的层数,隐藏层每一层的节点个数。在此选择AL1065,AL1596,AL566,AL543,LM69中前两个时间段的交通流量作为输入,即共10个输入,道路LM69作为其预测输出。其中隐藏层分别为浅层的结构10,10,4与深层的结构10,12,10,8,6,4,通过训练以后对道路LM69第30天做预测的结果如图2所示。 图2中横坐标表示的为第i个15min,纵坐标表示交通流量。从图可以看出深层结构预测的结果更加接近于真实值。 3.4结果对比与分析 实验程序在Windows7上开发完成,硬件条件为Intel?CoreTMi7?4710MQ,4GB内存,显卡NVIDIAGe?force840MHz。每次运算时间基本在30min以上,大多数1h内能完成。 实验中对DBN的BP过程调优次数epochs做了调整测试,结果发现大于某个数量时,DBN预测结果对于次数调整并没有大的影响。这也印证了DBN在预训练阶段参数的调整已经近乎较优的判断。 为了衡量深度架构的性能,同时也采用传统的MLP神经网络做了BP算法训练进行预测,并做了对比;结果发现,当训练层数增加时,BP算法的预测结果准确性反而降低了。这也说明传统的BP算法并不适应于深度架构。实验中MLP采用的是4,4,5浅层架构。 从图3可以看出,DBN架构相对于传统的MLP神经网络来说,无论在交通流的最高峰时期还是最低交通流量时,所预测得到的结果都更加准确。 MLP与DBN的性能指标对比如表1所示。 从以上数据可以看出,深度学习架构随着层次越深相对平均误差也越少,并且相对于传统的MLP网络有大幅度的预测准确性提升。 4总结 本文第一次将深度学习架构应用于城市主干道的交通流预测中。相对于城市的高速公路,城市主干道交通具有更大的不确定性与多变性。进而给预测带来的挑战也更大。同时,模型也成功地通过深度学习发现了交通道路之间潜在的特征,如时间、空间上等的非线性关系。 在此首先建立了深度体系架构,通过逐层非监督式的预训练挖掘潜在特征,并利用回归层实现全局微调参数,进一步优化了预测结果。然后,对比了DBN与MLP,实验表明,DBN所获得的准确率要大大强于MLP模型。 本文提出的模型仍可以进一步改善,如顶层换为SVM等其他预测模型,模型的应用场景可以推广到整个城市的交通流预测等。 参考文献 1邵春福,熊志华,姚智胜.道路网短时交通需求预测理论、方法与应用M.北京:清华大学出版社,xx. 2HUANGWenhao,SONGGuojie,XIEKunqing.Deeparchitec?turefortrafficflowprediction:deepbeliefworkswithmulti?tasklearningJ.IEEETransactionsonIntelligentTransporta?tionSystems,xx,15(5):2191?2201. 3AHMEDSA,COOKAR.Analysisoffreewaytraffictime?se?riesdatabyusingBox?JenkinstechniquesJ.TransportationResearchRecord,1979,722:214?221. 4LEES,FAMBRODB.Applicationofsubsetautoregressiveinte?gratedmovingaveragemodelforshort?termfreewaytrafficvolumeforecastingJ.TransportationResearchRecord,1999,1678:179?188. 5WILLIAMSBM.Multivariatevehiculartrafficflowprediction?evaluationofARIMAXmodelingJ.TransportationResearchRecord,xx,1776:194?200. 6KAMARIANAKISY,PRASTACOSP.Forecastingtrafficflowconditionsinanurbanwork?parisonofmultivariateandunivariateapproachesJ.TransportationResearchRecord,xx,1857:74?84. 7WILLIAMSBM,HOELLA.Modelingandforecastingvehicu?lartrafficflowasaseasonalARIMAprocess:TheoreticalbasisandempiricalresultsJ.JournalofTransportationEngineering,xx,129(6):664?672. 8YANGF,YINZZ,LIUH,etal.Onlinerecursivealgorithmforshort?termtrafficpredictionJ.TransportationResearchRe?cord,xx,1879:1?5. 9SUNShiliang,ZHANGChangshui,YUGuoqiang.ABayesianworkapproachtotrafficflowforecastingJ.IEEETransac?tionsonIntelligentTransportationSystems,xx,7(1):124?132. 10ZARGARISA,SIABILSZ,ALAVIAH,etal.Aputa?tionalintelligence?basedapproachforshort?termtrafficflowpredictionJ.ExpertSystems,xx,29(2):124?132. 11DAVISGA,NIHANNL.Nonparametricregressionandshort?termfreewaytrafficforecastingJ.JournalofTransportationEngineering,1991,117(2):178?188. 12JEONGYS,BYONYJ,ME
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 心血管疾病防治课件
- 第六单元说课课件
- 竹纤维混凝土工程课件
- 端午节相关知识课件
- 出口付款协议书范本
- 拆墙承包协议书范本
- 宠物租赁协议书范本大全
- 工钱结款协议书范本大全
- 婚纱店重拍协议书范本
- 有偿救援协议书范本
- 金属与石材幕墙工程技术规范JGJ
- 世界母乳喂养周母乳喂养健康宣教课件
- 食品保质期公开课课件
- 客房服务员:高级客房服务员题库考点
- 临床静脉导管维护操作专家共识
- 《建筑结构检测与加固》课件 第1-3章 绪论、建筑结构的检测与鉴定、混凝土结构的加固
- 2023北京高三一模英语汇编:阅读理解A篇
- 中暑的院前急救和护理
- 《中国急性肾损伤临床实践指南(2023版)-》解读
- 农业机械自动化与智能控制技术
- 混凝土外加剂凝结时间-自做
评论
0/150
提交评论