城市道路交通状态判别方法研究_第1页
城市道路交通状态判别方法研究_第2页
城市道路交通状态判别方法研究_第3页
城市道路交通状态判别方法研究_第4页
城市道路交通状态判别方法研究_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、城市道路交通状态判别方法研究摘要随着社会经济的快速发展,道路车辆不断增多,道路交通需求增长迅速,道路交通状况正变得日益严峻。恶性交通事故及交通拥挤的迅速增加,不但严重威胁人民生命和财产的安全,也给道路交通的运行效率带来了严重影响。为了提高道路交通的安全性和运行效率,世界各国尤其是发达国家不断研究运用先进技术对道路交通运行状态进行监控,出现了各种以不同设备为手段的交通监控系统。而要充分利用这些先进的交通检测手段为城市交通服务就需要适合的交通状态判别方法。本文基于此目的,分析了国内外相关课题的研究现状,对交通流参数、道路交通状态分析及目前已有判别方法进行了研究。首先重点分析了经典的加州算法、McM

2、aster 算法、指数平滑法、标准偏差法,并对算法作出了比较分析;然后针对已有研究成果在城市道路交通状态判别上的不足,在已有研究成果基础上,以聚类分析为方法,建立利用定点检测线圈数据进行交通状态判别的方法,并通过实际案例分析证明了方法的有效性。本论文的研究成果可为交通管理者实时了解路网交通状态变化的信息,及时采取对策,疏导交通、减少拥挤,提高交通安全保障,使有限的路网时空资源发挥效率而提供帮助。关键词:智能交通系统;道路交通状态;交通状态判别;聚类分析;环形检测线圈数据;IDENTIFICATION METHOD FOR URBAN ROAD TRAFFIC CONDITIONSABSTRAC

3、T With the high-speed develop of social economic,number of vehicles on road increases faster than any recent time,and the traffic demand also rapidly grows,traffic condition is becoming more and more serious. The vicious traffic accidents and traffic congestion rapidly increases,which is not only a

4、serious threat to people's lives and property,but also brings a serious impact to the effciency of traffic system.In order to improve the safety and effciency of road traffic,the world,especially the developed countries continue to study how to use advanced technology to monitor road' state,

5、which facilitated a variety of different means and devices of traffic control system.To take full advantage of these advanced traffic detection means for urban transport services ,we need a method to discriminant the traffic state.For this purpose,this study analyzed some related topics of domestic

6、and abroad, Today,some researchs has already been done on the subject of traffic flow parament and traffic state.This study first analyzed the classic algorithm of California,McMaster algorithm, exponential smoothing algorithm and the standard deviation method,then comparamised these methods;based o

7、n the lack of judging urban traffic status that the existing researchs has, and make use of cluster analysis method, establishes the use of fixed-point detecting coil data traffic status discrimination method, and through actual case analysis to prove the validity of the method。 The result of this s

8、tudy gives a way to the traffic managers to know the informations of traffic net in any time and take measures to manage the traffic,reduce congestion,improve traffic safety,and offer aids to allow limited road sources can be used efficiently.Key Words: intelligent transportation systems;road traffi

9、c status; traffic status discrimination; cluster analysis; loop detector data目录1绪论11.1研究的背景、目的及意义11.2 国外研究进展21.3国内研究现状31.4各种算法优缺点比较51.5论文研究的主要内容62 城市道路交通状态分类、指标和交通参数研究72.1我国关于交通拥挤的量化定义72.2交通流参数82.3基本的交通参数的选取83基于聚类分析的交通状态判别方法103.1 研究方法的选择103.2 聚类分析方法介绍103.3 聚类分析算法的特征数据样本123.4 原始数据规约153.5 对丢失基础数据的处理15

10、4案例分析164.1 交通基础数据说明164.2 交通状态聚类分析结果164.2 判别结果175 总结与展望19参考文献20致谢22附录23附录A经处理后的交通基础数据表23附录B经处理后的交通基础数据表26附录C经处理后的交通基础数据表30附录D经处理后的交通基础数据表33附录E经处理后的交通基础数据表371绪论随着在智能交通管理系统的不断发展,出现了各种交通状态实时判别方法。大多的交通状态判别系统都包括数据获取,数据准备,数据比较,实时状态判断等。交通状态判别即是要实现将采集到的基础数据经过处理后与一个既定的交通状态判别标准进行比较,从而判别出定性交通状况,判别结果可作为交通管理者决策时的

11、参考依据。现实中,交通系统是一个随时间不断变化的时变系统,交通流的基本特征不仅每时每刻都在发生着量变,而且在一个相当长的时期内,不断积累的量变会带来整个交通系统交通流特征的质变,质变的发生意味着交通定性状态的改变。1.1研究的背景、目的及意义随着经济的高速发展和社会进步脚步的加快,城市人口剧增,汽车的数量增长越来越快,城市路网的通行能力已经无法满足日益增长的交通需求,交通拥挤和堵塞现象变得越来越严重,交通事故,交通污染,能源消耗等各种引发出来的问题已经俨然成为世界各国特别是发达国家所面临和必须解决的重大问题,智能交通系统(ITS,Intelligent Transportation Syste

12、m)通过对传统的变革,提升交通系统的信息化、智能化、集成化和网络化,保障人、车、路与环境之间的相互交流,进而提高交通系统的效率、安全性、机动性、经济性、可达性达到保护环境,降低能耗的作用,ITS已经成为国际上公认解决上述交通问题的根本途径,越来越受到国内外政府、专家、学者等的重视和广泛应用。 在智能交通系统中,各种交通判别算法通常都是用来对道路环境中的实时交通状态判别,通过这些算法,可以通过对道路基础信息采集系统采集到的交通数据进行分析,通过一定数学方法处理,根据变化的趋势得到目前交通系统的运行情况,系统将得到的基础数据经过一定处理后与一个既定的交通状态判别标准进行比较,从而能够判别目前交通系

13、统处于何种状态,即实现对实时获得的交通监控数据进行处理,得到交通状态定性判别结果。当这个判别结果提供到交通系统管理者和决策者手中时,他们就可以针对不同情况制定相应的交通控制、管理和诱导措施。本文的研究目的即是要在已有研究的基础上,提出可利用定点检测线圈数据实现城市道路交通定性状态判别的方法。1.2 国外研究进展Thancanamootoo 和 Bell(1988)研究了一种用于城市主干道交通事件检测的算法,这种算法采用的指标是占有率参数。在这种算法中,使用指数平滑方法来估计每个信号周期内单个车道上下游位置占有率的预测值,然后将其与阈值比较来确定下游事件的发生。后来,Bretherton 和 B

14、owen(1991)依托MONOICA(Monitoring Incidents and Congestion Automatically,MONICA)项目,在 Bell 算法的基础上,设计了一个改进算法。这种算法使用流量和占有率数据作为事件检测的指标值。由于交通流量在路段上的不守恒性,导致 ACI算法的效果并不是很理想1。Ivan et al.(1993-1997)使用人工神经网络技术和数据融合技术处理来自固定检测器、移动检测器和人工报告三种数据源的数据来确定事件的发生。固定检测器算法处理 5 分钟和 7 分钟时间间隔内的平均占有率和平均流量数据,然后将当前值与历史值进行比较,最后利用判别

15、函数确定每个检测区内的交通状态;移动检测器算法利用探测车来报告路段行程时间,计算行程时间比率和速度比率,最后仍利用判别函数确定事件是否发生;人工报告利用现场对事件的定性描述来提供影响交通流运行的某些事件信息。结果表明,虽然 7 分钟作为数据采样的时间间隔可以很好地减少交通参数受信号的周期性影响,算法得到了较好的效果,但却存在算法检测事件所需时间过长的问题2,3,4。Khan and Ritchie (1998)提出了模块化的神经网络结构,该结构将复杂的任务分解成几个子模型,其中每个子模型就是一个神经网络,通常为一个多层前馈神经网络(Multi-Layer feedforward Percept

16、ron,MLP)网络。每个子模型完成一项子任务,他们独立完成自己的训练过程和任务;子模型的匹配通过误差函数在模型之间进行竞争,每个子模型和整个网络有相同的输入和输出,最后的输出 Y 是各个 y 的线性加权。在这个网络的训练中,如果有一个网络训练出了最好的结果,则将这个网络的权重立即增大到 1,其他网络的权重立即减少到 0,用这样的方法选择合适的子模型。最后利用来自加州和洛杉矶两个城市主干道的实测数据和模拟数据对基于 MLP 的多模型算法、基于 MLP 的单模型算法、模式分析算法、贝叶斯算法进行比较分析,得出基于 MLP 的多模型算法效果要好于其他的算法。这个方法的优点是在现实世界中某种数据源数

17、据缺乏的情况下,方法仍旧是适用的。但是这个模型使用 15 分钟间隔数据进行测试的,测试结果表明平均检测时间最好可达 1.63 个信号周期长度,对于实时的事件检测而言,这个算法的检测时间太长5。Luk 和 Chung(2001)指出,高速公路交通流通常比较稳定,在发生交通事件时交通流会发生较大的变化,而这种变化一般能被检测器检测到并及时送到交通控制中心。而城市道路交通流比较复杂,因此文章对城市主干路与高速公路发生事件前后交通流的变化特性进行了研究,提出了一种条件概率算法用于判别城市主干路上交通事件的发生。最后通过验证得出,检测器位于事件发生地点上游位置比检测器位于事件发生地点下游位置更容易检测到

18、事件的发生,其中占有率和速度最能反映交通状态的变化6。Fang Yuan 和 Ruey Long Cheu(2003)将支持向量机(SVM)技术应用到交通事件检测中,分别运用主干路网的模拟数据和加利福尼亚的 I-880 高速公路实测数据进行测试,并与多层前反馈神经网络测试结果比较7。Y. Li 和 M.McDonald(2004)提出一种基于浮动车的高速公路交通事件检测算法,该算法基于平均行程时间和相邻两时段平均行程时间差双变量分析模型而设计,模型建立的前提是当道路上发生交通事件时,其交通容量的改变所引发的路段行程时间急剧增加幅度要比正常交通需求情况下路段行程时间大许多。该算法的研究对象为高速

19、公路,对城市道路的研究可以借鉴该思想8。Yaser(2006)根据城市道路交通流的特点,提出在城市道路中交通流的动态不确定性(即为模糊性)更强,更适合用模糊数学法进行交通状态的判别。因此文章综合考虑了城市道路的几何因素和交通因素,采用模拟数据和模糊逻辑法,进行交通事件的判别。该方法消除了传统算法由于采用阈值而引起的临界决策问题,但是确定各个模糊集的隶属函数是一项至关重要的工作,隶属函数合适与否,直接影响到检测率和误报率9。1.3国内研究现状目前,对于城市道路交通状态判别算法的研究,国内还处于对国外研究思路和方法的介绍、研究、验证阶段。从20世纪70年代早期,关于道路实时交通状态判别算法的研究逐

20、渐开展起来,截至目前,各个领域的专家学者对这些研究都表示了浓厚的兴趣。这些算法的研究包括比较算法、时间序列分析法、Mc-Master算法、人工智能方法、Macroscopic算法、参数标定方法等。在比较算法中,交通状态的判别是根据比较一对交通流状态数据得出的,这一对交通流状态数据可能是基础的占有率数据,它们分别来自上下游路段相邻的一组检测器。时间序列建模技术应用到交通状态自动判别中标志着时间序列分析算法的诞生,郭恒明(2001)根据城市道路交通流是间断流、交通流的波动性较大的特点,为了提高检测精度、降低误报率、缩短检测时间,要求在城市道路路段上、下游交叉口停车线附近及路段中间按一定间距分别布设

21、环形线圈检测器,据此设计了交通异常累计占有率检测算法来判别城市道路上发生的交通异常。该方法指出如果该路段上所有相邻两检测器的累积占有率差的和超过一定的阈值,表明该路段发生了交通异常。但是该算法中阈值的选择关系到该算法的效果,同时该方法没有对检测器的布设间距进行研究10。周伟、罗石贵(2001)提出了一种基于模糊综合识别的交通事件检测算法,确定了流量、速度、上下游占有率各模糊集的隶属函数,并运用实际数据进行验证,该算法既可以检测拥挤,还能够确定拥挤成因11。杨兆升等(2003)对传统不确定性推理融合算法进行了比较,提出应用模糊综合决策模型来进行多目标多传感器的信息融合,以解决交通事件中多传感器的

22、交通事件识别问题,具有信息损失少、计算量少、实用性强等特点12。戴红(2005)将模糊模式识别方法应用于城市主干道的交通状态判别上,使用速度、占有率、信号交叉口平均每车停车延误 3 个交通参数进行多因素模糊模式识别评判交通状态,同时将交通状态分为畅通、正常、拥挤、堵塞四个等级13;但是如何确定隶属函数仍是在进行交通状态判别时面临的一个难点。皮晓亮、杨晓光等(2006)结合数据预备技术、交通工程技术对环形线圈采集的一个月的历史交通流数据(流量,速度,占有率)进行融合挖掘,最后给出畅通流、稳定流、拥挤流、堵塞流四种交通状态下的聚类矩阵,其中的每一列即代表每种交通状态的划分标准14;该文中没有明确指

23、出检测器的位置,只是确定了交通状态的划分标准,并没有利用该标准进行道路交通状态的判别,这种交通状态标准的确定方法的有效性有待于进一步的研究。姜桂艳等人(2006)为了从海量动态交通数据中快速识别路网中存在的交通拥挤,通过分析拥挤的特征模式和各种数据挖掘技术的特点后,设计了一种适用于城市道路的交通拥挤自动识别方法;该方法将占有率、速度和流量三个基础交通流参数进行组合得到新的特征变量作为多层前馈神经网络模型的输入向量,将交通拥挤指数(0,1)作为输出向量,最后用实测数据和模拟数据分别对基于不同阈值的神经网络算法进行了验证,拥挤识别率都在 85%以上,拥挤误识率在 2%以上15;然而对拥挤产生的原因

24、仍需要人工观察交通参数的变化才能获得。庄斌等(2006)针对中国城市道路中存在的交通拥挤现象,通过对城市道路路段上环形线圈采集到的交通流量和占有率数据进行对比性分析和统计推导,提出了交通拥挤现象出现与消散过程的相对增量判别准则。该准则指出,当流量的相对增量大于占有率相对增量时,车流趋于消散;当流量的相对增量小于占有率相对增量时,车流趋于拥挤。当然该准则成立的必要条件是车流在正常运行状态下,流量的相对增量等于占有率相对增量16,但是在该判别算法中要求在一个路段的上游和下游分别安有环形线圈检测器。肖永来(2006)针对现有城市道路中的信号控制系统主要以 SCATS(Sydney Co-ordina

25、ted Adaptive Traffic System,SCATS)为主,提出了基于路段车流密度、上游交叉口的平均占有率和下游交叉口的关键绿灯相位饱和度为指标的交通状态判别方法;由于基于 SCATS 系统的固定交通检测器都不能直接提供这些参数,因此需要根据相应的公式标定,其中涉及到的交通参数较多,有可能出现较大的误差,且此论文只是提供了一个判别的思路并没有对该方法进行实例验证17。路加(2003)通过绘制速度(V)-地理位置(D)坐标图来体现不同地点的速度变化信息,并通过速度的变化判断交通拥挤的性质;常发性交通拥挤最显著的特点是车流速度变化缓慢;偶发性交通拥挤最显著的特点是由于事故等随机因素的

26、影响,在城市道路某一个地点发生交通瓶颈后,上游车辆难以畅通通过,造成排队现象,在 V-D 坐标图中表现为事故以左的区域车辆行驶速度很低,而且车辆密度很大;而通过此瓶颈后车辆速度大幅提高,车流密度明显降低,在 D-V 坐标图中表现为在事故以右的区域,车辆速度大幅提升,同时车辆密度要比事故以左的区域小得多;最后利用道路上的流量比和行驶效率两个指标,利用模糊推理系统对拥挤度进行计算18。姜桂艳(2004)提出在能够可靠地获得交通流平均行程时间(平均行程速度)数据的情况下,通过将其与阈值(预测值)进行比较,以实现对道路拥挤或非拥挤交通状态的判别,同时还能对常发性拥挤和偶发性拥挤进行区分19。但是该方法

27、只适用于区分拥挤或非拥挤两种交通状态,如果将交通状态进行更细致的划分,该方法就需要进行改进;同时该方法中阈值的确定关系到交通状态判别结果的可靠性,也是该方法的一个难点。1.4各种算法优缺点比较各种算法优缺点比较见表1-1。表1-1 各种ACI算法优缺点比较判别算法 优缺点 加 州算 法基本算法该算法已经应用,收到良好效果,此算法的不足之处是不能鉴别拥挤的性质,且误报率较高。加州#7算法加州#8算法综合算法改进的 McMaster 算法该算法既能判别拥挤的发生,也能判别拥挤发生的原因,但要想准确地确定三条临界曲线比较困难,可能会出现比较大的误报。指数平滑法该算法使用简便,但单个采样周期内可能出现

28、高频噪声,出现很高的误报;通过调整平滑系数以达到良好效果比较困难。正态偏差法该算法使用也比较简便,但看不出交通变量的变化趋势,误差很大。DS-ANN 算法检测率、误报率和平均检测时间方面均比较理想,但训练数据对真实的历史数据依赖性强,算法的可移植性较差,已训练好的神经网络的结构对不同的地点可能不实用。基于移动检测器的判别算法能够获得路网状态信息,技术扩展性较好,是目前研究方向的主流。1.5论文研究的主要内容各章的具体内容如下:第一章:对以往研究成果进行归纳总结,对已有判别方法的优缺点进行比较,明确论文进一步研究的方向和内容;第二章:城市道路交通状态分类与指标研究。提出以道路固定检测线圈数据为基

29、础,适用于城市道路交通状态表征的分类方法和指标。第三章:交通状态自动判别方法研究。主要设计基于聚类分析方法的交通状态判别方法,给出计算步骤与流程图。第四章:以交通管理部门采集的固定线圈检测数据为例,证明聚类分析方法的可行性和有效性;第五章:对全文进行总结及展望。本章小结:本章主要是阐述了该课题的研究背景、目的和意义以及总结国内外在交通状态判别方面的已有研究成果,同时对以往的算法进行比较分析,引出论文的主要研究内容和方向。2 城市道路交通状态分类、指标和交通参数研究2.1我国关于交通拥挤的量化定义根据我国公安部2002年公布的相关标准,目前我国相关交通管理部门对城市道路交通状态的量化定义主要运用

30、主干道上的机动车平均速度大小来描述其拥挤程度20具体定义如下:(l)畅通:城市主干道上机动车的平均速度不低于30km/h;(2)轻度拥挤:城市主干道上机动车的飞卜均形成速度低于30km/h,但高于2Okm/h:(3)拥挤:城市主干道上机动车的平均行程速度低于20km/h,但高于10km/h;(4)严重拥挤:城市主干道上机动车的平均行程速度低于10km/h。公安部关于交通拥挤的定量描述具有较高的可操作性,可直接用于道路交通状态的判别。但是在实际应用中还需要解决两个问题:第一,给出其它道路类型的量化定义;第二,能够直接得到或者可以估计得到路段上的平均行程速度或平均行程时间。根据北京城市道路交通的实

31、际运行状况,市交管局目前在判别交通状态的时候主要依据平均速度或者流量,把交通状态区分为畅通、车流量大和交通拥堵三个级别,具体的量化标准如下:(l)畅通:快速路和联络线平均速度高于50km/h,有信号灯的主干道平均交通速度大于20km/h;或者快速路的断面检测周期内(每两分钟)流量小于 180veh,主干道断面流量小于 50veh;(2)车流量大:城市快速路和联络线上机动车的平均行程速度高于20 km/h,但低于50 km/h,主干道的平均速度高于10 km/h,但低于20 km/h;快速路和联络线检测周期内断面交通流量大于 180veh小于 250veh,主干道检测周期内断面交通流量大于 50

32、veh小于 100veh;(3)拥挤:城市快速路和联络线上机动车的平均行程速度低于20 km/h,主干道的平均速度低于10km/h;快速路和联络线周期内断面交通流量大于250veh,主干道检测周期内断面交通流量大于100veh。本文为了研究的效果能更直观,对交通状态划分为两类:畅通交通流、拥挤交通流。2.2交通流参数以及相互关系在道路上通行的大量行人和车辆在整体上具有类似流体的特点和特性,在交通工程中把在道路上通行的人流和车流统称为交通流(Traffic Stream 或 Traffic Flow)。一般在交通工程学中讨论的交通流主要指车流22是整体的、宏观的概念,通过对大量观测数据的分析,发

33、现交通流具有一定的特征性倾向,为此提出了交通流特性的概念。交通流特性是指交通流运行状态的定性、定量特征。用来描述和反映交通流特性的物理量称为交通流参数。用于描述交通状态的交通流参数分为宏观参数和微观参数。其中,宏观参数用于描述交通流作为一个整体表现出来的运行状态特性,主要包括交通量、速度、交通密度、占有率、排队长度;微观参数用于描述交通流中彼此相关的车辆之间的运行状态特性,包括车头时距和车头间距。道路交通状态指标体系应该以各种交通参数为基础,因此,这里对各种常用的交通参数进行简要介绍。交通量:是指单位时间内,通过道路某一地点或某一断面的实际交通参与者(含车辆、行人、自行车等)的数量,又称交通流

34、量或流量。如果不加说明,通常是指单位时间内通过道路某一地点或某一断面往来两个方向车辆数,也称为交通流量。车头间距:在同向行驶的一列车队中,两连续车辆车头间的距离。行程车速:是车辆行驶路程与通过该路程所需的总时间(包括停车时间)之比。地点车速:是车辆通过某一地点时的瞬时车速,因此观测时距离取值应尽可能短,通常以2025 m为宜,用作道路设计、交通管制和规划资料。交通密度:指在单位长度车道上,某一瞬时所存在的车辆数,一般用“辆/km/车道”表示。排队长度:交叉口等候排队车辆占有的路段长度。占有率:定义为车辆占有长度总和与路段长度的比值,在一条已知的路段上,采用直接的方法来测量车辆长度的总和是行不通

35、的。但是可以通过时间量测来计算该值。其公式为:occupy= (2-1)式中:occupy为占有率,ti为第i个时间间隔,车辆停留在检测器上的平均时间;T为观测总时间。2.3交通参数关系图图2-1 流量-占有率关系图图2-2 速度-占有率关系图图2-3 速度-流量关系图2.4基本的交通参数的选取根据姜桂艳等人对交通状态判别时所采用的交通参数选取调查可以得到表2-1结果23。此调查的对象主要是交通管理者、交通研究者、交通规划者、交通出行者,按照这个调查群体来说,此次问卷调查已经很好的覆盖了城市交通系统中包括研究、规划、管理、出行在内的各方参与者。全面的调查对象所得出的结果也因此具备很好的代表性和

36、普遍性。在进行实时交通状态判别取交通参数的有很多决定因素,例如考虑到大家的熟悉程度,和目前设备能提供的数据,以及判别算法要求等,本节将根据上述选取原则,综合考虑实际调查使用情况,结合交通管理部门能够提供的数据和本文运用的聚类分析方法所需数据这些因素。 一般通过调查或者检测可以得到的基本的交通参数有车速、流量、占有率、延误、排队长度等。据这些参数在交通状态判别中的作用对交通出行的参与者进行实际问卷调查,可以很好的反映出大家对各个参数的认可和认知程度。表2-1交通参数使用情况调查交通参数正在使用的比例(%)推荐使用的比例(%)车速8975流量7560占有率7485服务水平1724延误34排队长度3

37、4排队持续时间33根据上表的调查结果可以看出,对于各类参与调查对象来说,车速是最能直观反映交通状态的指标,所以认可度也是所有指标里面最高的,其次,流量和占有率这两个交通基本参数也比其他参数中使用比例和推荐使用比例明显高。由于城市道路状况的随机性,每个城市道路的交通状况和流量都有差异,结合本文所研究的方法和上文和表中调查所得结论,本文采取的研究指标是:流量,速度和占有率。本章小结:本章主要是城市道路交通状态分类、指标交通参数的研究,同时对利用通过本章的学习了解,明确各个指标的分类和定义,为下一章聚类分析方法所需指标做准备。3基于聚类分析的交通状态判别方法3.1 研究方法的选择第一章介绍各种算法的

38、历史进程,在这里不做赘述,将经典的ACI算法判别准确率,误判率等进行比较23。表3-1经典ACI算法的性能对比判别算法判别率(%)误判率(%) 加 州算 法基本算法821.73加州#7算法670.134加州#8算法680.177综合算法860.05改进的 McMaster 算法680.0018指数平滑法921.87正态偏差法921.3DS-ANN 算法930.0012从上表可以看出,加州算法系列中,综合算法的效果最好,但是判别率也不太高,改进的McMaster:算法误判率很低,但判别率也偏低,指数平滑法和正态偏差法的判别率较高,但其误判率也很,而DS-ANN 算法虽然判别率高,误判率低但是并不

39、适用于所以道路样本。但是从总体上看,这些经典的ACI算法的判别效果还是比较有限,最高的拥挤判别率也只有92%,但是其对应的误判率却达到了 1.3%;最低误判率的McMaster;算法判别率却又只有68%,这对于目前交通管理的现代化要求还是不够完善。因此,设计出具有较高判别率、同时误判率又较低的新算法对于交通管理和现代化的城市发展都是非常必要的,而聚类分析方法具有如下特点:(1)综合性:聚类分析可以利用多个变量的信息对样本进行分类,克服单一指标分类的弊端。(2)形象性:聚类分析可以利用聚类图直观地表现其分类形态,及类与类之间的内在关系。(3)伸缩性:对聚类复杂类型数据有效。(4)客观性:聚类分析

40、结果克服主观因素,比传统分类方法更客观、细致、全面和合理24,25,综合上面聚类分析方法的特点,本文将运用聚类分析方法来判别交通状态。3.2 聚类分析方法介绍聚类分析方法是适合于对交通状态数据分类的一种数据挖掘方法。基于聚类分析的交通状态量化方法是以交通检测器所采集道路上交通流的基础数据为基础, ,运用交通工程理论和数据挖掘等技术, 在对数据进行修复和处理后,对他们进行聚类分析,根据同种交通状态交通状态判别指标(流量,速度,占有率)的相似性和不同状态之间的相异性,得到适合不同道路的合理交通状态分类。KMeans Cluster聚类分析方法对于大规模数据集的应用占有优势。它包括硬K均值算法(Hc

41、m)和模糊K均值算法(Fcm)。其中Hcm算法是Fcm算法的一个特例。Fcm目标函数为:(U, V)=xi-vi2 (3-1)其约束条件为:cj1ni1式中:n环形线圈检测器采集的交通信息集经过数据规约后得到三个特征(流量,速度,占有率)的样本个数;c聚类中心数,即为两种(畅通交通流、拥挤交通流);uij矩阵的第i行第j列,代表第j个样本对第I个聚类中心的隶属程度;V=v1,v2聚类中心矩阵,代表两种交通状态;xi-vi第j组数据对于第i类聚类中心的距离;m模糊指数,目的是加强xi属于各类的从属程度的对比度。Fcm算法的基本步骤为:(1)随机选择一个两个类的初始划分矩阵U,它可以是硬划分,也可

42、以是软划分。然后计算这二个类的重心。(2)通过把样本分配给与其重心距离最近的类生成一个新的分区。(3)用类的重心来计算新类的中心距离。(4)重复步骤2和步骤3直到求出目标函数的最优解。图3-1为聚类分析方法对交通状态判别的流程图:图3-1 聚类分析方法对交通状态判别的流程图3.3 聚类分析算法的特征数据样本聚类分析法的特征数据样本,分别见图3-2、图3-3、图3-4、图3-5所示:图3-2显示的是堵塞交通流特征数据,从中可以看出在此交通状态下流量偏中,速度较小,占有率较高,图3-3显示的是畅通交通流特征数据,从中可以看出在此交通状态下流量较小,速度较高,占有率很低,图3-4显示的是拥堵交通流特

43、征数据,从中可以看出在此交通状态下流量较大,速度偏中,占有率较高,图3-5显示的是稳定交通流特征数据,从中可以看出在此交通状态下流量偏中,速度较高,占有率偏中。图3-2 堵塞交通流数据样本示意图图3-3 畅通交通流数据样本示意图图3-4 拥挤交通流数据样本示意图图3-5 稳定交通流数据样本示意图图3-6 速度、流量和占有率三围关系图根据图3-6与图3-2、图3-3、图3-4、图3-5对比可知,本论文采用的数据样本涵盖了交通流状态的所有特征。根据本文所采用的数据样本,对时间和速度两个变量做成二维图如下:3-7速度随时间推移二维关系图从上图可以看出,根据公安部02年对交通状态的判别文件,本论文所采

44、用的数据样本拥有公安部所有的判别状态分类。3.4 原始数据规约通常许多大型数据集存在数据高维度引起的数据超负问题,这种问题如果得不到适当得数据维度规约,会使数据挖掘方法不适用或难以得出理想结果。因此通过数据维度规约的工作,预处理的数据集的3个主要维度通常以平面文件的形式出现,即列(特征),行(样本)和特征的值。环形线圈检测器采集的交通信息原始数据集恰好符合数据挖掘预处理数据集的3个主要维度。3.5 对丢失基础数据的处理对于环形线圈检测器实时采集的交通数据,一般情况下能够使完整数据案例可能性比较小。可能由于由于环形线圈检测器有时非正常工作状态、通讯的网络障碍等等原因情况下,都会导致数据丢失的情况

45、。而本文中的所用的数据挖掘方法对数据丢失处理采用去除所有丢失样本,因为所得交通基础数据容量大,所以缺少少量的样本不会对算法产生影响。本章小结:在本章中,介绍了聚类分析方法的原理,设计了聚类分析进行交通状态判别的计算步骤与流程图。4案例分析4.1 交通基础数据说明数据来源:本论文采用的五组数据都是交通管理部门通过固定检测线圈采取的交通基础数据。数据格式:包括不同天6:00-19:00的流量、占有率、速度数据。详见附录A,B,C,D,E。4.2 交通状态聚类分析结果由于选择1min或2min为数据周期时,车流量数值范围波动较大,过大的随机性和不确定性不适合对交通流进行连续分析,因此选用5min为数

46、据周期进行分析。根据连续五天道路线圈检测得到的数据,通过SPSS软件对交通管理部门提供的数据A,B,C,D,E进行聚类分析,得到以下五组聚类结果,分别如表1,表2,,表3,表4,、,表5所示。对以下五个表格所提供的信息进行分析,可以得到交通状态判别指标标准,以便于交通管理部门决策者对道路交通状态进行实时监控从而有效管理交通运行。均值聚类分析结果如下表格:表1 附录A聚类分析结果最终聚类中心12流量306437速度58.7542.14占有率7.9720.88根据速度、流量和占有率数据分析得知,聚类1为畅通交通流,聚类2为拥挤交通流。表2 附录B聚类分析结果最终聚类中心12流量370.602150

47、537634234.270833333333速度64.248667156217占有率8.770340501792根据速度、流量和占有率数据分析得知,聚类1和聚类2都为畅通交通流,参照图3-7可以得知,该时间段速度数据不存在拥挤交通状态,同时也验证了方法的可行性。表3 附录C聚类分析结果最终聚类中心12流量173345速度61.9800468983859.47771954866占有率3.9381944444447.990740740741根据速度、流量和占有率数据分析得知,聚类1和聚类2都为畅通交通流,参照图3-7可以得知,该时间段速度数据不存在拥挤交通状态,同时也验证了方法的可行性。表4 附录

48、D聚类分析结果最终聚类中心12流量302445速度58.94306763608235.352111053654占有率7.26774376417225.259291187739根据速度、流量和占有率数据分析得知,聚类1为畅通交通流,聚类2为拥挤交通流。表5 附录E聚类分析结果最终聚类中心12流量414.864077669903281.641509433962速度42.77992135390759.598781151013占有率20.107.59根据速度、流量和占有率数据分析得知,聚类1为拥挤交通流,聚类2为畅通交通流。系统聚类分析结果:系统聚类分析汇总表案例群集案例群集案例群集案例群集案例群集0

49、6:00106:00106:00106:00106:00106:05106:05106:05106:05106:05106:10106:10106:10106:10106:10106:15106:15106:15106:15106:15106:20106:20106:20106:20106:20106:25106:25106:25106:25106:25106:30106:30106:30106:30106:30106:35106:35106:35106:35106:35106:40106:40106:40106:40106:40106:45106:45106:45106:45106:4510

50、6:50106:50106:50106:50106:50106:55106:55106:55106:55106:55107:00107:00107:00107:00107:00107:05107:05107:05107:05107:05107:10107:10107:10107:10107:10107:15207:15107:15107:15107:15107:20207:20107:20107:20207:20207:25207:25107:25107:25207:25207:30207:30107:30107:30207:30207:35207:35207:35107:35207:3520

51、7:40207:40107:40107:40207:40207:45207:45207:45107:45207:45207:50207:50207:50107:50207:50207:55207:55207:55107:55207:55208:00208:00208:00108:00208:00208:05208:05208:05108:05208:05108:10208:10208:10108:10208:10108:15208:15208:15108:15208:15108:20208:20208:20108:20208:20208:25208:25208:25108:25208:25208:30208:30208:30108:30208:30208:35208:35208:35108:35208:35208:40208:40208:40108:40208:40208:45108:45208:45108:45108:45208:50108:50208:50108:50208:50208:55108:55208:55108:55208:55209:00109:00209:00109:00209:00209:05109:05209:05109:05209:05209:10109:1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论