大数据环境下营运车辆驾驶行为特征分析_第1页
大数据环境下营运车辆驾驶行为特征分析_第2页
大数据环境下营运车辆驾驶行为特征分析_第3页
大数据环境下营运车辆驾驶行为特征分析_第4页
大数据环境下营运车辆驾驶行为特征分析_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据环境下营运车辆驾驶行为特征分析文江辉;杨先敏;吴超仲【摘要】通过大规模采集营运车辆驾驶行为信息,并对其驾驶行为特征进行定性、定量分析是有效遏制交通事故的前提.对采集的营运车辆驾驶行为数据进行预处理,包括清洗、筛选、分段等,提高了数据的质量.利用经纬度坐标转换后计算出的车辆行驶速度与车载速度加权的车速进行分析;并运用DBSCAN聚类和Spearman秩相关方法对不同车辆、不同时间段及不同天气状况下速度和加速度进行聚类和讨论相关系数,提取驾驶行为特征结果表明,驾驶员夜晚比白天行车速度波动大,需加强夜晚行车的安全监控,且聚类方法可用于判定车辆驾驶的稳定性程度,有助于道路交通中心对车辆安全状态的判断和避免交通事故发生;对于经验丰富的营运车辆驾驶员,天气对驾驶的影响相对较弱.【期刊名称】《交通信息与安全》【年(卷),期】2018(036)004【总页数】9页(P42-50)【关键词】交通工程;驾驶行为特征;DBSCAN聚类方法;营运车辆;大数据挖掘【作者】文江辉;杨先敏;吴超仲【作者单位】武汉理工大学理学院武汉430070;武汉理工大学智能交通系统研究中心武汉430063;威斯康星大学麦迪逊分校土木与环境工程学院美国麦迪逊53715;武汉理工大学理学院武汉430070;武汉理工大学智能交通系统研究中心武汉430063【正文语种】中文【中图分类】U461;TP3080引言营运车辆具有载客(货)量大、行车时间长、行驶里程远和运营环境复杂等特点,易引发群死群伤的重特大交通事故。调查显示,每年营运车辆1次死亡10人以上的特大道路交通事故约占全国道路交通重大事故总数的90%以上。为了改善这种状况,科研工作者亟须深入探究营运车辆驾驶行为规律,为交管部门有针对性地对训驾驶员进行教育和培训工作提供理论基础。迄今为止,国内夕卜在营运车辆驾驶行为研究上已取得部分研究成果,主要集中在3个方面:①对营运车辆的运行速度研究,如Fitzsimmons等[1]发现营运车辆在Z形乡村道路行驶存在安全隐患,于是将车辆和环境变量作为解释变量,建立了线性混合效应模型,并预测沿道路曲线上营运车辆的横向位置和速度;Naveen等[2]利用分数分割有序响应模型研究速度曲线,并通过收集Montreal市每周70个主干道上的数据进行实证研究,结果发现街道特性、车道数、停车位、人行道等都会影响营运车辆的速度。②营运车辆驾驶行为的安全性评估,Eskandarian等[3]采用神经网络算法,研究发现在疲劳状况下营运车辆司机发生危险的风险要远高于小车司机;张凌超等[4]、贺宜等[5]分别对营运车辆驾驶适宜性进行了评价和对特殊环境下营运车辆的驾驶行为进行了安全评估。③营运车辆驾驶行为及相关影响因素的研究,钱宇彬等[6]建立夜间高速公路长途客车的油门踏板行程和车速的聚类指标体系,分析不同驾驶员的聚类特征,从而探讨驾驶时间和换班管理的方法;牛增良等[7]以大量重特大交通事故数据为基础,运用聚类方法讨论危险驾驶行为与对应的夕卜部影响因素相近的关联度;Li等[8]研究了酒精、其他药物或父母对美国青少年驾驶员的影响;Woolsev等[9-10]讨论了酒精和功能性饮料对高风险驾驶和驾驶行为的影响;Ramirez等[11]利用T检验等统计方法比较了Lowa州的乡村公路上农村和小镇生活的人之间驾驶行为的区别。近年来随着互联网和物联网技术的迅速发展,使得驾驶行为信息采集系统反馈的数据量极其丰富,导致对驾驶行为的分析需采用大数据的信息挖掘技术。其常用的方法主要有:分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等。其中,分类的高级技术又包括贝叶斯网络、神经网络、学习算法、支持向量机、频繁模式分类、及惰性学习法等;聚类可基于划分、层次、密度、网格等不同方法分组[12-13]。在营运车辆驾驶行为大数据的研究上,孙川等[14]利用车联网数据,基于因子分析找出了有较高驾驶风险驾驶员所具有的特征;田飞等[15]对比分析了晴/雨天条件下高速公路营运车辆行车速度特点。本文同样以此数据平台为研究基础,从数据的自身特征入手,选择适用性较强的大数据处理方法,直接提取营运车辆驾驶行为的一般规律。首先,对采集的营运车辆数据进行预处理。为了减少误差,将经纬度数据进行坐标转换,利用坐标转换后数据计算出车辆行驶速度;然后,将车载速度与计算得到的速度进行加权得到综合速度,并计算出加速度;最后,利用DBSCAN聚类和Spearman秩相关方法对速度和加速度进行聚类,提取驾驶行为特征。1营运车辆驾驶行为大数据的处理方法笔者所选取的实验数据源于江苏省某固定国道的营运车辆监控平台,数据类型包括:营运车辆的车牌号、每个时刻车辆对应的经纬度及车载速度、方向、总里程数和道路信息等。由于数据采集过程中车载设备故障或信号失灵等导致数据存在少量无效、缺失或错误等情形,故需在数据分析前对采集的数据进行清洗、筛选和复原等。1)剔除车载速度为0的数据,原因是笔者主要研究驾驶行为的特征,这些零数据非本文的主要研究对象。由于车载设备的记录的误差,可能存在2组数据的时间相同而对应的速度不同的情况,需剔除重复时间的后一组数据。从卡车监控平台提取营运车辆24h的数据发现:数据量偏大,不易直接分析驾驶行为特征,因此选取了2个特殊时间段:00:00—01:00和07:00—08:00进行研究。原因是通过观察采集的数据,发现这2个时间段为营运车辆分别在晚上和白天出行频率较高的时间段,数据信息较全面。并主要筛选了时间、经度、纬度、速度等信息。此外,采集的数据还存在数据缺失现象,即相邻2个时间点的数据间隔不为1s,采用数据分段的方法进行处理。经过上述处理后,尽管数据信息中有车载速度,且采集间隔为1s,精度相对来说较高,但由于车载设备等原因仍可能存在误差,因为车载速度和经纬度信息换算的车辆速度间虽然基本一致,但仍存在一定区别。为减少该误差,利用车载速度数据与利用经纬度转换得到的速度进行加权,得到最终的速度。首先将经度、纬度数据存为文本格式,再利用COORD转换工具对经纬度格式进行转换,经过坐标转换得到直角坐标数据后,通过位移公式计算车辆的速度。取权重为0.5,得到综合速度,并利用运动学公式计算加速度。在计算得到速度和加速度后,分析数据特点发现:由于营运车辆在驾驶中速度、加速度不断变动,且采集过程中数据间隔较短,因而具有数据量大、密度高的特点;同时车载设备等可能存在误差,会导致数据中存在噪声。综合数据的量大、密度高、有噪声等特点,故采用DBSACN(density-basedspatialclusteringofapplicationswithnoise)算法对数据进行了聚类。其主要思想为:将具有足够密度的区域划分为簇,并在具有噪声的空间数据库中发现任意形状的簇[16-17]。2基于DBSCAN聚类方法的驾驶行为特征结果与分析根据DBSCAN算法步骤进行编程,得到营运车辆在不同时间段速度与加速度聚类图。由于篇幅限制,本文仅以2辆营运车辆为例,主要选择00:00-01:00和07:00—08:00进行对比研究。图1~4分别为营运车辆1,2在不同日期下2个时间段的部分聚类图,图中数据为归一化后的结果,数值无单位。图1营运车辆1在00:00—01:00的速度、加速度聚类图Fig.1Clusteringimageofspeedandaccelerationforoperationvehicle1between00:00—01:00图2营运车辆1在07:00—08:00的速度、加速度聚类图Fig.2Clusteringimageofspeedandaccelerationforoperationvehicle1between07:00—08:00图3营运车辆2在00:00—01:00的速度、加速度聚类图Fig.3Clusteringimageofspeedandaccelerationforoperationvehicle2between00:00—01:00图4营运车辆2在07:00—08:00的速度、加速度聚类图Fig.4Clusteringimageofspeedandaccelerationforoperationvehicle2between07:00—08:00图1~4显示:同1位驾驶员在不同时刻的驾驶行为存在差异,而不同驾驶员的驾驶行为间也存在差异。这说明驾驶员个体间存在着组间差异,而对于单个驾驶员存在组内差异。对于交通安全部门而言,有效的评估驾驶员的单个驾驶行为及整体驾驶行为特征,提出有效的个人及整体的驾驶监管政策是非常有必要的。2.1同一驾驶员在不同时刻的驾驶行为分析对比图1和图2发现:速度变化与聚类分散程度相关,当速度较集中时,聚类也较集中。由此,在12:00—13:00车辆的速度相对分散,而在07:00—08:00较集中。这是由于在夜间行车时光照条件差,人的视线范围有限,对路况掌握较低,从而驾驶员需随时调整车速以确保行车安全;而在白天行车时人的视野较为广阔,在未发生交通拥堵前提下驾驶员可控制车速在较小范围内波动。从图3和图4可得出类似的结论。其次,可通过计算得出聚类图的聚类中心。以营运车辆1为例,表1为其在00:00—01:00的聚类中心,表2为在07:00—08:00的聚类中心。对比表1和表2,不同时刻的聚类中心个数大多数为1个,且2个时间段的速度中心速度均值分别为62.03m/s和76.36m/s,显然白天的平均运行速度高于晚上。而两者聚类中心的加速度均基本为0,由于加速度是表征单位时间内速度的变化量,结果表明加速度值较小,即单位时间内车辆的速度变化较小,因此此时对应的车速较稳定,如图5所示。对车辆2同样进行上述分析,发现:00:00—01:00的速度均值为57.80m/s,07:00—08:00的速度均值为61.39m/s,白天的平均行驶速度仍然比夜晚平均行驶速度高。最后,通过计算可以得到车辆加速度的最大值、最小值,以及极差,表3~4分别为00:00—01:00和07:00—08:00的计算结果。从表3可见,00:00—01:00的驾驶加速度的最大值在4-11m/s2波动,最小值在-14~-4m/s2波动;而07:00—08:00点驾驶加速度的最大值在4m/s2附近波动,最小值主要在-4m/s2附近波动。图6反映2个时间段的极差,可观察:总体上00:00—01:00的加速度极值比07:00—08:00的加速度极值大。由于加速度波动与车辆行驶的稳定性相关,说明00:00—01:00较07:00—08:00的车辆行驶的稳定性差。表1营运车辆1在00:00—01:00速度和加速度的聚类中心Tab.1Clusteringcenterofspeedandaccelerationforoperationvehicle1between00:00—01:00参数日期12月4日12月5日12月12日12月13日12月15日12月20日聚类中心(61.93,0.031)(57.12,0.054)(68.61,-0.025)(63.09,0.029)(77.35广0.010)(44.07,0.009)(92.65,-0.092)表2营运车辆1在07:00-08:00速度和加速度的聚类中心Tab.2Clusteringcenterofspeedandaccelerationforoperationvehicle1between07:00-08:00参数日期12月1日12月2日12月7日12月8日12月9日12月10日聚类中心(81.58,-0.010)(81.62,0.011)(69.40,0.003)(80.38,-0.001)(82.80,-0.028)(6.96,0.207)(73.75,0.025)参数日期12月13日12月16日12月17日12月21日12月22日12月23日聚类中心(77.89,0.067)(70.11,-6.438)(76.60,0.019)(15.80,0.102)(71.55,0.015)(76.30,0.014)(61.02,0.04)(75.96,0.021)图5营运车辆1在00:00—01:00和07:00—08:00的速度Fig.5Clusteringcenterimageofspeedforoperationvehicle1between00:00—01:00and07:00—08:00图6营运车辆1在00:00—01:00和07:00—08:00的聚类中心散点图加速度极差散点图Fig.6Imageofaccelerationextremumforoperationvehicle1between00:00—01:00and07:00—08:00综上所述,营运车辆在夜间行车与白天行车相比较,白天平均行驶速度较高,且行驶稳定性较好;尽管夜间平均行驶速度比白天低,但相差并不特别大,主要问题是其稳定性较差,速度差与加速度极差均较大。导致这一结论的原因可能主要表现在2个方面:①与文献[13]的分析一致,其认为〃营运车辆驾驶人长期在特殊环境中(如夜间)驾驶主观风险意识较低,另为节省时间、提高效益,会采取加塞、超速等冒险行为,导致车辆加速度的剧烈变化”;②夜间行车较困难,对车辆的操控能力下降。因此,可采用此方法类似分析不同时间段内驾驶行为特征,道路交通部门重点监管危险时间段的营运车辆。表3营运车辆1在00:00—01:00的加速度Tab.3Accelerationforoperationvehicle1between00:00—01:00m/s2参数日期12月4日12月5日12月12日12月13日12月15日12月20日最大值11.0396.0475.7318.3654.7364.611最小值-8.710-9.968-7.356-14.689-4.869-5.969极差19.74916.01513.08723.0549.60510.579表4营运车辆1在07:00—08:00的加速度最大、最小值和极差Tab.4Accelerationforoperationvehiclelbetween07:00—08:00m/s2参数日期12月1日12月2日12月7日12月8日12月9日12月10日最大值4.3845.0186.1364.3974.5564.494最小值-4.561-5.133-13.489-4.486-9.119-5.754极差8.94510.15119.6248.88313.67510.248参数日期12月13日12月16日12月17日12月21日12月22日12月23日最大值4.7954.0916.9254.5455.8884.768最小值-7.699-6.676-6.030-4.853-7.052-4.515极差12.49410.76712.9559.39812.9409.2832.2不同车辆在同一时间段的驾驶行为分析对比营运车辆1和2在00:00—01:00,07:00—08:00的平均行驶速度发现:车辆1的平均行驶速度均大于车辆2,这很大程度上由驾驶员对速度的偏好决定。图8表明车辆1的加速度极差整体小于车辆2,即车辆2的加速度波动较大,则车辆1的驾驶平稳性高于车辆2的驾驶平稳性。图707:00—08:002车速度聚类中心散点图Fig.7Clusteringcenterimageofspeedbetween07:00—08:00图807:00—08:002车加速度极差散点图Fig.8Imageofaccelerationextremumbetween07:00—08:00上述结果仅比较了2辆营运车辆的稳定性,实际上,此方法可被推广,类似分析不同营运车辆的驾驶稳定性。特别是营运车辆所属公司也可类似分析所辖驾驶员的个人驾驶行为特征,对具有危险驾驶行为的驾驶员进行培训或停职处理等。2.3不同车辆在不同天气状况下的驾驶行为分析同样利用DBSCAN聚类方法可得到不同车辆在不同时间段速度和加速度的聚类中心,根据车辆轨迹和行车时间可对应查询具体的天气状况,仍以车辆1为例,表5~6为车辆1在00:00—01:00和07:00—08:00的速度聚类中心、加速度极差与对应的天气表。本文运用Spearman秩相关分析方法讨论天气与驾驶速度间的相关性。首先根据天气情况由坏到好进行排序,而相同天气将位次求均值,则天气对应的位次即为其秩;速度则根据其大小进行排序,以其位次作为秩。表7、表8分别为车辆1在00:00—01:00和07:00—08:00的速度和天气对应的秩。表5营运车辆1在00:00—01:00的速度聚类中心、加速度极差与天气表Tab.5Clusteringcenterofspeedandaccelerationrangeforoperationvehicle1between00:00—01:00andweather参数日期12月4日12月5日12月12日12月13日12月15日12月20日速度聚类中心/(m/s)61.9357.1268.6163.0977.3544.07加速度极差/(m/s2)19.74916.01513.08723.0549.60510.579天气多云/小到中雨中到大雨/小到中雨阵雨/小雨小到中雨/中雨阴/阴多云/多云表6营运车辆1在07:00—08:00的速度聚类中心与天气表Tab.6Clusteringcenterofspeedandaccelerationrangeforoperationvehicle1between07:00—08:00andthecorrespondingweather参数日期12月1日12月2日12月7日12月8日12月9日12月10日速度聚类中心/(m/s)81.5881.6269.4080.3882.8073.75加速度极差/(m/s2)8.94510.15119.6248.88313.67510.248天气多云/小雨小雨/阴多云/晴多云/小雨中雨/小雨小雨/阴参数日期12月13日12月16日12月17日12月21日12月22日12月23日速度聚类中心/(m/s)77.8976.6071.5576.3061.0275.96加速度极差/(m/s2)12.49410.76712.9559.39812.9409.283天气小雨/阴多云/晴晴/晴多云/阴中雨/小到中雨中雨/小到中雨表7营运车辆1在00:00—01:00的速度和天气对应的秩Tab.7Speedofoperationvehicle1between00:00—01:00andthecorrespondingrank参数日期12月4日12月5日12月12日12月13日12月15日12月20日速度聚类中心的秩325461天气的秩41.541.546表8营运车辆1在07:00—08:00的速度和天气对应的秩Tab.8Speedofoperationvehicle1between07:00—08:00andthecorrespondingrank参数日期12月1日12月2日12月7日12月8日12月9日12月10日速度聚类中心的秩101129124天气的秩959925参数日期12月13日12月16日12月17日12月21日12月22日12月23日速度聚类中心的秩873615天气的秩5912922由Spearman秩相关系数的计算表达式为式中:a(r)为xi在{x1,x2,...,xn}中秩Ri的计分函数,即同理b(r^yi在{y1,y2,...,yn}中的秩Qi的计分函数。根据表7,计算车辆1在00:00—01:00时的速度与天气间Spearman秩相关系数rs=-0.1543,查表有P(rs>0.829)=0.05,因此,P(rs<-0.1543)>P(rs>0.829)=0.05,说明车辆1在00:00—01:00的速度大小与天气不相关。同理,车辆1在07:00—08:00的速度与天气间Spearman秩相关系数由于表示速度大小与天气情况在该种情况下仍不相关。车辆2在在即速度大小与天气情况也不相关。利用Spearman秩相关分析方法也可计算其他车辆在不同时间段的速度与天气的秩相关系数,并做检验,发现大多数情况下两者间均不相关。这一结论似乎与常识不太一致,但文献[14]中结论:中雨与大雨条件下的车速差别较小,与该结论部分吻合,说明对于经验相对丰富的营运车辆驾驶员而言,天气对驾驶的影响相对较弱。笔者在后面的研究中会进一步分析天气对驾龄短的驾驶员驾驶行为的影响状况。3结论1)高速公路上驾驶员夜晚比白天行车速度明显分散,波动较大,说明需加强夜晚行车的安全监控。2)DBSCAN聚类方法可用于判定车辆驾驶的稳定性程度,有助于道路交通中心对车辆安全状态的判断和避免交通事故发生。3)通过分析不同营运车辆在不同时间段的速度与天气的秩相关系数,发现对于经验丰富的营运车辆驾驶员,天气对驾驶的影响相对较弱。本文在研究中也存在一些缺陷,如在进行特征提取时,面对大数据问题采用了先分类再利用DBSCAN聚类方法进行分析,如何直接有效的提取大数据特征是笔者后续的研究方向和拟解决的问题。尽可能多且准确的挖掘数据信息、提取营运车辆驾驶行为特征,才能更有效的解决营运车辆重特大交通事故导致的人员伤亡和经济损失。此外,需要说明的是:尽管文中仅给出了2辆营运车辆在2个时间段的研究结果,但DBSCAN聚类方法具有普适性,可以通过数据处理得到不同车辆不同时间段的车速、加速度等聚类中心。但能否通过完成上述工作构建特征数据库,且扩展分析不同地域、不同道路的驾驶行为特征等,也是今后可研究的问题。参考文献References【相关文献】FITZSIMMONSE,KVAMV,SOULEYRETTER,etal.Determiningvehicleoperatingspeedandlateralpositionalonghorizontalcurvesusinglinearmixed-effectsmodels[J].TrafficInjuryPrevention.2013,14(3):309-321.NAVEENE,VINCENTC,MORGANC,etal.DelingvehicleoperatingspeedonurbanroadsinMontreal:apanelmixedorderedprobitfractionalsplitmodel[J].AccidentAnalysis&Prevention.2013,59(10):125-134.ESKANDARIANA,MORTAZAYA.Evaluationofasmartalgorithmforcommercialvehicledriverdrowsinessdetection[C].The2007IEEEIntelligentVehiclesSymposium,Istanbul,Turkey:IEEE,2007.张凌超,王生昌,张新锋,等.营运车辆驾驶员驾驶适宜性暗适应分级评价指标确立[J].公路交通科技,2013,30(9):140-144.ZHANGLC,WANGSC,ZHANGXF,etal.Establishinggradedevaluationindexesofdarkadaptationforcommercialvehicledrivers[J].JournalofHighwayandTransportationResearchandDevelopment.2013,30(9):140-144.(inChinese).贺宜吴超仲,陈志军,等.长途客车事故现状及致因分析[J].交通信息与安全,2011(5):78-82.HEYi,WUChaozhong,CHENZhijun,etal.Analysisoncoachbustrafficaccidentsandtheircountermeasures[J].JournalofTransportInformationandSafety,2011(5):78-82.(inChinese).钱宇彬,刘浩学,吴长水,等.夜间长途客车驾驶员操作行为差异性识别研究[J].中国安全科学学报,2014,24(3):9-15.QIANYubin,LIUHaoxue,WUChangshui,etal.Studyonidentificationofdifferentiallongdistancebusdriver'soperationbehavioratnighttime[J].ChinaSafetyScienceJournal,2014,24(3):9-15.(inChinese).牛增良,李海斌,王文峰,等.基于聚类分析的营运驾驶人危险驾驶行为研究凹.山东交通学院学报,2014,22(1):19-23.NIUZengliang,LIHaibin,WANGWenfeng,etal.Studyonriskybehaviorofcommercialdriversbasedonclusteringanalysis[J].JournalofShandongJiaotongUniversity,2014,22(1):19-23.(inChinese).LIKG,SIMONS-MORTONBG,BROOKS-RUSSELLA.DrinkingandparentingpracticesaspredictorsofimpaireddrivingbehaviorsamongUSadolescents[J].JournalofStudiesonAlcoholandDrugs,2014,75(1):5-15.WOOLSEVCL,WILLIANMSRD,HOUSMANJM.Combineduseofalcoholandenergydrinksincreasesparticipationinhigh-riskdrinkinganddrivingbehaviorsamongcollegestudents[J].JournalofStudiesonAlcoholandDrugs,2015,76(4):615-619.WOOLSEVCL,JACOBSONBH,WILLIANMSRD.Acomparisonofthecombined-useofalcohol&energydrinkstoalcohol-onlyonhigh-riskdrinkinganddrivingbehaviors[J].SubstanceUse&Misuse,2015,50(1):1-7.RAMIREZM,ROTHL,YOUNGT.Ruralroadwaysafetyperceptionsamongruralteendriverslivinginandoutsideoftowns[J].JournalofRuralHealth,2013,29(1):46-54.HANJ,KAMERM.Dataminingconceptsandtechniques[M].Waltham,USA:TheMorganKaufmannSeriesinDataManagementSystems,2007.王淑芳.基于卫星定位系统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论