(计算机软件与理论专业论文)交通事故模式挖掘研究与应用.pdf_第1页
(计算机软件与理论专业论文)交通事故模式挖掘研究与应用.pdf_第2页
(计算机软件与理论专业论文)交通事故模式挖掘研究与应用.pdf_第3页
(计算机软件与理论专业论文)交通事故模式挖掘研究与应用.pdf_第4页
(计算机软件与理论专业论文)交通事故模式挖掘研究与应用.pdf_第5页
已阅读5页,还剩53页未读 继续免费阅读

(计算机软件与理论专业论文)交通事故模式挖掘研究与应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

交通事故模式挖掘摘要 【摘要】 智能交通系统是当翦硬究与应用的热点,交通事故分析作为该系统的重要组 成部分,一直以来受到人们的关注。交通事故本身具有随机性强,具体发生时间、 具体发生地点,具体损失程度不可预测的特点,给交通事故的预防带来很大不便。 对交通事故历史数据的模式挖掘研究,可以帮助交通管理人员辨识交通事故的重 要诱因组合,进而从管理实践及法规制定方面做出相应的规避措施,有助于减少 未来事故发生的可能,达到预防的目的。此外,这种研究对智能交通领域的深入 探索、功能完善及促进城市交通健康和谐,有序发展具有重要意义。 本文根据交通事故数据的离散、多维度、因素间关系模糊的特点,结合数据 挖掘在离散、多维度变量问挖掘关联关系的算法关联规则,提出了一种交通事故 数据分析方法一交通事故模式挖掘,主要工作成果为: 设计实现了一个交通事故数据的预处理技术。本文针对交通事故数据的特 征,基于交通事故数据收集使用现状,结合数据挖掘对分析数据的需求,实 现了交通事故数据的输入控制,转录加载及因素转换等事故数据预处理工 作。 挖掘事故数据集的全集模式,并给出模式解释评价方法。基于待分析事故数 据集的属性选择,在事故数据集全集中进行模式挖掘,分析我出交通事故诱 因组合及损失结果构成的事故模式及该事故模式在整体事故数据集中的关 键程度,并给出对挖掘出的事故模式进行解释评价的方法 挖掘指定时间段,指定损失类型的事故模式。交通事故的时间分布并不均匀, 各损失类型的事故数也差距极大,存在一些在全集模式挖掘中无法得到的事 故模式有待单独挖掘。本文依据用户的分析需要,使用过滤机制对整体事故 数据集进行时间段筛选及损失类型筛选,围绕挖掘目标得出新的数据集,并 在此基础上挖掘交通事故模式。 设计并实现了一个交通事故数据挖掘子系统。以前期工作中的智能交通数据 挖掘平台u t d d 为基础,设计并实现了一个交通事故数据挖掘子系统,并成 功应用于一个实现了i t s 系统中 关键词:数据挖掘、智能交通、交通事故数据分析、事故模式挖掘、关联规则、 过滤机制 中图法分类号:t p 3 1 1 复旦大学硕士学位论文 a b s t r a c t t h ei s s u eo ft r a f f i ca c c i d e n th a sb e c o m eac o m m o np r o b l e mf o rp e o p l e l i v i n gi nc i t i e so fm e d i u ma n dl a r g es i z e ,w h i c hh a v es e e nm o r ea n dm o r e p o p u l a t i o nf l o w i n g i n n o w a d a y s a n dt h e r e f o r e l a r g ea m o u n t s o f a u t o m o b i l e - j a m m e dr o a d s t r a 怖ca c c i d e n t sh a v et h ec a p a c i t yt oc o s tm o n e y a n di s ot h er e d u c t i o no ft h e mf o ras a f e rd r i v eh a sb e e na ni m p e r a t i v en e e d f o rr o a d - u s e r s h o w e v e r , at r a f f i ca c c i d e n ti sc h a r a c t e r i z e db yi t sr a n d o m o c c u r r e n c e ,m a k i n gi ti m p o s s i b l ef o re v e ne x p e d e n c e dt r a f f i ce x p e r t st op r e d i c t t h ee x a c tt i m e ,p l a c ea n dl o s sf o ro n e i nt h i sp a p e r 。w ep r e s e n tad a t am i n i n g m e t h o d ,a i m e da td i g g i n go u tu s e f u lo c c u r r e n c ep a t f e m s ,w h i c hc o n s i s to f a c c i d e n tf a c t o r ss u c ha sw e a t h e rc o n d i t i o n ,o c c u r r e n c et i m ea n de t c t h r o u g h l a r g ea m o u n t so fc o l l e c t e dc r a s hd a t a t h i sm e t h o dc a nn o to n l ya s s i s tt r a f f i c m a n a g e m e n tp e r s o n n e lt of i n do u tt h o s em o r ei m p o r t a n tf a c t o r sw h i c hh a v ea h i g h e rp r o b a b i l i t yl e a d i n gt ot h ea c c i d e n tr e s u l t sa sc o m p a r e dt ot h er e s to ft h e f a c t o r s ,b u tc a nb eu s e da sat h e o r e t i c a lg u i d ef o ra n ya c c i d e n t - p r o h i b i t i n g m e a s u r et ob eb r o u g h tt ot a b l e i na d d i t i o n ,t h em e t h o di s h e l p f u lf o rt h e d e v e l o p m e n ta n da p p l i c a t i o no fi n t e l l i g e n t t 旧f f i ca n ds i g n i f i c a n tf o ra h a r m o n i o u sc i t yr o a de n v i r o n m e n t a sc r a s hd a t aw i t hi t sa t t r i b u t e so fd i s c r e t e ,m u l t i - d i m e n s i o n a l ,u n c l e a r r e l a t i o nf i it h ea p p l i c a t i o no fa s s o c i a t i o nr u l ea l g o r i t h m w ed e s i g naa c c i d e n t p a r e mm i n i n gs y s t e mb a s e do na s s o c i a t i o nr u l ea l g o r i t h mi nt h i sp a p e r t h e a c c i d e n tp a r e mm i n i n gs y s t e mi sas u b - s y s t e mf o ra na l r e a d y - i n - u s es y s t e m u r b a nt r a 仃i cd a t a m i n i n gd e v e l o p m e n t i th a st h ec a p a c i t yt od i go u ta c c i d e n t p a l t e m sf r o ml a r g ea m o u n t so fc r a s hd a t aa c c o r d i n gt oa n a l y s i so b j e c t i v e s w i t ht h eh e l po ff i l t e rm e c h a n i s m a l s o ,am e t h o de x c l u s i v e l yf o rc r a s hd a t a c o l l e c t i n g ,i n t e g r a t i n ga n dp r e - p r o c e s s i n gi sp u tf o r w a r di nt h i sp a p e rf o rt h e c o m p l e t e n e s so ft h ew h o l ea c c i d e n tp a t t e mm i n i n gp r o c e s s k e y w o r d s :d a t am i n i n g ,i n t e l l i g e n tt r a f f i c c r a s hd a t aa n a l y s i s a c c i d e n tp a t t e r n m i n i n g 、a s s o c i a t i o nr u l e 、f i l t e rm e c h a n i s m 复旦大学硕士学位论文 论文独创性声明 本论文是我个人在导师指导下进行的研究工作及取得的研究成果。论文中除 了特别加以标注和致谢的地方外,不包含其他人或其它机构已经发表或撰写过的 研究成果。其他同志对本研究的启发和所做的贡献均已在论文中作了明确的声明 并表示了谢意。 作者签名: 论文使用授权声明 本人完全了解复旦大学有关保留、使用学位论文的规定,即:学校有权保留 送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内 容,可以采用影印、缩印或其它复制手段保存论文。保密的论文在解密后遵守此 规定。 作者签名:导师签 6 、意 交通事故模式挖掘第1 牵绪论 第1 章绪论 1 。1 研究背景 1 1 1 数据挖掘概念和应用 近十几年来,科学技术飞速的发展,经济社会的巨大进步使世界面貌 焕然一新,不断推进的计算机信息化进程为人们工作生活带来了极大的 便利。与此同时,计算机信息化也在各个领域产生了海量的数据,如全 世界银行每天生成的交易数据,各国人们使用通讯设备时彼此联系的信 息数据等等。数据的激增,使得企业数据库的存储级别已经达到甚至超 过了t b 级,如何有效利用这些海量数据,从而在激烈的市场环境中获得 竞争优势自然而然成为企业关注的紧迫问题。数据挖掘,正好为这类问 题提供了一个解决方案。 1 9 8 9 年,数据挖掘这一概念首次在国际顶尖的人工智能会议u c a i ( i n t e r n a t i o n a lj o i n t c o n f e r e n c e s 0 1 1 a r t i f i c i a l i n t e l l i g e n c e ) 上被提出,随后, 在接下来的近二十年中见证了其丰富的应用领域和广阔的发展前景。如 今,数据挖掘技术已经广泛应用在了银行,金融,保险,购物,生物, 制药,通讯,流媒体等多个领域,并被世界巨头公司m i c r o s o f t ,m m , y a h o o ,o o o g l c 等竞相追逐使用。一些传统领域,如客户关系管j 里( c g m ) , 供应链管理( s c m ) 等更是在数据挖掘技术的辅助下凸现出旺盛的市场 需求和生命力。 数据挖掘也称为数据库中的知识发现( k n o w l e d g ed i s c o v e r yi n d a t a b a s e ,k d d ) ,即从大规模的数据中抽取非平凡的、隐含的、未知的、 有潜在使用价值的信息或知识的过程 f p s + 9 6 】。初创伊始,其研究重点 逐渐从发现方法转向系统应用,数据挖掘注重多种发现策略和技术的集 成,以及多学科之间的相互渗透 s h a 0 0 。数据挖掘大量吸收了数据库技 术、统计学、机器学习、模式识别、人工智能、信息检索、数据可视化 方面的宝贵知识积累和经验总结,创出其特有的针对大规模数据集的模 式分析研究方法。根据模式发现阶段所发现的规则不同,数据挖掘方法 一般可以大致划分为关联分析、分类分析、聚类分析以及异常检测等几 复旦丈学硕士学位论文 交通事故模式挖掘第1 帝绪论 种 h k 0 1 】。 经过多年的实践积累,数据挖掘的一般过程可以分为三个阶段,包括 数据准备、模式发现与结果表达 h m s 0 1 】。数据准备又可分为数据清理、 数据集成、数据选择、数据变换。数据清理过程主要解决数据的不完整 和不一致问题,填充空缺值,识别异常点和纠正不一致现象;数据集成 过程主要是将分布在各个不同物理位置的多个同构或异构数据源中的数 据集中起来存放;数据选择过程主要是通过分析数据,获得与分析任务 相关的数据;数据变换过程主要是将实际数据转换成为适合挖掘的数据 格式。模式发现包括模式挖掘和模式评价,模式挖掘是使用统计、机器 学习或人工智能等方法,挖掘海量数据中存在的规律和知识模式的过程, 是整个数据挖掘的核心,也是数据挖掘领域的难点所在;模式评价根据 某种领域专家定义的兴趣度度量,识别发现真正有趣的模式。结果表达 是使用可视化和知识表示技术以一种直观、容易理解的方式展示给用户 挖掘得到的规则和模式。 数据挖掘技术植根于信息化的土壤中,而信息化的需求源自人们生产 生活的实际需要,因此,数据挖掘技术的长足进步取决于结合特定领域 的需要,定制出适合的挖掘方法和工具,以此才能取得良好的效果。 1 1 2 智能交通系统 2 0 0 7 年3 月1 3 日联合国人口司公布的一项研究报告显示,2 0 0 7 年世 界人口已经达到6 7 亿,2 0 5 0 时,这一数字将增至9 2 亿。而截至2 0 0 7 年初,我国的人口已经达到了1 3 5 亿,如此巨大的人口数量无疑为人们 的出行质量带来了极大挑战。城市交通拥堵、交通事故率上升、交通效 率不高导致的资源浪费成为各个城市发展面临的共同问题。在信息化程 度如此之高的今天,利用高科技手段解决交通问题顺理成章。创建科学 的高自动化智能交通系统( i n t e l l i g e n tt r a n s p o r t a t i o ns y s t e m ,i t s ) 是缓 解交通矛盾,减少交通拥挤的一种经济实用、行之有效的交通策略 【q c c 0 6 】。 智能交通系统( i t s ) 是将先进的信息技术、数据通讯传输技术、电 子传感技术、电子控制技术以及计算机处理技术等有效地集成运用于整 个地面运输管理体系,两建立起的种在大范围内、全方位发挥作用的, 实时、准确、高效的综合运输和管理体系 m a s 9 9 】【w l q 0 0 。美国,欧洲 和日本等工业发达国家都投入了大量的人财物进行智能交通系统的研 复旦大学硕士学位论文 交通事故模式挖掘 第1 幸绪论 究。1 9 9 2 年5 月,美国交通部和智能交通学会起草的美国智能交通系 统战略规划中将智能交通划分为七个领域 x h 0 q ,这七部分基本上包 括了智能交通的各个方面: 先进的交通管理系统a t m s ( a d v a n c e dt r a f f i cm a n a g e m e n t s y s t e m ) : 先进的出行信息系统a t i s ( a d v a n c e dt r a v e l e ri n f o r m a t i o n s y s t e m s ) ; 先进的驾驶员信息系统a d i s ( a d v a n c e dd r i v e ri n f o r m a t i o n s y s t e m ) ; 商用车辆调度系统c v o ( c o m m e r c i a l v e h i c l eo p e r a t i o n ) ; 先进的车辆控制安全系统a v c s s ( a d v a n c e d 临c l ec o n t r o l s a f e t ys y s t e m ) : 先进的公共交通系统a p t s ( a d v a n c e dp u b l i ct r a n s p o r t a f i o n s y s t e m ) ; 先进的乡问运输系统a r t s ( a d v a n c e dr u r a lt r a n s f e rs y s t e m ) 与此同时,美国地方政府,私人企业和有关院校开展了许多大规模的 智能交通实验项目,将这些系统应用在了美国8 0 的国土上。日本于1 9 9 1 年成立了车辆道路交通信息学会,协调促进政府部门、学校及科研机关、 私人企业集团合作研究发展智能交通。在日本,智能交通的研究较美国 更加侧重于都市交通管理和交通信息系统。其重要成就有都市交通监控 与智能交通信号控制、高速公路监控系统、实用城市停车系统、出行信 息系统、车辆导航系统、车辆定位系统、公共汽车定位与到站预报系统、 电子收费系统、隧道监视及事故检测系统和数字地图系统等等。近l o 年 来,在日本具有代表性的实施智能交通项目有车辆信息控制系统o t i c s ) 、 城市交通管理系统c u t m s ) 、先进道路交通系统( a r t s ) 和先进车辆安全计 划( a s v ) 。目前日本汽车公司近1 0 的内销汽车产品出厂时就配备了汽 车导航系统g p s 卫星定位和超短波近距离通i k ( d e d i c a t e ds h o r tr a n g e c o m u n i c a t i o n ,d s r c ) 。在欧洲,自德国在2 0 世纪7 0 年代研制a l i 公路 信息系统以后,1 9 8 6 年由私人公司主导,开发了普罗米修斯交通项目, 以研究高科技的车辆应用技术为主。1 9 8 7 年,欧共体运输部长联席会议 开始筹划“集成化道路运输环境系统。1 9 9 8 年开始实施第一阶段d r i v e 计划,即欧洲车辆安全专用道路设施,旨在充分提高道路的交通效率与 安全性。1 9 9 2 年开始实施第二阶段d r i v e 计划,即新型道路运输薪型系 统。目的是使第一阶段d r i v e 研究成果付诸实施并建立通用的系统规范, 复旦大学硕士学位论文 交通事故模止挖掘 第l 市绪论 并在欧洲实施了p r o m o t e ( p r o g r a mf o rm o b i l i t yi nt r a n s p o r t a t i o ni n e u r o p e ) 智能交通系统项目【l z s 0 1 】。 我国1 9 9 5 年后,加快了对智能交通系统的研究,交通部也将i t s 列 入了“九五”科技发展计划合2 0 1 0 年长期规划中。目前我国相对于发达 国家在智能交通领域落后还比较多,我们目前的研究和应用还大多停留 在先进的交通管理系统( a 1 阻订s ) 和先进的交通信息系统( a n s ) 方面, 原因大致有二:一是我们很多基础研究还未完成,没有时间和精力去开 展其它方面的研究,二是我们的资金非常紧缺,大多数投资还都仅限于 基础投资如监控和数据采集等方面,还不能在分析研究方面投入太多。 从长期来看,r r s 都已经被各个国家列为交通领域重点发展的方向, 原因总结下来有三点: 缓解日益增加的交通供需矛盾:交通拥挤、堵塞已经成为各个国家大 型城市的社会性矛盾,具有关分析统计,设计良好的智能交通系统可以 最大增加3 0 的网络交通通行能力,这样就可以在有限投资和时间内最 大的缓解交通供需之间的矛盾; 节约基础投资,降低环境污染:通过有效利用现有交通道路资源可以 节约大幅增加的基础设施方面的投资,使交通通行效率增加可以极大的 降低车辆尾气排放,从而降低环境污染; 提高道路安全,降低事故发生率:通过智能交通系统对道路交通状况 的有效监视和管理,分析事故发生原因,提高道路安全,降低事故发生 率,减少交通事故与人员伤亡,提高道路通常程度。 1 1 3 交通事故数据研究 交通事故一直以来都是困扰着人们的出行安全,交通事故造成的损失 严重威胁着人们的生命财产安全。美国2 0 0 0 年统计,机动车交通事故所 致经济损失达23 0 6 亿美元,其中包括4 19 2 1 人死亡,5 3 0 万非致死受伤 者和28 0 0 万辆车损坏 w a n 9 0 3 1 。与此同时,交通事故造成道路堵塞, 路况恶化,极大影响了人们工作,出行的效率。2 0 0 0 年,从美国7 5 个城 市发回的统计显示,机动车驾驶人员在行驶中造成的耽搁和延误中,有 5 2 - - 5 8 是由交通事故导致,2 0 0 5 年这一数字上升到了7 0 。 交通事故对当代社会的平稳运行已经构成隐患,各国交通管理部门都 在采取措施应对事故的发生。然而,交通事故本身是随机事件,其发生 具有偶然性,模糊性,事故的具体发生时间,发生场合,发生规律,造 4 复旦大学硕士学位论文 交通事故模式挖掘第1 章绪论 成伤害无法事先预计。无疑,这使得交通事故的研究成为困难。因此, 人们转向对事故发生后记录的事故数据的研究来研究交通事故。 在对交通事故数据准确收集的基础上,借助计算机技术,并选用有针 对性的方法对事故数据集进行综合研究,有助于我们更深入地认识事故 本身的成因以及趋势。美国a l a b a m a 大学与美国国家公路运输安全管理 局联合研发的c a r e ( c r i t i c a l a u t o m o b i l e r e p o r t i n g e n v i r o n m e n t ) 系统旨 在对收集到的交通事故数据进行分析,并为用户提供界面用户友好的分 析结果展示,使得运输安全保障工程师和决策制订者可以使用该系统工 作。本系统已经在美国八个州的公路安全方面使用,对交通管理人员制 定决策提供了重要的参考依据 i e e e 0 3 。与此同时,各国对事故数据的研 究涉及到建立异常检验模型,通过比较车辆在正常情况下行驶的规范数 据和异常状况的特殊数据,来判断交通事件是否为交通事故 m u 0 2 。国 内对交通事故数据的研究主要集中在三方面。一是建立预测模型,根据 历史数据对未来交通事故量,伤亡人数及经济损失做预测;二是对交通 事故做异常检验分析,以便预先判断事故的发生;三是研制交通事故处 理系统,以便流程化地,自动化地完成交通事故数据分析 z t 0 2 。 1 2 本文工作 本文分析了上海宝信软件股份有限公司的i c e n t r o v i e w ( 城市交通监控与 管理) 系统和上海市中心区道路交通信息采集系统共享交换平台等交通管理 系统所采集的事故数据( 以下简称“交通事故数据集”) 的特点,设计了事 故数据的预处理方案,借助数据挖掘模式挖掘算法及数据过滤机制,分析研 究了交通事故的隐含模式,并对挖掘出的模式进行了科学评价。研究内容和 成果主要包括以下几个方面: 针对交通事故数据的特征,提出了针对交通事故的数据收集,集成 和数据预处理方案 对事故数据集进行全集模式挖掘,分析找出有价值的隐含规则模式, 并进行模式评价 借助过滤机制,依据用户需要和兴趣,筛选待分析的事故数据集合, 并在此基础上分析挖掘在数据全集挖掘中不易得到的事故模式 在智能交通数据挖掘平台u t d d 的基础上,设计并实现了一个交通 事故数据挖掘子系统c d p m 复旦大学硕士学位论文 交通事故模式挖掘第1 章绪论 1 3 文章结构介绍 本文共分为六章,每章的主要内容介绍如下。 第一章简要地介绍了数据挖掘、智能交通和交通事故数据研究的背景, 论述了本文的立论意义,然后介绍了本文主要的研究内容及成果,最后,给 出了本文的整体组织结构。 第二章分析交通事故的影响因素及事故数据的特点,并回顾了交通事故 数据的分析研究现状。概要介绍了三大类( 交通事故异常检测,交通事故预 测,交通事故决策支持系统) 分析研究方法,以及数据挖掘方法研究交通事 故数据的方法和流程。 第三章根据事故数据收集方面需考虑的因素,设计了事故数据的预处理 方法,主要在于保证在使用挖掘算法对事故数据模式挖掘以前,事故数据能 在内容和格式方面做好准备。 第四章首先介绍了数据挖掘的挖掘方法分类,指出关联规则算法与交通 事故分析的适应性,然后给出关联规则算法的理论准备和模式挖掘算法的步 骤,接着指出过滤机制在分析挖掘中的作用和必要性,即整体数据集在不同 区段存在不同特点,需要区别对待。 第五章先描述数据挖掘系统的特点,然后针对智能交通数据及其平台特 点分析概括出智能交通数据挖掘平台u t d d 的功能和特点,最后描述了基于 u t d d 数据挖掘平台的c d p m 这一事故数据模式挖掘系统的实现。 第六章是讨论与小结部分,对本文的工作进行总结并指出了未来的研究 方向。 6 复旦大学硕士学位论文 交通事故模式挖掘第2 章交通事故数据分析 第2 章交通事故数据分析 交通事故是随机事件,其发生带有不确定性,即具体发生时间,发生地点, 严重程度不可预先估计,因此,有效的事先防范极其不易,从而导致交通事故常 常带来严重的财产损失和人员伤亡的结果。为减少交通事故带来的损失以及规避 交通事故的发生,除了加强交通监管力度,制定完善的法律规章外,对交通事故 发生后的事故数据的准确记录,并加以分析也不失为一种好的方法。如果能将道 路交通中每天发生的事故数据积累起来,就可以使用计算机技术对其进行处理和 分析,这样得出的结果可能带有尝试性,但在正确的理论分析和交通管理实践的 结合下,分析结果会越来越多的贴近实际情况,并最终为交通管理实践提供有益, 有效的指导。 2 1 交通事故影响因素 道路交通事故的引发都有其原因,因此有必要对道路交通事故的影响因 素进行分析,从而寻求改善道路交通安全状况的措施。人、车、路是构成交 通系统的基本要素,因此,道路交通事故影响因素也离不开这些方面。 人的因素 人是交通的参与者,也是交通事故的造成者和受害者,据1 9 9 8 年的中国 道路交通事故影响因素统计显示,人的因素在总的交通事故中占到9 2 7 6 ; 同年,黑龙江省,辽宁省的公路交通事故影响因素中,人的因素分别占到8 8 7 6 和9 2 5 0 p w 0 4 。据2 0 世纪9 0 年代初美,德,意,目等有关国家交通 部门的统计,公路上8 0 9 0 的交通事故是人为原因所致。作为交通参与 者的人主要包括机动车驾驶员,行人及乘客。其中,驾驶员是交通事故发生 的主要原因,驾驶员是交通事件的参与者,同时也是引发交通事故的最主要 因素。事实上,虽然各种事故统计的最终数字有所不同,但在各类统计中, 驾驶员责任在引发交通事故方面所占比重达到7 0 以上 v a s 9 6 】。 车的因素 交通事故的发生离不开以大型车,小型车,自行车等车辆为主的车辆因 复旦大学硕士学位论文 交通事故模a 挖掘第2 幸交通事故数据分析 素。车辆的安全性是交通事故的诱因之一,车辆的安全性主要包括主动安全 性和被动安全性,其中,主动安全性反映了车辆驾驶员在正常操纵状况下, 汽车能够按照驾驶员的已知运行,有效地避免或减少事故发生的可能性的能 力,主动安全性取决于车辆的制动性,操纵稳定性,汽车的后备功率,关键 部件的疲劳强度,汽车的照明效果等方面;被动安全性体现了车辆在发生事 故的过程和之后,如何保证成员不受伤害或最大限度减少伤害程度的能力, 被动安全性取决于车辆的耐碰撞性能、抗翻滚性能等方面 p w 0 4 。 路况的因素 道路是交通进行的场所,道路的线形规格、曲线半径、转角、坡度、坡 长等因素都道路安全有直接的关系,对我国g 1 0 8 线1 9 9 5 争 2 0 0 0 年的调查 结果表明:交通事故约有3 3 发生在平、纵曲线上,随着平曲线曲率的增大, 事故发生的频率也在增加。此外,道路通畅程度也直接影响交通质量,进而 易引起交通事故,导致路况不畅的原因如:修路占道,车道数量,宽度不能 适应车流量,由于l 临时活动导致的路面车辆过于集中等等。最后,天气状况 对道路的影响也不容忽视,道路常常是置于露天条件下,路况受天气状况影 响很大,据统计,路面湿润时候的交通事故是干燥路面的两倍,降雪时候的 事故率是干燥路面的五倍,结冰时时干燥路面的八倍。由于路面缺陷而产生 的交通事故中,因路面光滑而肇事者占3 0 。 2 2 交通事故数据特点 交通事故数据记录了交通事故发生时现场。如:事故发生时间,事 故发生地点,交通方式,损失程度等等。典型的交通事故数据如下所示: 发生时间: 发生地点: 事故信息: 事故结果: 早8 :3 0 a 城市b 路段 汽车撞行人 人员受伤 每起交通事故都有自身的特点,因此对交通事故的记录数据可以包 罗万象,但目的只有一个,就是以文字信息的方式尽可能的回顾事故发 生时的现场状况,以便于交管人员事后的善后处理工作。本节将主要讨 论交通事故数据的主要特点。 8 复旦大学硕士学位论文 交通事故模式挖掘第2 章交通事故数据分析 2 2 1 离散 任何交通事故都发生在一定的时间,空间及人为作用环境中,因此 在交通事故发生时,各事故因素彼此独立,其值由典型的交通事故数据 可以看出,显示出离散特性。事故因素中,即便是一些有可能量化的因 素,如司机年龄等,也可以事先将其分成年龄组加以离散。离散特性符 合交通事故数据特点,现实中也的确如此。 2 2 2 多维度 交通事故可能因为某一事故因素发生,但在大多数情况下,事故都 是在人为因素,路况天气因素,车辆因素等多个方面综合作用的结果下 发生 l l k + 0 5 。因此,任何一起交通事故都统摄了多方面因素,只有综 合多方面因素才能更准确,有效的表示事故发生时的完整情况,如果把 每一个因素表示成一个维度,则交通事故具有多维度特点。 2 2 3 因素问关系模糊 交通事故的发生会有相应的交通事故数据记录产生,记录中包含了 事故的多方面因素,然而因素彼此之间的关系却不明朗,即很难说是哪 个或者哪几个因素的共同作用导致了交通事故的发生。这给分析人员提 供了研究的机会,即可以通过探询事故因素的组合事故模式来进一 步交通事故本身的成因和规避措施。 2 3 事故数据分析及应用现状 2 3 1 交通事故异常检测 交通事故检测是使用计算机技术收集交通状况数据,并对数据进行 分析处理,对已经发生或者将要发生的交通事故进行识别,以辨别交通 事件是否为交通事故,通常使用事故检测率d r ,检测时间t 1 d 和误报 率f a r 来作为衡量检测质量的主要指标参数。交通异常检测是智能交通 复旦大学硕士学位论文 交通事放模式挖掘第2 章交通事故数据分析 系统的重要组成部分,1 9 8 9 年美国联邦运输部开始计划发展智能车辆道 路系统( i v h s ) ,其中投资的2 1 2 8 亿美元中有2 3 7 6 9 万美元用于异常检 测与交通流疏散控制的1 3 个项卧h a n 9 9 4 。1 9 9 4 年,联邦运输部提出发 展i t s 战略计划,交通异常检测与交通疏散控制又成为其中心子系统的 重要组成部分。当前交通异常检测法主要分为模式识别法,事故理论法, 统计预测法及人工智能检测法四类 c j o s ,其中,人工智能检测法是四 种方法中最新及最成熟的方法 m a r l ) 1 。 模式识别法: 模式识别法是交通异常检测中使用较多的方法。它利用感应环式车 辆监测器收集车道占有率,交通密度,交通速度等信息,通过这些检测 信息,按照设计的算法鉴别除不正常数据的模式,识别潜在事故。这种 方法要求预置临界状态,超出临界状态的任何交通状况被识别为异常。 但设置临界状态既困难又费时。模式识别算法可以分为c a l i f o r n i a 算法, a p i d 算法和p a t r e g 检测算法。 c a l i f o r n i a 算法 d m n 7 4 是交通异常检测中最早开发的算法之一,是 比较其它算法的基础,现在已经发展为一个系列的c a l i f o r n i a 算法。尽管 该算法直截了当,但要对数据采集的临界地点进行大量计算,对于大型 路网,要分别计算不同几何线形公路的临界分离点。另外,该方法考虑 因素少,检测精度和效率较差。 a n d ( a l lp u r p o s ei n c i d e n td e t e c t i o n ) 检测算法b f f 9 0 是c o m p a s s 软件的组成构件。a p i d 算法结合了几种c a l i f o m i a 算法,同时采取了平 滑的占有率作为观测变量以降低误报率。该算法在交通量较大的时候检 测准确度搞,在交通量小时作用不大。离线测试表明:事故检测率达到 了6 6 ,检测时间达到了2 5 5 s ,误报率为0 0 5 ,但该算法从未在线用 过。 p a t r e g ( p a t t e r nr e c o g n i t i o n ) 检测算法 b a n 9 7 9 c h m 7 9 1 是1 9 7 9 年英国道路研究室开发的,这种模式识别算法设计的初衷是将其与密集 车道占有率算法( h i o c c ) 结合使用。算法在中小流交通中准确度搞。 由于自8 0 年代以来该算法没有取得新的发展,现在已经很过时。 事故理论法: 事故理论可以描述事物突然的离散变化,这种变化通常出现在事物 的一个相关变量之中,其他相关变量处于相对平稳,连续的变化状态之 i o 复旦大学硕士学位论文 交通事故模式挖掘第2 章交通事故数据分析 中。交通事故中涉及的相关变量是速度,流量和车道占有率。该理论能 解释事故导致突然的停车排队并引起速度巨大变化的交通现象,因此, 可以区分偶发性拥挤和重现性交通拥挤。 m c m a s t e r 算法 h l s + 9 3 是唯一的事故理论算法,算法的早期测试是 失败的,但随着该算法的不断发展以及那些临界状态变的越来越复杂, 它的使用性得到了一定的改善;但复杂性和推广应用是一对此消彼长的 矛盾。 统计预测法: 统计预测法将实时交通信息与预测数据进行比较。采用事件序列数 据,该算法可以模拟实际的交通模式,也能预测数据值变化的范围。与 预测交通流相比较,交通流中任何非期望的变化都被看作是异常。该算 法的一个优点就是在运用算法之前不必收集大量的数据。统计预测算法 包括f i i o c c 算法,a r i m a 算法,s n d 算法,d e l o s 算法,b a y e s i a n 算法,s s i d 算法。 h i o c c ( h i g ho c c u p a n c y ) 算法 c o l l i n s 8 3 1 由英国道路研究室开发, 它与p a t r e g 算法联系紧密。h i o c c 算法的一个前提条件是:如果有事 故发生,交通要么停止,要么减速。该算法本身的特点是,在轻微拥挤 的交通中,它的性能会下降。工作人员在长为2 英里的路段上进行了1 8 个月的检测,从观测站的数据可以看出:该算法对1 l 起交通事故检测到 了l o 起,出现了1 3 0 次误报,其中7 起与交通流没有明显的减速相关, 由于慢速行驶的车辆导致了l ,3 的误报。 a r i m a ( a u t or e g r e s s i v ei n t e g r a t e d m o v i n g a v e r a g e ) 检测算法 s j h 9 6 i f j 7 6 用来计算9 5 的置信区间内的短期交通占有率,通过采用先前3 个时间间隔中的观测数据并且预测交通流情况,如果交通流情况超出了 由模型预测的范围,系统就发出警报。该算法在中等及严重拥挤的交通 中效果明显,但在轻微拥挤交通中略显不足。 s n d ( s t a n d a r d n o r m a ld e v i a t e ) 检测算法 s j p 9 1 采用简单的统计分 析来测算标准差,s n d 就是当前控制变量减去平均值,然后除以标准差。 控制变量的平均值和标准差由历史数据决定。如果用占有率计算出的 s n d 超出了预先设置的临界状态就发出警报。该算法的关键是临界状态 的设置以及监测器的分布间距。 d e s ( d o u b l ee x p o n e n t i a ls m o o t h i n g ) 检测算法 h j c 9 6 与s n d 很相 似,只不过采用了更为复杂的预测手段。算法的稳定性只适合目前交通 复旦大学硕士学位论文 交通事故模五挖掘第2 章交通事故数据分析 测量数据的计算。由于它的简单性,这种算法常用来在其他研究进行比 较。 d e l o s ( d e t e c t i o nl o g i cw i t hs m o o t h i n g ) 过滤模型检测算法 a c s 9 6 】 是c h a s s i a k o s 于1 9 9 3 年开发的。由于研究人员认为大量工作就是制定出 临界状态,高度精确的测试不易转换,因此把该方法设计得较简单。该 算法得核心就在于拥有一个移动普通滤波器,原始数据首先用滤波器过 滤后进行计算,通过相邻观测站之间得空间占有率检测事故。该算法于 模式识别算法得区别在于:d e l o s 算法采用3 分钟以内空间占有率得平 均值而不是采用一次性得问隔数值;同时,前5 分钟得占有率也能储存 起来。这两个数值得较大差异就意味着事故有可能发生。该算法需要3 分钟时间对数据进行平均处理,因此该算法得缺点就是检测事故需要相 当数量得时间,检测时间会超过3 分钟。 b a y e s i a n 检测算法采用两监测器占有率之间得差值来计算,这和 c a l i f o r n i a 算法相似,然后利用这些差值和b a y e s i a n 统计数据差值来计算 概率,即推算出较大得占有率差值是由交通事故引起还是由重现性拥挤 引起。这种计算需要三个数据库资料:无事故数据,事故数据,公路巡 视日志,这些数据反应了事故得类型,地点和严重程度。该算法与其他 算法得一个重要区别在于该算法不采用肯定或者否定得结果,而是采用 百分比计算事故发生得概率。这种算法有一个临界概率,一旦这个临界 值被超过就报警。该算法在离线测试时,检测速度和误报信号都让人满 意,但检测时间过长。 s s i d ( s i n g l es t a t i o ni n c i d e n td e t e c t i o n ) 检测算法 c w h 9 4 采用t 形 统计测试来分析每个检测器的临时占有率的差值。对前1 0 分钟的占有率 取平均值,这样就可以计算出标准方差。t 形测试就是要在平均值的比 值大于1 0 1 5 或者最新平均值与先前平均值的差值大于标准方差的7 5 , 就发出警报。 人工智能检验法: 人工智能检测法检测交通事故通过两种方法:准则为基础的算法, 学习鉴别的智能方法。其中神经网络和模糊逻辑时两个主要的应用。 人工神经网络算法。在2 0 世纪8 0 年代,c a l i f o m i a 大学的学者们发 现采用人工神经网络可以检测事故发生的概率。9 0 年代早期,c a l i f o m i a 等大学就开始筹建用于a i d 算法的神经网络 h l t 9 4 1 ,在o r a n g e 县城进 行的测试表现出比c a l i f o r n i a 算法更好的性能。从c a l i f o m i a 观测站收集 复旦大学硕士学位论文 交通事故模挖掘第2 章交通事故数据分析 的8 0 0 组数据可以看出,该算法要优于c a l i f o r n i a 算法,o 0 7 5 的误报率 意味着每l l 小时才有一次误报。神经网络近年来正开始发展,但它的在 线性能还没有得到测试。 模糊逻辑检测法。模糊逻辑法不会给出有或者没有事故的明确信号, 它只会指出事故的可能性。当数据遗失或不完整时候,可以用该算法来 粗略推理。这种算法可作为c a l i f o r n i a 算法的一种补充。尽管早期的测试 让人鼓舞,但它不能给出确切的结果。模糊逻辑算法需要广泛的测量以 便定义出逻辑临界状态。该算法还需要进行大量的研究工作和应用验证 以便完善发展。 2 3 2 交通事故指标预测 交通事故指标预测是在对已发生的交通事故数据的统计,分析,处 理的基础上,以事故发生的原因和发展变化规律为依据,通过科学分析, 对目前尚未发生或者还不明确的事故预先作出合乎逻辑的推理 z y 0 5 】。 国内关于道路交通事故预测方法研究最多的是回归分析预测法,其 建立的回归模型有一元的和多元的,线性的和非线性的。较为典型的 是由北京市交通工程研究所建立的北京模型,该模型利用临时人口,常 住人口,机动车辆,自行车,道路长度等1 1 个指标构建了北京市交通 事故模型。考虑因素较为全面,但在实际应用中过于繁琐。 道路交通事故预测方法还有时间序列法,如移动平均法,指数平滑 法,自回归模型,自适应滤波法,时间序列分解法等。以北京工业大 学的交通事故时间序列模型较为典型。它从交通事故基本信息特征研究 入手,将道路交通事故时间序列分解为:趋势变动,循环变动,季节变 动和随机变动。 基于灰色理论的预测方法 l i u 0 1 。交通事故是随机事件,本身具有 偶然性和模糊性,事故的具体发生时间,发生场合,发生规律,造成伤 害是无法事先预计的。因此由人一车一路系统构成的交通安全系统是一 个“贫信息”系统。灰色理论认为某一地区在某一时间区间内的交通事 故指标值是在一定范围内变化的与时间坐标有关的灰色量,因此,在交 通事故统计的基础上,运用灰色理论建立了一阶单变量的交通事故预测 模型,即g m ( 1 ,1 ) 模型;在灰色预测的基础上引入马尔可夫链预测理论, 建立道路交通事故灰色马尔可夫预测模型,其预测精度要高于g m ( 1 , 1 ) 模型。 复旦大学硕士学位论文 交通事故模式挖掘第2 章交通事故数据分析 人工神经网络预测方法。如杨义常建立

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论