(管理科学与工程专业论文)基于粒子群优化的神经网络对高速公路事故分析的研究.pdf_第1页
(管理科学与工程专业论文)基于粒子群优化的神经网络对高速公路事故分析的研究.pdf_第2页
(管理科学与工程专业论文)基于粒子群优化的神经网络对高速公路事故分析的研究.pdf_第3页
(管理科学与工程专业论文)基于粒子群优化的神经网络对高速公路事故分析的研究.pdf_第4页
(管理科学与工程专业论文)基于粒子群优化的神经网络对高速公路事故分析的研究.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(管理科学与工程专业论文)基于粒子群优化的神经网络对高速公路事故分析的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于粒子群优化的神经网络对高速公路事故分析酌研究 基于粒子群优化的神经网络对高速公路事故分析的研究 摘要 随着经济的发展,高速公路已经成为一种十分重要的交通方式。 然而,高速公路上频繁发生的交通事故却不断地威胁着人们的生命和 财产安全。因此,交警部门希望可以从长期累积的交通事故历史数据 中,提取出有价值的规则,为交警部门的相关工作提供科学的决策支 持。 神经网络作为一种数据挖掘的方式,长期以来被广泛地应用于各 种领域的数据分析和预测。粒子群算法是近年来比较新兴的算法,将 粒子群算法应用到b p 神经网络,作为其训练算法,可以优化网络的 性能,克服b p 算法的局限性。 本文的核心思想在于,基于沪杭甬高速公路杭州段的交通事故数 据,利用神经网络从事故影响因素角度分析交通事故的特点,并利用 粒子群算法对b p 神经网络进行优化,最终使甩m a t l a b 实现该神经网 络模型。本文介绍了b p 神经网络的基本原理和网络结构以及粒子群 算法的基本原理和算法流程。阐述了基于粒子群算法的神经网络的实 现方法,即将神经网络的均方误差值作为粒子群算法的适应度,而将 神经网络的所有权值和偏置值映射为每个粒子的维度。对原始的交通 事故数据进行数据预处理,主要包括样本数据的选择和量化。根据研 浙江工业大学硕士学位论文 基于粒子群优化的神经网络对高速公路事故分析的研究 究的目的以及样本数据的特点,设计神经网络的拓扑结构,运用 m a t l a b 编写神经网络程序。然后,使用处理好的样本数据对网络进 行训练和测试。最后,利用该网络模型对几个主要的影响因素进行了 分析和比较,并提出了相应的有利于实现高速公路安全管理的建议。 关键词:神经网络,粒子群算法,高速公路,事故分析 n 浙江工业火学硕士学位论文 基于粒子群优化的神经网络对高速公路事故分析的研究 as t u d yo na c c i d e n tr a t eo ff r e e w a y b a s e do na n nt r a 眦db yp s o a b s t r a c t w i t ht h ed e v e l o p m e n to fe c o n o m y , f r e e w a yh a sb e c o m ea l li m p o r t a n tt r a f f i cw a y h o w e v e r , l o t so fa c c i d e n t sw h i c hh a p p e n e do nf r e e w a ya r et h r e a t e n i n gp e r s o n a ls a f e t y , l i v e sa n dp r o p e r t y t h e r e f o r e ,t h et r a f f i cp o l i c ed e p a r t m e n th o p e st h a tv a l u a b l er u l e s c a nb ee x t r a c t e df r o m 也e i rt r a f f i ca c c i d e n td a t aa n dv a l u a b l ea d v i c ec a nb eg i v e na s t h e i rd e c i s i o ns u p p o r tt h r o u g ho ft h es t u d y a saw a yo fd a t am i n i n g ,n e u r a ln e t w o r k sh a sb e e nw i d e l yu s e dv a r i o u sf i e l d sf o r d a t aa n a l y s i sa n dp r e d i c t i o n p s oi sap o p u l a ra l g o r i t h mr e c e n t l y s oi ti su s e da sa t r a i n i n ga l g o r i t h mf o ra n n i nt h i sp a p e r , t oo p t i m i z et h ep e r f o r m a n c eo fn e t w o r ka n d t oo v e r c o m et h el i m i t a t i o n so fb pa l g o r i t h m t h ec o r eo ft h i sp a p e ri st oa n a l y z et h ef e a t u r e so ff r e e w a yt r a f f i ca c c i d e n t si n t e r m so fa f f e c t i n gf a c t o r s ,b a s e do na n nt r a i n e db yp s o ,w i t ht h er e a lf r e e w a yt r a f f i c a c c i d e n td a t a ,a n df i n a l l yu s em a t l a bt or e a l i z et h em o d e l t h i sp a p e ri n t r o d u c e s t h eb a s i cp r i n c i p l eo fb pn e t w o r ka n dp s oa l g o r i t h m o nt h i sb a s i s ,i te l a b o r a t e st h e w a yo fu s i n gp s o i n t ob pn e t w o r k t h em s eo fn e t w o r ke q u a l st ot h ef i t n e s si nt h e p s oa l g o r i t h m ,w h i l eb o t ht h ew e i g h sa n dt h eb i a s a r em a p p e dt oe v e r yp a r t i c l e s d i m e n s i o n s p r o c e s s i n gt h eo r i g i n a ld a t am a i n l yi n c l u d e ss e l e c t i n gs a m p l ed a t aa n d q u a n t i f i c a t i o n d e s i g nt h et o p o l o g yo ft h en e u r a ln e t w o r ka c c o r d i n gt ot h er e s e a r c h p u r p o s ea n dt h ec h a r a c t e r i s t i c so fs a m p l ed a t a ,a n dt r a i nt h en e t w o r kp r o g r a m m e db y m a t l a bw i t hs a m p l ed a t aw h i c hh a v eb e e np r o c e s s e d t h e n ,t h i sm o d e li su s e dt o a n a l y z et h em a i na f f e c t i n gf a c t o r sa n df i n a l l yu s e f u la d v i c e i sg i v e no u t 1 i i 浙江工业大学硕士学位论文基于粒子群优化的神经网络对高速公路事故分析的研究 k e yw o r d s :n e u r a ln e t w o r k ;p a r t i c l es w a r mo p t i m i z a t i o na l g o r i t h m ;f r e e w a y ; a c c i d e n t sa n a l y s e s 浙江工业大学 学位论文原创性声明 本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研 究工作所取得的研究成果。除文中已经加以标注引用的内容外,本论文不包 含其他个人或集体已经发表或撰写过的研究成果,也不含为获得浙江工业大 学或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡献 的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律责任。 作者签名: 苍晓芝 日期:加口2 年1 月f 日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学 校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查 阅和借阅。本人授权浙江工业大学可以将本学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本 学位论文。 本学位论文属于 1 、保密口,在年解密后适用本授权书。 2 、不保密瓯 ( 请在以上相应方框内打“”) 作者签名: 导师签名: 橄 肿枷u 1 日期;加、,2 年 日期:护莎年 i 冠flb f 月f 日 浙江工业大学硕士学位论文 基于粒子群优化的神经网络对高速公路事故分析的研究 1 绪论 1 1 选题背景 随着经济的飞速发展,高速公路作为一种便捷、安全、快速的交通方式, 在缩短城市间距离,促进地区经济发展的过程中发挥了重要的作用。在浙江省, 高速公路从1 9 9 2 年的7 公里开始发展,到2 0 0 6 年底,浙江全省高速公路通车 总里程已突破2 0 0 0 多公里。随着高速公路的总里程数的不断增加,高速公路交 通事故以其事故后果的严重、损失的巨大引起人们的高度警惕。形势要求我们 更快地认识高速公路交通事故的特点和规律,研究交通安全对策和方法。 沪杭甬高速公路是浙江省第一条开通的高速公路,连接上海、杭州、宁波 三大城市,穿越富裕的浙东平原,并与上三高速公路和杭金衢高速公路等十多 条国( 省) 道连接,是目前浙江省交通网络的核心,也是浙江省乃至华东地区 的重要交通枢纽。依托沿线经济的高速发展,沪杭甬高速公路日均车流量在1 0 万辆以上,年均车流量3 6 5 0 万辆以上,在全国高速公路中名列前茅。沿线的宁 波、杭州、上海等城市是整个浙江甚至长江三角洲经济圈中的核心城市。沪杭 甬高速公路杭州段虽然总里程数不多,但由于其车流量大、事故率高,因而被 选为本文的研究对象。 高速公路交通事故的形成因素包括人、车、路、气候等多个非线性因素, 带有较大的随机性。传统的线性分析方法难以揭示其内涵,存在着较大的局限 性,使得预测不能得到满意的结果。 人工神经网络( a r t i f i c i mn e u r a ln e t w o r k ,a n n ) ,亦称为神经网络,是由大 量神经元广泛互连而成的网络,是人脑的抽象、简化、模拟。它与人脑的相似 之处概括为两个方面:一是通过学习过程利用神经网络从外部环境中获取知识; 二是内部神经元用来存储获取的知识信息。人工神经网络所具有的非线性特性、 大量的并行分布结构以及学习和归纳能力使其在诸如建模、时间序列分析、模 式识别、信号处理以及控制等方面得到广泛的应用。尤其面对缺少物理或统计 理解、观察数据中存在着统计变化、数据由非线性机制产生等棘手问题,神经 网络能够提供较为有效的解决方法。 但是,传统的b p 算法具有学习速度慢,目标函数存在局部极小点的缺点。 为此采用粒子群算法( p s o ) 代替b p 算法对神经网络进行训练,以得到更优的 结果,实现对交通事故的预测。 粒子群优化算法最初由j i mk e n n e d y 于1 9 9 5 年提出并成功的用于函数优化 ( j k e n n e d y ,1 9 9 5 ) ,后来又进行了有效的拓展( s h iyh ,1 9 9 8 ) ,它是对鸟 浙江工业大学硕士学位论文基于粒予群优化的神经嘲络对高速公路事故分析的研究 群觅食过程中的迁徙和聚集的模拟,由简单个体组成的群落以及个体之间的互 动行为模拟搜索全局最优解。已有研究表明( 刘洪波,2 0 0 5 ) ,将粒子群算法用 于神经网络的学习训练,简单容易实现,而且能更快地收敛于最优解。 1 2 国内外研究现状 目前对道路交通的研究方法有很多( 秦利燕,2 0 0 6 ) ,如:道路交通事故致 因理论、道路交通事故宏观研究、道路交通事故微观研究等。 关于道路交通事故致因理论的研究大致经历了单因素理论和多因素理论 ( a b d u lr a o u f ,2 0 0 2 ) 两个时期。单因素理论,把事故简单地归结为由一种原 因引起,但当要确定事故的主要原因时,它的简单直观性非常有用:多因素理 论,广泛地用于事故分析,认为在道路交通事故分析中,主要应从人一车一路 三因素入手。然而到目前为止,道路交通事故致因理论的发展还很不完善,还 没有给出对事故分析和预防方面的普遍和有效的方法。 交通事故宏观研究就是根据历史的统计数据研究将来交通事故的发展状况 及趋势。国外道路交通事故宏观研究方法多用回归分析方法和时间序列法 ( e 1 - s a d i gm ,2 0 0 2 ) 。回归分析方法中,最经典是斯密德( s m e e d ) 模型,用整 个国家的机动车保有量和人口数预测交通事故死亡人数。此外,另有一些学者 利用灰色理论( 王福建,2 0 0 6 ) 对道路交通事故进行了研究,该方法将道路交 通事故作为道路交通系统行为特征量处理。其缺点是没有考虑道路交通事故的 影响因素对预测目标的影响,仅是数列趋势研究。 道路交通事故微观研究是以特定的道路、路段或断面作为研究对象,以便 及时了解该区段的道路安全状况,进而有针对性地提出具体的改进措施,从而 达到减少事故、降低事故危害程度的目的。国外学者曾用概率分析法、多元回 归法建立交通事故与相关因素的模型。 本文采用神经网络的方法来研究交通事故的特点。对于神经网络,目前已 经发展了多种算法来计算网络的权值,最常见的是b p 算法。但是,基于梯度下 降的b p 算法依赖于初始权值的选择,收敛速度缓慢且容易陷入局部最优。b p 的上述缺陷尤其是局部优化特性使其训练的神经网络的输出具有不一致性和不 可预测性,导致模式分类的可靠性降低( 高海兵,2 0 0 4 ) 。 d w h i t l e y ( 1 9 9 5 ) 成功地将遗传算法应用于神经网络学习中,遗传算法的 并行搜索策略及全局优化特性使其成为日益普遍的神经网络训练算法。s e x t o n ( 2 0 0 0 ) 通过实验证明,与b p 算法比较,遗传算法训练的神经网络在提高分类 正确率的同时可以加快训练的收敛速度。但是,遗传算法复杂的遗传操作如选 择复制、交叉、变异使神经网络的训练时间随问题的规模及复杂程度呈指数级 增长( y a n gj m ,2 0 0 1 ) 。而且,由于缺乏有效的局部区域搜索机制,算法在 2 浙江工业大学硕士学位论文基于粒子群优化的神经网络对高速公路事故分析的研究 接近最优解时收敛缓慢甚至出现收敛停滞现象( f r a n c h i n im ,1 9 9 6 ) 。 粒子群优化算法是基于群体智能理论的优化算法,通过种群中粒子间的合 作与竞争产生的群体智能指导优化搜索。与进化算法比较,p s 0 保留了基于种 群的全局搜索策略,但是其采用的速度一位移模型操作简单,避免了复杂的遗传 操作。在非线性函数优化、电压稳定性控制( y o s h i d ah ,2 0 0 0 ) 、动态目标优 化( c a r l i s l ea ,2 0 0 0 ) 等实际问题中取得了成功的应用。c z h a n g ( 2 0 0 0 ) 将 p s 0 与神经网络相结合,用p s 0 算法来优化神经网络的连接权值。这样做,可 以较好地克服b p 算法和g a 的问题,不仅能发挥神经网络的泛化能力,而且能 够提高神经网络的收敛速度和学习能力。 目前,基于粒子群优化的神经网络已经在多个方面实现其应用价值。如, 应用于对于某个城市或地区的环境污染水平的预测( l uw z ,2 0 0 3 ) ,图像识 别( 高艳霞,2 0 0 6 ) ,产品分类( 高亮,2 0 0 6 ) 等等。并且,结合的方式也不仅 限于直接应用p s 0 训练神经网络,也有许多其他的方法。例如,使用遗传算法 和粒子群算法的混合算法来训练神经网络( 王亚利,2 0 0 7 ) ,对粒子群算法进行 改进( 江涛,2 0 0 6 ) 后再应用到神经网络的训练中去。 1 3 研究价值及意义 高速公路具有通行能力高、安全舒适、运输成本低、经济效益好等特点, 现已成为我国综合交通运输系统的重要组成部分。高速公路以其方便、快捷的 特点在社会、经济生活中发挥着重要作用的同时,也一直以它的高事故率、高 事故损害困扰着我国高速公路的管理者和使用者。据公安部通报的全国道路交 通事故统计分析( 王炼,2 0 0 6 ) ,2 0 0 5 年全国共发生道路交通事故4 5 0 2 5 4 起; 造成9 8 7 3 8 人死亡;4 6 9 9 1 1 人受伤;直接财产损失1 8 8 亿元。其中高速公路 交通事故死亡人数达6 4 0 7 人,占总数的6 5 。在4 7 起特大交通事故中,高 速公路上就发生1 0 起,情节重大,后果严重。因此,探究高速公路交通事故发 生机理、内在规律,分析高速公路交通事故影响因素,对于高速公路减少交通 事故、交通安全控制,以及保障高速公路行车安全具有重要意义。 1 4 本文的内容及结构 第一章:绪论。简要介绍本论文的选题背景、研究目的和意义、文章结构。 第二章:基于粒子群优化的b p 神经网络。首先介绍了b p 神经网络的基本 概念,对其结构、原理、算法及其存在的问题分别作了必要的介绍。然后陈述 了粒子群算法的基本原理,算法流程。在此基础之上,给出本文所采用的基于 粒子群优化的神经网络的思路,流程和实现方法,并对该方法的优势加以说明。 浙江工业大学硕士学位论文基于粒子群优化的神经网络对高速公路事故分析的研究 第三章:数据预处理。首先对高速公路的原始数据情况进行分析,然后介 绍了常用的数据处理的方法。最后根据实际情况选择合适的数据处理方法对原 始数据进行处理。 第四章:神经网络的设计与实现。首先设计了神经网络的拓扑结构,并选 择p s o 为训练算法。然后采用m a t l a b 实现该神经网络。并将已经处理好的 数据作为训练和测试的数据对神经网络进行训练和测试,最后得到有一定预测 功能的神经网络。 第五章:结果分析与预测。根据神经网络的训练和测试结果,结合实际情 况对输入的各项因素进行分析,并研究它们与输出项的关联。进而使用该神经 网络,实现对交通事故的预测功能。 第六章:总结与展望。本章对论文的内容以及研究过程中的主要工作进行 了概括和总结,最后对相关研究的发展方向作了展望。 4 浙江工业大学硕士学位论文 基于粒子群优化的神经网络对高速公路事故分析的研究 2 基于粒子群优化的b p 神经网络 2 1 b p 神经网络的基本原理 2 1 1 人工神经网络简述 人工神经网络模型是基于生物学中神经网络的基本原理而建立起来的一种 模仿人脑工作方式的计算模型,可以被看作一种具有大量连接的并行分布处理 系统,它可以通过学习获取知识和解决问题,并将知识存储在连接权值中。 神经元是神经网络的基本处理单元,它的模型如图2 1 所示。 输入通用神经元 厂、厂弋 ! 嚣嚣f t i 矽+ 办, 图2 1 单输入神经元 从图中可以看出,标量输入p 乘以权值w 得到即,将其送入累加器并与偏 置值b 相加得到的值刀通常被称为净输入,它被作为参数送入传输函数厂,通 过厂的运算产生标量输出a 。神经网络的设计者可以选择特定的传输函数厂, 并根据学习规则调整权值w 和偏置值b 以满足特定的需要。其中的传输函数主 要包括三种类型:阶跃传输函数、线性传输函数和l o g s i g 传输函数,如图2 2 。 两个或多个并行操作的神经元组成神经网络的层,典型的神经网络可以包括一 层或多层。如果某层的输出是神经网络的输出,该层就为输出层,其他层为隐 c j 层o 5 基于粒子群优化的神经网络对高速公路事故分析的研究 0 7 ,i , ! 熊z 。 0 , 1 ,4 i :矽 。一 d , 1 扛= p u r e l b 捌l n ) a 兰l t 祭婚佳 图2 2 阶跃传输函数、线性传输函数和l o g s i g 传输函数 人工神经网络模型主要考虑网络连接的拓扑结构、神经元的特征、学习规 则等。目前,已有近4 0 种神经网络模型,其中有反传网络、感知器、自组织映 射、h o p f i e l d 网络、波耳兹曼机、适应谐振理论等。根据连接的拓扑结构,神 经网络模型可以分为: ( 1 ) 前向网络。网络中各个神经元接受前一级的输入,并输出到下一级, 网络中没有反馈,可以用一个有向无环路图表示。这种网络实现信号从输入空 间到输出空间的变换,它的信息处理能力来自于简单非线性函数的多次复合。 网络结构简单,易于实现。反传网络是一种典型的前向网络。 ( 2 ) 反馈网络。网络内神经元间有反馈,可以用一个无向的完备图表示。 这种神经网络的信息处理是状态的变换,可以用动力学系统理论处理。系统的 稳定性与联想记忆功能有密切关系。h o p f i e l d 网络、波耳兹曼机均属于这种类 型。 神经网络具有学习并获取知识的能力。所谓学习,就是修改神经网络的权 值和偏置值的过程。而指导神经网络进行权值更新的规则就被称为学习算法。 网络学习通常有两种方式:有监督学习和监督学习。两者之间的差别在于 学习的过程中是否有与输入相对应的目标输出对训练进行指导。目前大多数的 神经网络采用的都是有监督学习。它是一个重复的过程,当每个输入作用到网 络上时,网络的实际输出与目标输出相比较,然后学习规则调整该网络的权值 和偏置值,使得网络的实际输出进一步靠近目标输出。网络训练的过程如图2 3 所示( 李博,2 0 0 5 ) 。 6 浙江工业大学硕士学位论文 图2 3 神经网络学习过程 人工神经网络特有的非线性适应性信息处理能力,克服了传统人工智能方 法对于直觉,如模式、语音识别、非结构化信息处理方面的缺陷,使之在神经 专家系统、模式识别、智能控制、组合优化、预测等领域得到成功应用。人工 神经网络与其它传统方法相结合,将推动人工智能和信息处理技术不断发展。 2 1 2b p 神经网络与b p 学习算法 神经网络是人工智能的一大分支,并且也是人工智能研究的一个重要方向。 最早出现的神经网络即感知器神经网络是单层网络,只能解决线性可分问题, 即使计算单元的作用函数不用阐值函数而用其它较复杂的非线性函数,仍然只 能解决线性可分函数。增强分类能力的途径是采用多层网络,即在输入层和输 出层之间加上隐含层构成多层前馈网络。然而有隐含层之后学习比较困难,因 而限制了多层网络的发展。1 9 8 5 年r u m e l h a r t 等提出的e b p ( e r r o rb a c k p r o p a g a t i o n ) 算法( 简称b p 算法) ,系统地解决了多层神经元网络中隐含层连接 权的学习问题,并在数学上给出了完整的推导。由于b p 算法克服了简单感知机 不能解决的x o r 和其他一些问题,所以b p 模型已成为神经网络的重要模型之 一,并得以广泛使用( 侯清兰,2 0 0 6 ) 。 b p 神经网络具有结构简单,可操作性强,能模拟任意的非线性输入输出关 系等优点而成为目前应用广泛的神经网络模型,网络由输入层i 、隐含层j 、输 出层k 及各层之间的节点连接权所组成,其拓扑结构如图2 5 所示( 武美先, 2 0 0 5 ) 。网络的学习过程由信息正向传播和误差反向传播构成: 7 浙江工业大学硕士学位论文基于粒子群优化的神经网络对高速公路事故分析的研究 图2 4 神经元模型 ( 1 ) 正向传播过程:输入信息从输入层经隐含层逐层处理,传向输出层。 若输出层的实际输出与期望的输出不符,则转入误差的反向传播。 输入层:输入值一般为样本各分量输入值,输出值一般等于输入值。 隐含层:对于节点j ,其输入值甩甜,为其前一层各节点输出值q 的加权和: n e t j = q 。 ( 2 1 ) 输出值为: d ,= z ( e t j ) ( 2 2 ) 式中:z ( 宰) 称为激励函数或作用函数,一般采用s i g m o i d 函数: 1 f s ( n e t j ) = 百匆 ( 2 3 ) 式中:臼,称为阈值,名称为温度系数。隐含层可为一层或多层。 8 翩 规 h 输入层 隐层 输出层 图2 5 二层b p 神经网络 0 l : 0 | 浙江工业大学硕士学位论文 基于粒子群优化的神经网络对高速公路事故分析的研究 输出层:输出层的输x n e t k输出o k 与隐含层类似,分别为j n e t k = g ( 2 4 ) o k = 六( n e t k ) ( 2 5 ) ( 2 ) 反向传播过程:运用链导数法则将连接权关于误差函数的导数沿原来 的连接通路返回,通过修改各层的权值使得误差函数减小。 设网络输入模式样本为x p = 靠 ,期望输出为 ,均方误差函数e p 为: q = 去( 一) 2 ( 2 6 ) 对于所有的学习样本,系统的均方误差为: e = 去莓莓( 矿) 2 ( 2 7 ) 为了达到学习目的,要根据误差函数来相应的调整网络的连接权值,标准 学习算法采用最速梯度下降法调整权值,输出层的权值调节公式: 啄o + 1 ) = ( t ) + a w j k ( 2 8 ) 岛蔫 汜卵 式中:0 r s & t k ) 1 4 浙江工业大学硕士学位论文基于粒子群优化的神经网络对高速公路事故分析的研究 s t e p4 f o rf = l :1 :m s t e p 5 根据薯和训练集样本,按式( 2 1 8 ) 计算粒子适应度以; s t e p6 i fz 厶( ,) 以( j ) = z ;易= ;e n d i f s t e p7 i fj i g j g = j i ;p g = ;e n d i f s t e p8 e n d f o r s t e p9 f o ri - 1 :1 :m s t e p1 0 按式( 2 1 5 ) 更新粒子f 速度m ;按式( 2 1 6 ) 更新粒子f 位置向 量而; s t e p1 1 e n d f o r s t e p1 2 t = t + l ;线性减小国: s t e p1 3 e n dw h i l e s t e p1 4 输出最优适应度以;群最优位置向量。 上述流程中,x = ( 五,恐,) ,其中五= ( 确,墨:,勃) 7 是第f 个粒子的位 置;v = ( h ,v 2 ,v 肘) ,其中v = ( _ 扩,) r 是第f 个粒子的速度;以是所个粒子 迄今搜索到的最优适应值,其对应的粒子位置矩阵是p ( a ,p 。) ;以就粒子 群迄今搜索到的最优适应值,对应的最优粒子位置是以;线性减小国的策略有 多种,下式是其中较好的一种: c o ( t ) = c o o qx ( r r m 瓠) ( 2 1 9 ) 其中,和q 是常数。是的最大值,而一q 则是彩的最小值。 基于以上分析,该学习算法可以设计如下:将神经元之间的所有连接权值 编码成实数向量来表示种群中的个体;随机生成这些向量的群体,接着按照算 法原步骤迭代;抚今追昔中新生成的个体向量还原为神经网络权值,计算所有 样本通过神经网络产生的均方差( 等同于粒子群算法中计算粒子的适应度) ,如 果均方差小于系统指定的误差精度,则训练过程停止,否则继续进行迭代,直 到最大迭代次数。整个算法的流程图如图2 8 所示。 浙江工业大学硕士学位论文 基于粒子群优化的神经网络对高速公路事故分析的研究 图2 8 基于p s o 的神经网络算法流程图 可见,对于给定的神经网络结构,只需对连接权值进行编码,将其映射为 码串所表示的个体,并将训练中产生的均方误差作为评价个体的适应函数,此 时神经网络的训练就可以转化为寻找一组使均方误差最小的最佳连接权值的优 化问题了。 2 4 本章小结 本章首先介绍了人工神经网络的基本概念和它的构成,以及神经网络的特 性。又阐述了b p 神经网络的基本概念和结构特点,并介绍了b p 算法原理。然 1 6 浙江工业大学硕士学位论文 基于粒子群优化的神经网络对高速公路事故分析的研究 后介绍了粒子群算法的基本概念和算法的原理、流程。以此为基础将粒子群算 法作为学习算法应用于神经网络的训练,探讨了如何将神经网络的训练过程转 化为其连接权值的最优化过程,给出了具体的流程和实现方法。 1 7 浙江工业大学硕士学位论文基于粒子群优化的神经网络对高速公路事故分析的研究 3 数据预处理 3 1 数据预处理概述 在很多情况下,我们拿到的第一手数据会存在着噪声数据、丢失数据和不 一致数据等非正常情况,也可能会因为数据库太大,且来自于多个异构数据源, 从而为我们使用数据带来极大的不便。数据预处理技术可以改进数据的质量, 有助于提高应用于神经网络训练和检测的数据的可靠性和针对性,为后续工作 做好准备。 数据预处理的任务是根据原始数据集可能存在的问题,以及神经网络对样 本数据集的要求所决定的。从广义上理解,数据准备的全过程就是数据预处理。 它包括数据清理、数据集成、变换和数据归约等操作( 张志伟,2 0 0 4 ) 。 3 1 1 数据清理 现实世界的数据一般都是不完整的和不一致的。数据清理就是填充空缺的 数据值,识别孤立点、消除噪音,并且纠正数据中的不一致。下面介绍一下数 据清理的基本方法。 1 空缺值。在现实中,许多数据元组的一些属性是没有记录的。遇到这种 情况,通常采用的方法有: ( 1 ) 忽略元组:当类标号缺少时通常这么做,当每个属性缺少值的百分比 变化很大时,它的效果非常差; ( 2 ) 人工填写空缺值:这种方法很费时间,并且当数据量很大、缺少很多 值的时候,这种方法可能行不通; ( 3 ) 使用一个全局常量填补空缺值:将空缺的属性值用同一个常数替换: ( 4 ) 使用属性的平均值填补空缺值; ( 5 ) 使用与给定的元组属于同一类的所有样本的平均值: ( 6 ) 使用最可能的值填补空缺值:可以用回归、基于推理的使用贝叶斯形 式化方法的工具或判定树归纳确定。 上述六种方法中,方法( 6 ) 是最常用的,和其他的方法相比较,方法( 6 ) 使用现存数据的多数信息来推测空缺值。 2 噪声数据。噪声就是一个测量变量中的随机错误或偏差。去噪过程亦即 数据的平滑过程,常用的数据平常技术如下: ( 1 ) 分箱:首先排序数据,并将它们分到等深的箱中,然后可以按照箱的 平均值平滑,按箱中值平滑,按箱的边界平滑等等。分箱在某些情况下也可以 1 8 浙江工业大学顾士学位论文基于粒子群优化的神经网络对高速公路事故分析的研究 作为一种离散化的技术使用; ( 2 ) 聚类:孤立点可以被聚类检测。聚类将类似的值组织成群或“聚类”。 直观上看,落在聚类集合之外的值被视为孤立点,将其去除; ( 3 ) 计算机和人工检查结合:计算机监测可疑数据,然后对它们进行人工 判断; ( 4 ) 回归:通过让数据适应回归函数来平滑数据。 3 不一致数据。有些记录的数据可能存在着不一致的情况。有些数据不一 致可以使用其他材料人工的加以更正。 3 1 。2 数据集成 数据分析任务大多数都涉及数据集成。数据集成将多个数据源中的数据结 合起来放在一个一致的存储中。这些数据源可能包括多个数据库、数据立方体 或者一般的文件。 在数据集成的时候,需要考虑以下几个问题: 来自多个信息源的现实世界实体的识别问题。通常,数据库和数据仓库都 有元数据,即关于数据的数据,这些元数据可以避免模式集成中的错误; 冗余是另一个重要的问题。如果一个属性能由另一个表“导出 ,那么该属 性就是冗余的。属性或维命名的不一致也可能导致数据集中的冗余。有些冗余 可以被相关分析检测到。除了检测属性之间的冗余之外,“重复”也应该在元组 级进行检测。重复是指对于同一个数据,存在两个或者多个相同的元组。 第三个重要的问题是数据值冲突的检测与处理。对于现实世界的同一个实 体,来自不同数据源的属性值可能不同。这可能是因为表示、比例或者编码不 同。 仔细将多个数据源中的数据集成起来,能够减少或者避免结果数据集中数 据的冗余和不一致性。有助于提高神经网络训练和测试的精度和速度。 3 1 3 数据变换 数据变换是将数据转换成适合于使用的形式。数据变换涉及以下内容: ( 1 ) 平滑:去掉数据中的噪声。这种技术包括:分箱、聚类和回归。 ( 2 ) 聚集:对数据进行汇总和聚集。 ( 3 ) 数据概化:使用概念分层,用高层次概念替换低层次“原始”数据。 ( 4 ) 规范化:将属性数据按照比例缩放,使之落入一个特定的区间。 ( 5 ) 属性构造:可以构造新的属性,并添加到属性集中。 1 9 浙江工业人学硕二匕学位论文摧十粒予群优化的神纷州络对衍速公路事故分析的研究 3 1 4 数据归约 在海量的数据上进行复杂的数据分析需要很长的时间,数据归约得到数据 集的简化表示,它小得多,但能够产生同样的或几乎同样的分析结果。有许多 数据归约策略,包括数据聚集( 如建立数据立方体) 、属性子集选择( 如通过相 关分析去掉不相关的属性) 、维度归约( 如使用诸如最小长度编码或小波等编码 方案) 和数值归约( 如使用聚类或参数模型等较小的表示“替换”数据) 。使用 概念分层泛化也可以“归约”数据。 3 。2 原始数据情况分析 本文采用的分析数据,来源于沪杭甬高速公路杭州段从2 0 0 2 年到2 0 0 7 年 9 月底的所有事故记录。沪杭甬高速公路杭州段包括如图3 1 所示的从余杭到 柯桥的路段。 图3 1 沪杭甬高速公路杭州段 这条路虽然不是很长,路况也比较简单,但是由于沿路的地区经济比较发 达,因而车流量非常大,导致这5 6 年中间发生的事故次数也比较多。据我们 所拿到的数据来看,这一路段近五年内的事故记录数为5 2 0 0 多起。经过观察和 分析,我们发现在这五千多起的事故中,有相当一部分事故数据十分相似。因 此我们在对这五千多起事故数据归类的基础上进行了随机抽样,并基于抽样数 据来建立模型。 浙江工业大学硕士学位论文:基于粒子群优化的神经网络对高速公路事故分析的研究 一条事故记录所涉及的信息还是比较全面的。包括:事故文号、时间、发 生的路段、事故所属支队、死亡及受伤人数、事故主要原因、事故形态等等。 全面的信息为本文的研究带来的便利,同时也增加了对记录字段进行选择的要 求。 对于数据的可靠性,由于事故发生时,交警对事故的发生过程进行了详细 的盘查,并且根据法定的程序进行记录,因此绝大部分是可靠的。但是对于有 些属性,例如事故造成的经济损失等一些难以精确计算的属性,所作的记录带 有估计的成分,这些属性信息并不十分可靠。 对于数据的完整性,由于一些较为轻小的事故,比如车辆的些许刮擦等, 交警通常会在现场进行直接处理。对于这类轻微的小事故,有时候并没有作十 分详细的记录。因此,此类事故部分记录的部分属性会有不完整的情况。由于 小事故的起因通常并不复杂,而且事故的数据基数比较大,因此,本文遇到这 种不完整的数据时,一般采用忽略的方法。 此外,由于所作的记录数据大部分均是文字形式,即使是数字形式,也并 不能直接地应用于本文的研究模型中,因此,对数据进行量化是十分必要的。 3 3 数据处理 3 3 1 数据选择 考虑到从余杭到柯桥整个路段的情况并不完全相同,而各个路段的事故发 生频率也有很大的区别,因此,本文在抽取样本的时候,按照各个路段的原始 事故次数的比率进行选取。 首先将从余杭到柯桥的整个路段分为七个小路段,考虑到来回两个方向的 情况不同,所以将每个路段按方向分为两个路段,共计十四个路段。如图3 2 所示。 2 i 浙江工业大学硕士等皇位论文基于粒子群优化的神经网络对l 箭速公路事故分析的研究 ( 1 如 a鼬a3p 图3 2 余杭到柯桥的分段图 按( 1 ) 到( 1 4 ) 各个路段分别统计发生的事故次数及分别占总数的比率,然后 按设计抽取出约3 0 0 个样本进行研究,抽取样本时,按相同的比率进行。具体 情况如表3 1 所示。 表3 1 分路段样本抽取 黟路段 - ? j 一? ,事故起数( 起,)所占比率,、! j抽取样本数( 条) 譬 余杭杭州北 2 5 84 9 6 1 5 杭州北余杭 杭州北杭州 杭州杭州北 杭州萧山 萧山杭州 萧山红垦枢纽 红垦枢纽萧山 红垦枢纽机场 机场红垦枢纽 机场瓜沥 瓜沥机场 瓜沥柯桥 柯桥一瓜沥 合计 9 5 2 9 6 1 0 3 3 9 7 5 1 4 1 9 1 2 1 2 1 5 0 4 4 5 4 4 2 8 5 2 5 3 8 7 l l 5 2 0 4 1 8 2 5 6 9 1 9 8 7 6 3 9 8 8 9 6 3 6 7 4 0 7 2 8 8 8 5 5 8 4 9 1 6 3 7 1 0 3 4 1 3 6 6 1 0 0 5 6 船 ; n 抱9 髓 黔 的 札 钉 m 浙江工业大学硕士学位论文一 基于粒子群优化的神经网络对高速公路事故分析的研究 首先按照各个路段进行分类,针对每个路段,先删去一些不完整的记录。 然后分析记录的各个属性,将一些大量重复冗余的记录删除。选择一些比较有 代表性的记录,尽量以较少的记录数代表更多的信息量。例如,在事故记录中, 发生的由于未保持安全车距而产生的较小的财损型事故比比皆是,因而,可以 将冗余的信息去除,保留具有代表性的信息即可。按照上表的计算,最后得到 的样本数为3 0 1 条事故记录,按原有比例分布在各个路段上。 3 3 2 数据量化 选择了样本记录以后,要对这些数据进行量化处理,这是为了方便将实际 数据应用于本文所构建的模型当中。根据本文研究和建立模型的需要( 详细分 析见第四章) ,得到的数据信息相关属性为:路段、天气、肇事车辆车型、超速 行驶、违章装载、未保持安全车距、疲劳驾车、违章超车、违章变更车道、违 章停车、违章掉头倒车、违章穿行车行道、车辆故障、操作不当、道路情况和 事故等级,共计十六个属性。 具体的量化规则如下: 1 路段( 余杭柯桥) 按照图3 2 所示对整个路段进行分段,共分为十四个路段,分别按照图示 的标号进行量化。即: ( 1 ) 余杭杭州北:1 ; ( 2 ) 杭州北余杭:2 ; ( 3 ) 杭州北杭州:3 ; ( 4 ) 杭州杭州北:4 ; ( 5 ) 杭州萧山:5 ; ( 6 ) 萧山杭州:6 ; ( 7 ) 萧山红垦枢纽:7 ; ( 8 ) 红垦枢纽萧山:8 ; ( 9 ) 红垦枢纽期。场:9 ; ( 1 0 ) 机场红垦枢纽:1 0 ; ( 1 1 ) 机场瓜沥:1 l ; ( 1 2 ) 瓜沥机场:1 2 : ( 1 3 ) 瓜沥柯桥:1 3 : ( 1 4 ) 柯桥一瓜沥:1 4 。 2 天气 天气是指发生事故时的天气情况。 浙江工业大学硕士学位论文基于粒子群优化的神经网络对高速公路事故分析的研究 ( 1 ) 晴:o ; ( 2 ) 阴:1 ; ( 3 ) 雨:2 ; ( 4 ) 雪:3 ; ( 5 ) 雾:4 : ( 6 ) 大风:5 ; ( 7 ) 沙尘:6 ; ( 8 ) 其他:7 。 量化时,基本根据对于行车的影响度进行,如:在晴天行车视野较好,而 在阴雨天气,非但光线不好,而且路面较滑,更容易引起事故。后面几项由于 发生的机率很低,因而放在后面。 3 肇事车车型 由于发生事故时有时牵扯到多辆车,车型不同,因此采用肇事车车型作为 一项影响因素。 ( 1 ) 轻型货车( 1 吨以下) :0 ; ( 2 ) 小型货车( 3 吨以下) :1 ; ( 3 ) 小型客车:2 ; ( 4 ) 中型货车:3 ; ( 5 ) 中型客车:4 1 ( 6 ) 大型货车:5 1 ( 7 ) 大型客车:6 1 ( 8 ) 重型挂车:7 。 以上的量化基本上是遵从车型的从小到大的顺序,因为客车发生事故时, 更容易引起人员的伤亡,故而将同车型的客车放在货车后面。虽然小型客车的 车辆性能相对较好,但是由于小型客车所占比重大,小型客车造成事故的比率 非常大,因此并没有将它放在最前面。 4 超速行驶 这一项主要表示发生事故时,肇事车辆是否发生超速行驶。如果是,则为 l ;否则为o 。 5 违章装载 同上,如果肇事车辆发生违章装载,则此项为l :若没有,则为0 。 6 未保持安全车距 如果肇事车辆未保持安全车距,则此项为l ;若保持了安全车距,则为o 。 7 疲劳驾车 如果肇事司机疲劳驾车,则此项为1 ;否则为o 。 浙江工业大学硕士学位论文 基于粒子群优化的神经网络对高速公路事故分析的研究 8 违章超车 如果肇事车辆违章超车,则此项为1 ;如果没有,则此项为o 。 9 违章变更车道 如果肇事车辆声音变更车道,则此项为l ;如果没有,则此项为0 。 l o 违章停车 如果肇事车辆违章在高速公路上停车,则此项为1 ;如果没有,则此项为0 。 1 1 违章倒车、掉头 如果肇事车辆违章在高速公路上倒车、掉头,则此项为l ;如果没有,则 此项为0 。 1 2 违章穿行车行道 如果肇事车辆违章穿行车行道,则此项为l ;如果没有,则此项为0 。 1 3 车辆故障 如果肇事车辆没有发生故障,则此项为0 ;如果发生炸胎,则此项为1 ;如 果发生制动失效或制动不良,则此项为2 ;如果发生其他故障,则此项为3 。 1 4 操作不当 如果肇事司机没有操作不当,则此项为o ;如果制动不当,则此项为1 ;如 果转向不当,则此项为2 ;如果其他操作不当,则此项为3 。 1 5 道路情况 如果事故发生时道路情况正常,则此项为0 ;如果道路路阻,则此项为1 ; 如果道路施

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论