日常生活中的算法_第1页
日常生活中的算法_第2页
日常生活中的算法_第3页
日常生活中的算法_第4页
日常生活中的算法_第5页
已阅读5页,还剩2页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本文格式为Word版,下载可任意编辑——日常生活中的算法随着计算机应用技术的不断普及、进展和完善,利用数据挖掘技术、专家系统、计算机人工智能来对道路交通事故举行处理已经越来越广泛。鉴于道路交通事故的过程具有系统性、强关联性、繁杂性等一系列特点,运用计算机人工智能技术对道路交通事故的突发性、致因性、规律性、模糊性举行分析和研究等已经成为现实。本文通过对智能算法在交通事故分析中应用的可行性研究,提出了利用聚类分析算法和关联分析算法分别对事故黑点的排查及事故因素的关联分析。

智能算法;事故信息;聚类分析;关联分析

1.智能算法在交通事故分析上的应用

目前人们广泛采用的智能计算方法主要有统计方法)、器学习方法、面向数据库的方法、聚类分析方法、人工神经网络方法、遗传算法、近似推理和不确定性推理方法、基于证据理论和元模式的方法、现代数学分析方法、粗糙集或模糊集方法、集成方法、关联规矩算法、决策树方法等。

进展智能交通的最终目标就是通过对各类的交通信息、数据举行分析,对交通系统的操纵方案和策略予以优化,通过调整各类交通参与者的行为以及道路交通设施设备的创办、改善,从而实现交通系统的优化及高效运行的目的。因此,分析交通信息、制定操纵策略是整个系统的关键。本文在总结和借鉴大量学者研究的根基上,介绍两种基于数据挖掘理论的智能算法DBSCAN及Apriori,分别用于交通事故黑点的排查及事故关联因素的分析。

2.基于密度的聚类分析算法DBSCAN

2.1算法应用的数据类型与数据布局

数据挖掘不能直接把任何数据举行计算,要事先对数据举行预处理,构成算法能够应用的数据类型,然后输入到算法中的数据布局中去。基于内存的聚类算法通常都采用以下两种数据布局[1]。

2.1.1数据矩阵

数据矩阵是一个对象-布局。它是由n个对象组成,如:人;这些对象是利用p个属性来举行描述的,如:年龄、高度、体重等。数据矩阵的表达方式为n×p的矩阵。

2.1.2差异矩阵

差异矩阵是一个对象-对象布局。n个对象彼此之间的差异将存放于该矩阵中,采用n×n矩阵来表示。

由交警部门供给的交通事故数据经过整理后存放到数据矩阵中去保存。如:一个交通事故点可以占用一行,而它的每一个属性可以占用这一行的每一个列元素。对于差异矩阵,可以反映每两个事故数据的差异,它可以是两个事故发生地点的距离,也可以是两个事故发生处境的好像度倒数,还可以是两个事故发生的时间差。总之,它可以生动的反映事故之间的差异。在本系统中对于事故黑点的聚类分析采用事发地点的空间距离来构成差异矩阵。

2.2DBSCAN算法在交通事故黑点排查上的应用

DBSCAN算法是一个对比典型的基于密度的聚类分析法,它能从含有噪声的空间数据库中察觉任意外形的聚类。关于该算法的2个根本概念:(1)一个给定对象的ε半径内的近邻就称为该对象的ε-近邻;(2)若一个对象的ε-近邻至少包含确定数目(MinPts)的对象,该对象就称为核对象。DBSCAN算法的根本思想就是通过不断的探寻邻近点来使核对象周边的密度逐步增加,从而探索到一个区域内所查找点或对象密度大的地方。算法中所要研究的点可以描述为交通事故发生的地点,对于算法中的ε-近邻区域可以理解为道路的公里数,因此DBSCAN算法在道路交通事故黑点的智能排查上就可以理解为排查在半径为ε公里内发生MinPts以上交通事故的地点或者路段。

3.关联规矩挖掘的算法分析

3.1关联规矩挖掘的过程

设I={i1,i2,im}是项的集合。设任务相关的数据D是数据事务的集合,其中每个事务T是项的集合,使得T?I。每一个事务有一个标识符,称作TID。设A是一个项集,事务T包含A当且仅当A?T。关联规矩是形如A?B的蕴涵式,其中A?I,B?I,并且A∩B=?。规矩A?B在事务集D中成立,具有支持度support,是指D中包含A和B的事务数与全体事务数之比它,即概率P(A∪B)。规矩A?B在事务集D中具有置信度confidence,是指D中包含A和B的事务数与包含A的事务数之比,即条件概率P(BA)[2]。

给定一个事务集D,挖掘关联规矩问题就是产生支持度和置信度分别大于用户给定的最小支持度(MinimumSupportCount,简称min_sup)和最小置信度(MinimumConfidenceCount,简称min_conf)的关联规矩[3]。

项的集合称为项集(Itemset),包含k个项的项集称为k-项集。项集的展现频率是在整个事务数据集D中包含该项集的事务数,简称为项集的频率、支持计数或计数。假设项集的展现频率大于或等于min_sup与D中事务总数的乘积,称项集得志最小支持度min_sup。假设项集得志最小支持度,那么称它为频繁项集(FrequentItemset),简称频集[3]。频繁k-项集的集合通常记作Lk。

3.2Apriori算法在交通事故关联因素分析上的应用

Apriori算法是根据频繁项集中全体非空子集都务必也是频繁项集这一性质[4,5],对目标举行第k遍扫描之前,可先产生候选集Ck,Ck可以分两步来产生,设前一步(第k-1步)已生成(k-1)-频繁集Lk-1,那么首先可以通过对Lk-1中的成员举行连接来产生候选,Lk-1中的两个成员必需得志在两个成员的工程中有(k-2)个工程是一致的这个条件方可连接,即:Ck=Lk-1ΘLk-1={AΘB│A,B?Lk-1,│A∩B=k-2}。接着,再从Ck中删除全体包含不是频繁的(k-1)-子集的成员工程集即可。

发生道路交通事故的理由是由多方面因素抉择的,与驾驶员、车辆、道路、时间、天气等都是有确定联系的,是综合共同作用的结果。概括思路是利用多维Apriori算法得出各种事故相关因素的关联规矩,以“条件集合?结果”的方式显示,条件集合包括驾驶员因素、车辆因素、天气因素、时间因素、照明因素中的某一个或几个因素,即可能引发道路交通事故的理由因素。结果包括事故本身因素中的事故类型、事故主要理由、事故形态、伤害程度,即导致道路交通事故的结果因素。通过得到的每条规矩的支持度和置信度来判断规矩对道路交通事故影响的程度及规矩的重要性和有效性。(下转第98页)

(上接第86页)概括描述:通过选定要分析的交通事故本身与驾驶员、车辆、道路、天气、时间等概括选项信息,利用多维Apriori算法作关联分析。察觉各个因素之间的联系,结果采用文本形式来描述,形如(A,B,C)?D(min_sup;min_conf),其中A、B、C分别代表规矩的前提条件,D代表规矩的结果,min_sup和min_conf表示该规矩的支持度和置信度,取值均为0%到100%之间。支持度描述的是在全体的记录中,A、B、C同时展现的概率;置信度表示在A、B、C同时展现的条件下,发生处境D的概率。当一条规矩得志确定的最小支持度和最小置信度时,可以认为该规矩是对比常见的,可信度对比高的。如:天气:晴&照明条件:白天&驾驶员:无证驾驶?伤人事故(12.7%;29.8%),表示在全体的事故记录中,同时得志晴、白天和无证驾驶条件的记录占12.7%,由于这3个条件而展现伤人事故的占29.8%。[科]

[1]鲍海涛.聚类分析在交通事故黑点智能排查中的应用[D].吉林大学,2022:25-35.

[2]毛国君,段立娟,王实,等.数据挖掘原理与算法[M].北京:清华大学出版社,2022:65-68,280-290.

[3]陈文伟.数据仓库与数据挖掘教程[M].北京:清华大学出版社,2022:123-125.

[4]YangXue-bing.AHighEfficientMulti-dimensionalAssociationRulesMiningAlgorithm[J].ComputerDev

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论