




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据挖掘算法 在交通数据中的研究分析摘要:该 文 希望通过数据挖掘技术,科学合理地帮 决策者寻找数 据 之间的规律,全面地分析交通数据信息之 间隐含的内在 联 系,进一步科学合理地管理数据,为交通 运输管理部门 和 用户出行提供方便,为交通运输的信息化 发展起到促进 作 用。关键词: 数 据挖掘;交通;算法中图分类 号 :TP311 文献标识码: A 文章编号: 10093044(2014)12-2707-02The Researchof Data Mining Algorithm in Traffic Data Analysis and Data MiningWANG Ji1, YANG Q
2、ian2(1.Guizhou Vocational Technology Institute , Guiyang 550023, China; 2.Guizhou Polytechnic College of Communications , Guiyang 550008, China)Abstract: This paper hopesthrough the data mining technology , seeksthe laws between the data for decision makers scientifically and reasonably It analysis
3、of relationship between traffic data implied information comprehensively , further manage data scientifically and reasonably, for traffic management departments and usersto provide convenient transportation , and to promote information development for transportation.Key words: data mining ; traffic
4、; arithmetic 随 着现代 交通信息化技术的发展,数据的科学处理在交通发展过程 中显得越来越重要。通常,在交通系统的数据库中存储着 海量数据,需要用科学的方法进行数据的分析和管理,而 一般的数据库只是对数据进行查询,得到的只是数据的表 层信息,不能获得数据中的隐含关系,不能得到隐藏在数 据中的深层次的,有关数据之间关联特性的预测信息。在 信息技术高速发展的大数据时代,仅停留在表层处理的数 据分析方式已经不能适应现代科技发展的需求,研究基于 数据挖掘技术的交通数据分析处理技术已经成为交通系统 迫切需要解决的问题。1 数据挖 掘 技术概述数据挖掘 是 一个决策支持过程,是从大量的、不完全
5、 的、有噪声的 、 模糊的、随机的实际应用数据中,提取隐 含在其中但潜 在 有用的信息和知识的过程。数据挖掘对挖 掘中的大量数 据 进行抽取、转换、分析以及模型化处理, 从中提取辅助 决 策的关键性数据。数据挖掘就是从大量数 据中提取或“ 挖 掘”知识。数据挖掘的工作过程大致可分 为:数据准备(datapreparation) ,数据挖掘,以及结果的解释和评价( interpretation and evaluation )三个 部 分。2 数据挖 掘 技术在交通数据中的运用研究在交通数 据 的处理中,由于交通信息的特点,交通数 据量非常庞大 , 而且每天在迅速增多,历史数据众多,数 据挖掘技
6、术应 用 在交通系统中主要是挖掘交通数据历史知 识,得出一些 有 用信息,提供给用户,方便用户出行,方 便交通管理部 门 对数据进行管理。该文介绍常用的三种数 据挖掘算法。2.1 决策树算法在交通数据中的运用决策树方 法 是数据挖掘方法中的一种重要的方法,该 方法广泛用于 解 决与分类相关的各种问题,属于有指导的 归纳学习算法 。 该方法着眼于从一组无次序、无规则的数 据中归纳出一 个 分类描述,从中发现潜在的、具有商业价 值的信息。本算法在 交 通数据处理中可以应用到实时路况数据挖掘中。实时路 况数据库如表 1 所示,其中影响到道路的通 行有 两个属性 : 天气、是否为上班时间。在天气属性中
7、, 天气属 性的可 能取值为晴、小雨、大雨、冰雪等;是否为 上班时间 属性 取值为两个:是或者否。将这些取值都作为 关联算法中 的一个项,故关联算法中的数据项集 I 为: 晴、 小雨、大 雨、 冰雪、是上班时间、不是上班时间 ,分别用 i 来表示, 则数据项集 I 为:i1、i2、i3、i4、i5、i6。最后得出实时路 况 的类别为:通路畅通、道路阻断。并将其 作为数据项i7、i8,加入到数据项集中。利用关联规则找出i1i7、i2i7、i3i7、i4i7、i5i7、i6i7、的关联支持度,得出为: i1i7=4、 i2i7=4、 i3i7=3、 i4i7=1 、 i5i7=6、 i6i7=6。
8、故从关联 规则支持度分析,属于天气属性的和比是否 为上班属性的 支持度大,故首先使用天气属性进行决策树 的分支;然后 在利用是否为上班时间作为节点分支得到决 策树。本算法中 融合了关联算法的思想,通过支持度的策略 进行决策树的 节点分支,针对特定的交通实时路况数据库 进行决策树分 支。 考虑到交通实时路况数据库的无规律, 复杂, 比较凌 乱的 情况,对于决策树的分支做了个改进,最终只考虑了 道路通畅的情况,否则,如果将道路阻断也 考虑进去,最后导致决策树所有的分支都能有两种情况,通畅和阻断,这是因为实时路况数据库本身无规律决定的,不能肯定在什 分支时,无法完全分开么 情 况下一定是什么状态,什
9、么情况都有可能,故进行决 策2.2 关联规则算法在交通数据中的应用关联规则 挖掘算法主要是挖掘数据之间的内在关系, 关联规则用于 分析购物篮、人口普查等系统数据,已经证 明了能够产生 一些对实际问题有意义的规则。该文在分析 关联规则算法 在交通数据中的应用时,将该方法应用到交 通事故数据中 , 挖掘出交通事故中各个属性的内在联系。关联规则算法 是 挖掘交通数据中各种属性常见的一种方法, 比 如驾驶员属 性 、车辆属性、天气属性等可能引起交通事 故发生 的原因 之间的规则,从而得到规律,那么交通管理 部门就可以 对驾 驶员、车辆、道路、天气等因数的某些特征来判断导致 道路交通事故发生的可能性,从
10、而指导交通 管理部门的工 作 ,减 少事故的发生。在关联规 则 算法中常见的算法是 Apriori 算法。该算法 是挖掘产生关 联 规则所需要频繁项集的基本算法,利用层 次顺序搜集的 循 环方法来完成频繁项集的挖掘工作,这一 循环方法就是 利用 K 项集来产生( K+1 )项集,例如在交 通事故数据库 中 ,利用存在酒后驾车的记录,来产生既存 在酒后驾车也 存 在驾驶员文化水平因数的记录,这样递归 产生,最后就 能 显示出不同事故原因同时发生的几率。2.3 贝叶斯算法在交通路况的应用贝叶斯数 据 挖掘算法,主要是通过以往的知识利用概率来分析一件 事 发生的概念,这与交通实时路况预测相符, 对
11、于交通实时 路 况,主要是通过以往道路的路况,分析目 前或 者是以后 一 段时间内,道路路况如何,项目中,采用 了贝叶 斯网路 推理 ,利用历史数据,推出以后的在特定情 况下道路 的路况。交通实时 路 况是一个动态过程,随机性和偶然性高,有可能通过对 交 通状态的现状和历史进行综合分析,推测它发生的可能 。 可以采用天气、交通事故、上班时间、车 辆速 度等作为 贝 叶斯网的变量。利用 Y 表示交通状态,有 两种可 能:阻 塞和 畅通;利用 A 表示交通事故,有两种可 能:是和 否;利用 T 表示上班 时间,有两种可能:是上班 时间和不是 上班时间;利用 W 表示 天气状况,有两种可能: 天气良好和 天气恶劣;利用 S 表示车辆速度, 有两 种可能: 缓慢和正常。 利用上述五个变量可以组成贝叶斯网络模型。 有贝叶斯网络 模型推算出如果一条道路阻塞了,可以判定 发生交通事故 的 概率。3 小结本章主要 介 绍了三种数据挖掘的算法在交通数据库中 的应用,其中 , 利用决策树算法和贝叶斯算法可以对交通 运行状况进行 预 测,利用关联规则算法可以对交通事故原 因进行分析和 预 测。交通系统数据库庞大,数据量随机性 强,偶然性高 , 数据挖掘技术
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 油田钻井用APF可行性报告
- 2025年污水流量计行业市场调查报告
- 中国硼酰化钴项目商业计划书
- 运动康复培训计划书
- 业务承揽合同转让协议书
- 板材购销合同协议书范本
- 家纺加盟合同协议书
- 淡墨轩学生文化用具连锁股份有限公司的创业企划书
- 2025年特种线缆材料项目可行性分析报告
- 2025年电动平板车市场分析报告
- 国际财务管理教学ppt课件(完整版)
- DB33∕T 715-2018 公路泡沫沥青冷再生路面设计与施工技术规范
- 彩色简约鱼骨图PPT图表模板
- 光引发剂的性能与应用
- PID控制经典PPT
- 图像处理和分析(上册)课后习题答案(章毓晋)
- 油田注入水细菌分析方法+绝迹稀释法
- 医师处方权申请
- 简易充电器课程设计
- 部编版语文三年级下册课外阅读
- 门诊疾病诊断证明书模板
评论
0/150
提交评论