




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、management departments and users to provide convenient数据挖掘算法在交通数据中的研究分析摘要:该文希望通过数据挖掘技术,科学合理地帮决策者寻找数据之间的规律,全面地分析交通数据信息之间隐 含的内在联系,进一步科学合理地管理数据,为交通运输管 理部门和用户出行提供方便,为交通运输的信息化发展起到促进作用。中图分类口号:TP311 文献标识码: A 文章编号:1009-3044(2014)12-2707-02The Research of Data Mining Algorithm in Traffic DataAnalysis and Dat
2、a MiningWANG Ji1, YANG Qian21.Guizhou V ocational Technology Institute , Guiyang550023, China; 2.Guizhou Polytechnic College ofCommunications ,Guiyang 550008 , China )Abstract : This paper hopes through the data miningtechnology , seeks the laws between the data for decision makers scientifically an
3、d reasonably It analysis of relationship between traffic data implied information comprehensively ,further manage data scientifically and reasonably , for traffictransportation, and to promote information development for transportation.Key words: data mining; traffic ; arithmetic随着现代交通信息化技术的发展,数据的科学
4、处理在交通发展过程中显得越来越重要。通常,在交通系统的数据库 中存储着海量数据,需要用科学的方法进行数据的分析和管 理,而一般的数据库只是对数据进行查询,得到的只是数据 的表层信息,不能获得数据中的隐含关系,不能得到隐藏在 数据中的深层次的,有关数据之间关联特性的预测信息。在 信息技术高速发展的大数据时代,仅停留在表层处理的数据 分析方式已经不能适应现代科技发展的需求,研究基于数据 挖掘技术的交通数据分析处理技术已经成为交通系统迫切 需要解决的问题。1 数据挖掘技术概述数据挖掘是一个决策支持过程, 是从大量的、 不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中但潜在有用的信息和
5、知识的过程。数据挖掘对挖掘中的大 量数据进行抽取、转换、分析以及模型化处理,从中提取辅 助决策的关键性数据。数据挖掘就是从大量数据中提取或挖掘”知识。数据挖掘的工作过程大致可分为:数据准备(data preparation),数据挖掘,以及结果的解释和评价interpretation and evaluation )三个部分。2 数据挖掘技术在交通数据中的运用研究 在交通数据的处理中,由于交通信息的特点,交通数据量非常庞大,而且每天在迅速增多,历史数据众多,数据挖 掘技术应用在交通系统中主要是挖掘交通数据历史知识,得 出一些有用信息,提供给用户,方便用户出行,方便交通管 理部门对数据进行管理。
6、该文介绍常用的三种数据挖掘算 法。2.1 决策树算法在交通数据中的运用 决策树方法是数据挖掘方法中的一种重要的方法,该方法广泛用于解决与分类相关的各种问题,属于有指导的归纳 学习算法。该方法着眼于从一组无次序、无规则的数据中归 纳出一个分类描述, 从中发现潜在的、 具有商业价值的信息。本算法在交通数据处理中可以应用到实时路况数据挖掘中实时路况数据库如表 1 所示,其中影响到道路的通行 有两个属性:天气、是否为上班时间。在天气属性中,天气 属性的可能取值为晴、小雨、大雨、冰雪等;是否为上班时间属性取值为两个:是或者否。将这些取值都作为关联算法 雨、冰雪、是上班时间、不是上班时间 ,分别用 i 来
7、表示, 则数据项集I为:i1、i2、i3、i4、i5、i6。最后得出实时 路况的类别为: 通路畅通、 道路阻断。 并将其作为数据项 i7 、中的一个项,故关联算法中的数据项集I 为: 晴、小雨、大i1i7=4、i2i7=4 、i4i7、i5i7、i6i7 、的关联支持度,得出为:i3i7=3 、i4i7=1 、i5i7=6 、i6i7=6 。故从关联规则支持度分析,属于天气属性的和比是否为上班属性的支持度大,故首先使用天气属性进行决策树的分 支;然后在利用是否为上班时间作为节点分支得到决策树。本算法中融合了关联算法的思想,通过支持度的策略进行决策树的节点分支,针对特定的交通实时路况数据库进行
8、决策树分支。考虑到交通实时路况数据库的无规律,复杂, 比较凌乱的情况,对于决策树的分支做了个改进,最终只考 虑了道路通畅的情况,否则,如果将道路阻断也考虑进去, 最后导致决策树所有的分支都能有两种情况,通畅和阻断, 这是因为实时路况数据库本身无规律决定的,不能肯定在什 么情况下一定是什么状态,什么情况都有可能,故进行决策 分支时,无法完全分开。2.2 关联规则算法在交通数据中的应用 关联规则挖掘算法主要是挖掘数据之间的内在关系,关联规则用于分析购物篮、人口普查等系统数据,已经证明了 能够产生一些对实际问题有意义的规则。该文在分析关联规 则算法在交通数据中的应用时,将该方法应用到交通事故数 据中
9、,挖掘出交通事故中各个属性的内在联系。联规则算法是挖掘交通数据中各种属性常见的一种方法,比如驾驶员属性、车辆属性、天气属性等可能引起交通事故发 生的原因之间的规则,从而得到规律,那么交通管理部门就 可以对驾驶员、车辆、道路、天气等因数的某些特征来判断 导致道路交通事故发生的可能性,从而指导交通管理部门的 工作,减少事故的发生。在关联规则算法中常见的算法是 Apriori 算法。该算法是挖掘产生关联规则所需要频繁项集的基本算法,利用层次顺 序搜集的循环方法来完成频繁项集的挖掘工作,这一循环方 法就是利用 K 项集来产生( K+1 )项集,例如在交通事故数 据库中,利用存在酒后驾车的记录,来产生既
10、存在酒后驾车 也存在驾驶员文化水平因数的记录,这样递归产生,最后就 能显示出不同事故原因同时发生的几率。2.3 贝叶斯算法在交通路况的应用 贝叶斯数据挖掘算法,主要是通过以往的知识利用概率来分析一件事发生的概念,这与交通实时路况预测相符,对 于交通实时路况,主要是通过以往道路的路况,分析目前或 者是以后一段时间内,道路路况如何,项目中,采用了贝叶 斯网路推理,利用历史数据,推出以后的在特定情况下道路 的路况。交通实时路况是一个动态过程,随机性和偶然性高,有可能通过对交通状态的现状和历史进行综合分析,推测它发 生的可能。可以采用天气、交通事故、上班时间、车辆速度等作为贝叶斯网的变量。 利用 Y
11、表示交通状态, 有两种可能: 阻塞和畅通;利用 A 表示交通事故,有两种可能:是和否; 利用 T 表示上班时间,有两种可能:是上班时间和不是上班 时间; 利用 W 表示天气状况, 有两种可能: 天气良好和天气 恶劣;利用 S 表示车辆速度,有两种可能:缓慢和正常。利 用上述五个变量可以组成贝叶斯网络模型。有贝叶斯网络模 型推算出如果一条道路阻塞了,可以判定发生交通事故的概 率。3 小结本章主要介绍了三种数据挖掘的算法在交通数据库中的应用,其中,利用决策树算法和贝叶斯算法可以对交通运行状况进行预测,利用关联规则算法可以对交通事故原因进 行分析和预测。交通系统数据库庞大,数据量随机性强,偶 然性高,数据挖掘技术的引入
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 残疾人专职委员聘用合同(含工作绩效与晋升)
- 智能停车场车位租赁与广告投放合同
- 成都市二手房买卖税费缴纳协议范本
- 餐饮业食品安全信息共享与合作合同
- 动植物典当借款合同范本:活体抵押版
- 厂房出租安全监管与技术服务协议
- 电子产品采购合同附属协议范本
- 武术文化介绍
- 人教版三年级语文下册《鹿角和鹿腿》示范教学课件
- 羊水细胞形态图谱解读
- 2024-2025学年广东省佛山市南海区高二下学期素养提升学业水平测试数学试卷(含答案)
- 2024年济南产业发展投资集团有限公司招聘真题
- 店面租赁安全协议书
- 重症监护病房新生儿皮肤管理指南(2021)解读
- 财政与金融练习试卷1(共230题)
- 2025年心理健康教育与咨询考试卷及答案
- 现农庄可行性研究报告
- 废旧金属代卖合同协议
- 2025年幼儿教师通识性知识培训考试题库(附答案)
- 利润分配方案范文公司利润分配方案
- 以科技力量提升心理健康筛查效率与质量
评论
0/150
提交评论