




已阅读5页,还剩64页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于高速公路收费数据的交通流量多维分析技术研究重庆大学硕士学位论文学生姓名:万金朋导师姓名:孙棣华 教 授专 业:交通信息工程及控制学科门类:工 学重庆大学自动化学院二O一二年四月65 / 69Study on Multidimensional Analysis of Traffic Flow based on Highway Toll Data A Thesis Submitted to Chongqing Universityin Partial Fulfillment of the Requirement for theDegree of Master of EngineeringByWan Jinpeng Supervised by Prof. Sun DihuaMajor: Transportation Information Engineering and ControlCollege of Automation of Chongqing University, Chongqing, ChinaApril, 2012摘 要交通流量是反映交通运行状态的主要参数之一,如何科学的分析高速公路的交通流量分布规律是高速公路管理部门面临的重要问题之一。论文在讨论交通流量的获取与交通流量分析的国内外研究现状的基础上,指出目前对于交通流量的采集主要依靠人力或昂贵的硬件设备,高速公路的交通流量很不全面,对于高速公路流量的分析主要依靠经验,缺乏充分的数据和先进技术的支持,无法对交通流量进行多样化、多层次、多角度的分析,管理决策往往缺乏针对性和有效性等缺点。针对上述问题,论文利用现有的高速公路联网收费系统中的收费站出入口数据,提出了一种高速公路断面的交通流量的估算算法,进而采用趋势图、透视表等数据可视化方法对高速公路不同时间、断面以及车型的交通流量数据进行分析,获取其时空分布规律,加深对交通流量数据的理解,有助于进行高速公路交通流量的时空数据挖掘的研究,为有关部门提供科学管理和决策支持工具,支持对高速公路的针对性管理。论文将联网收费系统的收费数据作为分析高速公路断面的交通流量的依据,以整体框架的构建、交通流量的估算处理、相关信息的抽取、交通流量仓库模型研究、OLAP(On Line Analytical Processing)多维数据集的设计、数据仓库和多维数据集的更新为线索展开研究,对于交通流量分析结果,利用OWC(Office Web Component)组件进行多维展示。针对总体框架中需要解决的关键问题进行了深入研究。首先,根据目前高速公路管理部门的数据环境及数据特点,研究了基于DTS(Data Transformation Services)的交通流量数据抽取器,进而提出了一种基于高速公路联网收费数据的多断面交通流量估算方法。其次,对交通流量规律分析的数据仓库模型和OLAP数据库进行了研究,重点分析了交通流量数据的粒度,并对交通流量数据进行了基于粒度的概化,在此基础上,构造了数据仓库的星型模型并完成了物理实现。基于上述数据仓库模型,选取断面、车型、时间作为交通流量分析多维数据集的维度,创建了交通流量分析多维数据集。最后,针对实际应用环境的需要,研究了数据仓库更新的方法和流程。应用上述研究成果,利用重庆市联网收费平台采集的高速公路收费数据,开发了重庆市高速公路断面交通流量规律多维分析系统,具有良好的应用前景。关键词:交通流量分析,收费数据,OLAP,交通流量数据仓库,数据更新ABSTRACTTraffic flow is one of the main parameters to reflect the state of traffic running, How the scientific analysis of highway traffic distribution rule is one of the important issues facing the highway management department. The Paper to discuss traffic flow on the basis of the research status and traffic flow analysis, which points out human or expensive hardware for the acquisition of the traffic flow. Highway traffic flow is far from comprehensive, which mainly replys on experience in the analysis of freeway traffic. Lack of adequate data and advanced technology support, which can not be on the traffic flow, diversified, multi-layered, multi-angle analysis. Management decisions often lack relevance and effectiveness of other shortcomings.In response to these issues, The Paper takes use of the toll station entrances and exits in the data in the existing Highway Toll System and makes a point of a highway sections traffic flow estimation algorithm highway sections traffic flow estimation algorithm. Thus it adopts the trends, pivot tables and other data visualization methods,which rsponds to the analysis of the highway at different times, the cross section as well as models of traffic flow data and access to its spatial and temporal distribution, deeply understands the traffic flow data. It contributes to the highway traffic flow spatio-temporal data mining research,and provides scientific management and decision support tools for the relevant departments. Support targeted on the problem of highway traffic flow management. The Paper Toll System charges data as a basis for analysis of traffic flow on the highway section and uses the construction of the overall framework,traffic flow estimation processing, the extraction of relevant information, the design of the OLAP cube, data warehouse and cube updates provide some clues. For traffic flow analysis, it takes advantage of OWC components of the multi-dimensional to show.Key issues need to be addressed in the overall framework of the in-depth study. First of all, according to the data environment and data characteristics of the highway management department, it researchs the traffic flow data extraction based on DTS,and points out a traffic flow estimation method based on the data section of the Expressway Network charges.Secondly,it poses model law analysis of traffic flow data warehouse and OLAP databases,and mainly analyzes the traffic flow data granularity,and the traffic flow data based on the granularity of generalizability.On this basis, it constructes star model of the data warehouse and completes the physical implementation.Based on the above data warehouse model, it selects the section、models、times to make up of the dimension of the cube as a traffic analysis, and creates a traffic analysis cube.At last , contrary to the practical application of environmental needs, it researches the methods and processes the data warehouse updates. Application of the above research results,it takes advantage of the Chongqing toll collection of highway toll data platform,and we develope the Chongqing city expressway section traffic rule multi-dimensional analysis system ,which has a good prospect of this application .Keywords: analysis of the traffic flow, charge data, online analytical processing, traffic flow data warehouse, data update目 录中文摘要I英文摘要III目 录51 绪 论91.1研究的背景91.2研究的目的及意义101.3国内外研究现状及分析101.3.1国外研究概况101.3.2国内研究概况121.3.3研究现状问题分析131.4论文结构141.5本章小结152 高速公路交通流量多维分析总体框架172.1引言172.2需求分析172.3设计思想182.4高速公路交通流量多维分析182.5关键问题202.6本章小结213基于高速公路收费数据的交通流量分析233.1引言233.2 断面交通流量估算所需数据的抽取233.3建立高速公路断面交通流量估算模型243.3.1数据预处理243.3.2基础数据调研253.4 基于收费站数据的道路断面的交通流量估算263.5 实验及验证273.5.1实验环境273.5.2验证及对比273.5.3实验结果分析303.6 本章小结304 基于OLAP的交通流量数据仓库模型334.1 引言334.2数据多维分析相关技术基础334.2.1数据仓库技术334.2.2数据仓库的多维数据模型344.2.3 OLAP技术364.3流量变化规律多维分析数据仓库模型394.3.1 交通流量变化规律多维分析概念模型394.3.2 交通流量变化规律多维分析逻辑模型404.3.3 交通流量变化规律多维分析物理模型434.4 交通流量OLAP数据库设计444.4.1 维度及多维数据集选择444.4.2 交通流量规律多维数据集的创建454.5交通流量变化规律多维分析数据仓库和多维数据集更新方法研究454.5.1 数据仓库更新454.5.2 多维数据集更新474.5.3多维数据集更新处理流程474.6本章小结485实例分析505.1 应用环境505.2 基础数据处理505.2.1 基础数据505.2.2 数据预处理525.3 系统开发中关键问题实现525.3.1高速公路交通流量数据的估算的实现535.3.2交通流量数据到数据仓库事实数据的生成的实现535.3.3多维数据集的生成和更新的实现535.3.4基于OWC的分析结果的多形式展示的实现545.4高速公路交通流量规律多维分析结果展现555.4.1 数据透视表展示555.4.2 图表展现585.5 本章小结596 总结与展望606.1 总结606.2 研究展望60致谢63参考文献65附录69A作者在攻读学位期间发表的论文目录69B作者在攻读硕士学位期间参与的项目目录69 1 绪 论1.1研究的背景到2011年底,我国高速公路通车总里程已超过8.5万公里,位居世界第二位1。从高速公路通车里程和路网结构、高速公路密度的增长情况来看,我国高速公路这些年的建设规模和发展速度是空前的,施工水平和建设质量的技术进步也接近于发达国家水平,这使得我国高速公路的整体路网适应能力迅速提高。然而在高速公路的管理和高速公路的信息化建设方面,这些年的技术发展速度相对来说落后于施工技术的发展速度,与发达国家的差距比较明显2。交通数据的采集、整理、应用上远远落后于西方发达国家,表现在没有实现数据资源共享,未形成统一的数据管理模式等方面,致使大量宝贵的基础数据或已有数据没能得以充分利用,造成没有必要的重复、反复采集等一系列问题3。同时由于数据资源的缺乏也造成了交通管理上的不足。对于高速公路的交通流量的分析更是如此,在进行高速公路规划和建设方案研究时,都没有系统的、全面的高速公路网交通流量数据,许多高速公路建设项目在进行工程可行性研究时,都要花费大量的人力、物力进行局部的交通流量调查,同时由于受各种条件的限制其数据也不够准确、全面。不够准确的交通流量数据也极易导致规划或建设项目的失误。高速公路交通参数采集是一项十分重要的基础工作,其采集所得的交通参数是高速公路规划、设计、维修和养护管理不可替代的重要资料,也是评估、决策高速公路总体布局和交通发展战略的科学依据,也是评估经济发展水平的一个重要依据,在规划一个经济区域时,离不开这些交通参数4。80年代初6,高速公路主干道上日交通流量一般不过两千多辆,刚开始的手工计数阶段,人力成本极大,且得出的结果误差较大。改革开放以来,国民经济的快速发展,高速公路交通流量逐年快速上升。交通流量采集方法从原始的手工记数发展到机械计数器和自动观测仪器阶段。90年代中期,环形线圈检测器及相关数据处理软件的出现,彻底摆脱了枯燥、烦琐的人工计数方式,且计算较准确,这是高速公路交通流量采集技术的一次飞跃。到目前为止,全国大部分千线高速公路上的交通流量观测站都安装了这种仪器。随后出现了微波检测器以及光电式检测器等,但是上述方法都存在硬件寿命不长,干扰较大等缺点。近年来随着计算机视觉技术的日益成熟,基于视频的检测技术得到了众多学者和专家的推崇。但是,我们己进入21世纪,当今是高速发展的信息时代,社会对公路交通信息精确、快速和多方位应用的要求,使得现有的技术方式相形见拙。具体来说,有以下不足:(1)采集精度不够高,一般不能分车型采集,数量精度和车型分类精度难以满足2个95%要求;(2)设备稳定性差(受气候影响较大);(3)线圈检测器需要路面开挖,影响高速公路的正常运行,且不易维护;(4) 一些硬件寿命不长,干扰较大;(5)采集的数据难以快速汇总。1.2研究的目的及意义高速公路交通流量是最基本的交通管理数据,是我国高速公路交通研究与决策的重要依据,是进行高速公路管理的重要基础数据。无论是进行公路规划、制定建设计划、公路建设可行性研究分析、确定公路设计标准、公路养护管理等等,都需要高速公路交通流量作为研究的依据。建立一个全面的、能够反映全省高速公路网交通流量情况的数据库以及分析模型,对于做好高速公路管理的各项工作具有重要意义。而建立高速公路网交通流量数据库,需要进行大量的调查工作,一个完整的全省路网交通流量分析系统,还需要进行全省的路网交通流量调查,一个全省的路网交通流量调查,需动用的人员要上万人,资金投入也很大。这项工作涉及面广,组织复杂、工作量大,需要投入大量的人力、资金,而所调查的数据只是一个时段的交通流量,随着时间的推移,路网的变化和交通流量的不断变化,这些数据将逐渐失去使用的价值。如果将全省高速公路网的联网收费数据分析得到随意断面的交通流量,从而建成动态的、可以根据有关因素适时调整的数据库,则不仅可以充分发挥全省高速公路网交通流量调查的基础数据的作用,而且可以及时提供全省高速公路路网的全面的交通流量资料,这对于做好公路管理、制定规划、计划等工作都将具有十分重要的意义。另一方面,本论文所研究的数据仓库与OLAP(On Line Analytical Processing)技术应用于高速公路交通流量信息化系统的意义是通过高新技术的有效应用,使得对各种决策(包括收费站管理决策、人员评估战略决策、交通方式及交通路线选择决策等)起到支持作用的信息和知识在高速公路交通流量信息化系统中能够有效流通,提高决策的科学性,从而引导合理的交通行为,最大限度地发挥已有交通设施潜力的目的。1.3国内外研究现状及分析1.3.1国外研究概况高速公路作为干线公路的主体,早在20世纪20至30年代就开始在德国、意大利等西方发达国家出现。上世纪50年代中期以后,发达国家就开始有计划、大规模建设高速公路,到目前已经发展到了一个非常成熟的阶段(美国的高速公路网在上世纪80年代基本建设完成),无论其土建工程还是配套设施的发展都已经非常完善,进而许多发达国家开始重视高速公路的信息化管理、安全性等问题,正向以计算机科学和先进控制技术为基础的智能交通系统发展。国外的高速公路网交通流量数据采集系统大部分也是在高速公路大规模建设阶段日益建设起来,他们的数据资料齐全,在计算机模型上就可随时获得路网的交通流量等相关参数,不必要进行大规模的数据采集工作。交通流量采集信息采集是交通流量分析赖以生存的生命线,而交通流量采集是信息采集的最基本的形式。国外在二十世纪二十年代就开始重视交通流量采集工作,随着信息技术的快速发展,国外大范围的高速公路路网的交通流量采集工作日益呈现出自动化、信息化的特点,调查方法灵活多样。交通流量调查和信息采集手段已经跨过三个台阶,即:人工采集(现在已经很少采用)到半人工采集(成为信息采集的主要手段,现仍继续完善)到遥感采集(继续完善)。国外全体公民的参与热情、行业部门之间的信息交换频率及操作的透明度较高,交通调查工作较多地利用信息化、智能化的技术手段。高速公路交通流量采集方面的理论研究主要集中在新技术、新设备的开发以及交通信息传输方式的现代化方面。目前主要有一下几个方面1)环型感应线圈环型感应线圈7的优点是可靠性高、漏检率低、使用寿命较长。目前国际上公认较为成熟且广泛使用的自适应区域交通协调控制系统有英国的SCOOT系统(split cycle and off set optimization technique),澳大利亚的SCATS系统(Sydney coordinated adaptive traffic system),这两个系统中使用的车辆交通流量检测器均为环型线圈车辆检测器。2)微波检测器最具代表性的微波检测器8是由美国Wavetronix公司研发出的一种目前国际上技术最为领先的交通检测器数字雷达波车辆检测器Smart Sensor(SS105)。SS105用了目前最先进的数字雷达波检测技术,用来采集交通流量、车型、平均速度及占用率等交通数据,广泛应用于高速公路进行全天候的交通检测,可同时检测多达8条车道的交通流量、车道占用率以及平均车速,能够较精确的检测高速公路上的任何车辆。 3)视频检测器:早在20世纪90年代中期,美、英、日本等国就开始研究基于图像处理的事件自动检测系统10,模拟人工判别交通异常的方法来实现事件的直接快速检测。该方法检测率高,检测周期短(几十秒或更短),能识别不同事件的类型,并适应不同的交通流状况,是信息采集检测系统的发展方向11。Ikeda 等研制的基于图像处理技术的异常事件检测系统1314,能够快速检测交通流量、慢行车辆、停驶车辆、丢弃物体、车辆连续变换车道各种事件。 数据仓库技术数据仓库定义是由W.H.Inmon于1993年在建立数据仓库40一书提出的,第一次明确提出了数据仓库的定义:“数据仓库是一个面向主题的、集成的、随时间而变的、持久的数据集合,用以支持经营管理中的决策制定过程39。”利用数据仓库的意义不仅帮助人们制定能够改进生产过程或商业过程的决策,而且实现生产过程或商业过程的自动化11。应用数据仓库技术,改良生产活动或商业过程中的各个环节、发展生产力、提高生产效率的理念,改善企业决策的支持模式,以取得最大的投资回报率,是当今大多数优秀企业的共同经验。数据仓库技术是市场竞争下的产物,通过对大量的、不同源的数据进行集成处理,能够把综合的、丰富的、统一的信息提供给管理者或决策者,从而实现有效的决策辅助。根据调查全球500强中大部分的企业正在建立或己经建立数据仓库,数据仓库随着90年代后期的Internet 的兴起与飞速发展,正在成为当前技术的热点12。因此,各个大型数据库厂商顺应市场需求,都推出自己的数据仓库产品;已经建立和使用数据仓库的企业,大部分都取得了明显的经济效益,在市场竞争中表现出强劲的活力。国外数据仓库的研究在整合了分布式计算、数据库技术、管理信息技术等相关的学科技术的基础上,目前研究重点集中在元数据管理、数据模型等关键技术上。数据模型的建模研究主要集中在如下两个方面:对结构中各种不同类型的数据建模;为了实现数据集成和分析而建立合适的维度。数据模型的实现集中在两个方面:与概念设计无关的实施过程;概念模型到逻辑模型的结构映射。面向对象的组织方式是解决维度设计问题的一个有效的手段,它能够接受异构数据并容纳非附加数据。维度的层次定义为一种相互制约的数学函数,制约函数的意义是用来设计阐述事例和维度之间关系的维度,因此维度的层次表达是一个重点。1.3.2国内研究概况我国从上世纪八十年代初就开始进行高速公路的可行性研究工作,交通流量采集、研究工作随之开展起来16。在我国全面建设小康社会的进程中,高速公路交通面临新的更高的要求,需要在新的发展环境下实现新的跨越式发展。结合我国高速公路交通流量管理的发展情况,建立先进的交通流量采集、分析系统也是时代所趋。交通流量采集我国国内于八十年代引入交通数据采集,在二三十年的发展中,交通参数采集技术逐渐成熟,交通参数数据的采集分析逐渐步入正轨。交通参数已经广泛应用于宏观决策分析、微观工程建设及大量公路与道路专项研究(路网规划、轨道规划、交通状态判别、可行性研究、后评价、影响分析等)。大规模的交通参数采集因其可避免小区域重复采集、可获取详实的数据资料而被重视,广东、山东、黑龙江、江苏、河南和河北等省份先后开展了全省范围的交通参数采集工作。目前,在我国公路上使用的交通流量采集设备,按传感器的使用和信息采集方式的不同主要有以下几类:1)线圈检测器李强伟等5利用环型线圈检测器获得复杂交叉路口的实时交通数据。2)微波检测器徐勇军等6在研究智能交通系统中的微波车辆检测器过程中,利用雷达原理完成了对流量、速度等交通参数的实时采集和统计。调频雷达检测器是利用雷达测距原理来检测静止的车辆,在频域中,利用数字信号处理器对信号变换与处理,能准确、快速地得到车辆的流量、速度等信息。连续波微波检测器是利用运动目标产生的多普勒频移检测运动车辆;该检测器已广泛用于北京市智能运输系统中, 同时可以得出对运动车辆的流量和速度的检测准确率高达95%。3)视频检测器由北京漫波交通科技有限公司研究开发的vantage视频检测系统9可以分析记录停车、逆行、行人、丢弃物、平均车速、交通流量、车型、车间距、车道占有率等,在使用前要进行参数设定,其优点是准确、灵活,相关信息丰富;可根据不同道路环境灵活设置,配合快速使用可扩展性更强7。数据仓库模型国内在数据仓库方面的研究主要集中于数据仓库的架构问题上,主要包括数据模型建立的规则、数据仓库的系统、架构组成、数据管理等方面。另一方面,建立了一些数据仓库在大型企业中成功应用的案例,如上海三枪集团销售分析系统,宝钢能源部智能决策系统等,但总的来说,数据仓库技术在国内还没有得到大范围的应用。目前,数据仓库技术在交通运输行业的应用还很不广泛,在高速公路联网收费管理以及交通流量分析中还未应用,大量的收费数据没有被充分地用于分析交通流量,只是简单的进行收费和统计,所以引入数据仓库与联机分析技术将是非常有价值和有意义的技术。由此可见,建设数据仓库和联机分析处理的环境,可以有效地支持高速公路管理的决策。1.3.3研究现状问题分析我国开展交通流量采集工作虽然已经有二十多年的时间,积累了一些交通流量采集数据,在交通流量采集和分析技术和理论研究上取得了一些成果,高速公路网交通流量数据库及分析系统的开发软硬件设施以及交通数据分析的系统化发展的条件已经具备,但国内高速公路交通管理部门在整体高速公路网交通流量数据库及分析系统方面的研究很少,尚未开发出成熟的交通流量数据库和分析系统,管理手段仍然落后。还存在以下的问题:交通信息的利用效率低,存在大量的重复性采集研究工作。以往的交通流量分析多是针对某条或某几条新(改)建高速公路而进行,交通流量采集工作也仅是研究道路影响区域范围内的流量采集。由于数据的管理机制、共享机制和更新维护工作不很健全,往往形成重复采集和重复性研究工作,浪费大量的人力、物力和资金。另外,我国大部分高速公路均设有收费站和收费管理系统,交通流量观测资料非常丰富。但遗憾的是,这些资料没有多数只是用于收费和汇总报表逐级上报,没有得到充分的开发和利用,甚至有些数据以后闲置一旁,不能发挥应有的作用。交通流量调查数据的输入标准和处理程序不规范。不同部门间对同一交通流量数据的录入、存储形式不统一,不仅造成了数据的重复采集,也不利于数据的查询和检索,造成了极大的资源浪费。交通流量分析功能过于单一,没有充分利用数据间的复杂关联关系,最大程度地挖掘数据的利用价值。目前大多数交通流量分析流程多是为规划设计服务,输出的交通数据仅仅是路段交通流量、路段通行能力和服务水平等指标,但该流程潜在的分析处理的交通指标远不止这些,数据应用挖掘有待于进一步研究。交通流量数据仓库系统的更新维护功能有待研究和深化。我国正处于经济发展和基础设施建设飞速发展阶段,路网规模、布局调整的速度和程度都很大,交通流量常常在高速公路系统内部进行重新分布,这就要求交通流量数据仓库系统能够针对实际情况具有足够的调整基年交通流量分布和更新局部路网抽象的功能,以做到交通流量信息更新的及时性、准确性和数据管理的动态性。然而目前国内在此方面开展的研究还很少。1.4论文结构论文的各章内容安排如下:第一章:介绍论文的研究背景,研究的目的及意义,国内外研究现状及分析,以及论文的结构;第二章:介绍高速公路交通流量多维分析的总体框架,在分析高速公路管理部门的需求的基础上,运用数据仓库和OLAP等技术,提出高速公路交通流量规律分析的总体框架,并阐述总体框架中的关键技术;第三章:介绍关键技术中的数据抽取问题和提出一种基于高速公路收费数据的交通流量估算算法;第四章:研究基于OLAP的高速公路交通流量多维分析数据仓库模型,并研究了数据的粒度,构建了基于星型模式的数据仓库,然后分析高速公路交通流量关联的因素,选取交通流量分析的维度,构建多维数据集;第五章:运用上述方法和总体框架,利用重庆市高速公路的部分收费数据,开发了一个机遇高速公路收费数据的交通流量多维分析系统,实现对重庆市高速公路部分断面的交通流量的多维分析和展示;第六章:总结与展望。1.5本章小结本章给出了本课题研究的背景,对研究的目的和意义进行了阐述,并分析了国内外研究现状,接着给出了论文各章主要研究内容及具体章节安排。2 高速公路交通流量多维分析总体框架2.1引言随着高速公路交通流量的持续快速增长,提高高速公路管理水平、发挥高速公路路网整体运行效率的需求将越来越高。高速公路交通流量多维分析系统能够及时准确的提供高速公路的交通状况信息,从而要为各级高速公管理部门和决策者科学合理地组织高速公路运输,及时解决高速公路中出现的问题,提高服务水平,抓好高速公路安全和市场管理提供科学的决策依据。本章在分析需求的基础上,阐述设计高速公路交通流量多维分析系统的总体思想,最后提出高速公路交通流量多维分析系统的总体结构和系统流程,并提出设计高速公路交通流量多维分析系统所需要面临的四个关键问题。2.2需求分析高速公路管理部门目前的应用系统主要是基于联机事务处理的联机收费系统,此类应用系统主要负责高速公路的营运收费,支持大量用户进行日常事务处理,实现了办公的自动化和信息化。但是,现有的这些应用系统并不具备数据分析的能力,对于高速公路收费系统来讲,管理部门除了关心高速公路营运收入之外,更关心在这些现象所呈现出的分布情况以及背后所隐藏的规律。例如,交通流量在不同的时间、断面上的分布,车型之间的流量对比等。原来的收费系统对于这些需求,显得无能为力。因此,针对目前高速公路管理部门在收费站数据分析方面存在的问题,经过充分的调研和总结分析,确定交通流量规律分析的需求如下: 车辆流量的时间维分布考察车辆在特定时间段的交通流量分布情况,例如春运时期和黄金周。能够对不同年份的同一时期的车辆流量情况进行对比,给出交通流量对比图,并分析一年内不同季度和月份交通流量的规律,利用图表、趋势曲线对交通流量分布规律进行展现。 交通流量的不同检测断面的分布针对不同道路上交通流量情况进行分析对比,观察每条道路的交通流量情况,并且对于不同检测断面的交通流量情况利用地图染色的形式直观展现。 不同车型的交通流量对比。在时间和断面维上对不同车型进行综合分析,查看不同车型的交通流量分布情况。2.3设计思想针对上述需求分析,本文提出的高速公路交通流量规律多维分析设计思想如下: 经济性充分利用高速公路现有的设备和条件,与原有的收费站系统融合,恰当的设计系统,在减少新设备的投入的情况下依然能够获得令人满意的分析效果。 技术合理性数据仓库模型设计的合理与否直接关系到系统的性能和分析结果的优劣,是数据分析的基石,因此必须构建适宜分析的数据仓库模型。本论文充分利用OLAP(联机分析处理)多维分析技术,对高速公路交通流量进行多角度、多层次的分析,然后以数据表、图表显示等方式展现给管理者。因此,从整体系统结构上分为四个部分:一是对收费站数据、道路的基础信息等数据进行抽取,然后对抽取数据进行预处理工作;二是根据收费站数据估算随意断面的交通流量;二是根据需求和数据信息,设计合理的数据仓库模型和OLAP多维分析模型,生成查询分析所需的交通流量数据立方体。最后,将分析的结果以图表和透视表的方式展现。 易操作与可维护性对于数据抽取及转换服务,采用定时触发的方式从收费系统的数据库中抽取,大量的数据处理工作放在后台服务器,将处理结果直接提供给前台程序。对于后台数据的更新采用定时处理和点击按钮两种方式,对于技术管理人员来讲操作简单、容易维护。 可靠性与稳定性在整体方案设计时,系统的稳定性和可靠性也是必须需要考虑的问题。本方案后台服务器采用微软公司的SQL Server 2008及Analysis Service,对于系统运行过程中出现的异常情况,以日志形式进行记录,方便系统管理人员进行维护。2.4高速公路交通流量多维分析方案根据上述需求分析、设计思想,结合现有硬件条件,本文提出的总体方案体系结构框图如图2.1所示。图2.1 交通流量多维分析系统结构图Fig.2.1 Logic structure of the system该方案由基础数据库、数据抽取转换器、交通流量估算模型、SQL Server 2008数据仓库,OLAP多维数据集和前台软件组成。 基础数据库:保存由收费站信息系统传送过来的收费数据以及车辆、道路等相关的静态信息。同时,也作为高速公路管理部门日常事务处理的数据库; 数据抽取转换器:通过内部局域网将交通流量规律多维分析所需的基础数据(出入站数据、车型数据、出口入口时间)抽取到SQL Server数据仓库中,同时将数据进行相应的预处理; 交通流量估算模型:通过联网收费数据估算随意断面的交通流量,存放到数据仓库中; 数据仓库:将规范化和格式化的数据信息、视图、索引等进行存储,管理和更新交通流量数据,能够对交通流量数据进行备份和恢复,并且可以进行质量检查,审计和报告时间仓库的使用和状态,负责安全和特权管理等功能; OLAP服务器:利用收费站数据和基础数据信息创建交通流量分析的多维数据集,进行存储,并负责维护和更新多维数据集; PivotTable:用来展现交通流量多维数据集,可以在客户端对交通流量数据进行下钻、上卷、切片、切块、旋转等操作,通过不同的层次和角度对交通流量数据进行分析,同时与Chart组建绑定,实现交通流量规律的图表、曲线展现; 客户端软件:包括数据透视表和交通流量图表。通过客户端实现OLAP立方体的多维操作,分析高速公路交通流量规律。整体方案的工作流程如图2.2所示。图2.2总体方案工作流程Fig.2.2 Flow chart of system如图2.2所示,数据抽取转换脚本每小时自动运行,更新时间维表,然后将高速公路收费站数据迁移到SQL Server数据库服务器缓冲表中。对于新抽取的数据,利用本文提出的高速公路断面交通流量估算模型进行数据预处理,然后把相关维表调入内存,生成交通流量分析的事实表。为了保持数据的一致性,生成或更新事实表之后,将OLAP数据库中的数据立方体和共享维度一起更新。通过客户端的PivotTable和Chart控件对更新后的交通流量分析多维数据集进行展现。对于图表的展现可以进行多角度、多层次的分析。2.5关键问题结合实际应用背景,要实现本文提出的交通流量规律多维分析总体框架,需解决以下关键问题。 断面交通流量估算所需数据的抽取由于收费站数据库为OLTP数据库,主要面向事务处理,数据零散孤立,不利于数据分析,因此,需要将数据抽取到一个特定的数据环境中。在SQL Server数据库服务器上运行数据抽取器,定时从收费站数据库中抽取交通流量规律所需的原始数据。抽取器的设计要保证收费站数据的完整性和一致性,抽取的数据要准确、合理,并且抽取器的工作不影响收费站数据库的运行。 基于收费站数据的交通流量估算方法基于收费站数据的交通流量估算方法是进行交通流量数据分析的重要环节,通过对原始收费站数据信息进行处理实现交通断面交通流量的估算。本课题基于收费站数据的交通流量估算方法工作将在第三章进行了讨论,在此不再累述。 数据仓库模型的确立及其更新数据仓库模型的设计是否合理关系到多维数据分析的效率以及分析结果的准确性,同时也关系到数据仓库的维护和扩展性。此外,为了保证联网收费数据库与交通流量数据仓库数据的一致性,数据仓库的更新也是本文阐述的关键技术之一,将在第四章进行详细讨论。 OLAP多维数据立方体的设计及更新多维数据集创建过程中对于维的选择以及维的层次关系的设计决定了数据分析结果是否全面和有效,存储模式的选择决定了数据访问效率的高低,因此本文针对联网收费数据分析的特性,对OLAP多维数据集的设计进行研究。当交通流量数据仓库进行更新之后或者多维数据集的存储结构进行了更改,为了保证能够看到最新的分析结果,必须要对多维数据进行同步更新,以保证分析结果的准确性。本文对OLAP多维数据集更新的方法进行了研究,将在第四章进行详细讨论。2.6本章小结本章结合高速公路管理部门现有的应用基础和条件,针对其对高速公路交通流量规律分析的需求,本着合理性、稳定性、经济性、可操作性和可维护性等方面的设计思想,提出了高速公路交通流量规律多维分析的总体框架,并提出总体框架中相关关键技术。3基于高速公路收费数据的交通流量分析3.1引言目前大多数的断面交通流量数据主要来自三种途径:一是根据设置的交通流量采集点在指定时间内人工调查,计算得到断面交通流量;二是在地上或地下设置交通流量检测设备,通过设备取得断面交通流量;三是基于收费数据库数据进行OD矩阵推算得到断面交通流量。这三种方法目前具有一定的操作性,但是尚存在以下几点不足:(1)在交通流量采集点利用人工计数取得交通流量的方法会花费较大的人力、物力、财力,同时实施及数据整理过程较为复杂。(2)在交通流量采集点利用人工计数取得交通流量的方法受人为因素、外界因素的影响较大,相对于收费系统来讲失真度较大。(3)利用交通流量检测设备取得交通流量信息的方法设备成本较高,且只能反映指定点的交通流量。(4)基于收费数据库数据进行OD推算得到断面交通流量方法,该方法的使用受路网的限制,且算法较为复杂。王少辉于2007年提出数据仓库和联机分析技术在高速公路收费数据管理及分析中的应用,但目前国内高速公路收费站分为主线收费站与匝道收费站,匝道收费站的车流量数据只能反映进出高速公路的交通流量,无法反映经过道路断面交通流量。因此通过匝道收费站的流量数据,是根本无法直接得到道路断面交通流量的。基于以上采集方法存在的不足,本文提出了一种基于高速公路收费数据库的出入口刷卡时间、收费站地理位置及车型数据来推算高速公路任意断面交通流量计算方法。3.2 断面交通流量估算所需数据的抽取数据抽取是从联网收费数据库中将数据分析所需要的数据抽取到数据仓库中。为了保证不对联网收费数据库服务器产生过重的负载,采用定时触发的方式将交通流量规律分析所需的数据抽取出来,然后利用基于联网收费数据的道路断面的交通流量估算的方法对抽取的数据进行处理转换,最后将处理好的数据存入专用的数据分析服务器。因此,本数据抽取转换器采用定时触发方式,在约定的时间点进行数据抽取转换工作。本文采用的时间点在每小时的整点处,将一小时内的联网收费数据抽取出来,同时,利用SQL语句过滤与交通流量规律分析无关的收费信息,以减少数据的传输量,提高抽取效率。另外,在第一次抽取时,需要将收费站的基础数据信息从联网收费数据库抽取到SQL Server 服务器上,如果基础数据发生变更也要及时准确的反映到SQL Server服务器中基于以上数据抽取器的要求,本文采用DTS和触发器来实现数据抽取转换工作。 DTS和触发器DTS(Data Transformation Services)数据转换服务提供将一种数据源转换为另一种数据源的服务,能够从多个异构数据源向数据仓库导
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汉字真有趣课件照片
- 《Photoshop CC平面广告设计》高职全套教学课件
- Unit6 Plan for Yourself单元测试(无答案)人教版(2024)八年级英语上册
- 汉字多的课件
- 新能源汽车充电基础设施建设规
- 高端家电市场品牌竞争策略研究
- 汉子家园言课件
- 水边玩耍的安全教育
- 消防设施功能测试方案
- 建筑工程施工阶段安全监控方案
- 2025年体育教练员执业能力考试试题及答案解析
- 2025年住培结业考试题库及答案
- 2025年重庆辅警管理知识模拟100题及答案
- 创伤急救基本知识培训课件
- DB42∕T 2151-2023 应急物资储备库建设规范
- 2025年二级建造师继续教育题库及参考答案(完整版)
- 胶水储存管理办法
- 精神患者家属健康教育讲座
- 分包招采培训课件
- 公司全员销售管理办法
- 考试真题及答案解析注册安全工程师
评论
0/150
提交评论