




已阅读5页,还剩71页未读, 继续免费阅读
(交通运输规划与管理专业论文)基于IC卡信息的公交客流空间分布特征分析方法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
东南大学硕士学位论文 摘要 城市公共交通系统正常、有效地运行不仅取决于道路、车辆和场站等物资技术设施条件, 更有赖于城市公交线路网的合理规划以及科学有效的运营管理。只有及时、准确、全面地掌握公 交出行数据,才能做出科学的公交规划和运营决策,而城市居民公交出行空间分布特征正是公交 客流信息的重要组成部分。现状我国主要采用人工调查方法获取公交客流信息,耗费巨大的人力 物力,而调查结果却很难达到理想效果,所得数据不能动态反映城市公交出行的长期变化趋势。 目前,公交i c 卡在国内许多城市得到广泛应用,不仅方便了广大乘客,也提供了一种新的客流 调查统计手段,以获取相对实时动态的客流信息。本文即以“基于i c 卡信息的公交客流空间分 布特征分析方法研究”为题,研究从大量公交i c 卡记录中获得公交客流空间分布特征的方法。 论文首先提出公交i c 卡数据分析系统的理论框架结构。公交i c 卡数据分析系统以公交i c 卡记录为分析对象,同时结合其他各类公交运营调度资科。包括公交线路走向、站点布局、调度 时刻表等公交运营信息,以获得公交运营的基本客流信息:建立数据库平台模块、数据分析模块、 用户控制界面模块等三个模块,执行数据采集、数据预处理、数据分析、解释评价等四个分析过 程。在现状数据及技术条件下,提出了公交i c 卡乘客上下车站点判别的理论方法。 论文运用公交i c 卡数据分析系统提出了分析公交客流空间分布特征的方法。在刷卡乘客上 下车站点信息可准确获得的理想条件下,可以全面、准确得到公交客流量和出行特征相关指标, 以及描述公交出行空间分布的公交线路、线网、区域客流o d 矩阵:在客观条件限制无法准确判 别下车站点的现实条件下,重点论述了公交刷卡乘客客流发生量空间分布特征分析的全过程。现 实情况下上车站点的判断虽然可行精度却不高,因此将公交线网相邻站点按照一定的原则进行合 并,形成公交区段:将聚类算法引入到数据处理中,考虑了公交当前复杂运行的现状,主要通过 划分公交区段,采用快速聚类分析法来确定刷卡乘客上车公交区段;以此为基础进行通过线路与 区段两个角度刷卡乘客客流发生量空间分布特征分析。 论文最后以常州市公交系统为实例,运用刷卡乘客客流发生量空间分布特征分析方法对常 州公交i c 卡记录进行采集、挖掘、处理、分析,得到了常州市刷卡乘客客流发生量空间分布, 并进行了相应的数据分析。 关键词:公交i c 卡;空间分布特征;客流发生量;公交区段;快速聚类 东南大学硕士学位论文 a b s t r a c t t h ee f f i c i e n to p e r a t i o no fu r b a nt r a n s i ts y s t e md e p e 忸凼o nn o to n l yt h et e c h n i c a li n f r a s t r u c t u r e c o n d i t i o n so fr o a d s ,v e h i c l e s ,a n dt e r m i n a l s ,b u ta l s ot h er e a s o n a b l ep l a n n i n go ft r a n s i tl i n en e t w o r k a n de f f i c i e n t l yo p e r a t i o n a lm a n a g e m e n t h o w e v e r , i no r d e rt om a k es c i e n t i f i ct r a n s i tp l a n n i n ga n d o p e r a t i o n a ld e c i s i o n ,i ti sq u i e t l yn e c e s s a r yt oo b t a i nt h ec o m p r e h e n s i v et r a n s i tt r i pd a t ai nt i m e h e r e i n , t h es p a t i a ld i s t r i b u t i o nc h a r a c t e r i s t i co fu r b a nr e s i d e n tt r a n s i tt r i pi sj u s tac r i t i c a lc o m p o n e n to ft r a n s i t p a s s e n g e rf l o wi n f o r m a t i o n ,n o w a d a y s ,w em a i n l yu t i l i z et h em a n u a lc o u n tm e t h o dt o o b t a i nt h e i r a n s i tp a s s e n g e rf l o wi n f o r m a t i o ni nc h i n a , w h i c hi sc o s t - c o n s u m i n ga n de v e nd i f f i c u l tt og e te x p e c t e d r e s u l t s ,f o re x a m p l e ,t h eo b t a i n e dd a t ac a nn o t r e f l e c tt h el o n g - t e r mv a r i a b l et r e n do fu r b a nt r a n s i tt r i p p r e s e n t l y , t r a n s i ti cc a r dh a sb e e nw i d e l yu t i l i z e di nm a n yc h i n e s ec i t i e s ,w h i c hn o to n l yp r o v i d e s c o n v e n i e n c et op a s s e n g e r s ,b u ta l s oc o m e si n t ob e i n gan e ws u r v e ya n ds t a t i s t i ca p p r o a c ho fp a s s e n g e r f l o wi no r d e rt oo b t a i nc o m p a r a t i v e l yr e a lp a s s e n g e rf l o wi n f o r m a t i o n t h i st h e s i sj u s ta d d r e s s e st h e m e t h o dt oo b t a i nt h es p a t i a ld i s t r i b u t i o nc h a r a c t e r i s t i co fp a s s e n g e rf l o wf r o mt h er e c o r do ft r a n s i ti c c a r d t h i st h e s i sf i r s t l yp r o p o s e sat h e o r e t i c a lf r a m e w o r ko ft h ea n a l y s i ss y s t e mo ft r a n s i ti cc a r dd a t a t h i ss y s t e ma n a l y s e st h ei cc a r dr e c o r da n do t h e rt r a n s i to p e r a t i o na n ds c h e d u l i n gi n f o r m a t i o n , s u c ha s t h ed i r e c t i o no ft r a n s i tl i n e ,d i s t r i b u t i o no ft e r m i n a l , a n dt i m e t a b l eo fs c h e d u l i n gt oo b t a i nt h eb a s i c p a s s e n g e rf l o wi n f o r m a t i o no ft r a n s i to p e r a t i o n t h r e em o d u l e si n c l u d i n gd a t a b a s ep l a t f o r mm o d u l e , d a t aa n a l y s i sm o d u l e ,a n dn s e rc o n t r o l l i n gi n t e r f a c em o d u l ea r eb u i l tt op e r f o r md a t ac o l l e c t i n g , p r e m a n a g e m e n t , a n a l y s i sa n de v a l u a t i o np r o c e s s e s f u r t h e r m o r e ,at h e o r e t i c a lm e t h o dt oi d e n t i f y i n g p a s s e n g e r s l o a d i n ga n du n l o a d i n gs t o p sw i t hi cc a r d sb a s e do np r e s e n td a t aa n dt e c h n i c a lc o n d i t i o n a na p p r o a c ht oa n a l y z et h es p a t i a ld i s t r i b u t i o nc h a r a c t e r i s t i co fp a s s e n g e rf l o wi sp r o p o s e du s i n g t h et r a n s i ti cc a r dd a t aa n a l y s i ss y s t e m i nt h ep e r f e c ts i t u a t i o nw h e nt h el o a d i n ga n du n l o a d i n gs t o p i n f o r m a t i o no fi cc a r dp a s s e n g e r sc a nb ea c c u r a t e l yo b t a i n e d ,w ec a nc o m p r e h e n s i v e l yg e ts o m e r e l a t e di n d i c e so nt r a n s i tp a s s e n g e rv o l u m ea n dt r i pc h a r a c t e r i s t i c ,a n dp a s s e n g e rf l o wo dm a t r i x e so i l t h eb u sl i n e ,n e t w o r k ,a n dr e g i o nl e v e l s ,r e s p e c t i v e l y c o n s i d e r i n gt h er e a ls i t u a t i o nw h e ni ti su n a b l et o a c c u r a t e l yi d e n t i f yu n l o a d i n gs t o p sd u et os o m eo b j e c t i v ec o n s t r a i n t s ,t h i st h e s i sm a i n l yd i s c u s s e st h e w h o l ep r o c e s so fa n a l y z i n gt h es p a t i a ld i s t r i b u t i o nc h a r a c t e r i s t i co fg e n e r a t i o nv o l u m eo fi cc a r d p a s s e n g e r s a l t h o u g he s t i m a t i n gt h el o a d i n gs t o p si sf e a s i b l ei n t h er e a ls i t u a t i o n ,i t sa c c u r a c yi sn o t h i g h ,t h u sw ei n c o 巾o r a t et h en e i g h b o r i n gb u ss t o p si n t ot r a n s i ts e c t i o na c c o r d i n gt os o m ep r i n c i p l e s c l u s t e r i n ga l g o r i t h mi si n t r o d u c e dt ot h ed a t aa n a l y s i sa n df a s tc l u s t e r i n ga n a l y s i si se m p l o y e dt o d e t e r m i n et h el o a d i n gt r a n s i ts e c t i o no fi cc a r dp a s s e n g e r t h e n ,t h es p a t i a ld i s t r i b u t i o nc h a r a c t e r i s t i c o fg e n e r a t i o nv o l u m eo fi cc a r dp a s s e n g e r si sa n a l y z e df r o mt h ev i e w p o i n t so fb u s tl i n ea n ds e c t i o n , r e s p e c t i v e l y f i n a l l y , ar e a le x a m p l eo fc h a n g z h o ut r a n s i ts y s t e mi sp r e s e n t e d t h ep r o p o s e da n a l y s i sm e t h o di s u t i l i z e dt oc o l l e c ta n da n a l y z et h et r a n s i ti cc a r dr e c o r d s , a n dt h es p a t i a ld i s t r i b u t i o no fg e n e r a t i o n v o l u m eo fi cc a r dp a s s e n g e r si nc h a n g z h o ui st h e no b t a i n e d k e y w o r d s :t r a n s i ti cc a r d ;s p a t i a ld i s t r i b u t i o nc h a r a c t e r i s t i c ;g e n e r a t i o nv o l u m e ;t r a n s i ts e c t i o n ;f a s t c l u s t e r i n ga n a l y s i s 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽 我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究 成果。也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的 同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 研究生签名:日期: z - , f j s 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件 和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的 内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅。可以公布( 包括以电子信息 形式刊登) 论文的全部内容或中、英文摘要等部分内容。论文的公布( 包括以电子信息形式刊登) 授权东南大学研究生院办理。 蹴生签名:盟导师躲隘期:型三! 第一章绪论 i i 研究背景及意义 第1 章绪论 随着国民经济的迅猛发展和城市化、机动化进程的加快,城市规模的不断扩大,机动车保 有量急剧增加,道路交通流量日趋饱和,特别是大城市,交通问题日益突出。面对出现的这些交 通问题,直接的解决办法是通过修建更多的道路来提高路网的通行能力,但是由于城市中可供修 建道路的空间有限,交通设施建设的步伐远远跟不上交通需求的增长速度,交通拥挤现象仍然非 常严重。国内外对城市交通开展了多年研究,研究经验表明,发展城市公共交通,努力提高城市 交通的信息化水平,建立先进的公共交通系统。提高公交运营部门的管理水平,实现公交调度智 能化,是解决城市交通问题的有效途径【l j 。 城市公共交通系统是一个定时、定线行驶,并能够按时空分布变化而不断调整的随机服务 系统。这个系统能否正常、有效地运行,不但取决于道路、车辆和场站等物资技术设施条件,还 有赖于科学有效的运营管理系统、城市公交线路网规划和公交车的调度是提高城市公共交通运行 效率的有效方法。对于公交企业的日常操作,公交车的调度比公交线路网规划更重要。虽然它们 的最终目的都是为了合理利用现有的可支配资源,最大程度的满足城市发生的居民出行需求。但 是,实际的居民出行需求是个动态变量,根据静态数据做出的公交规划方案,是不可能总是满足 居民出行需求的动态变化。而公交车的调度则可以很好地发挥它的微调作用。 在调查数据的基础上,公交公司的调度人员通过对发车频次、行驶车速和车辆容量等参数 的调整,以公交调度的变化,来满足居民出行需求的变化。公交调查数据的经常性和调查精度直 接决定了调度的水平。在目前城市的道路交通条件下,公共交通系统正常高效地运营更多的有赖 于运营管理手段和技术手段的先进性。因此,对公交客流的全面、准确把握是公交管理工作的基 础,它不仅为日常调度提供依据,也为线网优化提供了参考【2 1 国内在公交规划中仍然使用人工调查方法作为数据采集的主要方法。这种方法主要包括四 项调查:居民出行调查、公交问询调查、公交随车客流调查、公交站点客流调查。其中居民出行 调查和公交问询调查目的是获取居民公交出行的特征,公交随车客流调查和公交站点客流调查目 的是获取公交线路及站点客流信息。这些调查方法已经较成熟,完善,只是耗费巨大的人力、物 力,取得数据的成本过高,且数据处理工作量大、周期长、不精确,导致规划结果与实际情况出 入过大,不利于实施:并且这种方法只能得到城市特定几天的公交出行信息,这些信息不能体现 城市公交出行的长期变化,也不能体现特殊事件时的居民公交出行行为【2 l 。在实际操作过程中, 做到经常、系统非常困难 公交i c 卡、乘客自动计数系统( a p c ) 等先进技术的应用可以取代传统的调查方法,获取相 对实时动态的客流信息。公交i c 卡在国内许多城市都有应用,不仅方便了广大乘客,也提供了 一种新的客流调查统计手段。i c 卡信息量大,数据全面,技术简单成熟,但目前其作用未得到 充分开发。 公交i c 信息分析方法是运用计算机程序,对公交i c 信息数据库进行数据挖掘,直接得到 城市公交出行信息。与人工调查方法比较,这种方法省去了设计调查方案、发放调查表格、回收 及录入调查数据等采集数据的环节,公交i c 数据采集是在乘客上车刷卡的同时完成的。公交i c 信息分析可以得到城市过去任何一天的公交出行数据,由于公交i c 卡信息的采集过程受到人为 影响因素很小,所采集的数据真实可靠,可准确反映城市公交出行的时间空间分布特征。该方法 分析结果的准确性与城市公交i c 卡的使用率以及数据分析算法相关。但是随着公交事业的发展, 第一章绪论 公交i c 卡的使用越来越多,数据挖掘技术也日益进步。它们对方法精度的影响将越来越小公 交i c 卡信息分析方法利用很少的投入,即可获取准确、可靠、连续的公交客流信息,是目前可 利用的最经济有效的公交数据获取方法,在我国有着较好的发展前景【3 1 国外的公交i c 卡使用较早,其功能已由早期的单一公交收费功能发展成为跨行业、跨部门 多领域的多功能一卡通。法国是世界上使用i c 卡最早的国家,在公共交通领域,以i c 卡取代传 统纸张式车票,用于公共汽车、地铁、火车等交通方式;日本正在筹划并实施公共行业间i c 卡 的合作,以先期发行的居民基本信息卡为基础。从技术上采用非接触i c 卡,支持多种应用,其 中包括行政、医疗、流通、交通以及金融等,应用之间采用防火墙;韩国的i c 卡发展也比较迅 速,例如釜山市在1 9 9 8 年就建立了基于非接触i c 卡的城市公交系统,并于2 0 0 0 年发行了适合 多种应用的双界面c p u 卡擞字釜山卡;新加坡致力于i c 卡跨行业、跨部门的多领域应用, 其电子钱包可用于超市、公路收费、停车场收费、图书馆、学校以及网上交易】。 国内于1 9 9 4 年开始使用公交i c 卡收费系统。先由珠海亿达技术开发公司引进国外i c 卡技 术,接着在杭州公交公司开发试用,并取得了可喜的成果。青岛公交公司在市政府的支持下,委 托青岛电子研究所联合开发青岛公交i c 卡收费系统。在此期间,全国有许多城市纷纷试用i c 卡收费系统,上海市在推广应用i c 卡收费系统中速度快,范围广,应用领域拓展到了地铁、公 交、轻轨、出租车、轮渡、高速公路、停车场、公用事业缴费、加油站收费系统等1 4 大领域, 并实现了上海、无锡、苏州等地“交通一卡通”的互通互联。公交i c 卡已在我国很多城市得到 应用,持卡出行消费的居民数量也不断增岁卯。 目前我国已超过1 0 0 个城市启动了公交i c 卡收费系统,累计发出公交数千万张,已经成 为公交企业认可的一种理想的收费手段,见表1 1 。 表1 - 1 部分城市i c 卡发行量统计表 其中北京i c 卡日刷卡量约1 0 0 0 万人次,占日公交客运量的8 0 以上:南京l c 卡日刷卡量 约2 0 5 万人次,占日公交客运量的6 5 左右。i c 卡在国内城市已经得到了广泛运用,而且i c 卡 信息量大且全面,技术简单成熟,其统计数据中蕴含着丰富的信息。 1 2 国内外研究现状 公交i c 信息分析方法主要涉及到i c 卡技术、数据库技术、统计学、数据挖掘技术。公交 i c 卡记录的信息包括乘客卡号、线路号、刷卡日期、刷卡时刻、车辆代号等,已足够运用于信 息的分析和挖掘,随着技术改进记录乘客上下车站点信息也将成为可能,将极大提高i c 数据分 析的精度。 公交i c 卡信息一天的数据量可达数百万条,传统的统计学方法几乎无能为力1 6 。1 9 8 9 年8 月在美国底特律市召开的十一届国际联合人工智能学术会议上,数据挖掘技术应运而出,它是从 大量数据中提取或挖掘知识的技术。数据挖掘技术近年来在国外被广泛运用于零售业、银行金融、 电信等领域。出现了一些较成熟的数据挖掘工具,世界上比较有影响的通用数据挖掘系统有: s a s 公司的e n t e r p r i s em i n e r , i b m 公司的q u e s t , s g i 公司的s e t m i n e r , s p s s 公司的c l e m e n t i n e , 2 第一章绪论 s y b a s e 公司的w a r e h o u s es tu d i o ,r u l e q u e s tr e s e a r c h 公司的s e e 5 、由加拿大s i m o nf r a s e 大学 “智能数据库系统研究实验室”与d b m i n e r t e c l m o l o g y 公司共同开发的产品d b m i n e r 7 l f 。】【9 】【l o 】【i i 】。 中外专家关于城市公共交通方面的问题已经做了较多的研究,但是在公共交通规划及运营 管理所需的基础资料的获取方法上的研究较少。现状我国仍然沿用传统的大规模调查方法获碍, 获得数据成本过高且数据质量难以满足要求。随着公交i c 卡近几年才在公交车上大力推广使用, 通过公交i c 卡记录获得公交基础数据的研究课题随之出现 公交数据调查方面,外国专家虽然在城市公共交通管理方面已经做了较多的研究,但是在 公共交通规划及运营管理所需的基础资料的获取方法上研究较少;国外的公交数据由于其完善的 家庭调查体系,不需要额外的大规模调查,因此国外没有专门针对公交数据调查方法的深入研究: i c 卡数据分析方面,j a m e sj b a r r y r o b e r t 、n e w h o u s e r 、a d a mr a h b e e 、s h e r m e e ns a y e d a ( 2 0 0 2 ) 详细研究了纽约m e t r o c a r d 系统,可以记录持卡乘客的卡号、乘车路线、上车时问及地点;文章 中假设大部分乘客下次出行的起点即上次出行的终点、当天出行的终点即当天出行的起点,在此 基础上对卡内数据分析处理,得到乘客出行o d ,进一步为客流分布及预测管理服务f 1 2 1 ;其他可 供借鉴的方面,j i a n h ed u ,l i s aa u l i m a n h a l l ( 2 0 0 7 ) 提供了借助g p s 系统识别出行者起终点的 方法,随着各城市公共交通中g p s 系统的引入,与i c 卡的配合将更准确、更快捷地为研究者提 供公交基础数据【i 引。 国内现有许多城市大力推行公交i c 卡,公交i c 技术已经比较成熟,通过公交i c 数据获得 公交基础数据的研究课题随之出现,侧重对现有系统采集到的海量公交i c 信息数据利用计算机 进行分析,得到公交客流情况及公交出行时空分布特征 陈学武、戴霄和陈茜( 2 0 0 4 ) 通过乘客长期的i c 卡刷卡信息统计得到反映连续出行的乘客 一般出行的刷卡站点序列,利用其进行出行起点、换乘点、出行终点的判断,从理论上解决了如 何将l c 卡记录的原始信息转化为直接可以运用于城市交通规划及公交运营调度的客流基本信息 所需要的乘客平均出行次数、起讫点分布、出行时间、换乘次数、出行距离等信息l l 卅; 师富民( 2 0 0 4 ) 围绕“居民公交出行调查方法”展开研究,提出的调查方法数据源是公交 i c 卡记录信息和公交车上的传感器信号,能够大量节省人力和物力;同时由于数据的及时性和 容易获得性,经过相应的数据处理后能够按照数据应用的要求产生相应的o d 矩阵;利用模糊 数学方法判断乘客上车站点、o d 矩阵的生成及运用聚类分析法划分交通小区,详细论述了在现 有公交i c 卡记录数据信息条件下得到公交乘客出行o d 的方法l l 习; 路智宁( 2 0 0 5 ) 研究了如何将数据分析技术应用于公交营运发展的管理决策中,依照数据 库管理技术的步骤,全面阐述源数据筛选整理、建立关系型数据库、形成数据仓库、创建o l a p 多维数据集及建立数据挖掘模型等过程;并且统计、分析和挖掘乘客乘坐公交车刷i c 卡的数据 记录,包括记录中的卡号、乘坐的车号、线路名、每次使用金额以及使用时间等重要信息。得出 每条线路的营运策略、做出应对公交发展的新决策、促进管理改革:对i c 卡记录数据的获取与 挖掘有详尽的阐述,但是关于公交数据分析技术方面涉及很少【1 6 l ; 姚宝珍、于艳宏和子滨( 2 0 0 5 ) 设计出用于对客流等数据采集的卡自动收费系统,并提出 利用它来进行客流等数据采集、处理的新方案,其设计的目的仍然是收费系统,没有乘客出行的 具体信息1 1 7 1 ; 陈学武、戴霄和杨敏( 2 0 0 5 ) 比较了传统人工调查法与公交i c 卡信息采集法,论证了利用 i c 卡进行公交出行数据分析的可行性,并在分析过程与运用层面进行了初步探讨【i 。1 ; 戴霄和陈学武( 2 0 0 5 ) 分析单条线路的公交卡数,分析刷卡时间间隔并归类,计算平均刷 卡时间,在车辆处于理想运行状态下,将平均刷卡时间与车辆到达站点的时间匹配,得到上车站 点,接着设想用站点吸引率分析下车站点,在此基础上分析单条公交线路运营及客流信息【1 9 l ; 一3 - 第一章绪论 郭婕和陈学武( 2 0 0 5 ) 假定线路沿途站点均有乘客刷卡上车,且同一个站点连续两个乘客 刷卡时间间隔小于或等于7 2 s ,分析公交i c 卡数据得到i c 卡乘客上车站点在车辆的实际运行 条件下有一定局限性i z 川; 冯艳春( 2 0 0 5 ) 拓展了公交i c 卡记录数据的运用方式与领域,着眼于公交行业的信息化资 源利用,通过对公交i c 卡系统的略加改善获取的数据,挖掘出对公交规划意义重大的指标,包 括线路全天客流量、线路高峰小时客流量、线路全天和高峰小时直达乘客客流量、线路全天和高 峰小时直达乘客出行矩阵、全市换乘乘客出行o d 矩阵等;充分利用公交i c 卡数据库资源对线 路的历史资料进行回归分析,结合新的公交线网布局模式,进行了公交规划方法的研究;侧重研 究公交规划方法,对于如何从公交i c 卡中挖掘处理数据没有提出明确的方法【2 l 】; 戴霄、陈学武和李文勇( 2 0 0 6 ) 探讨了数据挖掘技术在公交i c 卡信息处理方面的应用,设 计了公交i c 卡数据仓库结构,提出了数据挖掘系统的框架瞄l ; 戴霄( 2 0 0 6 ) 搭建了关于公交i c 信息的框架,初步提出了公交i c 卡数据分析的研究目标 与研究方法;对公交数据及其他相关数据的采集方法和数据结构作了分析总结,分析了公交数据 中各字段的实际意义以及公交数据结构:从应用的角度出发制定公交数据分析的目标和思路,提 出了公交数据的上下车站点判断方法,当然方法还有很多有待改进之处;总结了公交规划及公交 运营决策所需要的各类公交基本客流数据和公交运营指标数据,并研究通过公交数据分析获取这 些基础数据的方法;提出一种通过乘客一日出行路线形成的闭合圈确定下车站点的方法,由于乘 客一日有多次出行,且出行方式不定,获取信息难度大,数据处理过程复杂例: 郭婕( 2 0 0 6 ) 选取了出行规律易于把握的通勤乘客作为研究对象,着重研究了公交车辆理 想运行状态和实际运行状态下通勤乘客上车站点的确定方法;在理想运行状态下,公交车辆到达 各个站点的时间是确定的,利用乘客上车刷卡时间与公交车辆到达相应站点时间的准确的匹配关 系得到通勤乘客上车站点;而在实际运行状态下,公交车辆到达各个站点的时间是不确定的,于 是将线路相邻站点合并成站点区段,以通勤乘客上车时间与车辆起点站发车时间的差值以及通勤 乘客上车时间与车辆到达终点站时间差值为聚类因子,采用聚类分析法将通勤乘客分为不同的 类,通过通勤乘客分类结果与站点区段的匹配关系确定通勤乘客上车站点区段i 习j ; 周涛、翟长旭和高志刚( 2 0 0 7 ) 通过对i c 卡统计数据特点的分析,利用数据挖掘技术,分 别给出了由i c 卡统计数据推算公交线路站点o d 和区间出行o d 的方法,并进一步研究了如何 从i c 卡统计数据中得到公交出行的其他信息,并提出了基于g i s 的公交i c 卡数据分析处理系 统框架,建立了系统分析流程来实现公交o d 的推算:而且文章提出了更高的展望公交i c 卡的数据分析处理最终要建立起能将数据库的处理功能和地理空间的属性特性结合起来的地理 信息系统,才能够有效地解决公交o d 推算、换乘次数以及出行次数等问题1 2 4 1 : 孙文( 2 0 0 7 ) 提出了通过乘客出行的规律、特点建立一个换乘模型,利用i c 卡乘车数据库 内的乘车记录,根据换乘模型,对每天大量生成的i c 卡乘车数据进行相应处理得到能够反映 市民出行需求的公交o d 矩阵【捌。 综上所述,多数研究是在对i c 卡数据在一定的假定条件下,进行初步分析处理,对线路客 流统计,分析运营情况,并在理论上指导公交规划与管理。 1 3 研究目标及内容 1 3 i 研究目标 建立公交i c 卡数据分析系统,包括原始数据的采集与处理以及数据分析的方法与流程,在 4 第一章绪论 此基础上研究公交客流空间分布特征分析方法。 1 3 2 研究内容 本文以i c 卡记录的数据信息为研究对象,对城市公交i c 卡记录数据信息进行提取、挖掘、 分析,结合其他各类土地利用及公交运营相关资料,搭建公交i c 卡数据分析系统框架,在现状 条件下力求可以对公交持卡乘客出行路线起终点的判别问题提出一定的解决方法。 运用公交i c 卡数据分析系统研究公交客流空间分布特征分析方法,根据站点判别的可行性 与准确度的实现程度分别提出基于i c 卡信息的公交客流出行源流分析方法以及公交刷卡乘客客 流发生量空间分布特征分析方法。 由于客观条件限制,下车站点信息很难获取,只能针对客流发生量进行实际分析。以常州 市公交系统为实例,结合常州市的公交i c 卡信息及相关资料,运用公交刷卡乘客客流发生量空 间分布特征分析方法对实际公交i c 数据进行分析,得到常州公交刷卡乘客客流发生量空间分布 特征。 1 4 本章小结 本章开宗明义指出公共交通在解决目前城市交通问题的地位,进而阐述公交i c 卡数据分析 方法的优势和重要性。提出论文的研究背景及意义;其次介绍了国内外在公交i c 卡数据分析方 面的研究现状,包括公交i c 卡的国内外使用情况,以及数据分析、数据挖掘方法的研究和运用 情况;最后提出了文章的研究目标、研究内容。 本文搭建了公交i c 卡数据分析系统的框架结构,以此为工具研究了分析公交客流空间分布 特征的方法:针对下车站点难以准确判别的现状,将客流发生量作为研究对象提出刷卡乘客客流 发生量空间分布特征分析方法,并以常州市公交系统为实例进行了详细阐释。全文共分为五个章 节:第一章绪论,第二章公交i c 卡数据分析系统,第三章基于i c 卡信息的公交客流空间分布特 征分析方法,第四章公交刷卡乘客客流发生量空间分布特征分析方法实例分析,第五章结论与展 望。 5 第二章公交i c 卡数据分析系统 第2 章公交i c 卡数据分析系统 保证公交i c 卡数据分析方法成功的关键是综合利用、合理选择各类数据分析工具和方法, 建立完整高效的公交i c 卡数据分析系统。公交i c 卡数据分析是一个系统的过程,需要经过数据 采集、数据处理、数据分析、结果表示等流程,借助数据分析工具,利用适合的数据分析算法得 以实现。因此,进行公交i c 卡数据分析必须将数据分析的各个环节有机的结合。正确选用各类 数据分析工具及算法,保证各数据处理环节科学准确,进而建立起一套完整的数据分析系统。本 章阐释了公交i c 卡数据分析系统的理论框架与基本结构,重点研究公交i c 卡数据分析关键环节: 上下车站点的判别。 2 1 公交i c 卡数据分析系统基本结构 根据戴霄提出的公交i c 数据分析系统框架利用从公交公司或i c 卡中心搜集到的数据及 其他相关信息搭建公交i c 卡数据分析系统,包括数据库平台模块、数据分析模块、用户控制 模块,具体结构见图2 - 1 。 l 喝 j 它j i :兵 叛獬分析“( 兵 l 巧办网冒宣 1 0 :,;。,1 广敲嚣垮陵u 孓6 j 螫违兔 1 兰尘竺璺h 嚣嚣至瓮1 黑r 厂 l _ - 二二二= 二一 i 翟陋鳓攀馨甄 2 1 1 数据库平台模块 图2 1 公交i c 卡数据分析系统结构图 负责数据采集与数据预处理,将i c 卡上记录的数据信息进行提取、汇总经数据采集得到 公交i c 卡数据、公交线路数据、公交站点数据、公交运营调度数据,经数据预处理进行数据收 集、数据清理、数据变换、数据归约;建立数据仓库,将预处理过的数据存储进数据库,供数据 分析模块调用分析、挖掘处理。 - 6 - 第二章公交i c 卡数据分析系统 寄卡鬃客基本信l 引【i c 卡号ti d ,】 | i c 卡英越( t t n 1 | 年瞽堰,】 i 【性别t 靶i ,】 | 职业( 眦,】 f 【量甜证号c 畦】 翱调度够妻蹇 譬j f 鸿座号d 翔) j | 【咙路号蛐e 】 r 丰舅号( 哪e ) 】 j 【麓车站点塌号( r s t 叫) 】 l 【麓车时阆r t 瑚1 ) 】 i 【氩i 迭站点囊号ci b - t 0 1 ,】 i 【判迭时同盯珥1 ) 1 i c 卡剐卡信息表: 引【罩i 卡记景h l a ) 】 l i c 卡号( i ,】 f 嘴号( i 咖,】 1 【车羁缉号( c 皿北) 】 l 【l 佧时触( 哪e ) 】 l 【i c 卡葵墨n 挖 l i 【捌卡盒霸c 0 盯,】 图2 - 2 公交i c 卡分析系统数据仓库结构图 公交站点基本信息表 譬i 【站点螭号( s t o r ) 】 i 【站点名称ti 呱,】 i 【坐标加i n 】 l 所在站段苏识嘲,】 i 【站点形式t t 肛 】 j f 站点长度l l f 聃 】 宁车路径- 蛄点信患表 翟 行车路径蝈号( l i c o 比 】 l 【蜕路号( i e o d e ) 】 i 【站点螺号( s 锄j 】 i 次序号td 助e 脚l 】 【行车饕径桷号( u 砸咖 】 t 路名霖c 蹦1 ) 】 【懈英墨n ) 】 【t t 船长度嘲l ,】 【垅路0 车数( 耶晖,l 如图2 - 2 所示,数据仓库包括持卡乘客基本信息表、i c 卡刷卡信息表、车辆调度信息表、 公交站点基本信息表、行车路径一站点信息表、公交线路基本信息表: 持卡乘客基本信息表:i c 卡号、i c 卡类型、年龄、性别、职业、身份证号; i c 卡刷卡信息表:刷卡记录、i c 卡号、线路编号、车辆编号、刷卡时刻、i c 卡类型、刷卡 金额: 车辆调度信息表:调度编号、线路编号、车辆编号、发车站点编号、发车时间、到达站点 编号、到达时间; 公交线路基本信息表:线路编号、行车路径编号、线路名称、线路类型、线路长度、线路 配车数; 行车路径一站点信息表:行车路径编号、线路编号、站点编号、次序编号; 公交站点基本信息表:站点编号、站点名称、坐标、所在路段标识、站点形式、站点长度。 2 1 2 数据分析模块 负责数据分析,运用各种分析工具并结合其他渠道得到的辅助补充数据统计客流信息,以 期得到客流统计、起迄点分布、站点客流量、客运走廊断面客流量等公交客流空间分布特征( 图 2 - 3 ) ;构造公交o d 矩阵,以期得到公交站点o d 、公交线路o d 、公交线网o d 、公交区域o d ; 进而尝试进行客流预测。 公交i c 卡数据记录乘客i c 卡号、刷卡时刻、刷卡站点、刷卡线路,以公交乘客完成一次 出行目的作为一次出行,一次出行的第一次刷卡站点作为出行起点,最后下车站点作为出行终点, 之间的刷卡站点作为换乘站点( 可以没有换乘站点) ,判断出乘客的换乘站点和出行终点就可以 了解某乘客完整的公交出行过程。 7 - 第二章公交i c 卡数据分析系统 图2 - 3 公交i c 卡数据分析系统数据分析模块流程图 获得乘客上下车站点及相应时刻,从而得到某条固定线路全天各时段刷卡次数及上下车人 数,对这些数据进行分析统计,即可得该线路某一段时间或某一时刻的客流信息,包括该线路高 峰小时及某段时间的平均乘客数、上下车乘客数等;相应的断面客流量、站点客流量,以及公交 乘客的出行基本信息包括平均出行次数、起讫点分布、平均换乘次数等也可经数据分析得到。 通过公交i c 卡数据得到公交乘客起迄点分布后,进行公交o d 推算:公交线路o d ,某一 8 第二章公交i c 卡数据分析系统 公交线路上从某一站点上车而在另一站点下车的站点o d 矩阵;公交网络o d ,整个城市公交网 络上从某一站点上车而在另一站点下车的站点0 d 矩阵:公交区域o d ,交通区与交通区之间的 公交出行分布o d 矩阵。 运用数据分析还可以自动的统计出某些预测信息:某条线路的客流变化趋势、某公交站台 的客流变化趋势、站台的平均停车数量等,预测未来一段时间线路或站点的客流量大小 2 1 3 用户控制模块 负责解释评价,前台结果解释工具,根据用户的不同提供不同的服务:公交基本出行信息、 公交线路客流信息、各种公交现状指标、公交o d 矩阵、公交客流空间分布特征等。 2 2 公交i c 卡数据分析系统数据分析过程 将采集到的i c 卡实际数据,通过公交i c 卡数据分析系统对城市公交i c 卡记录数据信息提 取、挖掘、分析,找出系统中的不足与实际运行中出现的问题。 公交l c 卡数据分析系统分析过程分为四步:数据采集、数据预处理、数据分析、解释评价 ( 图2 - 4 ) 2 2 1 数据采集 该过程包括原始数据的采集以及数据集成。数据集成是将采集到的各类原始数据按照一定 的规则存储并汇总,实现统一的数据视图。数据仓库是很好的数据存储媒介,它可以存储大量数 据分析所需的基础数据,并且可以建立各类数据的数据类型和相关性。满足数据分析的基础数据 需要。 2 2 2 数据预处理 数据预处理是对数据仓库中数据进行筛选、清理,保留合理准确的数据。缩小数据范围, 以提高公交i c 数据分析的质量。数据预处理是简单的数据筛选过程。可以利用数据仓库工具或 数据分析工具进行处理。 2 2 3 数据分析 该过程是公交i c 数据分析的核心环节综合利用多种数据分析方法对预处理过的公交i c 原始数据进行分析。可以利用已有的数据分析工具,也可以自行编写算法程序进行数据分析。 2 2 4 解释评价 公交i c 数据分析得到的结果,需要利用可视化工具直观的显示给用户,以便用户理解和观 察。根据用户的不同要求,分析结果以不同内容和形式表现例如分析某条公交线路高峰小时或 者一天的客流分布情况
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 阎良区企业网络营销方案
- 高空作业机械维修工专业知识考核试卷及答案
- 城市建筑楼顶改建方案设计
- 咨询互联网拓客优化方案
- 药学公众号课件
- 辅导员述职汇报
- 企管咨询培训拓展方案
- 咨询农作物解决方案问题
- 绍兴水泥墙拆除施工方案
- 办公楼出租的营销方案
- 2025年秋季开学全体教职工大会校长讲话:35分钟会议把所有老师骂醒了
- 3.2《参与民主生活 》- 课件 2025-2026学年度道德与法治九年级上册 统编版
- CA-2100E(新机)可燃气体报警控制器使用说明书
- 2022环保检测作业指导书(HJ1237-2021机动车排放定期检验规范)
- 水泵技术规格书说明资料
- 苏科版三年级上册劳动第四课《橡皮泥塑》课件(定稿)
- 法理学-(第五版)完整版ppt全套教学教程课件(最新)
- 《峨日朵雪峰之侧》教案
- 全息经络刮痧疗法(内部培训)课件
- 火灾自动报警系统PPT课件
- 高压氧质控标准
评论
0/150
提交评论