




已阅读5页,还剩54页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
装订线毕业设计(论文)基于公交IC卡数据的城市轨道交通需求分析摘要本课题旨在利用上海市工作日全天的轨道交通IC卡刷卡数据,结合包含地理信息的城市轨道交通路网地图,对上海市轨道交通需求进行分析。在数据预处理过程中,利用ArcGIS数据导入TransCAD软件中,生成进行分析所必需的路线系统和公交网络;对IC卡数据进行OD格式转换和合并出行等处理。在描述性统计分析阶段,除了在SPSS软件中利用IC卡数据对全天总体的出行特征进行分析,还通过分区域、分线路、分站点的对比分析得出轨道交通出行的在出行频率、出行时间、出行时长和出行距离等各方面的特征。在客流路网分配阶段,通过结合在TransCAD路网上生成的路线系统和公交网络,利用TransCAD软件画出全天客流主要的OD期望线来分析轨道交通需求的主要OD对情况。最后,分别采用最短路径模型和最优策略模型对客流进行分配,得到客流在路网中可能出现的分配情况。本课题研究的目的是为了得到对上海市城市轨道交通需求特征的全面把握,找出在轨道交通需求中存在的特点,以便对未来的分析和研究提供思路和切入点。关键词:城市轨道交通,IC卡数据,需求分析,客流分配Demand Analysis of Urban Metro System Based on Transit Smart Card DataABSTRACTThis study aims to analyze demands of metro systems by using smart card data integrated with the geographical metro maps. The smart card data was collected in Shanghai for a whole weekday. In the process of data pretreatment, geographical information in ArcGIS are imported to TransCAD to form the route system and the transit network which will be indispensable in the latter analysis. The smart card data will be converted into OD format and two records of the same trip will be merged. In descriptive statistical analysis, the smart card data will be used to analyze general features of travel patterns of metro passengers in the whole day through SPSS. Besides, features like frequency, time, duration and distance will be drawn from the comparative analysis among areas, lines and stops. In order to get a deeper understanding of the characteristics of metro demands, desire lines of OD pairs will be drawn on the map to show the critical origins and destinations. At last, two different methods will be used in transit assignment, that is, shortest path model and optimal strategies model, combined with the base map formed. The goal of this study is to achieve an overall understanding of demands of Shanghai Metro System and find out its characteristics. In the future, further analysis and study can be conducted based on these findings.Key words: urban metro system, transit smart card data, demand analysis, transit assignment目 录1 引言12 课题背景22.1 轨道交通需求分析常用的方法22.2 文献综述22.2.1 轨道交通IC卡数据采集与处理方法研究22.2.2 轨道交通路网客流分配模型与算法研究22.2.3 轨道交通线路及站点客流需求分析研究42.2.4 轨道交通出行者时空特征分析42.3 数据来源42.3.1 路网原始数据42.3.2 公交IC卡原始数据6本章小结73 技术路线83.1 研究步骤83.2 研究流程图9本章小结94 数据准备104.1 轨道交通路网数据采集与输入104.1.1 补全路网空缺站点信息104.1.2 修正错误路网数据104.1.3 添加站间时间间隔信息124.1.4 添加换乘通道134.2 路线系统及公交网络的生成134.2.1 路网系统的生成134.2.2 公交网络的生成154.3 轨道交通IC卡数据整理184.3.1 剔除奇数次刷卡记录数ID184.3.2 转化为OD数据格式204.3.3 剔除不合理OD记录204.3.4 合并出行20本章小结225 描述性统计与分析235.1 地铁出行频率分布235.2 入站时间分布245.2.1 分区域入站时间分布255.2.2 分线路入站时间分布255.2.3 分站点入站时间分布265.3 出行时长分布275.3.1 分区域出行时长分布285.3.2 分线路出行时长分布295.4 出行距离分布305.4.1 空间直线距离分布305.4.2 行程距离分布315.4.3 乘坐站数分布325.5 入站人数分布335.5.1 总分布345.5.2 分时段入站人数分布36本章小结396 轨道交通路网客流分配与分析416.1 OD期望线分析416.1.1 全天OD期望线分析416.1.2 高峰小时OD期望线分析426.2 路网客流分配446.2.1 全天客流路网分配466.2.2 高峰小时客流路网分配476.3 换乘需求分析486.3.1 换乘频率分析496.3.2 站点换乘需求分析50本章小结507 结论和展望527.1 结论527.1.1 描述性统计与分析的结论527.1.2 客流路网分配与分析的结论527.2 展望52参考文献54致辞55IV1 引言城市轨道交通具有运量大、速度快、安全、准点、保护环境、节约能源和用地等特点。世界各国普遍认识到,解决城市的交通问题的根本出路在于优先发展以轨道交通为骨干的城市公共交通系统。上海的轨道交通系统已经开通线路14条,全网运营线路总长548公里,车站337座(截止到2014年底),是世界上运营线路最长的城市轨道交通系统。根据上海市第五次居民出行调查结果,上海市轨道交通出行分担率为8.3%1。分析轨道交通系统的需求对于了解整个城市的交通需求时空分布规律,制定合理的城市综合交通发展和交通管理政策以及改善系统项目的网络化运营有着重要的意义。与此同时,随着信息技术的飞速发展,公交IC卡在国内许多城市推广使用,不仅方便了广大乘客,也提供了一种新的客流调查统计手段。IC卡信息量大,数据全面,技术简单成熟,但目前其作用未得到充分开发。公交IC信息采集分析方法是运用计算机程序,对公交IC信息数据库进行数据挖掘,直接得到城市公交出行信息。与人工调查相比,这种方法省去了设计调查方案、发放调查表格、回收及录入调查数据等采集数据的环节,公交IC卡数据采集时在乘客上车或下车刷卡的同时完成的。公交IC信息采集分析的过程受到人为影响因素很小,所采集的数据真实可靠,可准确反映城市轨道交通出行的时间空间分布特征。本课题拟采用上海公交IC卡的刷卡记录数据,分析上海市民的轨道交通出行的特征,包括出行的时间分布和空间分布。而后,利用计算机技术,采集和输入轨道交通的路网数据并实施客流路网分配,分析乘客的换乘频率。本文余下部分组织结构如下。第二部分介绍此研究进行的背景,包括目前轨道交通需求分析常用的方法、相关研究的文献综述和研究使用的数据来源。第三部分介绍本课题研究的研究思路和技术路线,并给出了整个研究过程的明确的流程和步骤。第四部分描述了数据预处理的过程,为后续的分析研究进行了数据准备。第五部分展示了描述性统计的结果,并对相关结果进行了分析从而得出了相应的结论。第六部分描述了根据IC卡刷卡数据将乘客在路网进行分配的过程,根据客流分配的结果,我们得出与换乘相关的结论。第七部分是全文的总结以及从研究结果中得出的对现实情况的一些改善建议。2 课题背景2.1 轨道交通需求分析常用的方法一般地,城市轨道交通客流需求分析是以城市社会经济、人口、土地使用、交通等现状和规划资料为依据,利用交通模型、规划软件、计算机仿真等技术手段,预测目标年限城市轨道交通线网的相关客流指标。其中最核心的思想就是交通规划中的“四阶段”模型。对于每一阶段,国内外的许多专家都进行过大量的研究和论证。但是随着公交IC卡的推广使用,一种截然不同的轨道交通需求分析方法正备受关注。那就是基于IC卡数据的需求分析方法。与传统的需求分析方法不同,基于IC卡数据的城市轨道交通需求分析方法依赖于大数据的采集和挖掘。IC卡的普及为研究提供了海量数据,在此基础上,研究如何应用模型和算法来分析乘客的需求特征从而得出相关结论正是本课题的主要内容之一。2.2 文献综述随着公交IC卡近几年在轨道交通上大力推广使用,通过公交IC卡数据获得轨道交通基础数据的研究课题随之出现,对公交IC卡信息的分析挖掘也有所进展,但很多问题也有待进一步深入研究。2.2.1 轨道交通IC卡数据采集与处理方法研究东南大学戴霄2(2006)在硕士学位论文基于公交IC信息的公交数据分析方法研究中,对公交IC数据及其他相关数据的采集方法和数据结构做了分析和总结,详细研究分析了公交IC数据中各字段的实际意义,以及公交IC 数据结构。鼎汉沪通工程咨询(上海)有限公司的周崇华3(2007)在基于IC卡数据的地铁OD信息处理中提出了基于地铁IC卡数据计算动态OD信息的OD矩阵、O点主流向和关键OD对三个基本问题,并以深圳地铁为例,利用IC卡数据计算了深圳地铁OD矩阵、O点主流向和关键OD对,提高了利用地铁IC卡数据获取动态OD信息的可用性,为满足地铁客流量动态信息的获取奠定了基础。北京交通大学吴美娥4(2010)在其硕士学位论文对公交IC卡数据处理分析应用的探索中对各种公交信息数据采集方法进行了对比,得出公交IC卡数据采集方法简单方便,且数据信息量大、全面,容易获取,成本较低,是未来公交信息采集应用的重要方法。此文中详细介绍了公交IC卡的系统组成、信息采集流程、数据结构等,并给出公交IC卡数据库的建立和数据处理的方法,为进一步的公交IC卡数据挖掘打下基础。1.1.1.2.1.3.(1)2.2.2 轨道交通路网客流分配模型与算法研究北京交通大学的四兵锋,毛保华,刘智丽5(2007)在无缝换乘条件下城市轨道交通网络客流分配模型及算法一文中,结合国内城市轨道交通无缝换乘的运营特点,充分考虑了影响城市轨道交通网络客流分配的主要因素,包括出行时间和换乘次数,以及城市轨道交通网络运营的特有属性,构造城市轨道交通网络的广义费用函数,并分析乘客在城市轨道交通网络中的路径选择行为。在此基础上,基于随机用户平衡原则提出城市轨道交通网络客流分配问题的数学优化模型,在模型求解过程中,分析目前常用的有效路径搜索方法并设计了基于图的深度优化搜索算法,得出符合现实的有效路径集合,并给出了求解配流模型的连续平均算法。最后通过北京市轨道交通网络的数据对模型和算法进行了验证。同济大学徐瑞华,罗钦,高鹏6(2009)在基于多路径的城市轨道交通网络客流分布模型及算法研究中,结合城市轨道交通系统的基本特性,提出一种考虑乘客多路径出行选择的客流概率分布模型,并设计基于深度优先的路径搜索算法。该模型既体现了乘客出行阻抗最最小化的选择心理,又反映了路径多样化的实际情况。北京交通发展研究中心交通模型部部长刘剑锋7(2010)在期刊论文基于IC卡数据的城市轨道交通网络配流模型研究中以轨道交通IC卡数据为基础,得到轨道交通全网站间OD矩阵后,综合考虑行程时间、换乘次数、换乘时间等定量因素和其他影响路径选择的定性因素,提出了一种基于深度搜索优先和分支定界思想的有效路径搜索算法,并应用Logit模型对城市轨道交通网络的客流分配问题进行了理论建模,通过实际调查数据标定了模型中未知参数。论文的最后也通过北京市轨道交通网络实际调查数据的案例分析,对模型和算法的有效性进行了验证。刘剑锋8(2012)在其博士学位论文基于换乘的城市轨道交通网络流量分配建模及其实证研究中,对之前的研究进行了补充和改进:构建了基于乘客类别的城市轨道交通网络流量分配模型,针对模型中考虑乘客类型因素导致的计算复杂程度提高,设计了基于区间的随机网络流量分配算法;在考虑了乘客在城市轨道交通网络中选择路径的车内拥挤费用后,提出了描述车内拥挤程度的非线性路径广义费用,构建了基于Probit模型的随机用户平均客流分配模型;最后针对北京市轨道交通网络,利用自创模型及算法,基于利用Fratar模型的推算站间OD矩阵的方法,设计并开发了城市轨道交通客流分析系统。长安大学刘新华9(2013)在其博士学位论文基于时刻表的地铁动态配流模型研究一文中,通过对城市地铁乘客出行特征的调查分析,得到影响乘客路径选择的主要因素以及相关规律,对乘客属性与路径选择行为之间的相关性进行了统计分析,基于调查数据确定了乘客分类模式,特别是提出了基于乘客属性的地铁配流模型及算法,并对算法进行了实证研究。同时,此文在考虑到地铁需求的动态属性后,给出了基于时刻表的地铁时空扩展网络的概念和构建方法,在此基础上,建立了基于时刻表的地铁客流动态分配模型及算法,并利用北京地铁网络运营客流数据对模型及算法的可行性和有效性进行了验证。上海市城市综合交通规划研究所工程师张天然10(2010)在其文章城市轨道交通客流最优策略分配模型的改进中提出,城市轨道交通客流分配属于公交客流分配中的一种特殊情况,借鉴公交超级网络分配模型可以解决城市轨道交通客流分配问题。但论文中指出最优策略分配模型在策略寻找和流量分配两个环节上存在缺点,并应用Logit模型改进了最优策略分配模型的流量分配算法。山东理工大学的汤瑞, 张俊友11(2011)等人在基于transcad最短路径分配的研究一文中,为解决TransCAD软件提供的全有全无分配模型中存在的问题,定义了有效路径及有效交通量,使得在非最短路径的道路上也可以分配交通量。这种改进方法使得分配结果能较为直观地反映城市交通分配状况,可用于动态交通分配研究和交通仿真分析。 2.2.3 轨道交通线路及站点客流需求分析研究西南交通大学周高卫,罗霞12(2012)在城市轨道交通客流需求分析模型及计算机仿真一文中,针对用传统的“四阶段法”进行交通需求分析具有集聚特征显著、系统环境适应性差等问题以及城市交通系统很难进行实体仿真的缺陷,提出了一种基于城市综合交通统筹和TransCAD仿真的城市轨道交通客流分析模型。该模型基于“四阶段法”基本步骤,尤其在交通方式划分和分配中,结合合理系统结构边界和出行时间价值,对城市轨道交通客流分配进行精细配流。北京交通大学孙海瑞13(2012)在其硕士学位论文城市轨道交通线路实时客流推算方法研究中,在对轨道交通系统IC卡数据进行了分析的基础上,介绍了依据IC卡记录获取分时段站间OD和进站刷卡乘客的上、下行分流比例的方法,结合乘客在通道内的走行时间分布规律,利用概率理论建立了站台实时到达人数计算模型,并由此研究轨道交通线路实时客流推算方法。2.2.4 轨道交通出行者时空特征分析Juanjuan Zhao14等人(2014)在其论文Understanding Temporal and Spatial Travel Patterns of Individual Passengers by Mining Smart Card Data中,利用深圳市城市轨道交通出行者的IC卡数据,对深圳市民地铁出行的时空特征进行了分析和说明。他们提出一种用来提取轨道交通出行者的时间、空间以及异常的出行特征数据的系统研究法,并采集了深圳一个月的智能卡数据进行研究。结合地面公交数据,对具体不同出行特征的群体进行了深入的分析和阐释。2.3 数据来源本文使用的数据主要包括两个方面:路网数据和IC卡数据。基础的路网数据包括路网地理信息数据(shp文件)和站点信息数据(csv文件),直接由指导老师提供。IC卡数据(sav文件)来源于SODA游族杯开放数据大赛。另外,为获取地铁站间间隔而使用的上海地铁首末班车时间数据来自于网络上官方公布的首末班车时刻表。2.3.1 路网原始数据包含路网地理信息数据的所有shp文件和包含站点信息数据csv文件是本课题的重要数据,这些文件中包含了绝大部分的轨道交通路网及站点信息。主要的文件名称、属性和提供的详细信息如表2-1所示。表2-1 主要文件名称、属性和提供的详细信息文件名属性详细信息stops.shp点图层上海轨道交通系统站点信息,每一个点代表一个轨道交通站点,站点图层属性表如图2-1.交通出行_point.shp点图层上海市所有重要出入口点信息lines.shp线图层上海轨道交通系统线路图,每一条线代表一条轨道交通线路broken_lines.shp线图层通过将lines图层以stops图层进行打断得到,每一条线代表一段站点与站点之间的线路Lines_WGS.shp线图层上海市所有公交线路图,每一条线代表一条公交运行线路车站.csv表格上海轨道交通系统站点信息,每一行数据代表一个站点,数据格式如表2-2所示图2-1 站点图层属性表表2-2 站点信息csv文件的数据格式变量名类型备注ST_NO数值站点编号ST_NAME字符站点名称ST_NAME_EN字符站点名称拼音LINE_NO数值站点所在线路X数值站点经度Y数值站点纬度TRANSFER_TAG字符站点是否是换乘站,值为“换乘站”或者“普通站”SERIAL_NO数值站点在其所在线路上的编号ST_HORIZONTAL字符站点的形式,值为“地下”、“地面”或者“高架”站点图层属性表中重要的字段包括“LONGITUDE”(站点经度)、“LATITUDE”(站点纬度)、“LINE”(站点所在线路)、“STOP_NO”(站点编号)和“NAME”(站点名称)。其中最重要的字段是站点编号“STOP_NO”,它是与每一个站点一一对应的。即使是同一个站点名称,在不同的线路上会有不同的站点编号,表明名称相同的一个站点在不同的线路上即被视为两个站点。这样处理的好处是可以进行换乘站点的分析。站点信息csv文件中重要的变量包括“ST_NO”、“ST_NAME”和“LINE_NO”,它们分别与站点图层属性表中“STOP_NO”、“NAME”和“LINE”对应。2.3.2 公交IC卡原始数据本文使用的IC卡数据是2015年4月1日全天内整个上海轨道交通系统产生的所有刷卡记录,原始数据记录数总共9024322条。IC卡原始数据格式如表2-3所示,图2-2是截取的部分原始IC卡数据。表2-3 IC 卡原始数据格式变量名类型宽度备注id数值(N)10卡号date字符串10刷卡日期time字符串8刷卡时间station字符串16刷卡站点mode字符串4出行方式fare数值(N)4扣除费用discount字符串6是否享受换乘优惠图2-2 部分IC卡原始数据本章小结本章介绍了本次研究课题进行的背景。首先介绍了以往国内外进行类似研究常用的一些研究方法,指出了它们的不足,并注意到了公交IC卡作为一种新的数据采集方式的优越性。然后对近年来利用公交IC卡数据进行研究的相关文献分为四个方面做了总结和综述,进一步了解了国内外公交IC卡数据被利用的情况。最后一小节对本课题研究所使用的数据进行了介绍,确保了本次研究的真实性和可靠性。3 技术路线3.1 研究步骤本课题的研究将按照以下步骤进行。(1) 轨道交通路网数据的采集和输入轨道交通路网是本课题进行分析和研究的基础。原始数据的轨道交通路网信息是存储于地理信息系统(GIS)平台上的电子地图,而本研究进行路网数据分析的软件是交通规划软件TransCAD。故首先需要将GIS平台上的电子地图导入至TransCAD软件中,在TransCAD中生成分析所需要的公交路网和站点的路线系统数据库。其次,为了能够利用该软件进行更加深入的分析,必须为路网中所有的换乘站点添加必要的换乘连接,以确保可以应用计算机算法进行客流的网络分配。最后,为了后续分析的需要,我们要为所有站点之间的路线添加行程时间信息。通过从网上获取的首末班车时刻表进行换算,得到所有站点之间的行程时间数据,并添加至TransCAD的路网信息数据中。(2) 轨道交通IC卡数据的整理和分析本课题使用的另一部分重要的数据是轨道交通IC卡刷卡数据。从图2-2中我们看到,原始的IC卡刷卡数据的格式并不标准,无法满足分析的需要。故首先需要应用统计分析软件SPSS对原始IC卡刷卡数据进行读取、整理、筛选,提取我们分析所必需的变量和删去多余的变量,并利用公式和算法语句计算我们分析所需要的变量,并利用SPSS的统计分析功能对处理好的数据进行描述性统计与分析。再结合Excel,得到我们需要的统计分析图表,更加直观地展现我们的统计结果,并进行分析,进而得到上海市民一天之内的轨道交通出行的时间和空间分布特征。最后,我们需要获得分时段的各站点入站人数和每两个站点之间的客流量,结合路网数据,我们可以将IC卡数据的统计结果呈现在路网上。(3) 轨道交通路网客流分配和分析本课题最终的目的是希望结合公交IC卡数据和路网信息数据对全上海全天的轨道交通出行客流的特征得到一个全面的理解。最后一步的工作便是利用相应的分配模型将全天的客流在路网上进行分配,得到主要OD对以及路网各路段的断面客流量。我们将利用TransCAD软件提供的交通分配模型进行轨道交通网络的客流分配,统计并分析乘客的换乘需求,得到每个换乘站点的交通需求,从而得到整个交通系统的换乘需求。3.2 研究流程图图3-1展示的是本课题研究的流程。TransCAD路线系统原始IC卡数据原始路网数据原始数据地铁首末班车时间地铁站间间隔校正后路网数据标准化IC卡数据描述性统计与分析结论与建议客流分配与分析图3-1 本课题研究流程图本章小结本章梳理了本次研究进行的顺序,分别介绍了本次研究需要进行的三大重要步骤,并给出了课题的研究流程图,使读者更加清晰课题的思路和研究的过程。4 数据准备4.1 轨道交通路网数据预处理原始数据中的路网地理信息文件为我们提供了分析和研究所需要的绝大部分信息,但是原始数据中也存在许多问题,例如不同文件中的数据格式不匹配,数据获取的时间不同导致的数据完整性不同以及原始数据中存在的系统或人为的错误数据等等,这些问题使得我们不能直接利用这些原始数据进行分析。我们首先要对这些数据进行预处理,以便为后续的分析提供可用的数据。对于本课题路网数据中存在的问题,主要进行了四项处理:补全路网中空缺的站点信息、修正原始路网数据中存在的错误数据、添加站间时间间隔信息和添加换乘通道信息。4.1.1 补全路网空缺站点信息在原始的包含站点地理信息的“stops.shp”文件中,路网站点数量为338个,而在包含站点信息数据的表格“车站.csv”文件中,站点数量为346个。我们以“车站.csv”文件中的站点信息数据为准,筛选出矢量文件中缺少的站点,再结合“交通出行_point.shp”文件提供的信息,补全路网中缺少的站点信息。经过筛选得到缺少了的站点如表4-1所示。表4-1 原始路网数据中缺少的站点站点编号站点名称站点所在线路256唐镇2号线257创新中路2号线258华夏东路2号线259川沙2号线260凌空路2号线261远东大道2号线262海天三路2号线263浦东国际机场2号线补全路网站点信息的方法是在ArcGIS软件中,根据“交通出行_point.shp”文件提供的站点出入口信息找到估计的站点位置,利用添加节点的功能在地图中新建一个站点,再打开站点图层的属性表,根据站点信息数据补全属性表中新添站点的属性。4.1.2 修正错误路网数据在我们获取的原始路网数据中,存在许多有问题的数据。这些问题可能来自于采集和处理的过程中系统产生的错误,也可能来自于偶然的人为造成的错误。这些原始的错误在后续的处理与计算中可能被放大,以致于对我们分析的结果造成干扰甚至带来错误的判断。为了保证用于分析的数据没有过于严重的问题,需要我们对原始路网数据进行校正。路网数据校正的对象主要是站点数量和站点之间线段数量。因为“broken_lines.shp”文件是以站点图层“stops.shp”为基准,利用ArcGIS软件内部的打断功能对线路图层“lines.shp”进行打断所得。打断的原理是根据一个给定的精度,以线元素附近并且在给定精度之内的点元素的投影为端点,将原来的一条线分割为两条。因此,由于给定的精度是一个人为估计的量,在打断时容易产生重复打断或者遗漏打断的情况,造成多余的线段或者缺少的线段,因此我们需要获取的原始路网地理信息数据中的站点图层和线路图层进行数量和信息的校对。因为站点数量较多,我们选择了按线路的顺序对线路逐条进行校对的方法,以免出现重复和遗漏的情况。对线图层进行校对的具体方法是:(1) 在站点属性表中按“LINE”(线路号)对站点进行选择,选中某一条线路上的所有站点;(2) 对选中的线路上的站点数量与站点数据表中的站点数量进行核对,检查两者是否一致;(3) 在“broken_lines”线图层的属性表中选出该线路上的所有线段,检查被选中的线段数量是否为站点的数量减一;(4) 若步骤(3)中的线段数量不满足条件,则按“Shape_Leng”(线段长度)属性进行检查,若该属性值过小,则进一步检查是否为多余线段,确认为多余线段后将线路及站点信息记录下来。经过逐一检查后,所有线路上被重复使用打断的站点信息见表4-2。表4-2 线路打断时被重复使用的站点线路站点1富锦路、人民广场2徐泾东、中山公园3宜山路、金沙江路、虹口足球场4宜山路、金沙江路、蓝村路5闵行开发区6蓝村路7肇家浜路、东安路、花木路8市光路、人民广场9徐家汇、杨高中路10_1航中路、新江湾城、四平路、天潼路、交通大学11_1隆德路11_2三林、隆德路13金运路、隆德路、长寿路在核对站点数量与线段数量的过程中,我们发现了站点图层的属性表中数据信息也存在错误。经过逐一核对,一共发现了21个有明显错误的站点,如图4-1所示。这些站点的属性数据存在错误,我们通过属性表自身的数据和站点数据表中的数据结合,对这些站点的信息进行了修正。图4-1 属性表数据存在明显错误的站点4.1.3 添加站间时间间隔信息这一步骤需要在TransCAD软件中完成,因此我们首先要把ArcGIS中的路网导入至TransCAD中来。首先,我们以校对完成后的路网数据为基础,在TransCAD中生成底图路网(Node图层和Street图层)。生成底图路网的方法如下:在TransCAD中打开“broken_lines.shp”文件,使用TransCAD中的Tools-Export 功能将“broken_lines.shp”导出为dbd格式,再重新导入该dbd文件。经过此步骤后,TransCAD软件中就生成了以ArcGIS中打断后的线图层为基础的Street图层以及包含Street图层所有端点的Node图层。根据上一步骤中记录的错误站点信息逐一找到需要修正的站点以及相应的线段,使用软件的Edit-join links 功能修正。到目前为止,我们已经将所有原始的站点地理信息数据导入至TransCAD软件中。考虑到后续的分析和研究,我们需要上海轨道交通站点间的行程时间数据。我们假设所有列车在固定两点间的行程时间都相同。因为行程时间的数据难以获得,我们只能用相邻站点的首班车或者末班车到站时刻相减得出相邻站点间的行程时间。由于数据精度的问题,首班车时刻与末班车时刻之差之间可能存在1分钟的误差,为了保证所有行程时间相加的总和与实际情况最为吻合,我们采取一加一减的方法,即上一个站间采用了较大的一个行程时间,则下一个站间采用较小的一个行程时间。注意相同两个站点之间上行与下行的时间可以是不同的,因为虽然两个站点之间的水平距离是相同的,但是垂直方向上会存在上坡与下坡的差异。将站点首末班车时刻表上的数据转换成站间行程时间后,在TransCAD中添加该信息的方法是,选择线图层(Street层),依次点击相应的线段,手动将这些时间添加至TransCAD路网属性表的AB_time和BA_time字段中。需要注意的是,AB_time和BA_time的方向是以TransCAD的道路在生成时方向决定的。4.1.4 添加换乘通道该步骤是为后续生成路线系统及公交系统进行的准备,也是进行换乘分析的重要步骤。由原始路网地理文件转换成的TransCAD地理文件中,Street图层上换乘站点之间没有道路相连,即不同线路上相同名称的站点之间是不相连的。因此在该路网系统中,如果不为换乘站点间添加换乘通道,在路线系统中乘客将无法在换乘站进行换乘。添加换乘通道的方法很简单也很机械:在Street图层中,使用编辑的功能逐一在换乘站的两个站点节点间增加一条线。同一个站点拥有3个节点的换乘站需要两两相连。为保证不遗漏任何站点,同样按照线路编号逐一进行添加。该步骤一共添加了换乘通道46条。为了后续分析的进行,在Street图层中添加一个字段,命名为“Connect”。当Connect=1,表明该路段是一条换乘通道,否则Connect=0。在添加的换乘通道上也需要要时间的属性,用来表示乘客换乘花费的时间。不同的换乘站点换乘所需要的时间各不相同,因为本次研究的时间和精力有限,无法逐一测试在各换乘站的换乘需要花费的时间,因此将其简化为3分钟,即所有换乘通道上的行程时间为3分钟。所有换乘通道的情况如图4-2红色部分所示。图4-2 换乘通道(红色部分)至此,路网地理信息数据的预处理完成。我们利用这些数据可以进行路线系统和公交系统的生成,然后在此基础上进行分析和客流分配。4.2 路网系统及公交网络的生成4.2.1 路网系统的生成为了减少发生错误的可能性,生成路线系统采用的是TransCAD中Route Systems菜单下“Utilities-Create from Table”功能。首先,我们需要创建一个csv文件,命名为“RouteInfo.csv”,用以保存创建路线系统需要的信息。然后从站点信息数据表中获取 “ST_NO” (站点编号) 、 “ST_NAME” (站点名称)、 “TRANSFER_TAG” (换乘标签)和 “LINE_NO” (站点所在线路编号)四列信息至RouteInfo中。再从TransCAD 的street图层中依线路编号顺序获取每条线路上的节点编号,加入至RouteInfo文件的 “NodeID”一列中。需要注意的是,10号线、11号线分别都有2个方向,虽然在公共站点部分两个方向的路线重合,但是为了使分析更加准确,在路线系统中需要将两个方向的路线区分开来。因此需要在RouteInfo的表格中添加“RouteNO”(路线编号)一列,用来保存站点所在路线的编号,其与“LINE_NO”是不同的。例如,11号线上的嘉定新城站,其LINE_NO的值为11,但存在两个RouteNO的值,一个是1101,另一个是1102.最终RouteInfo.csv 文件中的站点数为396个,站点数据格式如表4-3所示。表4-3 站点数据格式变量名含义RouteNo路线编号NodeID节点编号ST_FLAG节点是否是站点ST_NO站点编号ST_NAME站点名称LINE_NO地铁线路编号TRANSFER_TAG是否是换乘站根据“RouteInfo.csv”文件中准备好的数据,我们可以生成路线系统。创建路线系统的方法具体如下:(1) 在添加好所有换乘通道的底图基础上,用Select-Select by Condition工具,设置Condition为Connect=1,把所有的换乘通道选中,并创立一个选择集,命名为 “Selection”。(2) 在TransCAD中打开添加好所有路线站点信息的表格RouteInfo.csv;(3) 在Route System 菜单中选择 Create from Table,在弹出的对话框中进行如图4-3所示的设置;(4) 用Route Systems-Editing Toolbox 逐一为创建的路线设置反向路线。图4-3 根据数据表创建路线系统步骤(1)的目的是将所有的换乘通道筛选至一个选择集中,以便在公交系统创建的时候使用。步骤(4)不可缺少的原因是,Street图层的道路是双向的,而路网系统中的路线都是单向的,因此需要对每一条路线都增加相应的反向路线。图4-4是路线系统的数据表。图4-4 路线系统的数据表4.2.2 公交网络的生成路网系统生成之后,在TransCAD软件中可以生成一套依附于路网系统的公交网络。因为我们研究的是铁路节点(Node)至节点之间的公交路线,所以要把换乘通道加入至公交网络中。创建公交网络的步骤如下:(1) 在刚刚生成的Route Stops图层中添加一个字段,名为“Node_ID”,用于储存下一步中产生的Node的信息;(2) 选择Route System 图层,用Transit菜单下“Tag Stops to Node”功能,把路线站点和底图中的Node关联起来,如图4-5所示;图4-5 将站点与节点对应(3) 用Transit-Create Network 创建公交系统,注意在Non-Transit links in的菜单栏中一定要选择Selection。设置如图4-6;图4-6 创建公交网络第(2)步的操作至关重要。因为只有将路线系统的站点与地理图层Street中的节点对应起来才能够进行节点至节点间的公交路线分配。否则,换乘通道与路线系统之间无法相连。至此,路网方面的数据准备全部完成。最终路网如图4-7所示。图4-7 路网总体图4.3 轨道交通IC卡数据预处理4.3.1 剔除奇数次刷卡记录数ID根据表2-3我们可知,在原始IC卡刷卡数据中,每一行记录就是乘客每一次进出站刷卡产生的信息。根据出行的定义,一次完整的出行应该包括一次进站刷卡记录和一次出站刷卡记录。也就是说,每个ID的记录条数都应该是由进站和出站组成的偶数。但是对数据进行筛选后发现,记录条数为奇数的ID仍然存在。奇数次刷卡意味着该出行者的某一次出行只有进站刷卡记录或者出站刷卡记录,这两种情况都是不符合现实情况的。所以这些记录条数为奇数的ID就是不合理的记录,需要进行处理。因为我们需要使用一个ID在一天之内的所有刷卡数据,因此只要是记录数为奇数的ID,该ID的所有记录都不作为分析的数据使用,需要删除该ID的所有记录。故我们首先要做的就是筛选出记录条数为奇数的不合理数据,并删去整个ID的所有记录。利用SPSS软件从9024322条刷卡记录中选出刷卡次数为奇数次的ID的方法是:(1) 用SPSS语法编辑器输入如图4-8的语句,运行语句后创建一个变量“index”,该变量的含义是每个ID每一次刷卡记录的序号;图4-8 创建变量index的语句(2) 对数据进行分类汇总,分类变量为“id”,汇总变量为“index”,函数为“MAX()”,如图4-9所示,得到变量“index_max”,该变量是每个ID在一天之内最大的刷卡记录序号,即一天内的总刷卡次数;图4-9 对index分类汇总(3) 利用筛选功能把“index_max”为奇数的记录全部筛选出来并删除。经过剔除记录数为奇数的ID的所有记录后,数据表中剩余的记录数由9024322条减少为8957374条,该步骤剔除的数据占总数据的0.7%。4.3.2 转化为OD数据格式在上一节中,我们已经把刷卡记录为奇数次的ID所包含的全部记录删除,余下的ID所包含的刷卡记录均为偶数。于是我们可以进行这一步骤。我们的分析以乘客的一次出行为单位。每一个乘客在一天内可能会有多次出行,而每一次出行都包括进站和出站两次刷卡记录。所以我们需要把刷卡记录转换成出行记录,也就是将同一次出行的进站记录数据和出站记录数据合并成一条OD数据。数据格式转换的实现使用的是SPSS的数据重组功能。根据软件的提示完成数据格式的转换之后,我们数据表中的记录数变为了原来的一半,即4478687条。完成OD数据格式转换后,数据库中的数据格式如表4-4所示。表4-4 OD数据格式变量名类型宽度备注id数值(N)10IC卡编号date字符串10刷卡日期mode字符串4出行方式time.1字符串8进站刷卡时间time.2字符串8出站刷卡时间station.1字符串16进站站点名称station.2字符串16出站站点名称fare.1数值(N)4进站扣费金额fare.2数值(N)4出站扣费金额4.3.3 剔除不合理OD记录完成OD数据格式的转换后,我们仍需要检查数据的正确性。我们发现了数据中存在另一个问题。在原始IC卡刷卡数据中,“fare”这个变量记录的是本次刷卡扣除的费用。在转换完成后的OD数据中,“fare.1”表示进站扣除费用,“fare.2”表示出站扣除费用。正常情况下,进站不扣费,fare.1 = 0,而出站时扣费,fare.2 0。但我们发现OD数据中存在一部分记录的fare.1 0或者fare.2 = 0。虽然我们无法得知是什么原因造成了这项数据的产生,但这些显然都是不合理的数据,我们只能将其删去。通过对OD数据进行筛选后,得出这样的记录数有87845条,占现有数据的1.95%,删去后剩下的记录数为4390842条。4.3.4 合并出行经过以上处理后,每一条OD数据就其本身而言已经没有问题,但是从逻辑上仍然需要修正。最主要的原因是出站换乘。在我们的表中,每一行数据代表一次进站和出站的行为。而“一次出行”的定义是:单程400m以上或步行时间5min以上,利用城市市政设施实现某一目的的单向出行活动。我们表中的一行数据有可能代表一次出行,也有可能仅仅是一次出行中的一个环节,即同一个ID多条OD首位相连的数据拼在一起才代表一次完整的出行。但这并非意味着同一个ID所有首位相连的数据都是在一次出行中。因此我们需要找出这样的数据,判断它们是否只是一次出行中的一个环节,然后对它们进行修正。首先,我们需要找出可能成为换乘环节的记录。需要注意的是,只有在必须出站换乘的站点才可能产生这样的数据。经过实地调查以及网上资料的搜索,在2015年4月1日,上海轨道交通系统中需要出站换乘的站点有:上海火车站站、人民广场站和陕西南路站。因此我们只需要将出站站点包含这三个站点的数据筛选出来,然后仅对这些数据进行分析和判断即可。按出站站点进行条件筛选后,只有457840条数据满足条件。数据量的缩小将对我们的分析带来许多方便。第二,我们需要在筛选出来的457840条数据中进行进一步筛选。因为在这三个站点出站的乘客并非全都为了换乘,也可能是达到了出行的终点。判断乘客是否在此站换乘的标准是与下一次进站的时间差。我们规定这个时间差为30分钟,即在30分钟内乘上另一条线的乘客,我们认为他是在该站进行了换乘,而分别记录了这两次进出站的两条记录其实只代表了一次出行,我们需要做的就是将这两条数据合并为一条。具体的筛选方法如下:(1)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农副食品加工设备安全风险评估与管理试题考核试卷
- 药品仓储库区划与管理考核试卷
- 斯蒂里设计师专业体系构建
- 《供应链管理》课件
- 渔业资源利用效率提升考核试卷
- 运维安全保密措施
- 粮食加工消防安全管理规定
- 糖果食品安全监管考核试卷
- 小组介绍课件
- 粮食产业与制糖业的联动发展考核试卷
- 2024-2030年新版中国铝钪合金项目可行性研究报告(甲级资质)
- 活动板房制作安装施工合同
- 《基于SIP协议的IP呼叫中心控制器设计与实现》
- 矿业权评估准则全
- 金庸人物课件
- 2024年合肥市网约配送员技能竞赛理论考试题库(含答案)
- 【浅谈劳动合同法中的试用期制度7500字(论文)】
- 2024中国企业海外知识产权纠纷调查
- 大学体育与健康智慧树知到期末考试答案章节答案2024年齐鲁师范学院
- 2023-2024学年浙江省绍兴市上虞市重点中学小升初数学入学考试卷含解析
- 小区消防移交物业协议书
评论
0/150
提交评论