(地图学与地理信息系统专业论文)基于gps轨迹的出行信息提取研究.pdf_第1页
(地图学与地理信息系统专业论文)基于gps轨迹的出行信息提取研究.pdf_第2页
(地图学与地理信息系统专业论文)基于gps轨迹的出行信息提取研究.pdf_第3页
(地图学与地理信息系统专业论文)基于gps轨迹的出行信息提取研究.pdf_第4页
(地图学与地理信息系统专业论文)基于gps轨迹的出行信息提取研究.pdf_第5页
已阅读5页,还剩150页未读 继续免费阅读

(地图学与地理信息系统专业论文)基于gps轨迹的出行信息提取研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

p h dd i s s e r t a t i o n ( 2 010 ) u n i v e r s i t yc o d e :1 0 2 6 9 s t u d e n ti d :5 2 0 7 0 8 010 0 6 e a s tc h i n an o r m a lu n i v e r s i t y d e r i v i n gt r i pi n f o r m a t i o nf r o m g p st r a je c t o r i e s c o l l e g e : r e s o u r c e sa n de n v i r o n m e n t a ls c i e n c e s d e p a r t m e n t :g e o g r a p h y m a j o r :c a r t o g r a p h ya n dg e o g r a p h i c a li n f o r m a t i o ns y s t e m r e s e a r c hd i r e c t i o n :t r a je c t o r yd a t am i n i n g a d v i s o r s : j im i n h e p h d c a n d i d a t e : z h a n gz h i h u a a p r i l2 0 1 0 华东师范大学学位论文原创性声明y 1 7 4 4 12 6 郑重声明:本人呈交的学位论文易砀钾s 彳地仇歌厉,彳毛之秤研戈 , 是在华东师范大学攻读硕士博占彳请勾选) 学位期间,在导师的指导下进行的研究工 作及取得的研究成果。除文中已经注明引用的内容外,本论文不包含其他个人已经发表 或撰写过的研究成果。对本文的研究做出重要贡献的个人和集体,均已在文中作了明确 说明并表示谢意。 作者签名:日期:2 - 口t 年月弓日 华东师范大学学位论文著作权使用声明 墨- i 口,多弘2 仍敞彳枵g 青免取研宄 系本人在华东师范大学攻读 学位期间在导师指导下完成的硕士博生( 请勾选) 学位论文,本论文的研究成果归华 东师范大学所有。本人同意华东师范大学根据相关规定保留和使用此学位论文,并向主 管部门和相关机构如国家图书馆、中信所和“知网送交学位论文的印刷版和电子版; 允许学位论文进入华东师范大学图书馆及数据库被查阅、借阅;同意学校将学位论文加 入全国博士、硕士学位论文共建单位数据库进行检索,将学位论文的标题和摘要汇编出 版,采用影印、缩印或者其它方式合理复制学位论文。 本学位论文属于( 请勾选) () 1 经华东师范大学相关部门审查核定的“内部”或“涉密 学位论文宰, 于年月日解密,解密后适用上述授权。 ( d2 不保密,适用上述授权。 导师签名 本人签名一銎丝暂l 一 加口年i 月3e l “涉密”学位论文应是已经华东师范大学学位评定委员会办公室或保密委员会审定过的学位 论文( 需附获批的华东师范大学研究生申请学位论文“涉密”审批表方为有效) ,未经上 述部门审定的学位论文均为公开学位论文。此声明栏不填写的,默认为公开学位论文,均适用 上述授权) 。 殛丝至博士学位论文答辩委员会成员名单 姓名职称单位备注 勰 貉缓佯辱y 币范峨 主席 州匆夕吐 跟才受 同珞久誊 孙建中 么智蟹 上遍僻黼乏确凌中j j f 缘皴教缓雒糸忻蓖久啄 芝使军么缓 牟吞膨姒尊 基于g p s 轨迹的出行信息提取研究 摘要 一个城市的活力得益于顺畅的交通系统。出行预测模型为交通规划和交通政 策的制定提供了科学依据。从2 0 世纪5 0 年代发展至今,出行预测模型发生了从 基于“出行”( t r i p b a s e d ) 向基于“活动”( a c t i v i t y - b a s e d ) 的范式转变。活动 分析法的基本思路是通过对在驱动因素和限制条件下微观个人的出行决策分析 来获得大尺度群体行为的宏观涌现,因此对出行细节数据的需求更为迫切,而传 统的出行调查方法无论在精度上还是在数据采集频率上已经远远落后于需要。 传统的出行调查方法采用入户访谈( f a c e t o f a c e ) 、计算机辅助电话调查 ( c a t i ) 的方式,这些方法本质上都依赖于被访者对行程的回忆和主观认知, 因此不可避免的存在受访回应率低、数据质量不高的问题,更无法提供活动模型 所需的路径选择信息。 将全球定位系统( g p s ) 应用于出行调查,变传统的人工记录为仪器记录, 可解决长期困扰传统调查方法的诸多难题,但同时又对从轨迹中自动提取出行信 息提出了挑战。对该问题的解决,不仅可革新出行调查技术,也可为行为学、时 间地理学等研究提供数据支撑。从更广泛的意义来讲,这种从仪器记录的时间位 置数据向可认知的语义信息的转化,为计算设备理解人的行为,实现“智慧化”, 提供了重要契机。 本文关注的问题是,在无需借助任何辅助数据的情形下,是否存在一些算法, 单纯依靠g p s 轨迹的时空特征,可以获得对常规出行信息的自动有效提取。换 言之,如果能最大限度地利用g p s 轨迹数据固有的时空结构,结合先验知识挖 掘出高质量的出行信息,便可少用甚至不用辅助数据,降低运作成本,提高工作 效率。这些信息包括三种交通规划模型的基本参数,即出行端点、出行方式、以 及出行目的。为此,本文研究的主要内容包括: ( 1 ) 面向对象的轨迹数据分割方法设计 从理论上增进对轨迹数据的深入认识,提出了面向对象的轨迹数据分割方 法。该方法依据轨迹中信息的多层次规律,参照面向对象的图像理解思路,实现 自下而上的轨迹逐级合并。为本文后续的行程识别、出行方式判定等工作打下了 基础,同时也丰富了轨迹数据的理论和实践研究。 ( 2 ) 出行端点提取方法研究 基于g p s 轨迹的出行信息提取研究 针对当前从g p s 轨迹中提取出行端点的研究中多是以单点为计算对象的不 足,根据本文提出的面向对象的轨迹分割思路,采用多次合并的方法实现出行端 点的提取,可有效地避免噪音干扰。根据训练样本,对识别端点的时间阈值进行 优化,发现1 8 0 s 的阈值更适合识别出行端点。 ( 3 ) 出行方式判别研究 根据对样本数据的速度、加速度、方向、信号质量等特征的观察,优选出合 适的统计量,并对比了多层感知器神经网络、贝叶斯网、决策树三个方法的分类 效果。结果表明,在c 4 5 决策树中使用速度的7 5 分位数、速度离差和信号缺失 比例三个统计量取得了最佳的总体分类精度,达9 2 3 4 。 ( 4 ) 出行目的推断研究 人的出行决策受制于时间、空间、社会关系和个人认知,因此从这四个方面 选取推断依据,结合g p s 数据特征,使用停留时长、到访时段、职业、到访频 率等属性,利用c 4 5 决策树进行出行目的推断,但结果并不理想。 ( 5 ) 国内出行调查试验初探 从华东师范大学的教师和学生中征集志愿者,开展出行调查试验。试验结果 表明,基于被动式g p s 的出行调查方式精度高,用户负担小,在这两方面显著 优于传统调查方式。 ( 6 ) 出行信息提取软件开发 基于m a t l a bg u i 开发了出行信息提取软件,可实现g p s 轨迹数据的自动入 库、行程自动识别、交互式修改行程、交通方式和出行目的样本库建立。 论文结论表明,本文提出的面对对象的轨迹分割方法有助于从轨迹中提取信 息,在行程识别和换乘点识别中取得了不错的效果。在无辅助数据的情况下,从 g p s 轨迹中可较好的提取行程和交通方式信息,但出行目的推断精度不高。总体 来讲,基于被动式g p s 调查方法不仅在调查精度和用户负担上优于传统调查方 法,而且可以提供路径选择信息,有着良好的应用前景。 本文的不足之处在于对轨迹数据的理论认识不够深入,而且研究所用的样本 量较小,出行目的推断的精度有待提高,在下一阶段的研究中应着力解决这些问 题。 关键词:出行调查、g p s 轨迹数据、信息提取、交通方式、出行目的 a b s t r a c t u r b a na n dr e g i o n a lp l a n n i n gi sm a i n l yb a s e do nt r a v e ld e m a n dm o d e l sw h i c ha i ma t e s t i m a t i n gc h a n g e si nt r a n s p o r t a t i o na c t i v i t yo v e rt i m e r e c e n t l y a c t i v i t y b a s e d m o d e l sh a v ea t t r a c t e da ni n c r e a s i n gi n t e r e s t t h i sn e wp a r a d i g mi sb a s e do nt h e b o t t o m - u pi d e a ,a n da sar e s u l t ,r a i s e sa l lu r g e n tn e e df o rh o u s e h o l d p e r s o n a lt r a v e l s u r v e y ( h t s p t s ) d a t a t r a d i t i o n a l l y , h t sd a t aw a sc o l l e c t e du s i n gf a c e t o f a c eh o m ei n t e r v i e w so r c o m p u t e r - a s s i s t e d t e l e p h o n ei n t e r v i e w s ( c a t i ) ,w h i c hn e e dt h er e s p o n d e n t sr e c a l l t r a v e ld e t a i l ss u c ha st r i po r i g i n s ,d e s t i n a t i o n s ,s t a r tt i m e ,e n d t i m e ,t r i pm o d e sa n dt r i p p u r p o s e c o m p a r e dt ot r i p b a s e dm o d e l ,a c t i v i t y - b a s e dm o d e la l s on e e d st r i pr o u t e s r e s p o n d e n t so f t e nf o r g e to rs l i ps o m et r i p s ,w h i c hl e a d st op o o ra c c u r a c yt ot r a v e l m o d e l s a tt h es a m et i m e ,h i 曲b u r d e ni sa l s or e s p o n s i b l ef o ral o wo v e r a l lr e s p o n s e r a t e g p sc a nr e c o r dl o c a t i o na n dt i m e w h i c h g i v eu sa na c c u r a t ea n dd e t a i l e dt r i p t r a j e c t o r i e s t h i sn e wt e c h n o l o g yp r e s e n t sar e v o l u t i o n a r ym e t h o do ft r a v e ls u r v e y h o w e v e r , i tc a l l sf o ra u t o m a t e di d e n t i f i c a t i o nt r i p sf r o mt r a j e c t o r i e sa n dd e r i v et r i p m o d e sa n dt r i pp u r p o s e s t h em a i ns t u d yc o n t e n t so ft h i sr e s e a r c hi n c l u d e : ( 1 ) a no b j e c t o r i e n t e dt r a j e c t o r ys e g m e n t a t i o nm e t h o dw a sp r o p o s e d ,w h i c hu s e da b o t t o m 。u pp r o c e d u r et om e r g ee a c h1 e v e lo ft r a j e c t o r yd e t a i l st of o r mas e m a n t i c t r a j e c t o r yw i t ht r i pi n f o r m a t i o n ( 2 ) c o m b i n e dw i t hm a c h i n el e a r n i n gm e t h o d s ,t r i pi n f o r m a t i o nw a sd e r i v e d ,w h i c h i n c l u d e ds t o p s ,t r i pm o d e sa n dt r i pp u r p o s e s ( 3 ) a ne x p e r i m e n t a lt r a v e ls u r v e yw a sc o n d u c t e di ne a s tc h i n an o r m a lu n i v e r s i t y , w h i c hu s e13v e h i c l er e s p o n d e n t sa n d11 p e r s o n a lr e s p o n d e n t s t h e i rt r a v e ld a t aw a s c o l l e c t e dt od ot h et r i pi n f o r m a t i o nd e r i v i n gr e s e a r c hd e s c r i b e da b o v e ( 4 ) as o f t w a r ew a sa l s od e v e l o p e dt oa s s i s tt h er e s e a r c h ,w h i c hc a l la u t o m a t e di m p o r t r a wg p sd a t at oas i m p l ed a t a b a s e ,i d e n t i f ys t o p sa n dg a v ea ni n t e r a c t i v eg u i f o r m o d i f yd e r i v e dt r i p sa n dc o n s t r u c ts a m p l ef o rm a c h i n el e a r n i n g t h er e s u l t si n d i c a t e dt h a tp a s s i v eg p st r a v e ls u r v e ym e t h o dh a sl o wb u r d e na n dh i g h a c c u r a c y t h ep r o c e d u r ew ep r o p o s e dh a v ed o n ew e l li nt r i pi d e n t i f i c a t i o na n dt r i p m o d ec l a s s i f i c a t i o n ,h o w e v e rt h em e t h o dt oi n f e rt r i pp u r p o s en e e dt ob e i m p r o v e d k e yw o r d s :p a s s i v eg p st r a v e ls u r v e y , t r i pi d e n t i f i c a t i o n ,t r i pm o d e ,t r i pp u 叩o s e i i i 基于g p s 轨迹的出行信息提取研究 目录 摘要i a b s t r a c t i i i 目录1 图片目录4 表格目录6 第1 章研究背景7 1 1 简介7 1 2 基于g p s 的出行调查的提出7 1 2 1 出行调查简介7 1 2 2 出行调查技术8 1 3 代表性的g p s 出行调查实验1 4 1 4 当前研究存在的问题1 7 1 5 本文的研究内容1 8 1 6 研究意义1 9 1 7 研究体系2 0 第2 章数据来源2 2 2 1g p s 记录仪选择2 2 2 1 1 国外g p s 调查所用仪器调研2 2 2 1 2 居民出行调查中g p s 仪器选择的一般原则2 3 1 3 我们选用的仪器2 4 2 2 数据收集过程2 5 2 2 1 基于车辆的被动式g p s 出行调查2 5 2 2 2 基于个人的被动式g p s 出行调查2 7 2 3 调查结果2 7 2 4 调查经验总结以及存在的问题2 7 第3 章数据预处理与可视化3 0 0 o 1 2 3 3 3 3 一据失移 征数缺漂特始据据据原数数 数,2 3 黔l l lg文文奠 ,ic v u 基y - g p s 轨迹的出行信息提取研究 3 2 数据预处理3 3 3 2 1 格式转换3 4 3 2 2 漂移去除3 5 3 2 3 数据滤波3 6 3 3 数据可视化3 8 3 3 1 基于g o o g l ee a r t h 的数据可视化3 8 3 3 2 基于m a t l a b 的轨迹展示4 0 第4 章行程识别4 3 4 1 行程识别简介4 3 4 2 研究现状与存在问题4 4 4 2 1 研究现状4 4 4 2 2 存在的主要问题4 7 4 3 对轨迹的认识4 8 4 3 1 轨迹的概念4 8 4 3 2 轨迹数据模型4 8 4 3 3 轨迹中的基本要素:j4 9 4 3 4 轨迹数据表达4 9 4 3 5 出行轨迹中活动地点的多尺度特征5 0 4 4 逐级合并的轨迹分割方法5 1 4 4 1 概念定义5 1 4 4 2 算法思路5 3 4 4 3 算法过程5 5 4 4 4 精度评价5 7 4 4 5 参数优化5 7 4 5 活动地点的多尺度聚类算法5 8 4 6 实验结果与分析5 9 4 6 1 识别结果5 9 4 6 2 结果分析6 0 4 6 3 出行特征6 2 4 7 行程识别总结6 5 第5 章交通方式判别6 7 5 1 相关研究概况6 7 5 2 研究方法6 9 5 2 1 方式段分割6 9 5 2 2 统计量选择7 0 5 2 3 机器学习算法7 l 5 3 实验及分析7 3 5 3 1 统计量选取7 3 5 3 2 判别结果7 8 5 3 3 结果分析8 1 5 4 交通方式判别的结论8 2 第6 章出行目的推断8 3 基于g p s 轨迹的出行信息提取研究 6 1 概述与相关研究8 3 6 2 研究方法8 7 6 3 实验及结果8 8 6 4 出行目的推定的分析与总结9 0 第7 章出行信息辅助提取系统9 2 第8 章总结与展望9 6 8 1 总结9 6 8 2 存在的不足与进一步研究展望9 7 附录a :相关调查表格9 8 附录b 文中部分代码1 0 4 参考文献1 1 2 后记1 1 6 。1 基丁ig p s 轨迹的出行信息提取研究 图片目录 图1 1 出行示意图8 图1 2 出行漏报、多报比例图1 0 图1 3l e x i n g t o n 调查中各天的出行填报次数1 1 图1 4 时间取整误差( 根据( m c g o w e n ,2 0 0 6 ) 改绘) 1 2 图l 。5b o h t e 实验中使用的出行信息网络验证界面( b o h t ea n dm a a t ,2 0 0 8 ) 1 7 图1 6 本文研究体系示意图2 0 图2 1g p s 出行数据采集仪( v 9 0 0 ) 2 5 图2 2 基于车辆的被动式g p s 出行调查实验流程图2 6 图3 1g p s 仪器采集到的原始数据3 l 图3 2 漂移示意图j 3 2 图3 3 漂移去除前后示意图3 6 图3 4 滤波前后的速度、方向、加速度变化图3 7 图3 5 平移前后的车辆g p s 轨迹3 8 图3 6 基于g o o g l ee a r t h 的轨迹展示4 0 图3 7 基于g o o g l ee a r t h 时间回放的轨迹可视化4 1 图3 8 基于点、线标注的出行轨迹可视化4 1 图3 9 基于时间地理学概念的出行轨迹可视化4 2 图4 1g p s 轨迹与出行信息关系示意图4 3 图4 2g p s 轨迹的等时记录法( 左图) 和关键点记录法( 右图) ( g o n z a l e z e ta 1 ,2 0 0 8 ) 5 0 图4 3 人的活动地点的多尺度特征示意图5 0 图4 4 行程识别的思路转变示意图5 1 图4 5 轨迹逐级合并示意图5 3 图4 6 点转段示意图5 5 图4 7 轨迹段转化为状态段5 5 图4 8 阈值确定和优化的流程5 7 图4 9 聚类过程示意图( a s h b r o o ka n ds t a r n e r ,2 0 0 3 ) 5 9 图4 1 0 行程识别的查准率和查全率示意图6 0 图4 1 1 未被识别的短时停留6 1 图4 1 2 漂移过大的停留6 1 图4 1 3出行距离分布图6 3 图4 1 4 出行时间分布图6 3 图4 1 5 出行时段分布图6 4 图4 1 6 出行平均速度( 千米时) 分布图6 4 图4 1 7 聚类过程中活动场所数目变化6 5 图5 1 多层感知器神经网络用于判定交通方式示意图7 1 图5 2 各种交通方式的速度频率图7 4 图5 3 各种交通方式的加速度频率图7 5 图5 4 各种交通方式的方向变化频率图7 5 基丁g p s 轨迹的出行信息提取研究 图5 5 速度7 5 分位数的分布频率图7 6 图5 6 速度离差的分布频率图7 7 图5 7 矢量加速度的分布频率图7 7 图5 8 信号质量的分布频率图7 8 图6 1 城市空间个人活动一出行分析框架( 柴彦威a n d 沈洁,2 0 0 8 ) 8 3 图6 2 出行目的影响因素示意图8 4 图7 1 系统主界面9 2 图7 2 数据预处理界面9 3 图7 3 行程识别工作界面9 4 图7 4 交通方式和出行目的录入界面9 5 1 基于g p s 轨迹的出行信息提取研究 表格目录 表1 - 11 9 9 6 年- 2 0 0 4 年各国开展的基于车辆的g p s 出行调查试验( b h a t , 2 0 0 4 ) 1 3 表卜21 9 9 6 年一2 0 0 4 年各国开展的基于个人的g p s 出行调查试验( b h a t , 2 0 0 4 ) 1 3 表1 - 3 土地利用类型与出行目的关系( w o l f ,2 0 0 0 ) 1 5 表2 - 1 车辆出行调查样本基本情况表2 8 表2 - 2 个人出行调查样本基本情况表2 8 表4 - 1 错误识别的停留表6 2 表5 - 1 从g p s 轨迹中判别交通方式的相关研究汇总6 7 表5 2 交通方式的换乘矩阵( z h e n gy u ,2 0 0 8 ) 6 9 表5 - 3 交通方式划分的统计量7 0 表5 - 4 多层感知器神经网络交通方式分类矩阵7 8 表5 - 5 贝叶斯网络的交通方式分类矩阵7 9 表5 - 6 决策树( 四属性) 的交通方式分类矩阵8 0 表5 - 7 决策树( 三属性) 的交通方式分类矩阵8 1 表6 - 1 文献中推断出行目的所用的因素8 4 表6 - 2 瑞典全国活动调查目的匹配表( 局部) 8 6 表6 3 出行目的推断使用的属性8 7 表6 - 4 出行目的分类结果表8 9 。1 1 基于g p s 轨迹的出行信息提取研究 第1 章研究背景 1 1 简介 居民出行调查是交通规划的数据基础。为适应城市飞速发展的需要,每隔几 年都会开展一次大规模的出行调查,调查手段主要采用入户访谈( f a c e t o f a c e ) 、 纸笔填写( p a p e r - a n d p e n c i li n t e r v i e w , p a p i ) 的方式。然而这种传统的调查方法 依赖于被访者对调查问题的主观认知,存在着遗漏出行、时间地点填写不准确、 无法获取出行路径、被访者负担大等问题( m c g o w e n ,2 0 0 6 ;w o l f ,2 0 0 0 ) 。 出行调查的核心内容是出行信息,包括出行起点、终点、出行时间、交通方 式、出行目的等,主要是位置、时间相关的信息。g p s 具备自动、准确记录位置 和时间的功能。如果通过g p s 记录的出行轨迹可以提取这些出行信息,那么就 有望利用g p s 革新传统的出行调查方式。 1 2 基于g p $ 的出行调查的提出 1 2 1 出行调查简介 出行是指“人有目的地进行的由特定出发地点到目的地的单向移动( 陆化普, 1 9 9 8 ) 。在具体实施出行调查时,有更为明确的定义:凡具有明确出行目的,采 用一种或几种交通方式,利用城市道路,从甲地到乙地的一次单向移动( 步行超 过5 分钟或使用交通工具出行距离超过4 0 0 米) 即为一次出行。比如某人从家出 发,到公司上班,即构成一次出行( 见图1 1 ) 。 出行的起点和终点,又称为出行端点( t r i pe n d s ) 。人在出行端点完成一定 目的的活动,出行目的可分为:上班( 包括回工作单位) 、上学、购物、文化娱 乐、业务、接送人、回家、其他生活等( 上海市,2 0 0 9 ) 。 居民出行要采用一定的交通方式,一次出行可以使用多种交通方式,如图 1 1 所示的某人从家到工作单位的出行,要先步行到公交站台,乘坐共交车到地 铁站,换乘轨道交通,然后再步行到单位,完成一次出行过程。出行调查中的交 通方式一般有:脚踏自行车、助动车和电动自行车、摩托车、出租车、公交车、 基于g p s 轨迹的m 行信息提取研究 单位超市小区等社会班车、驾驶小汽车、乘坐小汽车、轨道交通( 地铁、轻轨、 郊铁等) 、轮渡及其它( 上海市,2 0 0 9 ) 。 兮足田翩 自家- 一_ 步行一一- _ 公交_ 一- - 轨交_ 一- - 图1 1 出行不意图 f i g u r e1 1a s k e t c ho f t r i p 美联邦政府为了获得全美交通出行的基本特征,并向全美各地方政府和公众 的交通决策提供数据和信息支持,从1 9 6 1 年起开展全国范围的个人居民出行调 查( n p t s n h t s ) ,并形成了大体上五年一次的固定周期,至今已开展七次调查。 调查结果在网站上向公众公布,除了为交通规划和交通决策提供数据之外,也为 清洁能源、社会经济可持续发展、环境与健康等相关研究领域的研究提供数据支 撑( 周江评,2 0 0 4 ) 。最近一次n h t s 于2 0 0 8 年开展,有1 5 5 万个家庭参加。 我国的出行调查始于上个世纪八十年代初,主要以市域为调查范围。目前大 多数城市都开展过一次或几次出行调查,为城市规划和交通基础设施建设提供了 重要的支撑作用。有些城市也开始形成固定周期的出行调查。如上海已于1 9 8 6 年、1 9 9 5 年、2 0 0 4 年分别开展了三次出行调查,最近开展的第四次出行调查( 2 0 0 9 年) 为2 0 1 0 年上海世博会各项交通保障措施的制定提供了基础数据和决策依据。 1 2 2 出行调查技术 ( 1 ) 出行活动日志 出行日志用日志一样的方式记录受访者在调查日的每次出行时间、地点等。 调查形式包括纸笔调查( p a p e r - a n d p e n c i li n t e r v i e w s ,p a p i ) 和计算机辅助电话调 查( c o m p u t e r - a s s i s t e d t e l e p h o n ei n t e r v i e w s c a t i ) 。 纸笔调查是国外早期使用和国内目前普遍采用的调查方式,有入户调查 ( f a c e t o f a c ei n t e r v i e w s ) 和邮寄调查( m a i l o u t m a i l b a c ks u r v e y s ) 两种形式。 前者是国内采取的主要形式,后者在美国相当普遍。以国内的入户调查为例,首 氐骨癣嗡 纛 尺 | | : 基于g p s 轨迹的出行信息提取研究 先通过抽样选定被访户后,向其告知调查日和调查注意事项,然后在调查日之后, 由调查员登门当面了解该户中6 岁以上成员在特定调查日的详细出行情况。包括 预约登记、正式登门调查、复核或补充调查三个环节。 该方法一是能充分利用我国城市户籍制度比较完备和管理集巾的特点,使抽 样过程方便且科学性强;二是适合大中城市的调查一般由市政府负责的特点,使 组织实施工作较能做到有序协调。此外,该方法历年来一直广泛应用,已形成了 一套比较成熟完备的实施办法。 然而这种方法需要耗费大量人力物力,如2 0 0 5 年广州市出行调查,抽样涉 及2 5 万人,调查之前在电视、广播、报纸、网络等媒体广泛宣传,调查日出动 4 0 0 0 名调查员进行调查工作( 大洋网,2 0 0 5 ) 。这种方法需要事先培训大量的 调查员,并且调查员的素质对调查精度起到了很大的影响。调查表的输入整理费 时费力,后续整理中发现的填写错误还要向被访者复核或者补充调查。( 叶以农, 1 9 9 7 ;张卫华,2 0 0 5 ) 最近一二十年来,美国逐渐用c a t i 代替了p a p i 调查。调查过程中,调查 员面对计算机屏幕上的问卷,通过电话向受访者开展调查,同时将调查结果录入 电脑。该方法的优点是调查过程和数据整理过程同步进行,由计算机控制问题的 逻辑流程,调查结果在后台直接统计和分析。 虽然c a t i 在数据质量控制、成本效益比以及收集处理数据速度上较之家访 式调查有了很大改善。但由于固定电话使用的日益减少,通讯服务提供商的不同 所造成的电话号码混乱,以及受访者对电话调查拒绝率升高等问题,这种方法也 面临困境。 ( 2 ) 基于g p s 的出行调查( g p sb a s e ds u r v e y ) 基于g p s 的出行调查是给受访者配备一个g p s 接收器,利用g p s 的定位功 能,记录受访者的出行过程。按照受访者是否需要自助输入出行相关信息,分为 主动式和被动式两种形式。这是近十年来刚刚兴起的一种调查手段,和出行日志 的不同之处在于变人为记录信息为计算设备( g p s ) 自动记录信息。 p a p i 和c a t i 这两种传统的调查手段在国内外延用多年,每个城市每隔五年 左右都要实施一次出行调查,以上海这样规模的城市为例,每次调查中受调查人 数都达数十万人。然而由于传统调查手段自身的原因,下列问题长期困扰着调查 者: a ) 出行漏报 基丁g p s 轨迹的出行信息提取研究 长期以来,调查表中填写的出行次数都少于居民实际出行次数。出行漏报的 主要原因包括:受访者遗忘部分出行;受访者认为某些出行不重要,比如一些短 距离出行;受访者出于隐私的顾虑或者懒惰。 漏报问题一直存在,但无法做出准确估计。u l m e re ta 1 ( 2 0 0 3 ) 比较了v i r g i n i a 的交通量和出行日志的差别。出行日志中每天平均有9 1 5 次出行,而交通量估 计得到的数值是l o 8 1 次,大约1 5 的漏报率。 z m u d 和w o l f ( 2 0 0 3 ) 比较了g p s 调查和出行日志调查的结果,估计的漏 报率为2 7 。漏报不仅仅比例大,而且分布不均衡。如图1 2 所示,只有4 1 的 填报行程和真实行程完全匹配,有3 的家庭漏报1 0 条以上的出行。 3 3 圈多报1 次以上的出行 一完全匹配 口漏报1 _ 4 次出行 4 1 口漏报5 - 9 次出行 一漏报1 0 次以上的出行 图1 2 出行漏报、多报比例图 f i g u r e1 2d i s t r i b u t i o no fu n d e r - r e p o r t e dt r i p s ( z m u da n dw o l f ,2 0 0 3 ) p e a r s o n ( 2 0 0 1 ) 也比较了出行日志和g p s 记录的结果。他估计的漏报率在 1 2 一3 1 之间。 b ) 受访者厌烦 多天连续调查是可以反映出具体个人的活动规律,是建立活动模型的重要手 段。s t o p h e re ta 1 ( 2 0 0 8 ) 的研究表明,如果能收集多天出行数据,出行调查的 样本量可以减少至单天调查的2 0 3 0 。然而随着调查天数的增加,受访者厌 烦情绪增大,应付行为增多,漏报率也与日俱增。图1 3 是l e x i n g t o n 调查中随 天数增加,填报的出行次数,从第一天的4 5 0 多次降低到第六天的3 5 0 次以下 ( w a g n e r ,1 9 9 7 ) 。a r e n t z ee ta 1 ( 2 0 0 1 ) 在荷兰的一个为期两天的出行调查中 基于g p s 轨迹的出行信息提取研究 实践中也发现第二天漏报率比第一天要高。 图1 3l e x i n g t o n 调查中各天的出行填报次数 f i g u r e1 3r e p o r t e dt r i p si nl e x i n g t 0 1 1g p st r a v e ls u r v e y c ) 概念认知模糊 虽然调查表中为避免歧义,广泛采用“选择题”的形式,避免了很多误解和填 表失误,但一些概念仍存在不一致的理解。如对“出行”这样一个较为专业和陌生 的概念,虽然调查表中有准确定义,调查员也会反复讲解其含义,但仍会有一定 数量的错误理解。 d ) 时间填写不精确 受访者根据自身记忆填写的时间,误差常常可以达到半个小时以上。如图 1 4 所示,该柱状图是加利福尼亚州一次出行调查巾收集到的受访者填报的一小 时以下活动的持续时间。图中有很多突起的柱子,这并不是活动时间本身的突变, 而是由于受访者回忆或者填报的时间往往以整数为单位造成的。 基于g p s 轨迹的出行信息提取研究 停器时间( 分) 图1 4 时间取整误差( 根据( m c g o w e n ,2 0 0 6 ) 改绘) 图1 4t i m er o u n d i n ge r r o r ( r e v i s e df r o m ( m c g o w e n ,2 0 0 6 ) ) e ) 无法获得出行路径信息 出行路径反映了受访者对交通设施和交通管理措施的选择行为,对研究交通 政策的影响意义重大,但是因为涉及路径认知,传统手段很难采集。 f ) 因负担大而造成的拒访率增加 在实施调查时,需要受访者逐条回忆调查日的出行时间、目的、交通方式等 出行信息,给受访者带来很大负担。在生活节奏加快的今天,拒访率也在逐年上 升。在传统的调查手段中,受访者负担和调查精度是不可调和的矛盾,为提高精 度所作的种种努力都不可避免的增加受访者负担,减轻受访者负担又会带来调查 精度的下降。 从本质上来讲,上述这些问题产生于出行信息的理解、回忆和填写,换而言 之就是位置和时间信息的认知问题,人类认知的模糊性造成了数据收集的非规范 性。因此如果可以省去这些认知过程,直接记录信息,则这些问题都可以得到解 决。g p s 具备确定位置和记录时间的功能,为解决这些问题提供了可行性。1 9 9 6 年前后至今,以j e a nw o l f , p e t e rs t o p h c r 等为代表的一部分西方学者( a x h a u s e n e ta 1 ,2 0 0 4 ;s t o p h e re ta 1 ,2 0 0 7 ;s t o p h c re ta 1 ,2 0 0 8 ;s t o p h c re ta 1 ,2 0 0 5 ,2 0 0 7 ; w o l f e ta 1 ,2 0 0 1 ;z m u da n dw o l f 2 0 0 3 ) 考虑将g p s 技术加入交通调查领域, 并做了大量实验性调查。 以下是b h a t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论