基于nl模型的rpsp数据融合方法研究_第1页
基于nl模型的rpsp数据融合方法研究_第2页
基于nl模型的rpsp数据融合方法研究_第3页
基于nl模型的rpsp数据融合方法研究_第4页
基于nl模型的rpsp数据融合方法研究_第5页
已阅读5页,还剩2页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于nl模型的rpsp数据融合方法研究

在综合运输系统中预测交通方式的分离率通常采用非集计模型。该方法使用行为单元作为分析对象,将行人的步行效率分为两部分,其中一部分是可见的,可以通过研究方法获得。另一部分是未知的效果。根据随机效应理论,假设它遵循一定的概率分布。对显现化效用的获得有RP或SP两种调查方法。表1列出了两种调查方法的特点。使用RP调查,行为选择基于观察到的并且己经发生的行为,模型具有较高的可靠性。然而,对目前一些现实中不存在的选择行为、特性以及服务不能采用RP调查(如快速客运线)。SP调查是一种意愿调查,选择方案是在“假定条件下”,因此SP以虚拟更加广泛的选择方案供被调查者选择,从而弥补RP调查的缺陷,对在分析对象区域建立过去没有的选择方案的分析十分有利。但是,被调查者是在非现实、未体验的条件下做出的选择,更多地认为“应该”如何选择,从而会放宽判断的标准,发生SP调查结果与实际选择行为偏离的现象。为了更真实地体现个体的选择偏好,充分利用两种数据的优点,建立两种数据融合的预测模型是必要的。RP数据与SP数据都反映了出行者的“选择偏好(preference)”,具体到效用函数的模型中,即两种模型中个体对显现化变量的偏好存在相同的部分。但是,“选择偏好”的表现形式不同,表现为在两种模型中非显现化效用概率项的“效应”大小不同,而这种“效应”往往对整个效用函数有着不可忽视的影响。充分利用两种数据的优点,建立RP/SP数据的融合模型,关键是找出同一个体在两种数据中非显现化效用之间的联系。Morikawa首先建立起了两种数据融合办法,引入了测度系数(scaling)去修正效用中的非显现化部分,通过测度系数建立起RP与SP数据的关系,并利用RankLogit模型建立了RP+SP数据的似然函数,成功地对系数进行了标定,得出模型得到改进的结论。Hensher和Bradley提出了利用NL模型建立RP/SP数据融合的方法,并在案例中对比了利用RP与修正(rescaled)SP效用函数估计通道交通分担率的优缺点。之后,利用NL模型建立两种数据融合的办法得到推广,并在发展中进一步得到改进。Hensher指出在处理RP/SP数据时,考虑两类数据之间的关联度是必要的,但在有的时候,它们产生的误差可能没有交通方式分类属性的关联性来得重要。也就是在建立选择树的时候,首先按照交通方式的属性进行分层,这样会在去除同类交通方式IIA(IndependencefromIrrelevantAlternative)特性的基础上更好地做到两种数据的融合。文献利用SP数据建立了Logit模型,预测快速客运线运营以后长三角公铁客流量。本文在此基础上,基于RP/SP数据的特点,以未来沪杭通道的交通为背景,首先根据旅客的出行过程建立了RP与SP的效用函数,然后在Hensher和Bradley利用NL模型进行RP/SP数据融合的理论基础上,进一步考虑交通方式的关联性,建立考虑数据RP/SP性质的2层NL融合模型与既考虑数据RP/SP性质又考虑交通方式关联性质的3层NL融合模型,通过对比模型的精度,找出优化的融合模型。并在优化融合模型的基础上,预测了2015年沪杭间的公铁客流分担率。1上海和杭州之间的客运通道为r-sp数据的nl模型1.1重组菌选择枝的筛选沪杭客运通道主要由铁路和公路两种交通方式组成,旅客选择铁路或公路出行的影响因素除票价、速度、发车密度等交通方式自身特性外,还与出发地、目的地车站与城市交通系统的衔接程度,车站候车时间等其他因素有关。为了充分反映旅客出行链各部分因素对旅客出行选择的影响,在建模与调查中以旅客出行的全过程为对象,分出发地到车站、车站候车、车上、车站到目的地4个部分分别进行RP与SP调查。对于每一种独立的数据,设效用函数如下:{URΡi=αRΡi+βRΡtRΡi,out+χRΡtRΡi,wt+δRΡtRΡi,invt+γRΡcRΡi+εRΡi∀i∈CRΡUSΡj=αSΡj+βSΡtSΡj,out+χSΡtSΡj,wt+δSΡtSΡj,invt+γSΡcSΡj+εSΡj∀j∈CSΡ(1)⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪URPi=αRPi+βRPtRPi,out+χRPtRPi,wt+δRPtRPi,invt+γRPcRPi+εRPi∀i∈CRPUSPj=αSPj+βSPtSPj,out+χSPtSPj,wt+δSPtSPj,invt+γSPcSPj+εSPj∀j∈CSP(1)式中,i、j为选择集合CRP、CSP中的选择枝,CRP={i|i=1为既有铁路、i=2为公路},CSP={j|j=1为磁悬浮、j=2为客运专线、j=3为既有铁路、j=4为公路};tRΡi,outRPi,out、tSΡj,outSPj,out、tRΡi,wtRPi,wt、tSΡj,wtSPj,wt、tRΡi,invtRPi,invt、tSΡj,invtSPj,invt、cRΡiRPi、cSΡjSPj分别为RP与SP效用函数中相应选择枝的进出站时间(出发地到车站时间+车站到目的地的时间)、候车时间、车上时间、货币总支出;βRP、βSP、χRP、χSP、δRP、δSP、γRP、γSP分别为RP与SP效用函数中相应特性变量的系数;αRΡiRPi、αSΡjSPj为RP与SP效用函数中相应选择枝的固有哑元,反映未观察到的因素对选择枝效用函数带来的影响;εRΡiRPi、εSΡjSPj为RP与SP函数中非显现化效用的概率项,假设其服从同一参数独立的Gumbel分布,相应的方差设为σ2RP与σ2SP。1.2基于nl模型的rp与sp融合算法RP/SP数据融合的基础是被调查者在两种数据中对效用函数中显现化效用的感知是相同的,反映在函数中就是选择枝相同特性变量的系数是相同的,即βRP=βSP=β,χRP=χSP=φ,δRP=δSP=δ,γRP=γSP=γ,为找出两种数据中非显现化效用概率项之间的联系,引入测度系数(scaleparameter)对RP/SP的效用函数进行修正,使两种数据中非显现化效用概率项的方差相等。通常设一种数据的测度系数为1(如,设RP数据的测度系数为1),而标定另一种数据的测度系数。令USP′=θUSP,θ为SP数据的测度系数。根据Gumbel分布的性质,可以得到θ=σ2RΡσ2SΡ(2)θ=σ2RPσ2SP(2)借助NL模型的思路建立两种数据的融合,选择树如图1(为与后面的模型加以区别,此模型定义为NL1)。这并不是一般的非集计模型,因为对于一个个体来说,存在着RP与SP两种选择结果。在数据整理过程中需要进行一定的处理,才能利用NL模型的算法进行效用函数参数的标定。在数据处理过程中,对于RP选择枝,设SP的选择集合为空(nullchoiceset),对于SP选择枝则设RP的选择集合为空。第n个出行者在RP中选择交通方式i的概率为pRΡin=exp(VRΡin)2∑i=1exp(VRΡin)(3)pRPin=exp(VRPin)∑i=12exp(VRPin)(3)第n个出行者在SP中选择交通方式j的概率为pSΡjn=pSΡ(j|SΡ′)npSΡ(SΡ′)n=exp(θVSΡjn)4∑j=1exp(θVSΡjn)(4)pSPjn=pSP(j|SP′)npSP(SP′)n=exp(θVSPjn)∑j=14exp(θVSPjn)(4)式中,VRP、VSP分别为RP/SP效用函数的显现部分。利用NL模型构造的RP与SP融合数据的对数似然函数为lnLRΡ+SΡ(ˆαRΡi,ˆαSΡj,ˆβ,ˆχ,ˆδ,ˆγ,θ)=lnLRΡ(ˆαRΡi,ˆβ,ˆχ,ˆδ,ˆγ)+lnLSΡ(ˆαSΡj,ˆβ,ˆχ,ˆδ,ˆγ,θ)(5)lnLRP+SP(αˆRPi,αˆSPj,βˆ,χˆ,δˆ,γˆ,θ)=lnLRP(αˆRPi,βˆ,χˆ,δˆ,γˆ)+lnLSP(αˆSPj,βˆ,χˆ,δˆ,γˆ,θ)(5)其中lnLRΡ(ˆαRΡi,ˆβ,ˆχ,ˆδ,ˆγ)=∑n∈RΡ∑i∈CRΡnδ(RΡ)inlnpRΡinlnLSΡ(ˆαSΡj,ˆβ,ˆχ,ˆδ,ˆγ,θ)=∑n∈SΡ∑j∈CSΡnδ(SΡ)jnlnpSΡjnlnLRP(αˆRPi,βˆ,χˆ,δˆ,γˆ)=∑n∈RP∑i∈CRPnδ(RP)inlnpRPinlnLSP(αˆSPj,βˆ,χˆ,δˆ,γˆ,θ)=∑n∈SP∑j∈CSPnδ(SP)jnlnpSPjn式中,δ(RP)in=1、δ(SP)jn=1为个体n选择了第i或j种交通方式,δ(RP)in=0、δ(SP)jn=0为个体n没有选择第i或j种交通方式。以上通过测度系数建立了RP与SP数据中非显现化效用之间的联系,并利用NL模型实现了两种数据的融合,达到两种数据优点互补的目的。NL模型中对参数的估计有两种算法,一种为同时估计法,另一种为分阶段估计法。同时估计法以整体为考虑对象,通过使lnLRP+SP最大化来确定未知参数,由此得到的估计量具有无偏性、渐进正态性及有效性,但是该方法不能保证对数似然函数为凸函数,即标定的参数可能只处于局部最优,未必达到整体最优;另一种方法为分阶段估计法,具体到建立的融合模型中,即先估计第1层次lnLSP中的参数,然后把估计得到的参数带入到第2层的对数似然函数中去估计其余的未知参数,该方法每一次估计都属于传统的Logit模型参数估计,从而避免了同时估计时非凸的缺点。但是该方法是一种近似估计方法,估计结果的有效性较同时估计有较大的差距。相关研究表明,同时估计的非凸问题可以通过随机改变最优算法的初始值来解决(如Newton-Raphson算法中首先给出多组非0数值反复试算),从而可以避免结果只是局部最优的缺点。本文对建立的RP/SP融合数据的NL模型采用同时估计的方法进行参数标定。1.3建立3层nl数据融合模型以上的融合数据模型没有考虑交通方式的关联性带来的影响。未来沪杭通道内修建的磁浮交通与客运专线,从交通方式的属性来看属于铁路,如果SP效用函数中不考虑交通方式属性所带来的影响,往往会造成Logit模型的IIA问题。文献也指出了交通方式的属性在数据融合中起着重要的作用。本文根据沪杭通道的特点,提出既考虑RP与SP数据的特点,又考虑交通方式性质的3层NL数据融合模型(分别用NL2,NL3进行标示),如图2、图3所示。意在找出更好的数据融合方法,即消除同种交通方式相互关联带来的影响,又充分利用RP/SP数据的特点。在建立的3层NL模型中,图2首先按RP与SP数据进行分层,设SP数据的测度系数为β,然后在SP一层中再按照交通方式的性质进行分层,设铁路数据的测度系数为θ。图3则首先按交通方式的性质进行分层,设铁路数据的测度系数为β,然后在铁路交通方式的一层中再按照RP/SP数据性质进行分层,设SP数据的测度系数为θ。NL2、NL3模型数据的处理、极大似然函数的建立以及模型参数的标定与NL1模型中的方法相同。2上海和杭州之间公共交通列车运营率的确定2.1旅客出行调查调查时间为2006年10月26~31日;地点为上海、杭州两市的火车站与汽车站;对象为沪杭间出行的旅客;方式为抽样问询调查;获得的有效样本数据:RP356份,SP356份。2.1.1调查问卷主要调查内容RP调查主要反映在既有路网条件下,旅客出行的基本特征及选择行为。对火车站、汽车站的旅客进行抽样调查时,主要调查内容见表2。问卷中此次选择是对调查对象本次出行全部信息的统计,而估计选择是旅客根据出行的经验估计选择其他选择枝出行时的全部出行信息。即,在火车站调查时,调查旅客选择铁路出行整个过程的信息,然后请旅客估计一下如果此次选择公路出行,整个出行过程的情况。在汽车站调查时,则相反。2.1.2出行不同部分的水平设置当客运通道中引入新的交通方式后,为了获取该方式的效用特征信息,需要进行SP调查。根据沪杭通道客流的特点,在进行SP调查时,调查项目仍然为旅客的整个出行过程。出行不同部分的水平设置如表3。调查项目不同水平间的组合共有2×3×1×2=12种。对于SP调查中每一种虚拟情景,被调查者在多种交通方式之间进行选择,选择结果作为一条SP记录。调查中,对一个旅客进行完RP调查之后就进行相应的SP调查。SP调查中,调查人员都要对被调查者详细地解释每一种情境,以确保数据来源的可靠性。2.2mcfa热模型的建模表4列出了3种RP+SP数据融合NL模型以及单独利用ML模型进行RP或SP建模的参数及相关的检验值。对于不同的数据融合模型,可以通过分析模型的对数极大似然函数值、McFadden系数及参数的t检验值来判断模型的精度。首先,比较NL模型的3种不同RP+SP数据融合模型与单独利用RP或SP数据进行建模的优劣。由于3种NL模型与前2种ML模型在进行计算时的样本是不同的,因此需要比较各个模型的McFadden系数。从McFadden系数来看,3种NL模型的McFadden系数均大于单独利用RP或SP数据进行建模时的系数,3种NL模型的精度较前2种ML模型都有不同程度提高,说明利用RP/SP融合数据在提高模型精度方面是有效的。其次,比较3种NL模型的优劣。NL2、NL3模型的对数极大似然值以及McFadden系数都比NL1模型的大,说明在提高模型的精度方面,同时考虑同种交通方式的关联性以及RP/SP数据的性质比单独考虑数据的RP/SP性质要好。先按照交通方式的性质分层然后按照RP/SP数据性质分层的NL3模型的精度最高,这是因为它充分消除了同种交通方式间的关联性,又融合了RP/SP数据。2.3计算时间及模型预测结果本文预测2015年沪杭客运通道公铁分担率。目前沪杭客运通道内公路在发车密度以及与市内交通的衔接上都要优于既有铁路,表现为旅客的候车时间、出发地到车站、车站到目的地的时间均小于既有铁路。磁浮铁路及客运专线属于高级别的铁路运输方式,假设2015年磁浮铁路和客运专线在发车密度及与市内交通的衔接方面处于既有铁路和公路之间,即取旅客出发地到车站的时间和费用、车站候车时间、车站到目的地的时间和费用为既有铁路和公路的平均水平。考虑公路运营客车进入市区后速度明显下降,取运营汽车的平均速度为85km/h。既有铁路出行信息比较充分,出行信息可以通过列车时刻表获得。客运专线及磁浮铁路的票价及旅行时间的取值参考设计单位的相关文件,“沪杭甬客运专线本线短途列车运价率为0.5元/(人·公里),初期运行速度为300km/h”,“沪杭磁浮运价率初定为0.7元/(人·公里),初期运行速度为400km/h”。在计算磁浮及客运专线的旅行时间时,取沿途站点的停车时间为2min。假定2015年上海、杭州间出行选择各种交通方式的基本信息,见表5。从建立的RP+SP融合模型可以看出,对于既有铁路存在着RP与SP两类固有哑元。预测时,按照如下方法进行处理:(1)RP的固有哑元不用修正,直接用到预测未来既有交通方式的效用函数中。(2)SP的固有哑元用相应的测度系数进行修正后用到预测新的交通方式的效用函数中(如NL3融合模型中磁浮效用函数中的固有哑元为-0.2328×2.29)。由此可以得到未来4种交通方式的效用函数:V1=-0.5331-0.0067tout1-0.0173twt1-0.0145tinvt1-0.0231c1(6)V2=-0.1793-0.0067tout2-0.0173twt2-0.0145tinvt2-0.0231c2(7)V3=-0.551-0.0067tout3-0.0173twt3-0.0145tinvt3-0.0231c3(8)V4=-0.0067tout4-0.0173twt4-0.0145tinvt4-0.0231c4(9)其中,下标1、2、3、4分别代表磁浮铁路、客运专线、既有铁路、公路4类交通方式;touti、twti、tinvti、ci,i=1,2,3,4分别表示第i类交通方式的进出站时间、候车时间、车上时间、总费用。把表5中沪杭间各类铁路及公路的基本出行信息代入到SP效用函数与最优RP+SP效用函数中去,就可以得出各类铁路及公路的分担率,见表6。在既有路网下,上海~杭州铁路和公路的客流分担率分别为46%与54%,当磁浮铁路和客运专线建成后,将会有大量客流转向高等级的铁路运输,尤其是客运专线,将成为更主要的交通方式。SP模型以及RP+SP模型都反映出了这一趋势。对比SP模型以及RP+SP模型的预测结果可以看出,公路的分担率相差较大,这一点也正好反映出SP数据的特点,说明在SP的调查样本中,公路旅客向高等级铁路转移的意向较高,旅客对新的交通方式的意向往往要高于实际选择行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论