数学建模之火车客流量预测.docx_第1页
数学建模之火车客流量预测.docx_第2页
数学建模之火车客流量预测.docx_第3页
数学建模之火车客流量预测.docx_第4页
数学建模之火车客流量预测.docx_第5页
免费预览已结束,剩余13页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录铁路旅客流量预测客1摘要1一 问题重述11.1引言11.2问题的提出2二 问题分析22.1根据不同的限制条件整理数据,分析数据的分布22.2利用问题一中的结论,建立数学模型2三 模型假设与符号说明23.1.1模型假设23.1.2符号说明23.2.1模型假设33.2.2符号说明3四 模型的建立与求解34.1.1 数据分析处理34.1.2利用信息增益的计算公式求出各个特征属性的信息增量54.1.3 根据图表分析在不同的特征属性内部客流量的变化规律按车的种类分析按站点分析按时段分析按区间大小分析94.2.1灰色预测104.2.2问题分析与准备104.2.3预测模型的建立14五 模型的优缺点155.1 优点155.2 缺点15六 参考文献15七 16八 附录16铁路旅客流量预测客摘要铁路客流量预测,可以为制定合理的价格、改善客运站组织方式、优化铁路车辆资源配置、提高客运设备的服务能力提供帮助,对提高铁路客运运输效率具有重要的意义。影响客流量的因素有很多,例如车次,时间,车站,区间,天气,节假日等。现在我们分析前四个因素对客流量的影响,我们首先引用信息熵概念来计算具体哪个因素对客流量的影响最大,并通过ID3算法生成决策树,根据所得生成树可以快捷方便的分析客流量规律。在对原始数据进行研究分析后,车站对于客流量的影响最为显著,于是将车站这个因素选定为了主要变量,然后从这个主要变量着手,核心思想是通过对系统行为特征指标建立一组相互关联的灰色预测模型,预测系统中众多变量间的相互协调关系的变化,这种模型对于挖掘和利用原始数据有很好的帮助,同时参考了在问题一中所得出的客流量的一般规律,最终采用累减生成的放松得到了一组灰色序列以弱化数据的随机性和预测未来客流量。关键字:信息熵ID3算法灰色预测模型一 问题重述1.1引言随着关于改革完善高铁动车组旅客票价政策的通知的发布,高铁动车票价将根据市场情况自行定价。铁路部门为了保持市场的竞争力,实现利润最大化,需要了解日常铁路客运流量、淡旺季变动指数、冷热门线路的体情况,而其中对客流的预测是准确把握市场的首要条件,因此铁路客流预测的研究也成为铁路客运服务需要重点研究的方向。然而铁路客流量受多种因素的影响,比如:“春运”期间铁路客流量骤增,导致铁路运力无法满足客户乘车需求,同时也给铁路客运组织带来巨大压力。在非节假日期间,一些冷门线路区间上座率不足,造成铁路车辆资源的浪费。因此铁路客流量预测,可以为制定合理的价格、改善客运站组织方式、优化铁路车辆资源配置、提高客运设备的服务能力提供帮助,对提高铁路客运运输效率要的意义。1.2问题的提出针对该铁路公司的ZD190(站)至ZD111(站)区段的客运专线完成以下任务:(1)根据附件1,按车次、时段(小时)、车站、区间(两个车站之间)等条件分析客流规律。(2)考虑相关因素的影响,构建客流量预测模型,并预测未来两周的客流量。二 问题分析2.1根据不同的限制条件整理数据,分析数据的分布首先整理数据,剔除多余数据只留下ZD190至ZD111之间的客流量信息,统计客流量数据并整理出平均值,制作出一张主表。之后根据主表分别以车次,时段,车站,区间等条件划分客流量制成四张分表,根据分表的信息,引用信息熵等概念具体分析具体哪个条件对客流量的影规力较大,并通过观察与数据统计分析在分别以车次,时段,车站和区间划分数据时客流量的分布规律。2.2利用问题一中的结论,建立数学模型在认真分析了第一问中得出的客流规律以后,考虑到铁路客流量问题中一部分信息是已知的,另一部分是未知的,且系统内各部分因素间关系具有不确定性这些特点,建立灰色系统预测模型,通过一些基本假设的建立来简化现实铁路系统中较为复杂的各种情况,通过鉴别节假日、周末、平时的不同车次、时段、车站、区间之间发展趋势的相异程度综合考虑各种如各车站里程、区段各站点气象等现实条件的影响,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,以此来预测未来两周的客流量。三 模型假设与符号说明3.1.1模型假设1. 通过信息熵公式求得不同条件的信息熵。2. 实际情况与模型的情况相同。3.1.2符号说明Xi(i=1,2,3.n)随机变量的取值Pi(i=1,2,3.n)随机变量为Xi时的概率Entropy(S)当前信息的熵Entropy(S丨T)在特征属性T的条件下样本的条件熵IG(T)特征属性T带来的信息增量 3.2.1模型假设1. 假设天气不影响客流量。 3.2.2符号说明A原始数列F预测数列B累加数列I,J,K,L,P,S,T变量Xishu系数Wucha误差四 模型的建立与求解4.1.1 数据分析处理按车次种类划分列车种类日均人数K系列车2253G系列车5227D系列车7028T系列车550Z系列车113按时间段划分时间段日均人数0:004:001164:008:0034408:0012:00484412:0016:00445416:0020:00215420:0024:00163按车站划分车站日均人数ZD1115952ZD3262794ZD2502642ZD192716ZD311389ZD0621090ZD12121ZD02276ZD12067ZD1901295ZD37026ZD14350按间距划分区间(经过的站点数量)日均人数49515620965244726774.1.2利用信息增益的计算公式求出各个特征属性的信息增量在信息增益中,重要性的衡量标准就是看特征能够为分类系统带来多少信息,带来的信息越多,该特征越重要。在认识信息增益之前,先来看看信息熵的定义。熵这个概念最早起源于物理学,在物理学中是用来度量一个热力学系统的无序程度,而在信息学里面,熵是对不确定性的度量。在1948年,香农引入了信息熵,将其定义为离散随机事件出现的概率,一个系统越是有序,信息熵就越低,反之一个系统越是混乱,它的信息熵就越高。所以信息熵可以被认为是系统有序化程度的一个度量。假如一个随机变量的取值为,每一种取到的概率分别是,那么的熵定义为 意思是一个变量的变化情况可能越多,那么它携带的信息量就越大。对于分类系统来说,类别是变量,它的取值,而每一个类别出现的概率分别是这里的就是类别的总数,此时分类系统的熵就可以表示为信息增益是针对一个一个特征而言的,就是看一个特征,系统有它和没有它时的信息量各是多少,两者的差值就是这个特征给系统带来的信息量,即信息增益。根据公式分别求解以上四个特征属性的信息增量结果如下:特征属性信息增量车次种类1.67时间段2.06车站2.47区间1.75由上表可知对客流量影响最大的因素由低到高的排序为:车次种类,区间,时间段,车站。4.1.3 根据图表分析在不同的特征属性内部客流量的变化规律 按车的种类分析由表可知D和G系列车的日均客流量较大,K系列车日均客流量相对较小,而Z和T系车的日均客流量非常小。按站点分析由表可知ZD111车站的日均客流量最大,ZD326,ZD250,ZD062,和ZD190车站的日均客流量较大,而ZD192,ZD311,ZD121,ZD022,ZD120,ZD370和ZD143车站的日均客流量非常小。按时段分析由表可知客流量主要集中在4:00-20:00,其中的大多数客流量分布在8:00-16:00,而0:00-4:00和20:00-24:00的客流量非常少。按区间大小分析由表可知大多数乘客都会选择路程大于4站的的列车,而选择路程小于等4站列车的乘客很少。4.2.1灰色预测灰色系统是指部分信息已知,部分信息未知的系统.灰色系统的理论实质是将无规律的原始数据进行累加生成数列,再重新建模.由于生成的模型得到的数据通过累加生成的逆运算累减生成得到还原模型,再有还原模型作为预测模型。预测模型,是拟合参数模型,通过原始数据累加生成,得到规律性较强的序列,用函数曲线去拟合得到预测值。灰色预测模型建立过程如下:(1) 设原始数据序列X0有n个观察值,X0=X0(1),X0(2),.X0(n),通过累加生成新序列X1=X1(1),X1(2),.X1(n),利用新生成的序列X1去拟合函数曲线。(2) 利用拟合出来的函数,求出新生成序列X1的预测值序列X1。(3) 利用X0(k)=X1(k)-X1(k-1)累减还原得到灰色预测值序列:X0=X0(1),X0(2),.X0(n+m)。将序列X0分为Y0和Z0,其中Y0反应X0的确定性增长趋势,Z0反映X0的平稳周期变化趋势。利用灰色GM(1,1)模型对X0序列的确定性增长趋势进行预测。4.2.2问题分析与准备在问题一中得出了客流量的一般规律,下面将几个变量分开重新研究一下它们各自对客流量的影响,这三个影响因素分别是车站站点、时间段以及车次.在建立模型时不可能也没有必要考虑所有因素,只需考虑关键因素,进行合理的假设和模型构建。通过控制变量法,分析三个主要影响因素与客流量的关系,结合原始数据绘制了表图如下。 由题一可知相较于车次和时间段,车站站点对于客流量的影响更加显著。因此接下来我们就以车站为主要变量建立灰色预测模型来对原始数据进行分析以实现对未来两周客流量进行预测的目的。4.2.3预测模型的建立基于以上的分析,我们以车站为主要变量,建立灰色预测模型。原始数据如下:车站数 n=12平时上车X(1)0=4144,0,469,3641,1003,113,1380,111,55,48,0,1707平时下车Y(1)0=10722,1568,598,9906,1963,137,1793,167,139,79,0,3938周末上车X(2)0=6407,0,802,4123,1219,131,1532,91,56,38,0,2825周末下车Y(2)0=12599,1627,932,10177,2240,155,1903,141,156,77,0,4906构建灰色预测模型为核心思想的模型并得出了以下未来两周客流量的预测结果:未来平时上车X(1)1=4144,174,211,255,308,373,547,661,801,969,1173,1419未来平时下车Y(1)1=10722,940,1094,1273,1481,1723,2332,2713,3156,3672,4272,4970未来周末上车X(2)1=6407,150,189,239,302,381,608,769,971,1227,1549,1957未来周末下车Y(2)1=12599,567,677,808,964,1150,1638,1954,2332,2782,3320,3962五 模型的优缺点5.1 优点(1) 本文很好地利用了EXCEL 的数据处理功能,对附件一中提供的大量数据进行了整理分析。(2) 我们绘制了大量表图,使得客流量的规律能够具有一个很好的可视化展现。5.2 缺点由于我们能力有限,对一些较为重要的变量弱化甚至是忽视性的处理,这样大大影响了预测结果的实用价值。六 参考文献1 Thomas H.Cormen、Charles E.Leiserson等 编著,Introduction to Algorithms,机械工业出版社,2006;2 Floyd算法,百度百科/view/14495.htm 3边馥萍、侯文华、梁冯珍 编著,数学模型方法与算法,高等教育出版社,2005.5;4 Anthony, R. N. Planning and control systems: a framework for analysisJ. Harvard University,Boston, 1965.八 附录预测未来两周客运量的程序代码:A = 4144,0,469,3641,1003,113,4928,1380,111,55,48,0,1707,9255;B= zeros(1,14)B(1,1)=A(1,1);for i = 2:14B(1,i) = A(1,i)+B(1,i-1);endC=zeros(13,2);j = 1;for k=1:13C(k,j) = -1/2*(B(1,k)+B(1,k+1);endj =2;for k =1:13C(k,j) =1;endD=zeros(1,13);for l = 1:13D(1,l) = A(1,l+1);endM = inv(C*C)*C*Da = M(1,1)%baihuaxihuab =M(2,1)H=zeros(1,28);H(1,1) =A(1,1);for f = 1:27H(1,f+1) =(A(1,1) -

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论