版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
-.z.摘要对于问题一,建立了回归分析模型,用以验证国内统计标准的合理性。基于国内外航班延误的统计标准不同,由于flightstats给出的的是国际主要大型机场的排名,通过收集2014年国内十大航空公司局部月份的航班延误时间,然后进展数据统计与整理,对收集到的十个机场局部月份的指定天数的航班延误时间进展统计,进而求指定天数十个机场航班延误时间的平均值,判断得知flight的统计标准是不合理的。对于问题二,建立层次分析模型,从中分析得出导致航班延误的最主要因素。得出导致航班延误的主要因素权重排序由高到低为:航空公司运行管理、流量控制、恶劣天气影响、军事活动、以及机场保障,即导致航班延误的最主要因素是航空公司的运行管理。对于问题三,建立时间序列模型,利用一次指数平滑法建立预测模型,然后对预测的航班延误时间峰值进展人为调控。建立指数平滑模型之后进展模型评估,进而求出是适宜的,最后对航班延误时间进展预测,分析曲线走势,并与具体的航班延误时间进展比照分析,讨论模型的效用性。本文综合利用回归分析模型、基于层次分析法的综合评价,使用相关软件,对航班延误问题进展了多角度的分析。并给出了航班延误的时间序列模型,对航班延误作出了理论预测,且对模型的适用*围做出了推广,最后给出了模型的优缺点和改良方案,在实际应用中有较大的参考价值。关键词:回归分析模型;层次分析法;时间序列模型;指数平滑法问题重述随着我国民航运输业的快速开展,我国民航业正在经历美国等西方兴旺国家在上个世纪七十年代放松航空管制后航空业务量急剧膨胀,导致机场和空域拥堵严重、航班延误快速增长的局面。2015年3月21日,**"南华早报"报道,据总部设在美国的空中旅行数据提供商flightstats〔以下简称flight〕介绍,在全球61个最大机场中,中国机场及航空公司的准点离港表现可谓全球最差,准点离港表现最差的7个机场均位于中国内地,其中**虹桥机场、浦东机场和**萧山机场分别以37.17%、37.26%和37.74%的准点率排名垫底。此次调查中,**宝安机场、**白云机场、**机场和首都国际机场也在表现最差的7个机场之列。在全球61个特大机场中,日本东京羽田机场表现最正确,准点率达89.76%。在航空数据网调查的全球各地374个大小不同的机场中,日本大阪伊丹机场表现最正确,准点率高达94.56%。请自行收集数据并建立模型解决以下问题:1、关于上述flightstats提供的结论是否正确?2、我国航班延误的主要原因是什么?3、针对我国航班延误的现状,提出一些改良措施。问题分析首先,flight给出的是国际主要大型机场的航班延误时间排名,我们在本问题在也只讨论国内大型机场的航班延误,以2014年给出的国内十大机场为准,具体机场信息见附录4。另外,我们调查发现国内大型机场的航班到港根本不存在延误,因而我们在问题中只研究航班的离港延误时间,下面给出问题分析。2.1问题一的分析:关于flight给出的全球61个最大机场中准点率排名,我们在flight官网找到了2014年全球主要最大机场航班延误排名,见下表:表一:2014年全球主要最大机场航班延误局部排名On-timeRankAirportcodeFlightsSeatsTrackedp.FactorOn-time54SVO1.15*1051.82*10777.22%76.62%54.20%55PEK2.85*1055.72*10797.18%95.34%52.64%56CKG1.17*1051.84*10790.45%89.64%52.19%57CAN1.99*1053.41*10795.62%93.93%49.56%58SZ*1.34*1052.31*10796.22%93.53%49.42%59PVG1.82*1053.45*10796.25%94.11%37.26%60SHA1.30*1052.45*10797.48%93.96%37.17%61HGH1.00*1051.60*10794.58%93.16%36.74%注:原始数据见附录二首先这个排名是flight公司根据航班延误国际标准来统计作出的排名,但是由于每个国家的国情不同,开展阶段不一致,我们中国也有自己的民航航班正常统计方法〔以下简称统计方法〕,根据中国民航总局发布的"民航航班正常统计方法"[1],对于枢纽机场,如在首都国际机场、**浦东国际机场、**白云国际机场起飞的航班,在公布的方案离港时间后30分钟内起飞且没有发生不正常情况的航班为正常航班;对于在**虹桥国际机场和**宝安国际机场起飞的航班,这个时间规定是25分钟;对于在**双流国际机场和**巫家坝机场起飞的航班,这个时间规定是20分钟。由于国内外的统计标准不同,我们有理由疑心flight给出的排名的真实性。因而我们只需要说明国内统计方法的合理性,并大致得出其标准,同国际标准比照说明问题所在即可。毋庸置疑的是,国际航班延误统计标准和中国的民航航班延误统计方法都有其理论依据,肯定不是随便定义的,我们试图从航班延误时间的角度建立回归分析模型,因此数据预处理的重点在于从现有航班信息中统计出不同时段的离港航班延误时间。我们以首都国际机场为首的2014年国内十大机场的航班进离港信息表为原始数据,并在fight官网收集到了按时间顺序记录的离港航班的方案起降时间,实际起降时间,根据这些信息我们计算出了整点时间每个航班延误的具体时间,进而对这些延误时间作为回归分析的数据,建立一元线性回归分析模型。我们从收集的数据出发,确定自变量和因变量之间的定量关系式,即,大致估计出国内大型机场延误时间的上下界,并计算出均值,同国际标准进展比拟,最后说明国内大型机场航班延误统计标准的合理性。2.2问题二的分析据中新社2014年3月27日报道,航班延误的因素复杂多元,具体原因及其百分比是:航空公司运行管理占42.3%,流量控制占26.1%,恶劣天气影响占20.9%,军事活动影响占7%,机场保障占3.7%。基于我们查找到的航班延误的原因,欲找出导致航班延误的最主要因素,属于决策模型问题,由于层次分析具有系统性的分析方法,简洁实用的决策理论,以及所需定量数据信息较少的特性,我们的做法是建立层次分析模型,并依次建立层次构造模型,构造成比照拟阵,计算权向量并做一致性检验,计算组合权向量并做组合一致性检验,最后利用几何平均法,算术平均法,特征向量法,最小二乘法分别求得的总权重,综合分析得出导致航班延的最主要因素。2.3问题三的分析关于航班延误问题的解决方法,现在已经有很多政策性的方案,如预订机票时使用民航资源网数据分析中心的"航线运力数据分析系统〞提前查询航线航班历史准点率信息,尽量选择预订历史准点率较高的航班机票。我们的做法是建立航班延误预测模型。查找文献我们发现,MuellerR在2003年发表的"飞行器进离港延误特征分析〞[2]一文中分析了美国交通流量大和航班延误显著的10个主要枢纽机场的离港、航路和到达数据,其目的在于改善延误预测,分别用正态分布和泊松分布建模,得到飞机延误时间的概率密度函数,根据原始数据计算均值和标准差,用最小二乘法改善均值和标准差,以减少模型与实际分布之间的误差,研究说明泊松分布能较好的建模离港延误,而正态分布则对建模航路和到达延误效果理想;然而,这种进离港延误的总体概率分布模型对于短期或单航班的进离港延误预测来说并没有实际意义。徐涛等人在2009年发表的"基于贝叶斯网络的航班延误与涉及分析模型〞[3]一文中,采用贝叶斯网络对航班进离港事件进展分析和建模,构造了一个航班方案网络;利用贝叶斯原理,对网络中的节点进展延误预测,并能对可能发生延误的节点进展延误涉及影响的分析,为相关部门提供参考,以采取措施防止或减小延误影响。问题回到怎么解决航班延误问题,我们的想法是利用历史数据构建一个航班延误时间的预测模型,我们利用一次指数平滑法,对未来数天的航班延误时间作出大致预测,然后针对航班延误的峰值时间,及时进展政策方案调控〔见附录七〕,以及时解决延误问题。最后我们观察了首都国际机场2015年5月4日的航班延误实时数据,建立预测评估模型,与我们得到的预测数据进展比照,说明模型的可靠性。三、模型假设合理性假设:假设问题中影响数据拟合的误差是极小的。排他性假设:假设航班延误只与导致航班延误的主要因素有关,不考虑其他因素对航班延误的影响。3、准确性假设:假设我们收集的数据是真实可靠的,可以根据航班延误的时间得到相应的机场航班延误信息。四、符号说明与名词解释4.1符号说明序号符号符号说明123456789权重向量一致性指标一致性比例航班离港的花费时间流量控制影响的权重军事活动影响的权重航空公司运行管理的权重恶劣天气影响的权重机场保障影响的权重注:未列出的符号及重复的符号以出现处为准。4.2名称解释准点率:又称正点率、航班正常率,是指航空旅客运输部门在执行运输方案时,航班实际出发时间与方案出发时间的较为一致的航班数量即正常航班与全部航班数量的比率。准点:如果一个航班在方案起飞时间后30分钟内完成起飞(机轮离地),即认为该航班准点放行。略晚点:如果一个航班在方案起飞时间后30-45分钟内完成起飞,即认为该航班略晚点放行。较晚点:如果一个航班在方案起飞时间后45-60分钟内完成起飞,即认为该航班较晚点放行。5、严重晚点:如果一个航班在方案起飞时间后60分钟以后完成起飞,即认为该航班严重晚点。6、流量控制:流量控制是指通过限制单位时间内进入*空中交通管制节点的航空器的数量,来维持平安的空中交通流。五、模型的建立与求解5.1问题一的模型建立与求解5.1.1数据预处理由于flight给出的是全球主要最大机场的航班统计排名,我们在数据收集时针对中国十大机场,具体收集的数据方式如下,2014年12个月中国十大机场,每一个月抽取6号、12号、18号、24号、30号〔二月以28号为准〕,记为、、、、,从这五天再抽取0-24时每一个整点〔假设整点没有航班,以最近的航班为准〕的航班离〔到〕港的花费时间,记为,然后计算每一天的平均值,具体结果保存两位小数。我们具体整理了2014年2、5、6、8、9、12月的国内十大机场航班离港延误平均时间如下表所示:表二:2014年2月国内十大机场航班离港延误数据统计简称/时间2月6号2月12号2月18号2月24号2月28号PEK18.8014.3818.3319.0921.75CAN15.2513.8820.5016.7518.38PVG28.1325.3835.8024.4531.25SHA23.5026.7527.5030.2528.50CTU20.8018.7523.2521.5022.00SZ*24.8022.7523.3324.5021.88KMG26.7524.5025.3326.3325.11CKG26.2325.6024.8025.5027.38*IY20.0019.5019.3821.5021.33HGH20.3322.0523.1521.5021.88平均值22.4621.3524.1423.1423.94我们抽取这个月6、12、18、24、30号的平均延误时间,构造坐标如下:〔1.2,22.46〕,〔1.4,21.35〕,〔1.6,23.14〕,〔1.8,23.14〕,〔2.0,23.94〕。表三:2014年5月国内十大机场航班离港延误数据统计简称/时间5月6号5月12号5月18号5月24号5月28号PEK19.8815.5019.8020.5021.88CAN16.7514.5020.0017.7519.50PVG28.2526.3835.8026.5030.75SHA24.5025.7526.3330.8027.75CTU21.8019.5025.0020.7523.50SZ*25.5021.0024.5024.0022.80KMG25.0023.4527.1125.7524.80CKG26.1325.0826.0424.8025.50*IY21.1721.2120.0321.2922.33HGH20.0022.0323.0422.4222.38平均值22.9021.4424.7723.4624.12我们抽取这个月6、12、18、24、30号的平均延误时间,构造坐标如下:〔4.2,22.90〕,〔4.4,21.44〕、〔4.6,24.77〕、〔4.8,23.46〕、〔5.0,24.12〕。表四:2014年6月国内十大机场航班离港延误数据统计简称/时间6月6号6月12号6月18号6月24号6月28号PEK20.1716.0320.0019.4221.38CAN15.2115.0419.1718.0819.01PVG35.0426.0328.3826.0430.13SHA24.4225.7525.1731.0427.29CTU22.3825.5025.3821.0423.38SZ*25.0321.0324.0425.2922.38KMG25.2123.1727.2125.0324.42CKG26.1325.0826.1324.2424.29*IY22.2121.1720.3822.0422.03HGH21.0423.3823.4222.0423.37平均值23.6822.2223.9323.4123.77我们抽取这个月每月6、12、18、24、30号的平均延误时间,构造坐标如下:〔5.2,23.68〕,〔5.4,22.22〕,〔5.6,23.93〕,〔5.8,23.41〕、〔6.0,23.77〕。表五:2014年8月国内十大机场航班离港延误数据统计简称/时间8月6号8月12号8月18号8月24号8月28号PEK19.4221.0322.0416.0320.17CAN15.2120.4219.1718.0819.01PVG35.0426.0328.3826.0430.13SHA24.4225.7525.1731.0427.29CTU22.3825.5025.3822.0423.38SZ*25.0322.3824.0425.2922.03KMG25.2123.1723.3823.3826.46CKG27.3822.0426.1324.0424.29*IY22.2126.1720.3823.4225.08HGH21.0428.3821.0425.0323.42平均值24.2124.0823.5123.4424.13我们抽取这个月6、12、18、24、30号的平均延误时间,构造坐标如下:〔7.2,24.21),〔7.4,24.08〕,〔7.6,23.51〕,(7.8,23.44)、(8.0,24.13)。表六:2014年9月国内十大机场航班离港延误数据统计简称/时间9月6号9月12号9月18号9月24号9月28号PEK20.3822.0323.1717.3822.38CAN15.2120.4219.1718.0820.08PVG35.0426.0328.3830.0430.13SHA24.4225.7525.1735.3827.29CTU22.3825.5025.3825.8823.38SZ*25.0322.3824.0428.4226.88KMG25.2123.1723.3825.3826.46CKG26.4222.0426.1324.0424.29*IY22.0426.1722.3823.4225.08HGH23.8828.3824.1325.3826.42平均值24.4024.1824.1325.3725.24我们抽取这个月6、12、18、24、30号的平均延误时间,构造坐标如下:〔8.2,24.40〕,〔8.4,24.18〕,〔8.6,24.13〕,〔8.8,25.37〕,〔9.0,25.24〕。表七:2014年12月国内十大机场航班离港延误数据统计简称/时间12月6号12月12号12月18号12月24号12月28号PEK23.8824.1323.4625.3823.17CAN16.3822.2120.4223.3822.21PVG32.5025.1327.3830.4225.08SHA25.4226.0826.1730.0428.42CTU22.8825.1325.1325.8823.38SZ*26.4221.8824.0427.8825.13KMG24.0423.1723.3824.3825.45CKG26.3822.0426.1324.0424.29*IY22.8826.1723.4223.4225.08HGH24.0427.1325.8824.1327.08平均值24.5524.3024.5425.8924.93我们抽取这个月6、12、18、24、30号的平均延误时间,构造坐标如下:〔11.2,24.55〕,〔11.4,24.30〕,〔11.6,24.54〕,〔11.8,24.89〕,〔12.0,24.93〕。5.1.2模型的建立1、选择回归模型的类型我们通过上述数据预处理得到的观测数据,在坐标上分析其散点图的变化趋势,从而选择标准函数类型,我们整理数据并得到散点图如下:收集整理完数据以后我们着手建立回归分析模型,由于我们旨在求2014年国内大型机场的航班延误时间的分布图,以及延误时间的大致均值,观察散点图我们发现其波动在23-26之间,所以我们建立一元线性回归模型,所谓一元线性回归,就是假定与之间的关系是线性关系,而且满足:,其中和称为回归系数,此时进展回归分析的目标就是给出系数和的估计值。线性回归意味着条件平均数与之间的关系是线性函数,对于每个的观察值,来说,由于条件均值由式决定,观察值就应该是在条件均值的根底上再加上一个随机误差,则一元正态线性回归的模型为:,其中2、计算回归方程的参数由于实际问题中我们只能得到有限的数据,无法算出准确的和的值,只能求出它们的估计值和,并得到的估计值为:,一般使用最小二乘法估计回归系数和。根据最小二乘法原理,所求出的残差平方和到达最小的直线为回归线。即令:要使最小,应该有:整理并解此方程后的,得到:其中:*的校正平方和为:*和y的校正穿插乘积和为:我们将数据代入后,得到:对模型进展显著性检验对模型进展显著性检验,是用以判别回归效果,原本随机变量关系现在用确定性的关系式表示后,其可信度如何,必须加以验证,此是回归分析较为麻烦的步骤,我们得到的一元线性回归曲线:将数据带入公式:得到,即该回归曲线的拟合性较强。5.1.3模型的求解我们利用这30个坐标拟合国内大型机场航班延误时间的一元线性回归曲线,利用MATLAB得到如下直线:LinearmodelPoly1:f(*)=p1**+p2Coefficients(with95%confidencebounds):p1=0.08254(0.004081,0.161)p2=23.84(23.27,24.42)Goodnessoffit:SSE:12.42R-square:0.8423AdjustedR-square:0.1116RMSE:0.6661我们比照二次线性回归曲线:LinearmodelPoly2:f(*)=p1**^2+p2**+p3Coefficients(with95%confidencebounds):p1=-0.01344(-0.0363,0.009428)p2=0.2599(-0.05181,0.5716)p3=23.39(22.44,24.35)Goodnessoffit:SSE:11.79R-square:0.7861AdjustedR-square:0.1258RMSE:0.6607比照二者的R-square可以得到,,即一次线性回归曲线拟合离散型较强,观察一次二次回归曲线,我们发现,国内大型机场全年航班延误日平均曲线的总体特点是全年延误情况根本平稳,春季延误波动性较大;夏季航班延误根本平稳,由此可以看出首都机场航班延误受节假日〔包括五一十一黄金周〕影响,人们的出行影响显著,而秋冬季节由于气温较低,人们出行量较小。对于春季而言,由于适逢中国传统佳节春节,导致航班延误突然攀升和迅速下降的趋势,从图中的曲线变化趋势来看,这与国内的实际根本情况完全一致。综合分析,2014年国内大型机场航班延误时间分布在之间,我们可以利用航班延误时间的期望代表大型航班延误时间的标准。令代入得到我们可以算出曲线与的离散程度最小,即国内大型机场航班延误时间的标准大致应为分钟。反过来我们将国内大型机场航班延误时间的标准分钟与国际标准比照,显然,因此我们可以断定,不同标准下,flight给出的国际十大机场延误统计排名存在不合理性,从这个角度分析,他们给出的国际大型机场的航班延误率排名,并不能说明中国大型机场的航班延误问题较严重。通过这个结论,我们也应该意识到,现阶段不同的国家的兴旺程度以及管理措施也有差异,关于航班延误的时间标准,我们应该找出航班延误的主要原因,给予改良,进而向航班延误国际统计标准靠拢,这就是我们下一步要做的工作。5.2问题二的建模与求解问题二要求我们得出我国航班延误的主要原因是什么,由于层次分析法一种定性与定量相结合的决策分析方法。常被运用于多目标、多准则、多要素、多层次的非构造化的复杂决策问题,特别是战略决策问题,具有十分广泛的实用性,其中层次分析法权重向量的计算方法有四种,单一的计算方法存在较大误差,所以我们在但以计算方法的根底上,对其进展改良,选择四种方法均衡考虑,最后分析出导致航班延误的最主要因素,接下来我们依次建立模型。5.2.1模型的建立1、建立层次构造模型将决策的目标、考虑的因素〔决策准则〕和决策对象按它们之间的相互关系分为最高层、中间层和最低层,绘出层次构造图如下。2、构造判断矩阵在确定各层次各因素之间的权重时,如果只是定性的结果,则常常不容易被别人承受,因而采用:一致矩阵法,即:不把所有因素放在一起比拟,而是两两相互比拟。比照时采用相对尺度,以尽可能减少性质不同因素相互比拟的困难,以提高准确度。引用数字1-9及其倒数作为标度来定义判断矩阵,假设元素和元素的重要性之比为则元素j与元素i的重要性之比为,其中:1表示两个元素相比,具有同样的重要性3表示两个元素相比,前者比后者稍重要5表示两个元素相比,前者比后者明显重要7表示两个元素相比,前者比后者极其重要9表示两个元素相比,前者比后者强烈重要2,4,6,8表示上述相邻判断的中间值3、层次单排序以及一致性检验1〕计算一致性指标:其中为判断矩阵的最大特征值。查找平均随机一致性指标:1234567000.520.891.121.241.368910111213141.411.461.491.521.541.561.583〕计算一致性比例:矩阵的一致性可以承受,否则应对判断矩阵做一致性修复。4、层次总排序以及一致性检验:最终得到各元素,特别是最底层中各方案对目标的排序权重,从而进展方案选择,对层次总排序也需要做一致性检验,计算各个要素对系统总目标的合成权重,并对各个备选方案排序。得到评价因子矩阵A,航空公司运行管理,流量控制,恶劣天气影响,军事影响,机场保障的判断矩阵如下图:计算权重向量1、几何平均法计算步骤如下:1)A的元素按行相乘得到一新向量;2)将新向量的每个分量开n次方;3)将所得向量归一化既得权重向量。2、算术平均法Step1:A的元素按列归一化,即求:Step2:将归一化后的各列相加;step3:将相加后的向量除以n既得权重向量。Step4:特征向量法将权重向量W右乘权重比矩阵A,即:,其中为判断矩阵的最大值,存在且唯一,的分量均正向量,然后,将求得的权重向量做归一化处理即为所求。4、最小二乘法利用拟合方法确定权重向量,使得残差平方和最小,即求解如下模型:5.2.2模型的求解1、我们根据四种不同的求权重的方法,保存三位小数,整理得出如下数据:表八:导致航班延误评价因子判断矩阵的权重系数方法几何平均0.0990.0550.2920.2520.1136.3680.0730.059算术平均0.1010.0600.2870.2450.1146.3740.0740.060特征向量0.0980.0570.2930.2420.1156.3700.0740.059最小二乘0.0890.0510.3070.2620.1336.4540.0900.073分析得到全部,航空公司运行管理、恶劣天气影响的权重较大。表九:航空公司运行管理判断矩阵的权重系数方法几何平均0.2180.2180.0660.3980.0985.2890.0720.064算术平均0.2140.2140.0700.4000.1005.2910.0730.065特征向量0.2120.2130.0670.4110.0965.2920.0740.065最小二乘0.1890.1880.0710.4500.0995.3510.0880.078分析得到全部,恶劣天气、流量控制的权重较大。表十:流量控制判断矩阵的权重系数方法几何平均0.1300.0770.3680.0910.3325.0920.0230.020算术平均0.1330.0780.3660.0930.3285.1050.0240.021特征向量0.1310.0760.3700.0910.3295.0980.0280.021最小二乘0.1080.0770.3680.1040.3415.1520.0370.034分析得到全部,航空公司运行管理、机场保障的权重较大。表十一:恶劣天气影响判断矩阵的权重系数方法几何平均0.1400.0940.4120.0940.2605.1650.0410.037算术平均0.1430.0950.4110.0950.2555.1660.0420.037特征向量0.1400.0930.4230.0930.2525.1670.0420.037最小二乘0.1040.1050.4340.1050.2525.2850.0650.050分析得到全部,航空公司运行管理、机场保障的权重较大。表十二:军事活动影响判断矩阵的权重系数方法几何平均0.2850.1560.3760.1010.0835.2860.0720.064算术平均0.2780.1620.3680.1070.0845.2920.0730.065特征向量0.2840.1600.3730.1020.0825.2870.0720.064最小二乘0.2660.1310.4080.0970.0985.3620.0910.081分析得到全部,航空公司运行管理、流量控制的权重较大。表十三:机场保障判断矩阵的权重系数方法几何平均0.1990.1980.0750.3970.1315.2390.0900.054算术平均0.1940.1940.0810.3880.1435.2520.0630.056特征向量0.1950.1950.0730.3900.1425.2450.0610.055最小二乘0.2050.2050.0750.4050.1115.2750.0690.061分析得到全部,恶劣天气、流量控制、军事活动的权重较大。且以上判断矩阵在四种方法中都通过了一次性检验,即。2、计算各层对目标层的合成权重计算各层元素对目标层的合成权重,假设上一层次的包含个因素,,,,。如果C层次*些因素对于单排序的一致性指标为,相应的平均数即一致性指标为,则C层次的总排序随机一致性比率为:时,则层次总排序结果满足一致性要求,求得:1〕几何平均法:2〕算术平均法:3〕特征向量法:4〕最小二乘法:四种方法都满足层次总排序的一致性要求,可求得各个区域总权重如下:表十四:四种方法求得的区域总权重区域方法权重流量控制军事活动航空运行公司管理恶劣天气机场保障几何平均法0.2200.1630.2700.1940.157算术平均法0.2140.1640.2660.1970.158特征向量法0.2150.1630.2710.1960.156最小二乘法0.1950.1560.2910.2010.1593、综合分析分析四种方法得到的求得的总权重可知,几何平均法,算术平均法,特征向量法,这三种方法得出导致航班延误的主要因素严重性排序由高到低为:航空公司运行管理、流量控制、恶劣天气影响、军事活动、机场保障;而用最小二乘法得到导致航班延误的主要因素严重性排序由高到低为:航空公司运行管理、恶劣天气、流量控制、机场保障、军事活动。观察区域总权重可得航空公司运行管理的总权重是最大的流量控制和恶劣天气的权重差不多,同样军事活动和机场保障的总权重也非常接近,他们的结果会在不同的计算法方法下产生较大误差,最小二乘法得到的区域总权重就和其他三种不同,但是综合考虑四种计算方法,得出导致航班延误的主要因素严重性排序由高到低为:航空公司运行管理、流量控制、恶劣天气影响、军事活动、机场保障,即导致航班延误的主要因素是航空公司运行管理,这样得出的结果比单一的方法更有说服力。
5.3问题三的建模与求解针对航班延误预测问题,本文采用时间序列预测方法,试图从历史航班数据中建立时间序列航班预测模型。由于一次移动平均实际上认为最近期数据对未来值影响一样,都加权;而期以前的数据对未来值没有影响,加权为=0\*Arabic0。但是,二次及更高次移动平均数的权数却不是,且次数越高,权数的构造越复杂,但永远保持对称的权数,即两端项权数小,中间项权数大,不符合一般系统的动态性。一般说来历史数据对未来值的影响是随时间间隔的增长而递减的。所以,更切合实际的方法应是对各期观测值依时间顺序进展加权平均作为预测值。指数平滑法可满足这一要求,而且具有简单的递推形式[4]。我们选取时间预测模型中的指数平滑法,指数平滑法是在移动平均法根底上开展起来的一种时间序列分析预测法,它是通过计算指数平滑值,配合一定的时间序列预测模型对现象的未来进展预测[5]。其原理是任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均。5.3.1数据预处理收集处理数据我们选取首都国际机场为收集对象,从2015年4月24日-2015年5月3日,每天检测24个点,连续检测10天,共240个点,具体延误时间见下表,我们的统计如下:时间1:002:003:004:005:006:007:008:0012-72552317102415-3278221632314-52821719142413922101920201416423142424152610-21972018131917-8281128101010110290142742810-5111529216239716201817819时间9:0010:0011:0012:0013:0014:0015:0016:002823312724444150302425222120415631163234204124512428322131514243253121412531462131272631314548322918312134334353361028212141502429313723342331523118312327464834时间17:0018:0019:0020:0021:0022:0023:0000:00312630233622105332031312125343329261924345142232272722318113327202044289043201821332322823413123242113644313725242520224342924252433533231342734942、分析时间序列其数据散布图如下图,其中纵轴表示航班延误时间,轴表示从2015年4月24日-2015年5月3日,共计10天,我们构造轴为。从图中可以看出,该序列具有明显的趋势性和周期性,应该选取一次指数平滑法,在具体应用时.可在使用模型之前依据数据特征对数据进展一些变换,如Log,Logistic,Co*-Bo*等变换.得到各个模型拟合的残差平方和统计量、R-Square统计量和AIC统计量。5.3.2模型的建立1、预测模型设时间序列为为加权系数,,一次指数平滑公式为:上式是由移动平均公式改良而来的。我们知道,移动平均数的递推公式为:以作为的最正确估计。令,以代替,既得式:为进一步理解指数平滑的实质,把上式依次展开,有式说明是全部历史数据的加权平均,加权系数分别为显然得到:以这种平滑值进展预测,就是一次指数平滑法,预测模型为:即:(1)也就是以第t期指数平滑值作为期预测值。2、初始值确实定即第一期的预测值。一般原数列的项数较多时〔大于15项〕,可以选用第一期的观察值或选用比第一期前一期的观察值作为初始值。如果原数列的项数较少时〔小于15项〕,可以选取最初几期〔一般为前三期〕的平均数作为初始值。指数平滑方法的选用,一般可根据原数列散点图呈现的趋势来确定。如呈现直线趋势,选用二次指数平滑法;如呈现抛物线趋势,选用三次指数平滑法。或者,当时间序列的数据经二次指数平滑处理后,仍有曲率时,应用三次指数平滑法。3、加权系数确实定在进展指数平滑时,加权系数的选择是很重要的。由式可以看出,的大小规定了在新预测值中新数据和原预测值所占的比重。值越大,新数据所占的比重就愈大,原预测值所占的比重就愈小,反之亦然。假设把式(1)改写为从上式可看出,新预测值是根据预测误差对原预测值进展修正而得到的。的大小则表达了修正的幅度,值愈大,修正幅度愈大;值愈小,修正幅度也愈小。假设选取,则,即下期预测值就等于本期观测值,完全不相信过去的信息。这两种极端情况很难做出正确的预测。因此,值应根据时间序列的具体性质在之间选择。具体如何选择一般可遵循以下原则:如果时间序列波动不大,比拟平稳,则应取小一点,如,以减少修正幅度,使预测模型能包含较长时间序列的信息。如果时间序列具有迅速且明显的变动倾向,则应取大一点,如,使预测模型灵敏度高一些,以便迅速跟上数据的变化。在实用上,类似移动平均法,多取几个值进展试算,看哪个预测误差小,就采用哪个。5.3.3模型求解预测结果我们采用指数平滑法,并分别取进展计算,初始值为即:按照预测模型:我们先计算了各期预测值,然后我们整理了2015年5月4日8:00-14:00的首都国际机场的航班延误时间,具体数据见见附录5,与预测的航班延误时间比照列于下表中:表十五:时的预测值与实际值比照表时间8:009:0010:0011:0012:0013:0014:00预测值32292730352824实际值29302418283332表十六:时的预测值与实际值比照表时间8:009:0010:0011:0012:0013:0014:00预测值18322428323028实际值29302418283332表十七:时的预测值与实际值比照图时间8:009:0010:0011:0012:0013:0014:00预测值26402819262932实际值29302418283332分析上表可得,指数平滑法预测航班延误时间是有效的,但是取值不同误差也不一样,接下来我们建立预测模型评估。2、预测模型评估:通过上表我们发现,终究取何值为好,预测值是很不一样的,对预测模型进展预测性能评价,必须基于一定的评价指标。特别需要说明的是,对不同的预测模型进展比拟评价,基于不同的指标,比拟结果可能不同,这说明不同评价指标的不一致性。在不同的预测领域中,往往根据实际情况选择有价值的评价指标。预测模型选择如下统计量检验预测效果:我们建立预测评估模型如下:均方根误差〔RootMeanSquareError〕:〔2〕平均绝对百分比误差〔MeanAbsolutePercentageError〕:平均绝对误差〔MeanAbsoluteError〕:我们选择平均绝对百分比误差得到:α的取值0.20.50.8平均绝对百分比误差4.5034.5914.843计算结果说明:时,误差较小,应选取,预测其他时间的航班延误时间。六、模型的评价与推广6.1模型一的评价模型一的优缺点优点缺点1、具有适用性,可以推广至中型小型机场的航班延误统计标准。2、模型一的建立思路简单易懂,建立过程自然流畅,并随着航班延误问题的深入,而不断加以改良,通过对结果进展分析,可知本文的模型准确度较高。1、没有考虑各种因素对航班的影响,突发情况将导致特性改变时,不能够及时的在模型中反映出来。2、基于人工统计数据,误差相对较大。模型二的优缺点优点缺点1、给出了差异的具体表达式,思路清晰明确,结果定量化便于比照。2、同时考虑了导致航班延误的多种具体因素以及其波动的影响差异,考虑周全。3、利用层次分析法分析处理数据,所得结果可靠。1、不能排除突发因素给航班延误带来的影响。2、模型对机场和开展程度的差异考虑不够。模型三的优缺点优点缺点1、模型具有预测功能,能够为机场提供一定的参考,具有实际意义。2、模型的预测曲线精度较高,可靠性强。1、没有足够的历史实际数据对模型进展检验,无法评估模型的准确性。2、模型对突发天气状况或是节假日特殊情况考虑不周。6.2模型的推广1、关于模型一,航班延误的统计标准,会随着社会的开展改变,我们可以对现有的航班延误数据实时观测,从大型机场可以推广到中型、小型机场,同样可以求出对应航班延误曲线的的最小离散直线同样可以作为航班延误的统计标准。关于模型二,层次分析法是一种2、关于模型二,层次分析法是一种定性与定量相结合的决策分析方法,计算权重时我们采用的是四种方法综合考虑,但单一的层次分析还是有局限性,我们试图将层次分析与优化模型结合起来共同研究航班延误,先利用层次分析找出几个重要原因,再利用优化模型做后续工作。3、关于模型三,我们建立时间序列预测模型,同样我们可以将这个方法推广到交通上,对北上广等兴旺城市的枢纽路口,或是高速公路的主要路线建立车流量预测模型,以及时做好应急工作。最后我们写出了三个分别计算航班延误时间的MATLAB的程序,参见附录六。参考文献[1]"民航航班正常统计方法"[S],中国民航总局文件民航发〔2013〕。[2]MuellerERandChatterGB,Analysisofaircraftarrivalanddeparturedelaycharacteristics[C],ProceedingsofAircraftTechnologyIntegrationandOperationsTechnicalForum,2002。[3]徐涛,丁建立,王建东,赵学健,基于贝叶斯网络的航班延误与涉及分析模型[J],系统仿真学报,2009。[4](美〕乔治E.P.博克斯,时间序列分析预测与控制,机械工业2011年4月。[5]姜启源,谢金星,叶俊,数学模型,高等教育,2011年4月第四版。[6]"航班延误赔偿指导意见",民航总局文件,2013年。附录一、航班运行过程图二、2014年全球主要机场航班延误局部排名三、国内外统计指标比照图指标名称国外国内说明关舱延误√该指标主要是用于衡量机场和航空公司在起飞前的保障工作进展的情况滑行延误√不同机场的滑行时间应该是不同的,该指标主要是用于衡量滑行延误的情况空管起飞延误√√该指标是衡量航班延误的重要指标空管着陆等待延误√该指标主要是对由空管造成航班在着陆前等待所造成的延误衡量着陆延误√国外对于延误的衡量是全面的着陆延误也是一个相当重要的指标航路延误√该指标主要衡量航路飞行的延误情况流量控制延误√国外存在流量管理系统,流量管理系统用于实际航班运行指导,该指标是衡量在发生流量控制的时候对于航班延误的影响程度通过对美国和国内现行统计指标体系的比照可以发现:美国的航班延误统计涉及到航班运行的全过程,即从航班滑行、起飞到着陆的整个过程,而我国现行统计方法仅仅是围绕航班的起飞正常性进展统计,这样衡量出来的正常率数据比拟片面,缺少对航班整个运行过程中延误的统计,导致许多正常率高的航班反而旅客投诉比拟多,因此,指标的设置已经不能真正衡量航班运行质量。而且,现行统计方法缺乏延误时间与延误原因的匹配,无法适应航班延误分析的需求。另外现行统计方法有时候在航班延误的责任界定方面存在模糊性,造成各个相关单位在造的航班延误是空管原因造成的航班延误的具体责任上互相推卸责任,不利于延误的消除。四、国内十大机场及其简称:首都国际机场**白云国际机场**浦东国际机场**虹桥国际机场**双流国际机场**宝安国际机场**长水国际机场**江北国际机场****国际机场**萧山国际机场五、首都国际机场2015年5月4日航班延误实时情况:我们可以看出首都国际机场2015年5月3日以后几天的航班延误时间根本平稳,比照我们收集到的2015年5月4日首都国际机场的航班延误实时情况〔如下所示〕:我们发现航班延误的时间序列预测模型的稳定性与可靠性,因而我们可以通过建立航班延误的预测模型,使用历史数据,对未来几天的航班延误情况作出大致预测,以及时对航班延误的峰值时刻提早作出准备,最大程度上解决航班延误问题。计算的MATLAB程序如下:代码一:clc,clearloaddianqi.t*tyt=dianqi;n=length(yt);alpha=[0.20.50.8];m=length(alpha);yhat(1,1:m)=(yt(1)+yt(2))/2;fori=2:nyhat(i,:)=alpha*yt(i-1)+(1-alpha).*yhat(i-1,:);endyhaterr=sqrt(mean((repmat(yt,1,m)-yhat).^2))*lswrite('dianqi.*ls',yhat)yhaty=alpha*yt(n)+(1-alpha).*yhat(n,:)代码二:clc,clearloadfadian.t*t%yt=fadian;n=length(yt);alpha=0.3;st1(1)=yt(1);st2(1)=yt(1);fori=2:nst1(i)=alpha*yt(i)+(1-alpha)*st1(i-1);st2(i)=alpha*st1(i)+(1-alpha)*st2(i-1);end*lswrite('fadian.*ls',[st1',st2'])
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海邦德职业技术学院《中国现代文学三十年》2025-2026学年期末试卷
- 上海杉达学院《会计电算化》2025-2026学年期末试卷
- 上海交通职业技术学院《耳鼻喉头颈外科学》2025-2026学年期末试卷
- 石家庄科技职业学院《中国古代文学批评史》2025-2026学年期末试卷
- 上海体育大学《卫生事业管理》2025-2026学年期末试卷
- 通化师范学院《数值分析》2025-2026学年期末试卷
- 上海电机学院《高频电子线路》2025-2026学年期末试卷
- 上海工会管理职业学院《道路工程测量》2025-2026学年期末试卷
- 上海兴伟学院《中医保健推拿学》2025-2026学年期末试卷
- 上海工商职业技术学院《大学生心理健康教育》2025-2026学年期末试卷
- 人防平战转换施工方案(3篇)
- 胃息肉课件查房
- 物流交付环节管理办法
- 电网检修培训课件下载
- 电器元件销售管理制度
- 保安公司现场安保信息管理制度
- 研究生导师培训讲座
- 人工智能项目产业投资基金设立流程
- DB1331T 063-2023雄安新区地埋管地源热泵系统工程技术规程
- 标准图集-L22G310-钢筋混凝土结构构造
- 政府机关办公用品配送方案
评论
0/150
提交评论