




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、摘 要对于问题一,建立了回归分析模型,用以验证国内统计标准的合理性。基于国内外航班延误的统计标准不同,由于flight stats给出的的是国际主要大型机场的排名,通过收集2014年国内十大航空公司部分月份的航班延误时间,然后进行数据统计与整理,对收集到的十个机场部分月份的指定天数的航班延误时间进行统计,进而求指定天数十个机场航班延误时间的平均值,判断得知flight的统计标准是不合理的。对于问题二,建立层次分析模型,从中分析得出导致航班延误的最主要因素。得出导致航班延误的主要因素权重排序由高到低为:航空公司运行管理、流量控制、恶劣天气影响、军事活动、以及机场保障,即导致航班延误的最主要因素是
2、航空公司的运行管理。对于问题三,建立时间序列模型,利用一次指数平滑法建立预测模型,然后对预测的航班延误时间峰值进行人为调控。建立指数平滑模型之后进行模型评估,进而求出是合适的,最后对航班延误时间进行预测,分析曲线走势,并与具体的航班延误时间进行对比分析,讨论模型的效用性。本文综合利用回归分析模型、基于层次分析法的综合评价,使用相关软件,对航班延误问题进行了多角度的分析。并给出了航班延误的时间序列模型,对航班延误作出了理论预测,且对模型的适用范围做出了推广,最后给出了模型的优缺点和改进方案,在实际应用中有较大的参考价值。关键词:回归分析模型;层次分析法;时间序列模型;指数平滑法 1、 问题重述
3、随着我国民航运输业的快速发展,我国民航业正在经历美国等西方发达国家在上个世纪七十年代放松航空管制后航空业务量急剧膨胀,导致机场和空域拥堵严重、航班延误快速增长的局面。2015年3月21日,香港南华早报报道,据总部设在美国的空中旅行数据提供商flight stats(以下简称flight)介绍,在全球61个最大机场中,中国机场及航空公司的准点离港表现可谓全球最差,准点离港表现最差的7个机场均位于中国内地,其中上海虹桥机场、浦东机场和杭州萧山机场分别以37.17%、37.26%和37.74%的准点率排名垫底。此次调查中,深圳宝安机场、广州白云机场、重庆机场和北京首都国际机场也在表现最差的7个机场之
4、列。在全球61个特大机场中,日本东京羽田机场表现最佳,准点率达89.76%。在航空数据网调查的全球各地374个大小不同的机场中,日本大阪伊丹机场表现最佳,准点率高达94.56%。请自行收集数据并建立模型解决以下问题:1、关于上述flight stats提供的结论是否正确?2、我国航班延误的主要原因是什么?3、针对我国航班延误的现状,提出一些改进措施。2、 问题分析首先,flight给出的是国际主要大型机场的航班延误时间排名,我们在本问题在也只讨论国内大型机场的航班延误,以2014年给出的国内十大机场为准,具体机场信息见附录4。另外,我们调查发现国内大型机场的航班到港基本不存在延误,因而我们在问
5、题中只研究航班的离港延误时间,下面给出问题分析。2.1问题一的分析:关于flight给出的全球61个最大机场中准点率排名,我们在flight官网找到了2014年全球主要最大机场航班延误排名,见下表:表一:2014年全球主要最大机场航班延误部分排名On-time RankAirportcodeFlightsSeatsTrackedComp.FactorOn-time54SVO1.15*1051.82*10777.22%76.62%54.20%55PEK2.85*1055.72*10797.18%95.34%52.64%56CKG1.17*1051.84*10790.45%89.64%52.19%
6、57CAN1.99*1053.41*10795.62%93.93%49.56%58SZX1.34*1052.31*10796.22%93.53%49.42%59PVG1.82*1053.45*10796.25%94.11%37.26%60SHA1.30*1052.45*10797.48%93.96%37.17%61HGH1.00*1051.60*10794.58%93.16%36.74%注:原始数据见附录二 首先这个排名是flight公司根据航班延误国际标准来统计作出的排名,但是由于每个国家的国情不同,发展阶段不一致,我们中国也有自己的民航航班正常统计办法(以下简称统计办法),根据中国民航总局
7、发布的民航航班正常统计办法1,对于枢纽机场,如在北京首都国际机场、上海浦东国际机场、广州白云国际机场起飞的航班,在公布的计划离港时间后30分钟内起飞且没有发生不正常情况的航班为正常航班;对于在上海虹桥国际机场和深圳宝安国际机场起飞的航班,这个时间规定是25分钟;对于在成都双流国际机场和昆明巫家坝机场起飞的航班,这个时间规定是20分钟。由于国内外的统计标准不同,我们有理由怀疑flight给出的排名的真实性。因而我们只需要说明国内统计办法的合理性,并大致得出其标准,同国际标准对比说明问题所在即可。毋庸置疑的是,国际航班延误统计标准和中国的民航航班延误统计办法都有其理论依据,肯定不是随便定义的,我们
8、试图从航班延误时间的角度建立回归分析模型,因此数据预处理的重点在于从现有航班信息中统计出不同时段的离港航班延误时间。我们以北京首都国际机场为首的2014年国内十大机场的航班进离港信息表为原始数据,并在fight官网收集到了按时间顺序记录的离港航班的计划起降时间,实际起降时间,根据这些信息我们计算出了整点时间每个航班延误的具体时间,进而对这些延误时间作为回归分析的数据,建立一元线性回归分析模型。我们从收集的数据出发,确定自变量和因变量之间的定量关系式,即,大致估计出国内大型机场延误时间的上下界,并计算出均值,同国际标准进行比较,最后说明国内大型机场航班延误统计标准的合理性。2.2问题二的分析据中
9、新社2014年3月27日报道,航班延误的因素复杂多元,具体原因及其百分比是:航空公司运行管理占42.3%,流量控制占26.1%,恶劣天气影响占20.9%,军事活动影响占7%,机场保障占3.7%。基于我们查找到的航班延误的原因,欲找出导致航班延误的最主要因素,属于决策模型问题,由于层次分析具有系统性的分析方法,简洁实用的决策理论,以及所需定量数据信息较少的特性,我们的做法是建立层次分析模型,并依次建立层次结构模型,构造成对比较阵,计算权向量并做一致性检验,计算组合权向量并做组合一致性检验,最后利用几何平均法,算术平均法,特征向量法,最小二乘法分别求得的总权重,综合分析得出导致航班延的最主要因素。
10、2.3问题三的分析 关于航班延误问题的解决办法,现在已经有很多政策性的方案,如预订机票时使用民航资源网数据分析中心的“航线运力数据分析系统”提前查询航线航班历史准点率信息,尽量选择预订历史准点率较高的航班机票。我们的做法是建立航班延误预测模型。查找文献我们发现,Mueller R 在2003年发表的“飞行器进离港延误特征分析”2一文中分析了美国交通流量大和航班延误显著的10个主要枢纽机场的离港、航路和到达数据,其目的在于改善延误预测,分别用正态分布和泊松分布建模,得到飞机延误时间的概率密度函数,根据原始数据计算均值和标准差,用最小二乘法改善均值和标准差,以减少模型与实际分布之间的误差,研究表明
11、泊松分布能较好的建模离港延误,而正态分布则对建模航路和到达延误效果理想;然而,这种进离港延误的总体概率分布模型对于短期或单航班的进离港延误预测来说并没有实际意义。 徐涛等人在2009年发表的“基于贝叶斯网络的航班延误与波及分析模型”3一文中,采用贝叶斯网络对航班进离港事件进行分析和建模,构造了一个航班计划网络;利用贝叶斯原理,对网络中的节点进行延误预测,并能对可能发生延误的节点进行延误波及影响的分析,为相关部门提供参考,以采取措施避免或减小延误影响。问题回到怎么解决航班延误问题,我们的想法是利用历史数据构建一个航班延误时间的预测模型,我们利用一次指数平滑法,对未来数天的航班延误时间作出大致预测
12、,然后针对航班延误的峰值时间,及时进行政策方案调控(见附录七),以及时解决延误问题。最后我们观察了北京首都国际机场2015年5月4日的航班延误实时数据,建立预测评估模型,与我们得到的预测数据进行对比,说明模型的可靠性。 三、模型假设1、 合理性假设:假设问题中影响数据拟合的误差是极小的。2、 排他性假设:假设航班延误只与导致航班延误的主要因素有关,不考虑其他因素对航班延误的影响。3、准确性假设:假设我们收集的数据是真实可靠的,可以根据航班延误的时间得到相应的机场航班延误信息。四、符号说明与名词解释4.1 符号说明 序号 符号 符号说明 1 2 3 4 5 6 7 8 9 权重向量 一致性指标
13、一致性比例 航班离港的花费时间 流量控制影响的权重 军事活动影响的权重 航空公司运行管理的权重 恶劣天气影响的权重 机场保障影响的权重注:未列出的符号及重复的符号以出现处为准。4.2名称解释1、 准点率:又称正点率、航班正常率,是指航空旅客运输部门在执行运输计划时,航班实际出发时间与计划出发时间的较为一致的航班数量即正常航班与全部航班数量的比率。2、 准点:如果一个航班在计划起飞时间后30分钟内完成起飞(机轮离地),即认为该航班准点放行。3、 略晚点:如果一个航班在计划起飞时间后30-45分钟内完成起飞,即认为该航班略晚点放行。4、 较晚点:如果一个航班在计划起飞时间后45-60分钟内完成起飞
14、,即认为该航班较晚点放行。5、严重晚点:如果一个航班在计划起飞时间后60分钟以后完成起飞,即认为该航班严重晚点。6、流量控制:流量控制是指通过限制单位时间内进入某空中交通管制节点的航空器的数量,来维持安全的空中交通流。五、模型的建立与求解5.1问题一的模型建立与求解5.1.1 数据预处理由于flight给出的是全球主要最大机场的航班统计排名,我们在数据收集时针对中国十大机场,具体收集的数据方式如下,2014年12个月中国十大机场,每一个月抽取6号、12号、18号、24号、30号(二月以28号为准),记为、,从这五天再抽取0-24时每一个整点(若整点没有航班,以最近的航班为准)的航班离(到)港的
15、花费时间,记为,然后计算每一天的平均值,具体结果保留两位小数。我们具体整理了2014年2、5、6、8、9、12月的国内十大机场航班离港延误平均时间如下表所示:表二:2014年2月国内十大机场航班离港延误数据统计简称/时间2月6号2月12号2月18号2月24号2月28号PEK18.8014.3818.3319.0921.75CAN15.2513.8820.5016.7518.38PVG28.1325.3835.8024.4531.25SHA23.5026.7527.5030.2528.50CTU20.8018.7523.2521.5022.00SZX24.8022.7523.3324.5021.
16、88KMG26.7524.5025.3326.3325.11CKG26.2325.6024.8025.5027.38XIY20.0019.5019.3821.5021.33HGH20.3322.0523.1521.5021.88平均值22.4621.3524.1423.1423.94 我们抽取这个月6、12、18、24、30号的平均延误时间,构造坐标如下:(1.2,22.46),(1.4,21.35),(1.6,23.14),(1.8,23.14),(2.0,23.94)。表三:2014年5月国内十大机场航班离港延误数据统计简称/时间5月6号5月12号5月18号5月24号5月28号PEK19.
17、8815.5019.8020.5021.88CAN16.7514.5020.0017.7519.50PVG28.2526.3835.8026.5030.75SHA24.5025.7526.3330.8027.75CTU21.8019.5025.0020.7523.50SZX25.5021.0024.5024.0022.80KMG25.0023.4527.1125.7524.80CKG26.1325.0826.0424.8025.50XIY21.1721.2120.0321.2922.33HGH20.0022.0323.0422.4222.38平均值22.9021.4424.7723.4624.
18、12我们抽取这个月6、12、18、24、30号的平均延误时间,构造坐标如下:(4.2,22.90),(4.4,21.44)、(4.6,24.77)、(4.8,23.46)、(5.0,24.12)。表四:2014年6月国内十大机场航班离港延误数据统计简称/时间6月6号6月12号6月18号6月24号6月28号PEK20.1716.0320.0019.4221.38CAN15.2115.0419.1718.0819.01PVG35.0426.0328.3826.0430.13SHA24.4225.7525.1731.0427.29CTU22.3825.5025.3821.0423.38SZX25.0
19、321.0324.0425.2922.38KMG25.2123.1727.2125.0324.42CKG26.1325.0826.1324.2424.29XIY22.2121.1720.3822.0422.03HGH21.0423.3823.4222.0423.37平均值23.6822.2223.9323.4123.77 我们抽取这个月每月6、12、18、24、30号的平均延误时间,构造坐标如下:(5.2,23.68),(5.4,22.22),(5.6,23.93),(5.8,23.41)、(6.0,23.77)。表五:2014年8月国内十大机场航班离港延误数据统计简称/时间8月6号8月12号
20、8月18号8月24号8月28号PEK19.4221.0322.0416.0320.17CAN15.2120.4219.1718.0819.01PVG35.0426.0328.3826.0430.13SHA24.4225.7525.1731.0427.29CTU22.3825.5025.3822.0423.38SZX25.0322.3824.0425.2922.03KMG25.2123.1723.3823.3826.46CKG27.3822.0426.1324.0424.29XIY22.2126.1720.3823.4225.08HGH21.0428.3821.0425.0323.42平均值24
21、.2124.0823.5123.4424.13 我们抽取这个月6、12、18、24、30号的平均延误时间,构造坐标如下:(7.2,24.21),(7.4,24.08),(7.6,23.51),(7.8,23.44)、(8.0,24.13)。表六:2014年9月国内十大机场航班离港延误数据统计简称/时间9月6号9月12号9月18号9月24号9月28号PEK20.3822.0323.1717.3822.38CAN15.2120.4219.1718.0820.08PVG35.0426.0328.3830.0430.13SHA24.4225.7525.1735.3827.29CTU22.3825.50
22、25.3825.8823.38SZX25.0322.3824.0428.4226.88KMG25.2123.1723.3825.3826.46CKG26.4222.0426.1324.0424.29XIY22.0426.1722.3823.4225.08HGH23.8828.3824.1325.3826.42平均值24.4024.1824.1325.3725.24 我们抽取这个月6、12、18、24、30号的平均延误时间,构造坐标如下:(8.2,24.40),(8.4,24.18),(8.6,24.13),(8.8,25.37),(9.0,25.24)。表七:2014年12月国内十大机场航班离
23、港延误数据统计简称/时间12月6号12月12号12月18号12月24号12月28号PEK23.8824.1323.4625.3823.17CAN16.3822.2120.4223.3822.21PVG32.5025.1327.3830.4225.08SHA25.4226.0826.1730.0428.42CTU22.8825.1325.1325.8823.38SZX26.4221.8824.0427.8825.13KMG24.0423.1723.3824.3825.45CKG26.3822.0426.1324.0424.29XIY22.8826.1723.4223.4225.08HGH24.0
24、427.1325.8824.1327.08平均值24.5524.3024.5425.8924.93 我们抽取这个月6、12、18、24、30号的平均延误时间,构造坐标如下:(11.2,24.55),(11.4,24.30),(11.6,24.54),(11.8,24.89),(12.0,24.93)。5.1.2 模型的建立1、选择回归模型的类型我们通过上述数据预处理得到的观测数据,在坐标上分析其散点图的变化趋势,从而选择标准函数类型,我们整理数据并得到散点图如下: 收集整理完数据以后我们着手建立回归分析模型,由于我们旨在求2014年国内大型机场的航班延误时间的分布图,以及延误时间的大致均值,观
25、察散点图我们发现其波动在23-26之间,所以我们建立一元线性回归模型,所谓一元线性回归,就是假定与之间的关系是线性关系,而且满足:,其中和称为回归系数,此时进行回归分析的目标就是给出系数和的估计值。线性回归意味着条件平均数与之间的关系是线性函数,对于每个的观察值,来说,由于条件均值由式决定,观察值就应该是在条件均值的基础上再加上一个随机误差,则一元正态线性回归的模型为: ,其中 2、计算回归方程的参数由于实际问题中我们只能得到有限的数据,无法算出准确的和的值,只能求出它们的估计值和,并得到的估计值为:,一般使用最小二乘法估计回归系数和。根据最小二乘法原理,所求出的残差平方和达到最小的直线为回归
26、线。 即令: 要使 最小,应该有: 整理并解此方程后的,得到: 其中:x的校正平方和为: x和y的校正交叉乘积和为: 我们将数据代入后,得到: 3、 对模型进行显著性检验对模型进行显著性检验,是用以判别回归效果,原本随机变量关系现在用确定性的关系式表示后,其可信度如何,必须加以验证,此是回归分析较为麻烦的步骤,我们得到的一元线性回归曲线:将数据带入公式: 得到,即该回归曲线的拟合性较强。5.1.3 模型的求解 我们利用这30个坐标拟合国内大型机场航班延误时间的一元线性回归曲线,利用MATLAB得到如下直线:Linear model Poly1:f(x) = p1*x + p2Coefficie
27、nts (with 95% confidence bounds):p1 = 0.08254 (0.004081, 0.161)p2 = 23.84 (23.27, 24.42)Goodness of fit:SSE: 12.42R-square: 0.8423Adjusted R-square: 0.1116RMSE: 0.6661我们对比二次线性回归曲线:Linear model Poly2:f(x) = p1*x2 + p2*x + p3Coefficients (with 95% confidence bounds):p1 =-0.01344 (-0.0363, 0.009428)p2
28、=0.2599 (-0.05181, 0.5716)p3 =23.39 (22.44, 24.35)Goodness of fit:SSE: 11.79R-square: 0.7861Adjusted R-square: 0.1258RMSE: 0.6607对比二者的R-square可以得到,即一次线性回归曲线拟合离散型较强,观察一次二次回归曲线,我们发现,国内大型机场全年航班延误日平均曲线的总体特点是全年延误情况基本平稳,春季延误波动性较大;夏季航班延误基本平稳,由此可以看出首都机场航班延误受节假日(包括五一十一黄金周)影响,人们的出行影响显著,而秋冬季节由于气温较低,人们出行量较小。对于春
29、季而言,由于适逢中国传统佳节春节,导致航班延误突然攀升和迅速下降的趋势,从图中的曲线变化趋势来看,这与国内的实际基本情况完全一致。 综合分析,2014年国内大型机场航班延误时间分布在之间,我们可以利用航班延误时间的期望代表大型航班延误时间的标准。令代入得到 我们可以算出曲线与的离散程度最小,即国内大型机场航班延误时间的标准大致应为分钟。反过来我们将国内大型机场航班延误时间的标准分钟与国际标准对比,显然,因此我们可以断定,不同标准下,flight给出的国际十大机场延误统计排名存在不合理性,从这个角度分析,他们给出的国际大型机场的航班延误率排名,并不能说明中国大型机场的航班延误问题较严重。通过这个
30、结论,我们也应该意识到,现阶段不同的国家的发达程度以及管理措施也有差别,关于航班延误的时间标准,我们应该找出航班延误的主要原因,给予改进,进而向航班延误国际统计标准靠拢,这就是我们下一步要做的工作。5.2 问题二的建模与求解问题二要求我们得出我国航班延误的主要原因是什么,由于层次分析法一种定性与定量相结合的决策分析方法。常被运用于多目标、多准则、多要素、多层次的非结构化的复杂决策问题,特别是战略决策问题,具有十分广泛的实用性,其中层次分析法权重向量的计算方法有四种,单一的计算方法存在较大误差,所以我们在但以计算方法的基础上,对其进行改进,选择四种方法均衡考虑,最后分析出导致航班延误的最主要因素
31、,接下来我们依次建立模型。5.2.1模型的建立1、建立层次结构模型将决策的目标、考虑的因素(决策准则)和决策对象按它们之间的相互关系分为最高层、中间层和最低层,绘出层次结构图如下。2、构造判断矩阵在确定各层次各因素之间的权重时,如果只是定性的结果,则常常不容易被别人接受,因而采用:一致矩阵法,即:不把所有因素放在一起比较,而是两两相互比较。对比时采用相对尺度,以尽可能减少性质不同因素相互比较的困难,以提高准确度。引用数字1-9及其倒数作为标度来定义判断矩阵,若元素和元素的重要性之比为那么元素j与元素i的重要性之比为,其中:1 表示两个元素相比,具有同样的重要性3 表示两个元素相比,前者比后者稍
32、重要 5 表示两个元素相比,前者比后者明显重要 7 表示两个元素相比,前者比后者极其重要 9 表示两个元素相比,前者比后者强烈重要 2,4,6,8 表示上述相邻判断的中间值3、层次单排序以及一致性检验1)计算一致性指标: 其中为判断矩阵的最大特征值。2) 查找平均随机一致性指标:1234567000.520.891.121.241.368910111213141.411.461.491.521.541.561.58 3)计算一致性比例: 时可以认为矩阵的一致性可以接受,否则应对判断矩阵做一致性修复。4、层次总排序以及一致性检验: 最终得到各元素,特别是最底层中各方案对目标的排序权重,从而进行方
33、案选择,对层次总排序也需要做一致性检验,计算各个要素对系统总目标的合成权重,并对各个备选方案排序。得到评价因子矩阵A,航空公司运行管理,流量控制,恶劣天气影响,军事影响,机场保障的判断矩阵如图所示: 5、 计算权重向量 1、几何平均法 计算步骤如下: 1)A的元素按行相乘得到一新向量; 2)将新向量的每个分量开n次方;3)将所得向量归一化既得权重向量。2、算术平均法 Step1:A的元素按列归一化,即求: Step2:将归一化后的各列相加; step3:将相加后的向量除以n既得权重向量。 Step4:特征向量法将权重向量W右乘权重比矩阵A,即:,其中为判断矩阵的最大值,存在且唯一,的分量均正向
34、量,然后,将求得的权重向量做归一化处理即为所求。4、最小二乘法 利用拟合方法确定权重向量,使得残差平方和最小,即求解如下模型: 5.2.2模型的求解1、我们根据四种不同的求权重的方法,保留三位小数,整理得出如下数据:表八:导致航班延误评价因子判断矩阵的权重系数方法几何平均0.0990.0550.2920.2520.1136.3680.0730.059算术平均0.1010.0600.2870.2450.1146.3740.0740.060特征向量0.0980.0570.2930.2420.1156.3700.0740.059最小二乘0.0890.0510.3070.2620.1336.4540.
35、0900.073分析得到全部,航空公司运行管理、恶劣天气影响的权重较大。表九:航空公司运行管理判断矩阵的权重系数方法几何平均0.2180.2180.0660.3980.0985.2890.0720.064算术平均0.2140.2140.0700.4000.1005.2910.0730.065特征向量0.2120.2130.0670.4110.0965.2920.0740.065最小二乘0.1890.1880.0710.4500.0995.3510.0880.078分析得到全部,恶劣天气、流量控制的权重较大。表十:流量控制判断矩阵的权重系数方法几何平均0.1300.0770.3680.0910.
36、3325.0920.0230.020算术平均0.1330.0780.3660.0930.3285.1050.0240.021特征向量0.1310.0760.3700.0910.3295.0980.0280.021最小二乘0.1080.0770.3680.1040.3415.1520.0370.034分析得到全部,航空公司运行管理、机场保障的权重较大。表十一:恶劣天气影响判断矩阵的权重系数方法几何平均0.1400.0940.4120.0940.2605.1650.0410.037算术平均0.1430.0950.4110.0950.2555.1660.0420.037特征向量0.1400.0930
37、.4230.0930.2525.1670.0420.037最小二乘0.1040.1050.4340.1050.2525.2850.0650.050分析得到全部,航空公司运行管理、机场保障的权重较大。表十二:军事活动影响判断矩阵的权重系数方法几何平均0.2850.1560.3760.1010.0835.2860.0720.064算术平均0.2780.1620.3680.1070.0845.2920.0730.065特征向量0.2840.1600.3730.1020.0825.2870.0720.064最小二乘0.2660.1310.4080.0970.0985.3620.0910.081分析得到
38、全部,航空公司运行管理、流量控制的权重较大。表十三:机场保障判断矩阵的权重系数方法几何平均0.1990.1980.0750.3970.1315.2390.0900.054算术平均0.1940.1940.0810.3880.1435.2520.0630.056特征向量0.1950.1950.0730.3900.1425.2450.0610.055最小二乘0.2050.2050.0750.4050.1115.2750.0690.061 分析得到全部,恶劣天气、流量控制、军事活动的权重较大。且以上判断矩阵在四种方法中都通过了一次性检验,即。2、计算各层对目标层的合成权重计算各层元素对目标层的合成权重
39、,若上一层次的包含个因素,。如果C层次某些因素对于单排序的一致性指标为,相应的平均数即一致性指标为,则C层次的总排序随机一致性比率为:时,则层次总排序结果满足一致性要求,求得: 1)几何平均法: 2)算术平均法: 3)特征向量法: 4)最小二乘法:四种方法都满足层次总排序的一致性要求,可求得各个区域总权重如下:表十四:四种方法求得的区域总权重区域方法权重流量控制军事活动航空运行公司管理恶劣天气机场保障几何平均法0.2200.1630.2700.1940.157算术平均法0.2140.1640.2660.1970.158特征向量法0.2150.1630.2710.1960.156最小二乘法0.1
40、950.1560.2910.2010.1593、综合分析分析四种方法得到的求得的总权重可知,几何平均法,算术平均法,特征向量法,这三种方法得出导致航班延误的主要因素严重性排序由高到低为:航空公司运行管理、流量控制、恶劣天气影响、军事活动、机场保障;而用最小二乘法得到导致航班延误的主要因素严重性排序由高到低为:航空公司运行管理、恶劣天气、流量控制、机场保障、军事活动。观察区域总权重可得航空公司运行管理的总权重是最大的流量控制和恶劣天气的权重差不多,同样军事活动和机场保障的总权重也非常接近,他们的结果会在不同的计算法方法下产生较大误差,最小二乘法得到的区域总权重就和其他三种不同,但是综合考虑四种计
41、算方法,得出导致航班延误的主要因素严重性排序由高到低为:航空公司运行管理、流量控制、恶劣天气影响、军事活动、机场保障,即导致航班延误的主要因素是航空公司运行管理,这样得出的结果比单一的方法更有说服力。5.3问题三的建模与求解针对航班延误预测问题,本文采用时间序列预测方法,试图从历史航班数据中建立时间序列航班预测模型。由于一次移动平均实际上认为最近期数据对未来值影响相同,都加权;而期以前的数据对未来值没有影响,加权为0。但是,二次及更高次移动平均数的权数却不是,且次数越高,权数的结构越复杂,但永远保持对称的权数,即两端项权数小,中间项权数大,不符合一般系统的动态性。一般说来历史数据对未来值的影响
42、是随时间间隔的增长而递减的。所以,更切合实际的方法应是对各期观测值依时间顺序进行加权平均作为预测值。指数平滑法可满足这一要求,而且具有简单的递推形式4。 我们选取时间预测模型中的指数平滑法,指数平滑法是在移动平均法基础上发展起来的一种时间序列分析预测法,它是通过计算指数平滑值,配合一定的时间序列预测模型对现象的未来进行预测5。其原理是任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均。5.3.1 数据预处理1、 收集处理数据 我们选取北京首都国际机场为收集对象,从2015年4月24日-2015年5月3日,每天检测24个点,连续检测10天,共240个点,具体延误时间见下表,我们的统
43、计如下:时间1:002:003:004:005:006:007:008:002015.5.312-7255231710242015.5.215-327822163232015.5.114-5282171914242015.4.301392210192020142015.4.291642314242415262015.4.2810-2197201813192015.4.2717-82811281010102015.4.2611029014274282015.4.2510-5111529216232015.4.249716201817819时间9:0010:0011:0012:0013:0014:
44、0015:0016:002015.5.328233127244441502015.5.230242522212041562015.5.131163234204124512015.4.3024283221315142432015.4.2925312141253146212015.4.2831272631314548322015.4.2729183121343343532015.4.2636102821214150242015.4.2529313723342331522015.4.243118312327464834时间17:0018:0019:0020:0021:0022:0023:0000:0
45、02015.5.33126302336221052015.5.2332031312125342015.5.13329261924345142015.4.302232272722318112015.4.29332720204428902015.4.284320182133232282015.4.272341312324211362015.4.264431372524252022015.4.25243429242524332015.4.24533231342734942、分析时间序列 其数据散布图如图所示,其中纵轴表示航班延误时间,轴表示从2015年4月24日-2015年5月3日,共计10天,我们
46、构造轴为。从图中可以看出,该序列具有明显的趋势性和周期性,应该选取一次指数平滑法,在具体应用时可在使用模型之前依据数据特征对数据进行一些变换,如 Log,Logistic,Cox-Box等变换得到各个模型拟合的残差平方和统计量、R-Square统计量和AIC统计量。5.3.2模型的建立1、预测模型 设时间序列为为加权系数, 一次指数平滑公式为: 上式是由移动平均公式改进而来的。我们知道,移动平均数的递推公式为:以作为的最佳估计。令,以代替,既得式:为进一步理解指数平滑的实质,把上式依次展开,有式表明是全部历史数据的加权平均,加权系数分别为 显然得到:以这种平滑值进行预测,就是一次指数平滑法,预
47、测模型为:即: (1)也就是以第t期指数平滑值作为期预测值。2、初始值的确定 即第一期的预测值。一般原数列的项数较多时(大于15项),可以选用第一期的观察值或选用比第一期前一期的观察值作为初始值。如果原数列的项数较少时(小于15项),可以选取最初几期(一般为前三期)的平均数作为初始值。指数平滑方法的选用,一般可根据原数列散点图呈现的趋势来确定。如呈现直线趋势,选用二次指数平滑法;如呈现抛物线趋势,选用三次指数平滑法。或者,当时间序列的数据经二次指数平滑处理后,仍有曲率时,应用三次指数平滑法。3、加权系数的确定在进行指数平滑时,加权系数的选择是很重要的。由式可以看出,的大小规定了在新预测值中新数据和原预测值所占的比重。值越大,新数据所占的比重就愈大,原预测值所占的比重就愈小,反之亦然。若把式(1)改写为 从上式可看出,新预测值是根据预测误差对原预测值进行修正而得到的。的大小则体现了修正的幅度,值愈大,修正幅度愈大;值愈小,修正幅度也愈小。若选取,则,即下期预测值就等于本期观测值,完全不相信过去的信息。这两种极端情况很难做出正确的预测。因此,值应根据时间序列的具体性质在之间选择。具体如何选择一般可遵循下列原则:如果时间序列波动不大,比较平稳,则应取小一点,如,以减少修正幅度,使预测模型能包含较长时间序列的信息。 如果时间序列具有迅速且明显的变动倾向,则应取大
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《高血压药物治疗》课件
- 滴滴课程考试试题及答案
- 2025年耐温隔热纸项目合作计划书
- 重庆小学教师试题及答案
- 2025年制剂仿制药项目合作计划书
- 《大肠癌诊疗概述》课件
- 地理科第四章第一节导学案
- 量子信息与物理研究试题及答案
- 《流体力学基础》课件
- 2025-2030年黄葱项目商业计划书
- 2025年国家保密基本知识考试题库及答案
- 《《定制式医疗器械医工交互全过程监控及判定指标与接受条件》》
- 第12课 19世纪下半期资本主义的扩展
- 2022版艺术新课标解读心得(课件)小学美术
- 锂离子电池失效分析及后果PFMEA-电子表格版
- 律师事务所法律咨询委托书
- 中华人民共和国保守国家秘密法实施条例
- 人美版八年级美术下册《1. 绘画的多元化》说课稿
- DB34T4829-2024公路工程泡沫轻质土设计与施工技术规程
- 【新课标核心素养目标】6.2.1二氧化碳的性质和用途教案(表格式)初中化学人教版(2024)九年级上册
- 预防性侵害安全教育
评论
0/150
提交评论