(交通信息工程及控制专业论文)航段运量预测算法及其优化.pdf_第1页
(交通信息工程及控制专业论文)航段运量预测算法及其优化.pdf_第2页
(交通信息工程及控制专业论文)航段运量预测算法及其优化.pdf_第3页
(交通信息工程及控制专业论文)航段运量预测算法及其优化.pdf_第4页
(交通信息工程及控制专业论文)航段运量预测算法及其优化.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(交通信息工程及控制专业论文)航段运量预测算法及其优化.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南京航空航天大学硕士学位论文 i 摘摘 要要 本文结合现代民航运输的需要在深入分析航段运量的特点及比较几种航段运量 预测方法的基础上进一步研究了利用支持向量机方法对航段运量进行预测并结合 实际情况对其进行了改进优化 首先本文较系统的分析并比较了传统运量预测算法的特点对其适用范围和程 度进行了探索进一步研究了熵权系数法和 bp 神经网络算法的改进算法 并对熵权系 数法进行了模拟试验接着详细阐述了支持向量机理论的基础和支持向量机原理 推导了最小二乘支持向量机的算法重点研究描述了贝叶斯框架下的支持向量机模型 最后本文探讨了支持向量机预测模型的建模方法包括核函数的选择模型参数选 择算法的改进学习算法的改进等建立了支持向量机预测模型本文将支持向量机 预测模型改进应用于航班优化与航线经济分析系统中进行航段运量的预测分析 了建立的支持向量机预测模型的不足指出了模型改进的方法 关键字关键字航段运量预测神经网络贝叶斯支持向量机 航段运量预测模型及优化算法研究 ii abstract basing on the need of the modern civil aviation transport, this thesis gives the characteristics of the flight segment volume and the analysis of comparing several forecasting methods. it applies the support vector machine theory in flight segment volume forecasting, then builds forecasting model and gets certain effect. first, this thesis analyzes the characteristics of existed forecasting methods and compares their advantage and disadvantage. then it introduces the support vector machine theory in detail. the paper analyzes ls-svm theory and experiment procedure and mostly discribes the svm based on bayes. three models are built and the result shows support vector machine can serve for flight segment volume forecasting. now the theory of the svm has been used in the system of formax. at last, the thesis tells the disadvantage of the model and points the later development objects. key words flight segment volume, forecasting , neural network bayes support vector machine 图图 表表 图 2. 1 模型建立流程图.12 图 2. 2 模拟结果显示图.13 图 2. 3 人工神经元简化模型.15 图 2. 4 三层神经网络拓扑结构图.18 图 2. 5 经验风险和期望风险关系.22 图 2. 6 结构风险最小化示意图.23 图 2. 7 线性可分情况下的最优超平面.25 图 2. 8 线性不可分情况下的最优超平面.27 图 3. 1 模型建立流程图.38 图 3. 2 贝叶斯框架下 svm 拟和结果表 .39 图 3. 3 ls-svm 拟和结果表 .39 图 3. 4 贝叶斯框架下 svmls-svmbp 神经网络预测结果对比.39 图 4. 1 formax 系统功能框架图.41 图 4. 2 市场预测功能框架图.42 图 4. 3 预测模块流程图.43 图 4. 4 预测和优化模块入口界面.45 图 4. 5 运量历史数据浏览界面.46 图 4. 6 运量数据图形显示界面.46 图 4. 7 运量预测界面.46 图 4. 8 预测模型效果对比图.47 图 4. 9 优化结果.47 表 2. 1 原始数据.13 表 2. 2 代数算法与 bp 算法的比较.20 表 4. 1 航段历史运量表.42 表 4. 2 svm 模型信息表.44 承诺书 本人郑重声明所呈交的学位论文是本人在导师指导下独立进行 研究工作所取得的成果尽我所知除文中已经注明引用的内容外本学 位论文的研究成果不包含任何他人享有著作权的内容对本论文所涉及的 研究工作做出贡献的其他个人和集体均已在文中以明确方式标明 本人授权南京航空航天大学可以有权保留送交论文的复印件允许论 文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库进行 检索可以采用影印缩印或其他复制手段保存论文 (保密的学位论文在解密后适用本承诺书) 作者签名 日 期 1 第一章第一章 绪论绪论 随着航空公司在航空市场上的竞争越来越激烈航空运输管理技术得到民航管理 局航空公司和机场等多方面的关注航空运输预测是航空运输管理的重要工作航 段运量预测作为航空运输管理预测的内容之一也被航空公司越来越重视因此针 对航段运量的特点采用有效的方法建立预测模型有着重要的意义本文旨在对支持 向量机技术在航段运量预测中的应用进行研究 1.1 课题背景课题背景 我国航空运输现阶段的突出矛盾为先进的航空运输技术与落后的航空运输管理 之间的矛盾1 为解决此矛盾进一步提高我国民航在国际上的竞争力就必须加强航 空运输管理航空运输管理预测是航空运输管理的重要组成部分合理的预测能够科 学决策制定使航空运输资源得到优化配置的计划航段运量预测作为航空运输管理 预测的重要内容日益受到业界重视 航段运量预测是编制机队规划和航班计划的基础性工作只有对航段运量做出预 测测算出每条航线未来的旅客流量以及潜在的客运量进而安排飞机需求量才可 确定年度机队规划航班计划有三个主要步骤市场调查研究和航段运量预测提出 公司未来的任务目标和市场规模进行航班计划编排可见航段运量预测已成为航 空公司制定航班计划和规划决策的重要步骤之一起到越来越重要的作用 影响航段运量的因素很多诸如地区经济发展状况季节性航线气象旅游业 等都会对航段运量产生影响而每种因素对具体航段产生的影响程度不同因此使 用单一预测模型对所有航段进行运量预测容易造成有些航段的预测结果不够准确 目前可用于航段运量预测的模型很多这些预测模型都有各自的特点和适用的环境 必须根据实际情况选择合适的预测模型对具体航段的运量进行预测才可能有较好的 预测效果因此为了获得较为准确的预测结果进而制定有效的航班计划需要针 对具体航段选择合适的预测模型 总之航段运量预测是对航空公司的有效资源进行最佳配置的基础性工作对航 段运量预测方法的研究具有极其重要的理论意义和应用价值 1.2 航段运量预测现状航段运量预测现状 目前航空运量的预测方法很多 如基于经验和判断对预测对象作定性分析的定 性预测方法一般不单纯依赖当前的系统数据常用的有集思广义法和德尔菲法这 两种方法都是基于精通预测问题的相关人员依靠经验和讨论所得简单易行可靠性 2 好但受人的主观因素影响较大还有依据历史数据的统计资料利用数学的方法 推测出预测对象未来的发展趋势的定量预测方法如传统的时间序列预测法因果关 系回归分析预测法和灰色预测法等近年来常用的还有神经网络预测方法此外将 定量预测和定性预测相结合产生的综合分析判断法是不依据历史资料不按照常规方 法求出关系式而是就其内因外因进行动态的分析研究进行预测在实际预测中 可以先以定量预测为主对于测对象作出预测然后请有关专家对定量预测结果提出 修正意见对预测结果加以修改完善 在进行航空运量预测时大多采用传统的预测方法它们无论在理论上还是在应 用上都已经非常成熟传统的预测方法能够比较好的处理线形关系对非线性关系的 处理往往不尽如人意近年来灰色模型和神经网络已在预测领域取得广泛的应用 但是对于灰色模型来说当数据离散程度较大时预测精度较差而且它比较适 合于具有指数增长趋势的运量指标当运量指标具有其它趋势时则误差较大神经网 络带有浓厚的经验色彩理论上可以逼近任意非线性系统但存在着网络拓扑结构难 以确定容易陷入局部极小点收敛速度慢等问题而且样本对模型的预测效果有着 关键性的影响在小样本情况下的预测效果常常不够理想 另外现有的大多数航空预测技术都来自于世界上经济发达地区其应用背景主 要是成熟的航空运输市场和特定的环境而我国的航空运输市场还不成熟还处在摸 索学习的过程因此急需要根据我国的现实情况探索适合我国航空运量特点的预测 方法23 1.3 支持向量机现状支持向量机现状 支持向量机是由 vapnik 在二十世纪九十年代中期提出的一种机器学习算法4支 持向量机以统计学习理论中的 vc 维理论和结构风险最小原理为基础根据有限的样 本信息在模型的复杂性(即对特定样本的学习精度)和学习能力(即无错误识别任意样本 的能力)之间寻求最佳折衷以获得最好的推广能力支持向量机以其良好的理论背景 为机器学习提供了一个崭新的方向已成为解决分类回归和概率密度估计等问题的 一种有力工具 支持向量机的求解可归为有约束的二次型规划问题(qp 问题)可以利用标准二次 型优化技术来求解二次规划是一种常见的优化问题有一套比较成熟的理论从数 学角度分析svm 是一个求条件极值问题在二次规划中条件极值问题的通常解法 有惩罚函数法和单纯形法但这些方法只适合小样本情况当样本量较大时算法复 杂度急剧增加在解决大训练集的支持向量机训练问题时大部分算法思想是将原问 题分解为若干子问题通过某种迭代策略反复求解子问题最终获得最优解分解算法 的基本思想就是将 svm 的 qp 问题分解成一系列规模较小的子问题希望通过对子问 3 题的迭代求解而得到 qp 问题的全局最优解这样便解决了存储空间受限制的问题 块算法 (chunking algorithm)5以及贯序最小优化(smo)算法6也大大加快了收敛 速度skeerthi 等提出最近点算法(gsmo)7对 smo 算法的违例样本进行改进使 得算法速度有很大的提高laskov 针对回归 svm 提出了最大不一致算法并指出对 二分类问题这个算法等价于 joachims 的可行方向策略cauwenberghs 提出了增量减 量式学习方法考虑了增加或减少一个训练样本对拉格朗日系数和支持向量机的影响 由于支持向量机二次规划问题求解复杂目前有许多简化求解的优化suykens 等提出最小二乘支持向量机(ls-svm)以及 takuya 提出模糊支持向量机等 支持向量机 主要解决的是分类问题与回归问题最初时只是用来解决 2-类分类问题后来经过众 多学者的努力适用范围有了很大的扩展利用支持向量机解决多分类问题方面主 要有 1-v-r1-v-1有向无环图等分类算法分类算法的重点在于如何构建分类器减 少训练时间1-v-r 算法构建的分类器数目少但需所有样本参与每个分类器的训练过 程样本很多时训练时间很长1-v-1 算法构建的分类器数目较多训练时间随分类 器数目增长很快 有向无环图算法分类速度较快 但会产生分类错误向后传递的问题8 支持向量机进行预测需要选择合适的核函数以及对核函数参数进行选择在参数 选择方面最早出现的是试凑法试凑法首先给参数赋初始值然后进行测试并且选 择参数根据测试精度不断调整参数值直到得到满意的测试精度为止对支持向量 机经过变换最终归结为一个最优化问题这样产生了最优化方法最优化方法的关 键在于对给定参数分类性能进行评估评估方法主要有留一法和支持向量机算法另 外还有利用其他技术进行参数选择的方法比如利用遗传算法进行参数选择等 支持向量机开始主要应用在模式识别方面如手写数字的识别语音识别等后 来应用于人脸检测文本分类及时间序列分析91011有人将小波分析与支持向量机 结合提出基于小波的支持向量机预测模型并将其应用于电子商务交易模型中可 较好的解决交易状态表示及预测等问题有人用人工免疫算法对支持向量机的核函数 和参数进行寻优还有人将主元分析与最小二乘支持向量机结合提高了模型的预测精 度总之支持向量机具有坚实的理论基础同时也表现出的良好的推广性能 1.4 研究意义研究意义 近几年支持向量机的研究得到了极大重视它能有效地解决过学习问题具有 良好的推广性和较好的分类精确性在许多领域的分类和回归方面起了越来越重要的 作用 支持向量机能够在有限的信息下得到最优解而不是样本量趋于无限大时的最优 值算法最终将问题转化为二次寻优问题理论上说能够得到全局最优点算法首 先将非线性变换转换到高维空间在高维空间构造线形判断函数来实现原空间的非线 4 性判别函数这使得学习机器有较好的推广性同时解决维数问题做到算法复杂度 与样本维数无关支持向量机以结构风险最小原则为基础同时考虑算法的复杂性以 获得最佳的泛化能力 鉴于传统方法的局限性和支持向量机的优越性现将支持向量机引入到航空运量 预测中来以期找到更优秀的航段运量预测模型 1.5 论文内容和组织结构论文内容和组织结构 论文的研究内容是支持向量机理论在航段运量预测中的应用和改进主要包括 分析了航段运量的特点讨论当前常用的航空运量预测方法并分析其优缺点支持向 量机理论研究如何利用支持向量机对航段运量进行建模并进行仿真实验将支持向 量机模型应用到航班优化与航线经济分析系统中等本文的组织结构如下 第一章 绪论概述了航段运量预测的研究背景介绍支持向量机理论现状及本文 的主要内容 第二章 航段运量预测方法研究首先介绍了航段运量的特点以及传统的航段运 量预测方法及其特点 然后研究了熵权系数法在运量预测中的应用 重点阐述 bp 神经 网络的学习算法及其缺点 引出了 bp 算法的改进方法代数算法最后介绍了支持向 量机的理论基础研究了支持向量机原理 第三章 首先引入了 ls-svm详细描述了贝叶斯框架下的支持向量机深入分析 了支持向量机预测模型的建模步骤包括样本的采集与处理核函数与参数的选择算 法学习算法的改进等并建立了运量预测模型通过仿真实验验证了模型的有效性 第四章 将支持向量机模型改进应用到航班优化与航线经济分析系统中进行航 段运量的预测具体讲述了市场预测模块的功能框架与实现过程 第五章 总结和展望对本文的主要研究工作进行简要的阐述对需要进一步解决 的问题进行了探讨和展望 5 第二章第二章 航段运量预测方法研究航段运量预测方法研究 航段运量实质上是一种基于时间的变化量本质上是时间序列很多可用于时间 序列预测的数学模型可以用来预测航段运量本章在介绍传统的航段运量预测方法中 的时间序列预测法灰色预测法和组合预测法的基础上主要对航段运量的定量预测 方法进行了研究然后重点研究分析了熵权系数法和 bp 神经网络预测方法 2.1 航段运量预测概述航段运量预测概述 2.1.1 航段运量预测的特点航段运量预测的特点 时间序列是按时间顺序排列的观测值的集合航段运量一般按照一定时间顺序排 列本质上是一种时间序列在时间上是连续的序列则称为连续型时间序列只在 一些规定的时刻进行的序列则称该序列为离散的12现实中的时间序列的变化受许 多因素的影响有些起着长期的决定性的作用使时间序列的变化呈现出某种趋势 和一定的规律性有些则起着短期的非决定性的作用使时间序列的变化呈现出某 种不规则性 航段运量虽然受到各种因素影响但本质上是一种离散型时间序列很多可用于 时间序列预测的模型也可以作为航段运量预测的模型航段运量具有时间序列的一般 特征而构成时间序列的各种因素使得时间序列表现出不同的特征经归纳主要有 长期趋势季节变动循环变动和不规则变动四种13 趋势变动是由各个时期普遍和长期起作用的基本因素影响的变动它表现为持续 上升或下降的变动趋势是对未来状况进行判断和预测的主要依据季节变动是指时 间序列受自然季节变换和社会习俗等影响而发生的有规律的周期性波动季节变动的 周期通常在一个年度之内循环变动指社会经济发展中的一种近乎规律性的盛衰交替 变动其成因比较复杂周期在一年以上长短不一按周期长短不同可将循环变 动分为三类大循环或长期循环波动这种循环变动主要是受重大技术突破或科技突 破的影响中循环或中周期波动如西方国家的周期性经济衰退便是最典型的中循环 波动小循环或短周期波动如企业的固定资产更新和技术变革会造成这种短周期波 动不规则变动也称为剩余变动或随机变动使各种偶然因素如自然灾害战争以 及无法预料和具体解释的随机性因素影响的结果不规则变动和时间无关根据中心 极限定理通常认为不规则变动近似服从正态分布 纵观民航的运营过程区域经济发展水平旅游或季节性节日气象以及各种突 发事件都会对航段运量产生影响因此航段运量具有上述特征而趋势和季节特征 6 尤为明显 2.1.2 航段运量预测常用方法航段运量预测常用方法 预测方法分为两大类一类是确定型另一类是随机型确定型预测方法的基本 思想是用一个确定的形如 y=f( t )的时间函数来拟合时间序列不同的变化采取不同的 函数形式来描述不同变化的叠加采用不同的函数叠加来描述随机型预测方法的基 本思想是通过分析不同时刻变量的相关关系揭示其相关结构利用这种相关结构来 对时间序列进行预测 根据航段运量的特点目前可用于航段运量预测的模型和算法很多较常见的 有以下几种时间序列法季节指数法灰色预测法基于神经网络的预测算法基 于混沌系统的预测算法等等在本文里对于传统预测算法进行了简单的优缺点分析 1时间序列法 时间序列法仅着重分析时间对预测对象的变化的影响或者说是假设预测对象的 变化仅与时间有关这种针对时间因素的方法并非否认实际中其他变动因素的影响 而是对多种变动因素复杂作用的简化因为在多种变动因素的影响下事物才表现出 随着时间变化的多种变化时间序列的每一个数据都反映了当时多重要素综合作用 的结果所以这种简化和针对性使预测更为直接和简便并不影响其科学性 时间序列法把运量数据看作是一个按年季节月份及天周期性变化的时间序列 根据运量的历史资料设法建立一个数学模型来描述运量这个随机变量变化过程的统 计规律性在数学模型的基础上确立运量预测的数学表达式对未来的运量进行预测 在时间序列法中常采用的技术有移动平均法指数平滑法自回归移动平均法 等 时间序列方法模型简单容易实现但有其局限性主要表现在对历史数据的 准确度要求高脏数据对预测效果影响很大预测步数越长预测精度越差对数据 之外的因素不敏感难以解决因其它因素造成的短期运量预测不准确问题 2多项式拟合法 多项式拟合也叫作多项式最小二乘拟合是常用的一种数据拟合方法它常用 于把离散的数据归纳总结为连续的函数以利于进一步应用多项式拟合过程如下 假设已知数据组,.,m,i,xx ii 21)(=,现求一个不超过 n(nn 的最小二乘解 把 k a 当作变量上述方程组得矩阵记法为 = n 1 0 n 1 0 n mm n 11 n 00 y . y y a . a a x.x1 . x.x1 x.x1 2.1 这是一个超定方程组根据解超定方程组的定理(在此省略)可得到正规方程组 = + + + i n i ii i n 1 0 2n i 1n i n i 1n i 2 ii n ii yx . yx y a . a a x.xx . x.xx x.x1m 2.2 其中的记号均为 = n 0i 的简写 记 = = m 0i m 0i i r ir k ik yxt ,xsk=0,1,2,2nr=0,1,n,则正规方程组可写为 = + + n 1 0 n 1 0 2n1nn 1n21 n10 t . t t a . a a s.ss . s.ss s.ss 2.3 此方程组的系数矩阵是一个对称正定矩阵因而存在惟一解通过解该方程组即 可得到 k a从而确定要拟合的多项式)x(pn 在多项式拟合中提高拟合多项式次数未必能改善拟合或逼近的效果而且当 拟合多项式的次数较高时其正规方程组常是病态方程组解的误差很大致使拟合 失败或达不到较好的拟合效果在对航段运量进行预测时拟合次数最大为 3 次方 得到比较满意的结果 3灰色预测法 灰色系统理论以不确定系统为研究对象通过对部分已知的信息的生成开 发提取有价值的信息实现对系统行为的正确认识和有效控制灰色模型法在建模 时不需要计算统计特征量从理论上讲可以使用于任何非线性变化的运量指标预测 将一定范围内变化的历史数据列进行累加使其变成具有指数增长规律的上升形状就 对生成的数列建立起 gm(grey model)模型gm(n,1)也就是对 n 个变量用一阶微分方 程建立的灰色模型数列的生成方式有三种累加生成累减生成和级比生成14其 中 n 代表阶数1 通常代表时间变量个数在这里使用 gm(1,1)作为预测模型 gm(1,1)模型是对一次累加生成序列,.,3 , 2 , 1, )1 ( ntxx t =建立微分方程 8 uax dt dx =+ )1 ( )1( 2.4 记系数向量 t ua,=用最小二乘法对求解 m tt ybbb u a 1 = = 其中是原始序列,xm,.,x,xxym)() 3()2(= 矩阵b 为 + + + = 1)1()( 2 1 1)2()3( 2 1 1)1 ()2( 2 1 )1()1( )1()1( )1()1( m-xmx . xx xx b 2.5 解得后代入微分方程可知 )1 ( x序列在1+t时刻的估计值计算公式为 a u e a u xtx at +=+ ) 1 () 1( )1 ( 2.6 原始序列在1+t时刻的估计值为 ) 1 ()0(3210)() 1() 1( )1 ()1( xx,.,m, ,ttxtxtx=+=+ 灰色预测法具有要求运量数据少 不考虑变化趋势 运算方便 易于检验等特点15 主要针对航段月运量进行预测预测时间范围不超过一年灰色模型比较适合这种情 况并取得了令人满意的效果但是也存在一定的局限性 a数据离散程度越大即数据灰度越大则预测精度越差 b具有实际意义精度较高的预测值仅仅是最近的一两个数据对于后几天 的预测值将会有较大的偏差 c其微分方程指数解比较适合于具有指数增长趋势的运量指标对于具有其它趋 势的指标则有时拟合灰度较大精确度难以提高 4组合预测法 无论是传统的航空预测模型或是智能预测模型自身都具有不足和缺点将各种 预测算法优点的有机组合或许能有效的提高算法的预测能力组合预测法就是指对某 一预测对象采用各种可能适合模式分别拟和后对通过了检验的几种模型进行组合 用组合预测值作为最后预测值组合预测有两类概念一是指将几种预测方法所得的 预测结果选取适当的权重进行加权平均二是指在几种预测方法中进行比较选择 拟合优度最佳或标准离差最小的预测模型进行预测 组合预测方法是基于对信息最大利用为目的最优组合了多种单一模型所包含的 信息从而兼有多种模型局部的优点 a较强的适应能力由于是选取两种或几种与所要预测特点相关的预测算法相结 合进行预测所以这样得出的预测结果具有对环境变化的适应性 9 b几种预测算法比较之后所选择的拟合较好误差较少的算法进行组合从而未 来的预测结果也相对减少了误差精确度提高 在实际应用中组合预测算法需要进行多种算法比较多个算法进行拟合还不 像其他的算法那样形成系统的分析方法再对其他情景进行预测的时候往往需要重新 进行算法选择和拟合而且计算时间较长其在理论和实践方面尚有许多问题需要更 深入的研究与解决 2.2 熵权系数法熵权系数法 2.2.1 熵的概述熵的概述 熵在被提出之初(1854,clausis)是作为热力学的一个基本概念用来度量一个系统 中分子运动的混乱程度1948 年美国的通信工程师 shannon 在研究信息传输过程中不 确定性问题时提出了信息熵的概念将信息定义为不确定性的减少从而不确定性 可以通过熵来度量随后在 1957 年 jaynes 提出的极大熵准则以及 1959 年 kullback 提 出的极小交互熵准则更是极大地丰富了熵的运用开辟了熵研究与应用的新天地16 熵是一种不确定性的定量化度量考虑系统具有 n 个结果的概率试验并设这些 结果各自具有离散概率 pi (i=1,2,n)时,则该系统的熵为 1 ln n ii i epp = = 其中,pi满足 0=pi=1 1 1 n i i p = = 熵的基本性质是 可加性具有概率性质从而系统的熵等于其各个状态熵之和 非负性系统处于某状态的概率为 0=pi=1所以系统的熵总是非负的 极值性当系统状态为等概率即 pi=1/n (i=1,2,n)时其熵最大有 e=(p1,p2,pn)=e(1n,1n,1n)=lnn 系统的状态数 n 增大时系统的熵也增大但增 长的速度比 n 慢得多由此可以推断如果系统仅有一种状态且其概率 pi=1则系统的 熵 e(pi)=0说明系统没有不确定性即系统完全确定 对称性系统的熵与其状态出现概率 pi的排列次序无关信息熵是系统无序程度 的度量越小表示该系统确定度高信息量多系统熵与 pi,n 有关状态数 n 增大 系统熵也增大pi越接近系统熵越大提供给决策者信息量越少 目前在很多领域都渗透着熵的应用而且形成了专门的分析方法熵权系数法 特别是在研究多指标问题的过程中随着需要进行大量数据计算的多指标综合应用的 需求利用熵权系数法更快速地加以衡量便变得很重要 10 2.2.2 建模过程建模过程 熵权系数法系根据熵(entropy)的概念与性质把多指标决策评价中各待选方案的 固有信息和决策者的经验判断的主观信息进行量化综合建立基于熵的多指标决策评 价模型其特点是能够将系统中各评价指标与目前状况下相应评价指标的理想值进行 比较通过定量与定性相结合的一种较为理想的评价模型 根据熵的性质建立多指标决策评价模型其过程如下设用 n 个评价指标决策评 价 m 个待选方案首先计算二级指标的个体指数可以使用功效系数法先分别确定 各项二级指标的阀值然后计算其功效系数并作为每个指标的个体指数功效系数 d 的计算方法为 - - is i hi xx d xx =其中 xh 和 xs 分别为各项指标的满意值和不允许值 确定满意值和不允许值的基本原则是 以某项指标可能达到的最佳值为满意值 而以该项指标不应出现的最差值为不允许值实际操作时如果理论上的满意值和不 允许值难以确定可适当作处理 其一是以某项指标历史上曾达到的最佳值为满意 值而以该项指标曾出现过的最差值为不允许值 其二是以所有参评对象中某项指 标的最大值和最小值作为该指标的满意值和不允许值应该注意的是第二种方法中 对于正指标满意值是最大值不允许值是最小值对于逆指标则相反所以 功效系数为 对于正指标 min maxmin - - i i xx d xx =对于逆指标 max minmax - - i i xx d xx = 且这样得到的功效系数取值范围为0=di=1 1熵权系数法的基本原理 熵是系统无序程度的度量若系统可能处于多种不同状态每种状态出现概率为 pi (i=12m)时则该系统的熵就定义为 1 1 n j j w = = 显然当 pi = 1 /m ( i = 12m)时即各种状态出现的概率相同时熵取得最 大值为 max lnem= 现设有 m 个待评项目n 个评价指标形成原始指标数据矩阵 r=(rij)m*n 对于某个指标 rj 有信息熵 1 ln m ji ji j i epp = = 其中 1 / m i jiji j i prr = = 容易理解如果某个指标的熵ej 越小说明其指标值的变异程度越大提供的信 息量越多在综合评价中该指标起的作用越大其权重应该越大反之若某个指标 11 的熵ej 越大说明其指标值的变异程度越小提供的信息量越少在综合评价中起的 作用越小其权重也应越小故在具体应用时可根据各指标值的变异程度 利用熵 来计算各指标的权重利用各指标的熵权对所有的指标进行加权从而得出较为客观 的评价结果 2利用熵权系数法确定各指标权重的步骤 计算pij (第j个指标下第i个指标值的比重) 1 / m i jiji j i prr = = 其中rij为第j个指标下第 i个对应的指标值 计算第j个指标的熵值ej 1 ln m ji ji j i ekpp = = 其中k = 1 / lnmm为参加评比的算 法个数 计算权重wj (第j个指标的权重) 1 (1-)/(1-) m jjj j wee = = 其中n为指标的个数易见 0=wj=1 1 1 n j j w = = 在计算过程中给出的评价指标体系是具有层次的在确定权重时需要先确定 各二级指标的权重然后结合各项二级指标的功效系数利用加权算术平均法求得各一 级指标的指数再利用熵权系数 法确定各一级指标的权重最后对各一级指标对应的 指数加权平均即得综合评价指数假设通过计算得出第一个一级指标状况下各二级 指标的权重分别w11 w12 w1n 功效系数分别为d11 d12 d1n 则第一个一级指标状况的指数计算方法为d1=w11 d11 +w12 d12 + +w1n d1n 设 通过同样的计算方法得到其他一级指标的指数分别为d2 d3 dm n=m+1则 可以根据一级指标对应的指数通过熵权法确定它们的权重w1 w2 wm 最 后的综合评价指数的计算方法为d =w1 d1 +w2 d2 + +wm dm 2.2.3 模拟实现及算法评价模拟实现及算法评价 航空公司对具体航段进行实际预测时由于地区差异或特殊情况的存在运用单 一的预测方法预测运量可能导致在某时间或特定情况下出现较大误差现拟采取熵权 系数法将多种运量预测方法同时模拟并计算其权值的方法进行预测并将预测结果进 行整理形成新的模版以供相类似条件下的航段进行运量预测 12 获取历史数据 分别按所选预测算法计算当 月预测值 将预测值与历史实际值比较求绝对 差值作为当月此算法的一个指标 根据指标计算功效系数 计算指标系数的比重 计算权值 计算预测值 否 是否预测结束 图 2. 1 模型建立流程图 具体设计步骤现假设已知 20020304 年的数据资料其中 xab 为分别用算法 1算法 2 以及算法 3 预测出的当月值与实际值的绝对差额将其设定为一个指标 指标选择 算法 1 算法 2 算法 3 02 年 1 月 x11 x12 x13 03 年 1 月 x21 x22 x23 04 年 1 月 x31 x32 x33 a分别选取每一列的最大值和最小值计算各指标的功效系数为 对于正指标dab = (xab xmin)/(xmax xmin) 对于逆指标 dab = (xab xmax)/(xmin xmax) 且这样得到的功效系数取值范围为: 0=dab=1 b计算各指标系数的比重pab = dab/sum(dab) c计算权值wb = pab*ln(pab) (正指标的权值)逆指标的权值为1-wb d预测值t=w1*(算法 1 的预测值)+w2*(算法 2 的预测值)+w3*(算法 3 的预测值) 本节仿真实验在 matlab 环境下进行选取某航空公司成都到北京这条航段从 2002 年 1 月到 2004 年 12 月 36 个月份的运量数据作为学习和预测样本原始数据如表 2.1 所示可以看出2003 年 4 月5 月和 6 月的运量数据明显偏小将这三个月份的数 据参照往年的规律略加调整其他 33 个月份的样本数据均保持原样 13 表 2. 1 原始数据 年月年月 编号编号 运量运量 年月年月 编号编号 运量运量 2002.1 1 23467 2003.7 19 24802 2002.2 2 29537 2003.8 20 35817 2002.3 3 28673 2003.9 21 34990 2002.4 4 28606 2003.10 22 38927 2002.5 5 28943 2003.11 23 26205 2002.6 6 20970 2003.12 24 20758 2002.7 7 27168 2004.1 25 24632 2002.8 8 30902 2004.2 26 28529 2002.9 9 28482 2004.3 27 27808 2002.10 10 35585 2004.4 28 31653 2002.11 11 22478 2004.5 29 30309 2002.12 12 25069 2004.6 30 31014 2003.1 13 26554 2004.7 31 39399 2003.2 14 25574 2004.8 32 40531 2003.3 15 25617 2004.9 33 38658 2003.4 16 19332 2004.10 34 38722 2003.5 17 3634 2004.11 35 24692 2003.6 18 10623 2004.12 36 21128 按照建模过程在 matlab 中编写程序算法选取多项式拟合法季节指数法灰色 模型三种进行模拟分别输入原始值以计算此三种算法每月的预测值比较模拟结果 显示如图 2.2 所示 图 2. 2 模拟结果显示图 14 具体应用中可精确使用往届多年数据进行多次模拟比较最终根据显示结果 选取分别在某两个月份期间预测值与实际值最接近的算法可暂定在该月份用此算 法对未来进行预测从而将一年 12 个月均选取特定较好的算法用作模型 在航空运输领域由于航段运量受到多种因素的制约这些影响因素都可以归结 为指标的一种而且由于单一的预测方法只对特定的航段有较好的预测能力因此 将几种预测方法按指标的标准应用于熵权系数法中从而计算出的结果兼有了这几种预 测算法的优点由此可见熵权系数法也不失是一种比较简单有效的预测方法 a 兼有组合预测模型的特点 在设计指标过程中 可同时考虑使用多用预测方法 b过程简单模型相对容易可根据需要采取正指标或逆指标来进行计算预测 c预测结果可根据权值大小进行裁夺按照满意值和不满意值进行区分综合了 几种算法的优点相对的减少了误差 不过随着预测复杂程度的加深以及预测可变性的增大熵权系数法也日渐显露 出以下弊端 a在预测过程中要进行多个预测方法的选择使用和计算 b计算量较大指标的选取对预测的结果有一定的影响 c要求对往年的数据有一定的准确性在预测精度方面仍需进一步提高 2.3 神经网络算法神经网络算法 神经网络具有较强的逼近非线性函数的能力并具有自适应学习并行分布处理 和较强的鲁棒性及容错性等特点为解决未知不确定非线性系统的建模问题提供了一 种有效途径因此神经网络预测的研究已逐步成为预测方法研究的重要内容17神经 网络有许多不同的类型应用较多的是 bp 神经网络与 rbf 神经网络 随着 bp 算法的普及也日渐引起很多批评 主要集中在常不收敛或收敛于局部极 小即使收敛其速度也很慢这使得 bp 算法只能解决小规模的问题针对 bp 算法的 缺陷 很多人提出改进研究但大都没有摆脱 bp 算法思想框架的束缚梯度下降思想 18 目前神经网络在向纵深发展的同时也在与模糊技术遗传算法进化计算等 智能方法相结合 2.3.1 传统的传统的 bp 算法算法 神经元是神经网络操作的基本信息处理单元是神经网络的设计基础目前随 着研究的深入 出现了多维多层的神经元 为了描述方便 将神经网络简化为如图 2.3 15 i fai i p1 w r bpn p2 图 2. 3 人工神经元简化模型 其中p1p2.pr为神经元的输

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论