已阅读5页,还剩40页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 实时准确的交通流量预测是实现智能交通控制和诱导的前提与关键 也是智 能化交通管理的客观需要 目前的研究中 许多方法只是把序列数据当成一堆 纯 粹 的数据 把预测当成一种 从数据到数据 的纯数学过程 但进一步提高预 测准确率的主要途径却是从预测策略方面的研究 作为对 组合预测 策略的细化和深化 机理 辨识 预测策略比较全面地 考虑了复杂系统的结构知识和行为经验知识 本文研究其应用在短时交通流预测 中的几个基本问题 研究内容和结果如下 1 将 机理 辨识 预测策略应用到短时交通流预测中 讨论了 机理 辨 识 预测策略的基本结构 证明了实非线性动力系统的差分系统的l y a p u n o v 指 数保持不变 2 从统计学角度探讨了时间序列长度对预测准确率的影响 并分别用 a n n a r 方法对国内某快速路一天的交通流量实测数据进行数值实验 理论和 实验表明 随着序列长度增加 预测准确率的提高等价于正态分布样本标准差估 计的置信区间随样本容量的变化 它按照卡方分布方式提高 3 将数值天气预报中的e n s e m b l e 方法移植到短时交通流预测中来 并分别 用a n n 和a r 模型加以实现 并对e n s e m b l e 的次数和噪声强度对预测准确率的 影响进行了实验和探讨 实验表明 e n s e m b l e 预测提高了预测结果的准确率 研究表明 机理 辨识 预测策略以及d d d a s 提倡的模型评价后预测方式 是对预测策略的新的有益探讨 这些方法可以明显稳定地改善短时交通流预测的 可靠性和准确率 关键词 短时交通流预测 机理 辨识 预测策略d d d a se n s e m b l e a b s t r a c t t r a 布cf l o wf o r e c a s t i n gw i t hh i g l la c c u r a c yi st h ep r e m i s e sa n dk e yi nt r a f f i c c o n t r o la n dt r a f f i ca b d u c t i o ni ni n t e l l i g e n tt r a n s p o r t a t i o ns y s t e m i t s s o m er e c e n t s t u d i e sj u s tu s et h ed a t at ob ef o r e c a s t e da s o n l y d a t a w h i c ht a k ef o r e c a s t i n ga sa p u r e d a t at od a t a m a t h e m a t i c a lp r o c e s s h o w e v e r t h ec h i e fw a yt oi m p r o v et h e a c c u r a c yo ff o r e c a s t i n gm u s tb et h es t u d yo ns t r a t e g i e so ff o r e c a s t i n g a sa ni m p r o v e m e n to fc o m b i n e df o r e c a s t i n gs t r a t e g y t h eb a s i cp r o b l e m so ft h e m e c h a n i s mm o d e l i d e n t i f i c a t i o nm o d e l f o r e c a s t i n gs t r a t e g yw h i c hc a n c o m p r e h e n s i v e l yc o n s i d e rt h e s t r u c t u r ei n f o r m a t i o na n dh i s t o r i c a lb e h a v i o ro f c o m p l e xs y s t e m sa p p l y i n gi ns h o r t t e r mt r a f f i cf l o wf o r e c a s t i n gw e r es t u d i e di nt h i s d i s s e r t a t i o n t h em a i nc o n t e n t sa n dr e s u l t sa r e 1 a p p l i e d m e c h a n i s mm o d e l i d e n t i f i c a t i o nm o d e l t os h o r t t e r mt r a f f i cf l o w f o r e c a s t i n g w i t ht h ed i s c u s s i o n so ft h eb a s i cs t r u c t u r eo f m e c h a n i s mm o d e l i d e n t i f i c a t i o nm o d e l p r o v e dt h a tl y a p u n o ve x p o n e n to fd i f f e r e n t i a ls y s t e mo fr e a l n o n l i n e a rd y n a m i c a ls y s t e mk e e p st h es a m e 2 c o n s i d e r i n gt h ei n f l u e n c eo nf o r e c a s t i n ga c c u r a c yb yt h el e n g t ho f t h et i m e s e r i e st ob ef o r e c a s t e df r o mt h ev i e w p o i n to fs t a t i s t i c s u s e dt h em e t h o d so fa n n a r e t c t od on u m e r i c a lt e s t t h et h e o r ya n dr e s u l t so ft h ee x p e r i m e n t ss h o w e dt h a ta st h e l e n g t ho ft h es e r i e sg r o w s t h ea c c u r a c yo ff o r e c a s t i n gg r o w sa s t h a tt h es t a n d a r d d e v i a t i o ne s t i m a t i o no fc o n f i d e n c ei n t e r v a lg r o w sw i mt h ei n c r e a s eo fn u m b e ro ft h e s a m p l e sa c c o r d i n gt o 瓮zd i s t r i b u t i o n 3 t r a n s p l a n t e dt h ee n s e m b l em e t h o di nn u m e r i c a lw e a t h e rf o r e c a s t i n gi n t o s h o r t t e r mt r a f f i cf l o wf o r e c a s t i n g a n dt e s t e di tb ya n na n da rr e s p e c t i v e l yt og e t t h er e s u l t t h ep a p e ra l s oa t t e m p t e dt om a k ee x p e r i m e n ta n df u r t h e rd i s c u s so nt h e i n f l u e n c eo fn o i s ei n t e n s i t ya n dt i m e so fe n s e m b l eo nf o r e c a s t i n g sa c c u r a c y t h e n u m e r i c a lt e s ts u g g e s t st h a tt h ee n s e m b l em e t h o di m p r o v et h ea c c u r a c yo fs h o r t t e r m t r a f f i cf l o wf o r e c a s t i n g t h er e s e a r c hs u g g e s t st h a tu s i n g m e c h a n i s mm o d e l i d e n t i f i c a t i o nm o d e l s t r a t e g ya n dt h es t r a t e g yo fb e h a v i o r sf o r e c a s t i n ga f t e rm u l t i m o d e l se s t i m a t i o n s a d v o c a t e db yd d d a st of o r e c a s ts h o r t t e r mt r a m cf l o wi sab e n e f i c i a ln e w d i s c u s s i o no ff o r e c a s t i n gs t r a t e g y t h e s em e t h o d sc a l lo b v i o u s l yi m p r o v et h e c r e d i b i l i t ya n dt h ea c c u r a c yo fs h o r t t e r mt r a f f i cf l o wf o r e c a s t i n g k e yw o r d s s h o n t e r mt r a f f i cf l o wf o r e c a s t i n g m e c h a n i s mm o d e l i d e n t i f i c a t i o nm o d e l s t r a t e g y d d d a s e n s e m b l e 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的 研究成果 除了文中特别加以标注和致谢之处外 论文中不包含其他人已经发表 或撰写过的研究成果 也不包含为获得墨壅盘鲎或其他教育机构的学位或证 书而使用过的材料 与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示了谢意 学位论文作薯签名 王 锾觐 签字日期 上 0 1 年 月c p 日 学位论文版权使用授权书 本学位论文作者完全了解鑫叠盘堂有关保留 使用学位论文的规定 特授权鑫鲞盘堂可以将学位论文的全部或部分内容编入有关数据库进行检 索 并采用影印 缩印或扫描等复制手段保存 汇编以供查阅和借阅 同意学校 向国家有关部门或机构送交论文的复印件和磁盘 保密的学位论文在解密后适用本授权说明 学位论文作者签名 王 胃桅导师签名 签字日期 j d 7 午6 月r 扩日 柄乙觎 签字吼爿年占胂日 天津大学硕士学位论文公路交通流预测中 机理 辨识 策略的若干基本问题 第一章绪论 1 1 短时交通流预测及其研究意义 智能交通系统 i n t e l l i g e n t t r a n s p o r t a t i o ns y s t e m i t s e l 前尚无公认的定义 这一方面是因为 不同的研究者从不同的角度考虑 对智能交通系统的认识不同 另一方面 智能交通系统本身正处于迅速发展时期 其内涵和外延都处于发展变 化之中 美国i t s 手册2 0 0 0 年对智能交通系统给出了如下定义n 1 智能交通系统 i t s 由一系列用于运输网络管理的先进技术以及为出行者 提供的多种服务所组成 i t s 技术的基础是以下三大核心要素 信息 通信和集 成 信息的采集 处理 融合和服务是i t s 的核心 无论是提供交通网络的实时 交通状态的信息 还是为制定出行计划提供在线信息 i t s 技术能使管理者 运 营者以及个体出行者变得更为消息灵通 相互间能够更为协调 做出更为智能化 的决策 中国智能交通系统体系框架研究报告中对智能交通系统给出了如下定义m 1 在较完善的基础设施 包括道路 港口 机场和通信等 之上 将先进的信 息技术 通信技术 控制技术 传感技术和系统综合技术有效地集成 并应用于 地面运输系统 从而建立起大范围内发挥作用的 实时 准确 高效的运输系统 i t s 的主要内容瞳1 先进的交通信息服务系统a t i s 先进的交通管理系统a t m s 先进的车辆控制和安全系统a v c s s 先进的公共交通系统a p t s 营运车辆运行管理系统c v o 电子收费系统e t c 紧急救援管理系统e m s 交通流预测是指在t 时刻对下一决策时刻t 芒乃至以后若干时刻的交通 流作出实时预测 一般认为at 即预测时间跨度不超过1 5 m i n 乃至小于5 m i n 的 预测为短时 s h o r t t e r m 交通流预测怕1 交通流量预测在各种交通控制系统中有相当重要的作用 主要体现在 1 在城市集成交通控制系统中的信号控制子系统和动态导引子系统的前提 第一章绪论 是准确的交通参数的预测 2 智能交通系统中的营运车辆运行管理系统 先进的交通管理系统等子系 统以及自动高速公路系统的网络层和连接层对流量等参数进行控制也需要对数 据进行预测 交通控制和交通诱导是智能交通系统的重要组成部分 交通流量预测结果的 好坏直接关系到交通控制与诱导的效果 实时准确的交通流量预测是实现智能交 通控制和诱导的前提与关键 也是智能化交通管理的客观需要 所以智能交通系 统中的交通流短时预测越来越受到重视h 1 1 2 国内外研究发展现状 目前广泛应用的交通流预测的研究模型与方法主要有两类怕1 一类是以数理统计和微积分等传统数学和物理方法为基础的预测模型 包括 时间序列模型 卡尔曼滤波模型 参数回归模型 指数平滑模型等 一类是以现代科学技术和方法如模拟技术 神经网络 模糊控制为主要研究 手段而形成的预测模型 其特点是所采用的模型和方法不追求严格意义上的数学 推导和明确的物理意义 而更重视对真实交通流现象的拟合效果 包括非参数回 归模型 基于小波理论的方法 基于多维分形的方法 支持向量机 谱分析法 状态空间重构模型和多种与神经网络相关的复合预测模型等 其中 历史平均模型 时间序列模型 神经网络模型和非参数回归模型是当 前应用较多的 每种方法在进行预测时 都有各自的优缺点 到目前为止 还没 有哪 种方法能进行最好的预测 正因为上述原因 近年来组合预测越来越受到重视 组合预测是将不同的预 测方法进行适当的组合 以便综合利用各种预测方法所提供的信息 尽可能的提 高预测准确率 1 其基本思想就是先采用多个具体的单一模型来预测并得到各自 的预测结果 再将这些预测结果合成一个比较好的结果 其中优化权重的 简单 平均法 简单实用 往往比许多复杂的组合方法效果要好 口3 但在目前的研究中 许多方法并没有利用好产生时间序列的复杂系统结构信 息 只是把时间序列当成一堆 纯粹 的数据 造成预测成为一种 从数据到数 据 的纯数学过程啊1 从未来的发展趋势看 先从预测机理的角度将若干预测模 型进行组合后预测 比组合预测效果更好嘲 同时 预测也不将仅仅是研究时间 序列数据 并且对交通流采样间隔 可预测性的研究也越来越得到重视 这个指 导原则也意味着时间序列分析理论和统计学之间的结合n 们 2 天津大学硕士学位论文公路交通流预测中 机理 辨识 策略的若干基本问题 1 3 本文的主要工作 针对快速路短时交通流量的变化特点 将 机理 辨识 预测策略应用到短 时交通流预测中 并通过数值实验对实测数据进行仿真验证 机理 辨识 预 测策略的主要原理是首先研究已知的序列的结构化信息 机理模型 然后对已 知因子进行回归分析 再通过辨识模型进行预测 本文的主要研究内容如下 1 将 机理 辨识 预测策略应用到短时交通流预测中 讨论了 机理 辨 识 预测策略的基本结构 证明了实非线性动力系统的差分系统的l y a p u n o v 指 数保持不变 2 考虑时间序列长度对预测准确率的影响 并分别用a n n a r 方法对国 内某快速路一天的交通流量实测数据进行数值实验 理论和实验表明 随着序列 长度增加 预测准确率提高的等价于正态分布样本标准差估计的置信区间随样本 容量的变化 它按照卡方分布方式提高 3 将数值天气预报中的e n s e m b l e 方法移植到短时交通流预测中来 并分别 用a n n 和a r 模型加以实现 在e n s e m b l e 预测中 对交通流实测数据 将一定 强度的高斯白噪声 均值为0 进行刀次噪声叠加 分别进行预测 得到n 个 预测结果 再对这刀个预测结果进行统计 得到预测结果 并对e n s e m b l e 的次 数和噪声强度对预测准确率的影响进行了实验和探讨 第二章短时交通流的智能预测方法简介 第二章短时交通流的智能预测方法简介 2 1 预测策略的发展阶段 从预测方法的基本思想来看 时间序列预测策略到目前有两个发展阶段 第一阶段是采用单一模型的预测 例如历史平均模型 时间序列模型 神经 网络模型和非参数回归模型等 对同一问题采取不同的单一预测模型时 不同的 预测方法往往能够提供不同的有用信息 组合预测概念的提出可以看作是预测方法的基本思想的第二个发展阶段 1 9 6 9 年j m b a t e sa n dc w j g r a n g e r 对组合预测方法进行了比较系统的研究 首次明确提出了组合预测的概念 目前广泛应用在各种时间序列预测中的组合预 测是单一模型预测结果的直接加权组合 其主要出发点是 不同方法的预测结果 一般都有差异 应设法在这些预测结果的基础上综合判断 给每个预测模型赋予 不同权重 由此得到一个预测效果更好的综合模型 组合预测的具体算法思想为 对于某一预测问题 在某一时间段内的实际值 为y t f 1 2 3 刀 组合预测值为夕 f 1 2 3 以 假设 为第i 种方法的第 t 个预测值 f 1 2 3 m t 1 2 3 玎 第m 种预测方法的权系数为 c o 1 2 3 m e l 为第i 种方法的第t 个预测值的预测误差 则 e i 2y f x t t 占 力2 乞 q h p j r t 1 晶 y f2 乙c o l x l l 其中对不同模型预测结果进行简单的平均的 简单平均法 在实际预测尤其 是时变环境下往往变现出良好的性能 2 2 概率化预测 在当前的研究中 概率化预测越来越得到重视 常规的复杂时间序列预测只 是给出一个确定的数值 其缺点是无法确定预测结果可能的波动范围 某些传统 的预测方法中 从概率论中置信区间分析的角度 可以给出一个 喇叭型 伸展 的带状区域 使得未来数据的预测有一个大致的变化范围 4 天津大学硕士学位论文1 公路交通流预测中 机理 辨识 策略的若干基本问题 概率化的预测已经普遍用于各国的数值天气预报的e n s e m b l e 技术中 其中 初值扰动问题是主要的研究难点阳 在当前应用的预测策略和方法中 已普遍使用了 模式识别与智能技术 2 3d d d a s 简要介绍 复杂系统行为的精确分析和预测是非常困难的 甚至相当精细的系统模型产 生的仿真仍有可能不能正确地预测目标系统的真实行为 这种情况在实时动态条 件下显得更为突出 为此 美国自然科学基金 n s f 提出了动态数据驱动应用 系统 d d d a s d y n a m i cd a t ad r i v e na p p l i c a t i o n ss y s t e m s n s f 在其信息技术 研究 i t r 专项经费的支持下 在2 0 0 0 2 0 0 4 年期间资助了多个d d d a s 相关 项目的研究 自2 0 0 5 年起 n s f 开始为d d d a s 提供专项资助 由于d d d a s 的研究需要多学科的支持 d d d a s 在n s f 中被定性为横向类的项目 并促使了 多个管理局和代理处的共同参与n 钉 n s f 对d d d a s 给出的定义是 一种新的协作应用和测量系统模式的研究 在这种模式下 仿真运行能够接受并动态响应注入到应用中的新数据 同时 相 反地 这些应用系统也具有动态控制测量过程的能力 o 幻 d d d a s 动态地集成了解决需求问题的计算的和实验的测量方法 在广泛的 科学和工程应用领域创造了新的性能 d d d a s 的计算性能在不同层次的计算机 平台上实现 包括计算机网络 超级计算机 中规模计算机群 分布式的 高数 据流量的计算环境 高端工作站和传感器网络 因此 d d d a s 研究的核心是计 算科学和工程 高端计算 测量方法以及相应的网络基础设施n d d d a s 是一个将应用 仿真和测量合成为一个共生反馈控制系统的范例 d d d a s 能够动态地将输入的数据合并处理到一个可执行的应用软件 反过来 该软件具有能够动态地引导操纵观测过程的能力 这些能力保证了更准确的分析 和预测 精确的控制 以及更可靠的输出n d d d a s 系统的动态适应性体现在以下几个方面 能够适应来自传感器或其 它测量设备的动态数据变化 能够适应计算需求的变化 能够有效地进行优化决 策 以调整系统结构或配置 并将仿真结果及时地反馈给实际系统 d d d a s 目前在工程科学的应用主要有 系统的组合描述方法 系统的细节 的多尺度模型 混沌和分形 系统建模 异步数据采集 精确度不同的数据合成 等等 其在仿真与测量的融合 工程优化设计 控制与预测 应急管理等领域也 正在得到广泛的推广 在n s f 的资助计划中 d d d a s 在智能交通管理中将得到广泛应用 第二章短时交通流的智能预测方法简介 2 4 短时交通流预测中的智能方法与技术 短时交通流预测的方法很岁3 卜35 州2 1 下面简要介绍以下几种常见的和本文 用到的智能预测方法旧1 主要包括历史平均模型 人工神经网络 a 卜跗 方法 时间序列预测法 非参数回归方法等等 2 4 1 历史平均模型 历史平均模型的算法基于这样一个假设 一个点的交通流量是遵循一定的规 律的 它是以一天为周期重复再现的 它把简单的历史上 时刻的平均流量作为 当前t 时刻的流量预测值 算法定义为 v n e w 伽 1 一a v o l d 2 1 式中v n e w 代表某路段在一定时间间隔内的待预测的交通流量 v o l d 代表 该路段在一定时间间隔内的上一时刻的交通流量 v 为最近观察到的该路段在一 定时间间隔内的交通流量 口为平滑系数 s t e p h a n e d e s 于1 9 8 1 年开始将历史平 均模型应用于城市交通控制系统中 历史平均法算法简单 参数可以用最小二乘法 l s 在线估计 可在一定 程度内解决不同时间 不同时段里的交通流变化问题 但在静态的预测上表现不 好 因为它不能反映动态交通流基本的不确定性与非线性特性 尤其无法克服随 机干扰的影响 2 4 2b p 神经网络方法 多层前向反馈式神经网络是目前应用比较广泛的人工神经网络 其中b p 算 法是最著名的多层前向反馈式神经网络训练算法 早在1 9 8 2 年 r u m e l h a r t m c c l e l l a n d 及他们的同事成立了研究小组并于1 9 8 5 年发展了b p 网络 b a c k p r o p a g a t i o nn e t w o r k 学习算法滔一引 k o l m o g o r o v 等人从理论上证明了三层网络模型对于非线性系统有较好的建 模能力 任一连续函数或者映射都可以由一个三层神经网络实现 即一个输入层 一个隐含层 一个输出层 一般所采用的网络响应函数为 f x 专 2 2 g o r m a n 指出隐层神经元数j 与模式数 的关系是 s l 0 9 2 n k o l m o g o r o v 定 理表明 隐层神经元数s 2 n l0 为输入层节点数 等等 但实际上隐层节点数 仍需要根据实际情况和经验来决定 6 天津大学硕士学位论文公路交通流预测中 机理 辨识 策略的若干基本问题 石二1 输入层i 1 隐含层七输出厨 图2 1 三层b p 神经网络结构图 三层b p 网络的结构如图2 1 所示 x x 0 x l 工剃 7 工 r 为输入向 量 隐层髓个神经元 一 r f 工 o r l 一 打 i 7 输出神经元y r y y o y l 一1 r 输入层与隐层之间的权值为 阈值为岛 隐层与输出层 间的权值为 阂值为岛 那么隐层神经元的输出满足 n 工 一嘭 2 3 输出层神经元的输出满足 里兰 y l 厂 一q 2 4 k 0 网络关于第p 个样本的误差测度 2 5 e p z c v 一o t 2 j l b p 神经网络的学习过程由模式的正向传播和误差反向传播所组成 在正向 传播过程中 输入信息经隐层神经元逐层处理并传向输出层 如果输出层不能得 到所期望的输出 则转入反向传播过程 将实际值与网络输出之间的误差按原来 的联结通路返回 通过修改各层神经元间的权重使误差减小 然后再转入正向传 播过程 如此反复计算 直到误差小于设定值为止 由于b p 网络的每次训练及其权值的修正都是针对样本的一个模式 也就是 说该次权值的修正对某个特定的样本肯定是朝着误差减少的方向进行的 而对于 另外的样本就不一定了 很可能反倒使样本的全体误差增加 这样就导致了网络 训练时间的增长和收敛速度的减慢 在学习次数很多的情况下 b p 网络的训练 非常耗时 现在的应用中 为解决b p 网络学习速度缓慢的问题 常加入一冲量刁 它也需要经验试凑 b p 网络具有很强的自学习和复杂的非线性函数拟合能力 很适合于时间序 列预测问题 是在短时交通流预测上得到认可的实用预测方法之一 7 第二章短时交通流的智能预测方法简介 2 4 3 时间序列预测法 时间序列分析是概率统计学科中应用性较强的一个分支 在金融经济 气象 水文 信号处理 机械振动等众多领域有着广泛的应用 时间序列模型最主要的 特征就是承认观测值之间的依赖关系和相关性 它是一种动态模型 能够应用于 动态预测 8 侧 传统的应用范围较广的时间序列分析方法是由美国著名的统计学专家b o x 和 英国的j e n k i n s 于1 9 7 0 年提出的a r i m a 自回归求和滑动平均 方法 也称为 b o x j e n k i n s 法 它是一种理论比较完善的时间序列预测方法 实际经验已经证 明 b o x j e n k i n s 法是一种精度比较高的短期预测方法 常用的时间序列模型有自回归模型 a r 模型 滑动平均模型 m a 模型 自回归滑动平均模型 a r m a 模型 和自回归求和滑动平均模型 a r i m a 模型 1 a r 模型 自回归模型 p 阶自回归模型a r p 的解析式为 y f 办y f l 矽p f 一 口 占f 2 6 自回归模型的物理意义为 现在值乃可由过去值的加权值的有限线性组合及 一个干扰量毛来表示 其中p 是模型的阶数 砚 妒 为相应阶数观测值的系数 毛为白噪声序列在t 时刻的值 a r 方法简单易用 只要知道待预测问题的历史数据记录即可 而且稳健性 较好 2 m a 模型 动平均模型 与a r 模型不同 动平均模型 m a 理论假设干扰的影响在时间序列中只表现 在有限的几个连续时间间隔内 然后就完全消失 而a r 模型干扰的影响是在无 限长的时间内存在的 即一个初始时刻的干扰将会影响到未来无限长时间内的观 测值 口阶m a 模型的数学表达式为 只 o i e 一i 一吃乞1 2 7 其中q 称为模型的阶 常数系数q 占 占 为回归系数 3 a r m a 模型 自回归一动平均模型 自回归模型主要是应用有限项过去观测值及现时干扰 来确定模型的现时 值 而动平均模型是利用现时干扰与过去干扰的有限项来确定模型的现时值 假 如把这两类模型结合起来 就得到另一类型的模型 即a r m a 模型 其解析式为 y 噍y f 1 i 允y 一p 占 q t l 色 一g 2 8 天津大学硕士学位论文 公路交通流预测中 机理 辨识 策略的若干基本问题 实际上令p 0 q 0 得到的a r m a o q 就是m a q a r m a p 0 就是 a r p 4 a r i m a 模型 累积式自回归一动平均模型 累积式自回归一动平均模型的含义是 如果对原序列经过d 次差分运算后得 到的新序列的模型为a i m a 匆 模型 那么原序列的模型即是a i i k l a 向西矽模 型 其数学表达式为 彳 b v 4 少 f c b e t 2 9 其中a 例即a r 模型 f 例即m a 模型 且是后移算子 v d 1 一口 d 是d 阶差分 该模型不但可以用于平稳时间序列 还能适用于非平稳随机时间序列 并将 非平稳随机过程中的平稳随机变化包含在模型中 这些模型考虑因素较为简单 参数一般用最小二乘法或似然估计法进行在线 估计 相对而言 计算简便 易于适时更新 便于应用 但由于这些模型无法反 映交通流的不确定性与非线性特性 抗干扰能力差 2 4 4 非参数回归法 非参数回归是近几年兴起的一种适合不确定的 非线性的动态系统的非参数 建模方法 它不需先验知识 只需足够的历史数据 寻找历史数据中与当前点相 似的 近邻 并用那些 近邻 预测下一时刻值 因此 预测结果要比参数建 模精确 特别是在有特殊事件发生时 1 9 9 1 年 d a v i s 和n i h a n 将其应用于交通流预测中 1 9 9 5 年s m i t h 又将之应 用于单点短时交通流预测 但因其搜索 近邻 点的速度太慢和试凑的参数调整 方法而没有得到真正实用 随后人们又提出了很多的改进办法 比如采取基于密 度集 的变搜索算法 基于动态聚类和散列函数的历史数据组织方式 经过改进 可明显提高算法速度 非参数回归的四大要素是 历史数据的准备 状态向量的选取 相似机制的 选取或近邻机制的选取和预测函数的选取 非参数回归作为一种无参数 可移植 高预测准确率的算法 它的误差比较小 且误差分布情况良好 在非参数回归方法中 大量应用了 模式识别与智能技术 2 4 5 四种重要预测模型的比较 交通流过程的复杂性和不确定性决定了准确的交通流预测不是单一的模型 9 第二章短时交通流的智能预测方法简介 或方法所能解决和完成的 各种预测模型在具体的情况下各有其优缺点 各有其 适用范围和应用条件 至今还没有任何一种算法能够表现出对其它所有算法的绝 对优越性能 在下表中 分别比较了各种常用模型的优点和缺点 表2 14 种主要预测模型的性能比较 模型优点缺点 历史平均模型 模型简单 算法速度快 无法应对随机性 时间序列模型技术成熟 准确率较高 对非线性 非平稳序列效果 鲁棒性好 不好 神经网络模型适合复杂 非线性条件 训练过程复杂 没有明确的物 拟合准确率高理意义和数学模型 参数选取具有一定随机性 非参数回归模型不需先验知识 预测准确率高寻找近邻的算法通常比较复杂 2 5 数据挖掘技术在交通流预测中的应用 数据挖掘 d a t am i n i n g d m 的任务就是提取隐含于数据库等数据源中未知 的 有用的 不一般的 即不像总和 平均值之类的普通信息 信息或知识 数据挖掘是数据库中知识发现 k n o w l e d g ed i s c o v e r yi nd a t a b a s e k d d 过程 中的一个特定步骤 它用专门算法从数据中抽取模式 p a t t e r n 基于数据库的知 识发现被认为是从数据中发现有用知识的整个过程 它始于上世纪8 0 年代末期 数据是数据挖掘的来源 这些来源包括数据库中的数据 数据仓库中的数据及网 络数据 数据挖掘的结果是概念化的知识 经过1 0 多年的发展 国际上典型数据挖掘的方法和技术主要有6 大类 1 归纳学习方法 包括信息方法 决策树方法 集合论方法 2 仿生物技术方法 包括神经网络方法 遗传算法 3 公式发现 包括物理定律发现系统 经验公式发现系统 4 统计分析方法 5 模糊数学方法 6 可视化技术 在工程实际中 上述6 种方法通常必须综合使用 才能解决问题 在智能交通系统的交通控制和交通诱导中 均需要从现有的有限数据中 进 行数据挖掘 得到交通流的特征规律或知识 并进行交通流预测 大量的观测已 经发现 车辆的到达具有随机性 应用概率统计理论挖掘交通流特征规律是可行 l o 天津大学硕士学位论文 公路交通流预测中 机理 辨识 策略的若干基本问题 的 数据挖掘的统计分布方法为研究交通流特性提供了定性分析和定量分析的技 术手段 目前 交通流数据挖掘经常采用的统计模型为泊松分布和负指数分布 通常情况下 人们用泊松分布规律来描写交通不拥挤时的统计特性 交通拥 挤时车辆自由行驶机会少 受到约束 这时交通流具有较小方差值 符合二项分 布 5 2 6e n s e m b l e 预测方法简介 作为当今普遍使用的天气预报的数值预报方法 e n s e m b l e 预报的基本思想 如下 由于大气是一个高度非线性的复杂系统 气象分析资料永远只是实际大气的 一个可能的近似值 而实际大气的真正状态永远也不可能被完全精确地描述出 来 将 原始实际观测值 作为初值求解天气预报方程 只能得到一个单一的预 报值 除了这一个 可能的 预报值以外 这个预报值的可信度有多大 即所谓 可预报性 的预报 以及所有可能出现的未来状态有哪些都难以确定 为解决 这一问题 1 9 6 9 年e p s t e i n 先在理论上提出了动力随机预报 1 9 7 4 年 l e i t h 提 出了 蒙特卡罗 预报 m o n t ec a r l of o r e c a s t i n g 经典的e n s e m b l e 预报基本上 就是基于蒙特卡罗预报概念的 为要找出所有可能的解 首先要估算出初值中误差分布的范围 根据这一范 围 就可给出一个初值的集合 在此集合中的每一个初始场都有同样的可能性代 表实际大气的真实状态 从这一初值的集合出发 我们就可相应得到一个预报值 的集合 这一方法 就是所谓的 e n s e m b l ep r e d i c t i o n 当前先进的e n s e m b l e p r e d i c t i o n 系统中不但考虑初值的不确定性 而且把数值模式中物理过程的不确 定性也同时考虑进去了 数值天气预报可以看成是动力系统 解析方程 的初值 问题 如果描述天气的解析方程是比较合适的 那么由各地气象台站上报的天气 因子的观去测值 就是对未来天气预报的初值 但是 由于各种原因 这些上报 的天气因子的观测值 只能是真实历史天气的一个近似值 由于大气的方程是对 初值敏感的 因此初值的近似性是导致天气预报失误的重要原因之一 在一个由 观测得到的初值上增加一定的扰动 形成多个 接近实际天气状况的近似初值 分别进行多次预测 然后再合成为一个概率化的预报 就是e n s e m b l e 预报方法 的核心思想n 第三章复杂时间序列中的 机理 辨识 预测策略 第三章复杂时间序列预测的 机理 辨识 策略 3 1 组合预测当前的特 性和问题 组合预测 c o m b i n a t i o nf o r e c a s t i n g 或c o m b i n e df o r e c a s t i n g 在国内也称为结 合预测 综合预测或复合预测 1 9 5 4 年 美国人s c h m i t t 就研究过组合预测方法的 简单应用 1 9 6 9 年j m b a t e sa n dc w j g r a n g e r 对组合预测方法进行了比较系统 的研究 首次提出了组合预测的概念 从目前的各种研究来看 使用简单平均法的简单组合往往比复杂组合要好 简单平均法对个单项预测给予同等重视 忽略单项预测的相对性能及相关特征 虽然在理论上具有很大的局限性 但在实际预测尤其是时变环境中却往往表现出 良好的性能 m a k r i d a k i s 1 9 8 4 在利用所收集的1 0 0 1 组经济时间序列进行预测方 法比较时得出结论 对于大多数不同类型的序列 组合预测相对于单项预测都取 得了更好的预测效果 并且简单平均法较b g 组合具有更好的性能 m a k r i d a k i s 和w i n k l e r 1 9 8 3 进一步考察了增加单项预测数目对简单平均法性能的影响 研 究表明 同数量单项预测的各种简单平均的平均预测准确率随单项预测数的增加 而提高 而且 预测准确率的方差随单项预测数目的增加迅速下降 下降速度远 高于平均效果和有限总体效果所决定的速度 因此c l e m e n 1 9 8 9 和m a k r i d a k i s 1 9 8 9 建议增加取自不同信息来源的单项预测 然后简单平均 为什么简单平均有效 在什么情况下比其它方法更有效 h 1 简单平均 法具有无偏性 鲁棒性 l i l i a n 和d e r e k 认为 既然只有 好 的预测方法才可 以应用到组合预测中去 各种单一模型之间的预测方差不应该相差太大 在这 种情况下 采用简单平均往往比复杂组合效果要好n6 1 p a l m 和z e l l n e r 建议在 小样本情况下 使用简单平均法 在大样本情况下 使用最佳组合n n e w b o l d 和g r a n g e r 认为先将单一预测模型进行组合 再进行结果合成的 c o m p o s i t e m o d e l 比直接进行结果合成的 c o m b i n e dm o d e l 要好 而传统的 趋势 季节 残差 预测方法虽然颇有争议 但仍得到广泛的应用悖1 3 2 机理 辨识 预测策略 一般而言 预测的两类方法是 机理模型 和 辨识模型 机理模型是因 1 2 天津大学硕士学位论文 公路交通流预测中 机理 辨识 策略的若干基本问题 果的 它由系统的各部件的输入输出关系来综合得到 它从物理机制上揭示了系 统中诸多因素间的变化规律 往往具有很强的预测能力 即使是确定性混沌行为 也具有短期的预测能力 但是对于复杂系统 如交通流 找到其确定性机理模型 的可能性是较小的 作为经验预测的一种具体方法 辨识预钡僦成为预测的主要 手段 如时间序列 人工神经网络 支持向量机 混沌预测等 通过对大量的较为全面的国内外短时交通流 电力短期负荷 厄尔尼诺预测 文献的学习和思考 我们于2 0 0 6 年提出了 机理 辨识 预测策略 机理 辨识 预测策略的基本方法是 1 研究已知的序列的结构化信息 机理模型 2 对已知因子进行回归分析 3 对上两类预测的残差再进行辨识模型预测 预测的 机理 辨识 策略的主要特征有 1 是 机理 辨识 两阶段预测 机理阶段主要考虑了已知影响因子的作用 辨识阶段再通过辨识模型对残差进行经验预测 2 模型评价 在复杂系统预测中 建议对预测中采用的多个模型的表现 预 测结果 进行评价 如 平均误差 代表预测的系统误差 平均绝对值误差 最大误差 重要数据的预测误差 如对最大值 最小值 特定数值等 等 进行统计考核 以确定该模型在多模型合成中的地位和作用 3 预测结果的灵活合成 根据对系统将来行为的预测目的 根据各模型的 预测表现 由控制误差的关键量 采用灵活的多套预测值的合成 以期在人们最 感兴趣的未来行为预测中得到最优效果 4 概率化预测 由于采用了灵活的多模型预测 可以用一定的方法把这些 预测结果的概率统计性质 用概率的方法表示 使得对预测结果的风险进行更准 确和科学的评估 5 非平稳数据的平稳化技术 通过 机理 辨识 策略 以及差分等技术 实现非平稳数据的平稳化 提高辨识预测的准确率 6 1 预测准确率上限和可预测性研究 在 机理 辨识 预测策略的第一阶段 对系统的预测准确率上限和可预测性进行研究 在 机理 辨识 预测策略的 2 3 和 4 阶段中 将普遍使用 模式识别 与智能技术 3 3 预测方法的稳健性 探讨预测误差形成机理 是可靠地提高复杂时间序列预测准确率的主要途 第三章复杂时间序列中的 机理 辨识z 预测策略 径 对复杂时间序列 辨识预测的基本结构如图3 1 所示 建立预测方程往往需 要回归分析 从数值计算角度看 矩阵奇异性和实际问题中难以避免的噪声 是 影响预测结果的两类主要原因 奇异性和噪声共同作用的结果是 不仅降低了预 测方程的稳健性 还放大了初值中噪声对预测结果的不利影响 图3 1 奇异性和噪声 降低预测方程的稳健性 放大初簿中噪声引起的预测误差 因此 提高预测结果可信性的基本途径是 首先提高预测方程的稳健性 然 后降低初值中的噪声对预测结果的不利影响 其数学实质是降低数值计算中矩阵 奇异性的不利影响 3 4 预测准确率上限与噪声的关系 从特定观测数据 时间序列 中识别白噪声的正确的分布函数是一个困难问 题 但却是有重要的理论和应用意义的问题 从预测理论的角度看 首先 不同的时间序列 预测的准确率上限是不同的 观测数据中的噪声以 及混沌等非线性因素 使得不同的时间序列有不同的预测准确率上限 第二 通过多种方法预测后进行残差的分析以确定优化模型与参数的传统方 法 难以找到最优的预测 这种途径得到得是预测上限的 构造性 结果 实际 中一般低于真正的预测上限 如对于复杂时间序列 最佳线性预报尽管是可靠和 稳健的 但一般不是最佳预报 第三 如果某预测方法的残差是白噪声 就可以认为是最佳预测 但对于小 样本 白噪声的检验还不完备 包含了失误的可能性 如一般小于5 0 个数据的 样本 实际中难以可靠判断是否是白噪声 第四 一些先进的预测方法 如时间序列中的e n s e m b l e 预测 要求预先对 1 4 天津大学硕士学位论文 公路交通流预测中 机理 辨识 策略的若干基本问题 观测数据中的白噪声强度有一定程度的估计 因此 从观测数据中直接估计白噪声强度的问题 即预测准确率上限的 存 在性 研究 对于预测理论与应用都是重要的 3 5 非线性动力系统的差分系统性质研究 下文证明 一般地 非线性动力系统的差分仍然是动力系统 且l y a p u n o v 指数保持不变 埔1 考虑如下一维实离散动力系统 为 x 州 f x 3 一1 这里疗
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 粉饼清仓活动方案
- 粮食双拥活动方案
- 红色物件活动方案
- 百货公司年底活动方案
- 红牛换胎活动方案
- 精致露营招募活动方案
- 线上教学课程活动方案
- 病房夏季活动方案
- 红色春节活动方案
- 线上免税活动方案
- 古诗文默写-中考语文专项复习(湖北专版)(带答案)
- 影视部岗位职责
- 水龙头常用英文词汇
- 《病理心血管疾病》课件
- 房屋拆迁补偿合同范本
- 分红股东合伙协议书范本
- 北师大版八年级物理上册期中考试及答案【可打印】
- 挖掘铲运和桩工机械司机-国家职业标准(2023年版)
- 2024智能网联汽车自动驾驶功能仿真试验方法及要求
- 第一单元测试 高中日语华东理工版新编日语教程1
- GB/T 8492-2024一般用途耐热钢及合金铸件
评论
0/150
提交评论