已阅读5页,还剩71页未读, 继续免费阅读
(计算机应用技术专业论文)基于时间序列模型的化工设备状态的预测应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 基于时间序列模型的化工设备状态的预测研究 摘要 故障预报和预警是2 0 世纪后期才发展起来的一个新兴的研究方向, 也是当前预测控制理论研究的热点之一。随着对系统可靠性和安全性要求 的进一步提高,人们希望能够在故障对系统的危害显现之前就能够更加准 确的预测故障发生的有关信息,由此提出了对故障预报更加严格的要求。 目前故障预报研究进展较为缓慢,基于时间序列预测的方法是现有的主要 预报方法。本文分析了在时间序列预测领域中应用比较广泛的几种基础的 方法,比较了它们在预测中的应用范围和各自的优劣,并在这基础的方法 上提出了改进。结合当今预测领域新兴的数据挖掘思想,介绍了国外一种 新的预测方法,并将上述预测方法和化工监测诊断系统相结合。本文着眼 于预测模型的实际应用,主要工作如下: l 、总结并分析了时间序列预测领域中应用最广泛的自回归一滑动平均模 型( a r m a 模型) ,并针对其在定阶中的存在的模糊性和人为判定的情况, 本文在实际应用中采用了f 检验逐步自动定阶的方法,避免了a r m a 模 型定阶中所遇到的问题,实现了数据处理、模型定阶和状态预测的实际应 用。 2 、针对基础的e l m a n 神经网络,本文基于已有的神经网络思想,改进了 其网络的内部结构,即在基础的e l m a n 神经网络的承接层增加一个自反 馈,增强了e l m a n 神经网络的动态跟踪性能。 i 北京化工大学硕士学位论文 3 、本文把时间序列序贯学习的思想引入e l m a n 网络的在线建模过程中, 实现了网络在线学习,通过时间窗的推移,不断地利用新采集数据对网络 进行训练,提高了网络的建模效率和对真实数据的跟踪和拟合能力。 4 、针对故障样本数据丰富的情况,借鉴美国辛辛那提大学的i m s ( i n t e l l i g e n tm a i n t e n a n c es y s t e m s ) 中心提出的匹配矩阵的思想,本文介 绍了一种基于数据挖掘技术的匹配矩阵预测模型,并将其应用于设备状态 的真实数据,取得了良好的预测效果。而且在该匹配矩阵模型的建模过程 中融合了a r m a 模型,拥有较高的建模效率和反应速度,体现了多种预 测方法相互融合的现代预测技术的发展方向。 5 、面对目前m a t l a b 软件不支持建模函数编译成动态链接库被v c 调用的问 题,通过重新编写算法和利用其他组织编写的时间序列工具箱等方法,应 用v j f 1 m a t l a b 混合编程的技术,将论文中提出的预测方法加以实现并应用 到化工领域的维修与安全保障完整性管理平台中,并进行仿真实验。仿真 结果表明了文章中提出的的预测方法,预测精度和效率能够达到实际应用 的要求。 关键词:时间序列预测,a r m a 模型,e l m a n 神经网络,数据挖掘,匹 配矩阵,混合编程 n 摘要 r e s e a r c ho nc h e m i c a le q u i p m e n tf o r e c a s tb a s e do n t i m es e r i e sm o d e l a b s t r a c t f a u l tf o r e c a s t i n ga n da d v a n c ew a r n i n gi san e ws u b j e c ts t a r t e df r o mt h e l a t e2 0 t hc e n t u r y , a n di so n eo ft h eh o tr e s e a r c ha r e a so fp r e d i c t i v ec o n t r o l t h e o r y w i t hf u r t h e ri m p r o v e m e n to ft h es y s t e mr e q u i r e m e n t sf o rr e l i a b i l i t y a n ds e c u r i t y , i ti s h o p e dt h a t w ec a nm o r ea c c u r a t ep r e d i c tt h ef a u l t i n f o r m a t i o nb e f o r et h ef a u l th a r mt ot h es y s t e ma p p e a r s a n db e c a u s eo ft h a t s t r i c td e m a n d so nf a u l tf o r e c a s t i n ga n de a r l yw a r n i n ga r em a d e n o wp r o g r e s s i nt h ep r e d i c t i o nf i e l di ss l o w , b a s e do nt i m es e r i e sp r e d i c t i o nm e t h o di st h e m a i ne x i s t i n gf o r e c a s t i n gm e t h o d s t h i sp a p e ra n a l y z e ss e v e r a lm o r ee x t e n s i v e a p p l i c a t i o no fb a s i cm e t h o d si nt h et i m es e r i e sp r e d i c t i o n ,a n dc o m p a r e so f t h e i rs c o p eo fa p p l i c a t i o na n dt h e i rr e s p e c t i v ea d v a n t a g e sa n dd i s a d v a n t a g e s , a n dm a k e ss u g g e s t i o n st oi m p r o v e t h ep a p e ri n t r o d u c e san e wm e t h o do f p r e d i c t i o nb a s e do nd a t am i n i n g t h em a i nc o n t r i b u t i o n so ft h i sp a p e ra r ea sf o l l o w s : 1 、s u m m a r i z e da n da n a l y z e dt h ea u t or e g r e s s i o n - m o v i n ga v e r a g e m o d e l ,a n di nt h el i g h to ft h ec o n c r e t ep r o b l e m se x i s t i n gi nt h em o d e lo r d e r c o n f i r m a t i o n ,t h i sp a p e ra d a p t sa u t o o r d e rm e t h o ds t e pb ys t e pa n df s i g n i f i c a n tt oa v o i dt h ea r m a m o d e lo r d e rc o n f i r m a t i o n 1 北京化工大学硕士学位论文 2 、a i m da tt h eb a s i ce l m a nn e u r a ln e t w o r k ,t h i sp a p e ri m p r o v e dt h e i n t e r n a ls t r u c t u r eo ft h en e t w o r k ,e n h a n c e dd y n a m i ct r a c k i n gp e r f o r m a n c e o fe l m a nn e u r a ln e t w o r k 3 、i n t r o d u c e das e q u e n t i a ll e a r n i n ga l g o r i t h mo fn e u r a ln e t w o r ka n di t s a p p l i c a t i o n ,a n db a s e do nt h a tr e a l i s e dn e t w o r ko n l i n es t u d y g o e st h r o u g h t h et i m ew i n d o w , c o n t i n u et ot a k ea d v a n t a g eo fn e wd a t ac o l l e c t i o nf o r t r a i n i n g 4 、b a s e do nt h ec o n d i t i o no fr i c hf a u l ts a m p l ed a t a ,t h ep a p e ru s et h ei d e a o fm a t c hm a t r i xp u tf o r w a r db yt h e i m s ( i n t e l l i g e n tm a i n t e n a n c e s y s t e m s ) o fu n i v e r s i t yo fc i n c i n n a t if o rr e f e r e n c et od e s c r i b ean e w p r e d i c t i o nm e t h o dd e p e n d so nd a t am i n i n g 5 、i nv i e wo ft h ec u r r e n tp r o b l e mt h a tm a t l a bd o s e n ts u p p o r tm i x e d p r o g r a m m i n go fm o d e lb u i l d i n gf u n c t i o n ,t h r o u g hr e w r i t i n ga l g o r i t h ma n d m a k i n gu s eo ft i m es e r i e s t o o lb o xt h a to t h e ro r g a n i z a t i o n sw r i t ee t c , u s i n gm i x e dp r o g r a m m i n gt ot a k et h ef o r e c a s t i n gm e t h o dt h a tp u t sf o r w a r d i nt h et h e s i st oc a r r yo u ta n da p p l yt oa r e a so fp r o d u c t i o n k e yw o r d s :t i m es e r i e sp r e d i c t i o n ,a u t or e g r e s s i v em o v i n ga v e r a g e ( a r m a ) m o d e l ,a r t i f i c i a ln e u r a ln e t w o r k ( a n n ) ,d a t am i n i n g ,m a t c hm a t r i x , m i x e d p r o g r a m m i n g i v 北京化工大学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立 进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含 任何其他个人或集体己经发表或撰写过的作品成果。对本文的研究做出重 要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声 明的法律结果由本人承担。 作者签名:丝盘丝 日期: 关于论文使用授权的说明 学位论文作者完全了解北京化工大学有关保留和使用学位论文的规 定,即:研究生在校攻读学位期间论文工作的知识产权单位属北京化工大 学。学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允 许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可 以允许采用影印、缩印或其它复制手段保存、汇编学位论文。 保密论文注释:本学位论文属于保密范围,在上年解密后适用本授 权书。非保密论文注释:本学位论文不属于保密范围,适用本授权书。 作者签名: 导师签名: 大经 日期: 日期: 口oc 1 b 、多 1 j 。穹l1 ;s 第一章绪论 1 1 课题背景 1 1 1 课题来源 第一章绪论 本课题来源于国家自然科学基金重点项目:机械复杂系统建模仿真、运行优化和 自愈调控理论与方法( 项目编号:5 0 6 3 5 0 1 0 ) ;属于理论研究范畴,主要针对石油化工 领域中的安全监测系统的设备状态数据进行时间序列预测方面的研究。对于实际生产 中的反映设备运行状态的时间序列,特别是非线性时间序列,利用a r m a 模型、神 经网络和数据挖掘等不同方法对设备状态进行了预测研究。 1 1 2 课题研究的目的和意义 随着石化企业生产自动化程度的不断提高,维修在现代企业中的地位也日益明 显,同时,安全生产业已成为企业的关注点,设备故障控制与预防必然成为现代企业 管理所面临的重要课题。如何更有效地利用当前的固定资产降低设备维护的成本,并 减少由于设备原因导致的生产安全事故越来越受到企业的重视。 维修与安全保障完整性管理平台实现了数据到信息的转变,针对化工设备而言, 将机组状态监测数据转变为对机组运行状态的整体性能评价,当机组发生故障或出现 早期故障征兆时及时发现、精确诊断、准确预测得到,得到故障特征、原因及部位, 同时生成维修建议报告提交到计划部门实现状态维修,并获取维修反馈形成对故障全 生命周期的管理,同时将故障记录、维修记录存储,为风险分析提供数据支持,为实 现设备的科学管理提供依据。从整个设备管理的流程来看,故障的预测和预报无疑是 极为重要的一环,在今后的一段时期内,故障预测和预报的精度和准确性将成为提升 设备维修及安全保障水平提升的关键。 1 2 国内外研究现状 1 2 1 时间序列预测的基本概念 时间序列是按时间顺序排列的一组数字序列,是指将某一现象在时间上发展 变化的一系列数量表现,按时间先后顺序而形成的一个动态数列,也称为时间数列或 动态数列。时间序列预测就是已知时间序列的现在和过去的观测值,预测( 估 北京化工大学硕士学位论文 计) 其将来的值或变化趋势,以预测未来事物的发展。在工程、自然科学、经济、 和社会科学等领域的实际工作者和研究人员都要和一系列的历史观察数据打交道。具 体到化工生产领域,一个设备在某个化工生产过程中的状态值就可以看作一个时 间序列,该序列表明了这台设备的发展变化过程及其趋势,并可以用这组时间序列预 测该设备状态的发展方向及前景。 时间序列由两个基本要素组成,一个是现象所属的时间,另一个是现象在各个不 同的时期内所达到的水平。非线性时间序列预测一般反映序列的三种实际变化规 律:趋势变化、周期性变化、随机性变化,因此,对预测效果好坏的判定也主要 着眼在这三个方面,即预测的精度如何,能否反映出序列的趋势性,能否比较好 的跟踪序列的波动性。 1 2 2 时间序列预测的发展历史 化工生产领域的预测研究开展始于上世纪八十年代初。最早的生产设备负荷预测 工作完全依靠检测人员的运行经验,没有科学的理论做指导,预测误差往往较大。随 着生产规模的不断扩大,化工厂的生产系统日趋复杂,单纯地依靠人工预测己经远远 不能满足预测的要求。因此,要求化工设备负荷预测更科学、更准确,极大地预测理 论研究的开展。 自2 0 世纪8 0 年代中期以来,国内外学者开展了大量以各种设备负荷预测模型和 方法为主体的负荷预测理论研究,提出了许多有效的负荷预测模型和方法,部分己经 在实际中应用。这一阶段所提出的各种预测方法,总体而言,可以归结为数学模法和 非数学模型法两类。数学模型法是这一阶段早期电力负荷预测研究的主要方向。数学 模型法主要基于理统计理论,通过分析负荷与历史负荷或其他相关因素之间的定性关 系,建立负荷的学模型或统计模型,通过对历史数据进行参数估计得到这些模型的参 数,并且根据模型的残差来评价模型。典型的数学模型法主要有时间序列法和回归分 析法。 时间序列法是由b o x - j e n k i n s 于7 0 年代提出并发展起来的。电力设备的负荷变动 具有惯性特征,在时间上有延续性,因而时间序列法成为早期负荷预测技术中的主要 方法,并且是现在各种先进预测技术的基础。其中,最常用、最有效的方法是 b o x - j e n k i n s 时间序列法,该方法将负荷序列当作一个随机过程进行处理,应用自回归 动滑动平均模( a r m a ) 、自回归积累式动平均模型( a r l m a ) 等模型进行预测1 1 j 。 1 9 9 1 年,美国华盛顿大学的d c p a r k 等人首次将人工神经网络引入负荷预测,负 荷预测理论方法从传统的统计学方法发展到智能化的人工神经网络法、专家系统方法 和模糊逻辑理论法,并在实际应用中取得了良好的效果。由此,国外的负荷预测方法 也就围绕着人工神经网络以及模糊逻辑在进行讨论。 2 第一章绪论 1 2 3 时间序列预测的研究现状 目前,对线性时间序列分析方法及其应用的研究已经比较成熟。已有人将由故障 发生的时间间隔构成的数据建立l a r m a 模型( 线性自回归滑动平均模型) ,并实现了 对系统故障的一步预报。相对而言,非线性时间序列的分析要困难得多,日前仅对一 些特殊的序列,如双线性时间序列,有较完善的理论分析。实际工作中,大量的时间 序列都是非线性的甚至是混沌的,此时用经典的时间序列分析方法来处理则会带来较 大的分析误差,而用非线性时间序列方法分析的难度又很大,因此神经网络在这方面 得到了广泛的应用。人工神经网络以其独特的信息处理特点,在许多领域得到成功应 用。它不仅具有强大的非线性映射能力,而且还具有自适应、自学习、容错性和并行 处理等性质。神经网络的特点使其非常适合于非线性序列预测的研究。通常,大家往 往采用b p ( e r r o r b a c k p r o p a g a t i n n ,误差反向传播) 神经网络和r s f ( r a d i a l b a s i s f u n c t i o n , 径向基函数) 网络以及它们的改进算法进行预测。自从1 9 8 7 年l a p e d e s 和f a r b e r 首先 应用神经网络进行预测以来,神经网络预测时间序列方法受到了重视。目前,己有多 种不同形式的网络被用于工业、经济等的预测中【2 j 。 近年来,随着工业生产中检测数据的不断积累,各种故障状态的数据也变得日益 丰富。各种设备的故障模式数据库中的数据量急剧增大,激增的数据背后隐藏着许多 重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。但 目前数据库系统所能做到的只是对数据库中已有的数据进行存取,但无法发现数据背 后隐藏的知识,导致了“数据爆炸但知识贫乏一的现象。隐藏在这些数据之后包含许 多有用信息,其中比较重要的信息是关于这些数据的整体特征的描述及对其发展趋势 的预测,这些信息在决策生成的过程中具有重要的参考价值,它将为决策者提供重要 的信息知识,从而产生不可估量的效益。因而,基于数据挖掘技术的时间序列预测研 究也已经引起许多人的关注。 1 3 本文研究对象及主要贡献 时间序列预测方法将数据看作一个按时间次序排列的数据序列,通过相邻数据之 间的相关性,建立拟合时间序列的数学模型。时间序列按照其量与量之间是否成比 例、成直线的关系分为线性时间序列和非线性时间序列。迄今为止,虽然对非线 性的概念、非线性的性质,并没有清晰的、完整的认识,对其哲学意义也没有充 分地开掘,但对这两种时间序列的预测研究已经开展多年,这两种时间序列依据 自身的特点各自对应着不同的预测方法。 本文研究了基于少量样本数据的a r m a 模型和e l m a n 人工神经网络网络模 3 北京化工大学硕士学位论文 型,并针对样本数据丰富、故障种类完善的情况,介绍了基于数据挖掘的匹配矩 阵预测法。本文将这三种预测方法应用于真实的化工生产领域的设备状态的预测 研究并针对三种方法在实际应用中遇到的问题提出了改进方案。 本文的主要贡献在于: 1 、针对a r m a 模型定阶中的存在的模糊性和人为判定的情况,本文在实际应用中采 用了f 检验逐步自动定阶的方法,避免了a r m a 模型定阶中所遇到的实际困难。 2 、针对基础的e l m a n 神经网络,本文改进了其网络的内部结构,即在基础的e l m a n 神经网络的承接层增加一个自反馈,增强了e l m a n 神经网络的动态跟踪性能。 3 、本文把时间序列序贯学习的思想引入e l m a n 网络的在线建模过程中,实现了网络 在线学习,通过时间窗的推移,不断地利用新采集数据对网络进行训练,提高了网络 的建模效率和对真实数据的跟踪和拟合能力。 4 、针对故障样本数据丰富的情况,本文介绍了一种基于数据挖掘技术的匹配矩阵预 测模型,并将其应用于设备状态的真实数据,取得了良好的预测效果。而且在该匹配 矩阵模型的建模过程中融合了a r m a 模型,拥有较高的建模效率和反应速度,体现 了多种预测方法相互融合的现代预测技术的发展方向。 5 、面对目前m a t l a b 软件不支持建模函数编译成动态链接库被v c 调用的问题,通 过重新编写算法和利用其他组织编写的时间序列工具箱等方法,实现了m a t l a b 和 v c 混合编程的目的。 4 第二章a r m a 预测模型算法及其应用 第二章a r m a 预测模型算法及其应用 2 1a r 姒模型的基本原理 时间序列分析方法最早起源于1 9 2 7 年,数学家耶尔( y u l e ) 提出建立自回归模型 ( a r 模型) 来预测市场变化的规律。在1 9 3 1 年,另一位数学家w a l k e r 在a r 模型的启 发下,建立了m a 模型,初步奠定了时间序列分析方法的基础,当时主要应用在经济 分析和市场预测领域。2 0 世纪6 0 年代,时间序列分析理论和方法迈人了一个新的阶 段,b u r g 在分析地震信号时最早提出最大m e s 估计理论,后来,有人证明a r 模型 的功率谱估计与最大m e s 估计是等效的,并称之为现代谱估计。它克服了用传统的 傅立叶功率谱分析所带来的分辨率不高和频率漏泻严重等固有的缺点,从而使时间序 列分析方法不仅在时间域内得到应用,而且扩展到频率域内,得到更加广泛的应用, 特别是在各种工程领域内应用功率谱的概率更加方便和普遍。近几年来,随着计算机 技术和信号处理技术的迅速发展,一方面,时间序列分析的理论和方法更趋向完善, 特别是在参数估计,模型识别以及与智能计算技术的融合等方面都取得了丰硕的研究 成果。另一方面,时间序列分析的应用范围变得日益广泛,并且应用成果都处于一个 较高水平层面上。 a r m a 模型作为时间序列模型的一种,是由美国统计学家g e e b o x 和英国统计 学家g m j e n k i n s 在二十世纪七十年代提出的时序分析模型,即自回归滑动平均模型 ( a u t o r e g r e s s i v em o v i n ga v e r a g em o d e l ) ,用此模型所作的时间序列预测方法也称博克 斯。詹金斯( b - j ) 法。人们对a r m a 模型时间序列的预报有广泛的理论和应用兴趣, 它是将非平稳时间序列平稳化,然后对得到的平稳序列利用自回归过程和滑动平均过 程,以及样本自相关系数、样本偏自相关系数等数据,对模型进行辨识、估计和预报。 经典时间序列分析的基本问题之一就是a r m a 时间序列的预测。利用a r m a 模型描 述的时间序列预测问题在信号处理、状态估计等领域具有重要的理论意义,并且这一 问题本身也具有重要的应用意义。 自回归滑动平均a r m a ( p ,q ) 模型表示为: y 一唬l = 一l + 唬z 一2 + + 砟y p + 一b 1 一岛q 一2 一乞一口式( 2 - 1 ) 其中实参数( 唬,晚,o b o9 啦) 称为自回归系数,实参数( q ,吼,吃) 称为滑动平 均系数, 为白噪声序列1 3 。 5 北京化工大学硕士学位论文 2 2a r m 模型的定阶 时间序列分析和建模是以系统的观测数据序列为研究对象,通过分析数据之间的 依赖关系,用回归分析方法建立起描述当前时刻和过去时刻观测数据之相互关系的数 学模型。对于a r m a 模型的时间序列预测,传统的方法即是通过相关性分析,选择 建模变量,进行回归分析预测。具体说,即是通过分析时间序列的自相关函数和偏自 相关函数确定模型a r ( 自回归) 部分和m a ( 滑动平均) 部分的阶数。 2 2 1 自相关函数 在实际中,我们经常研究一对变量之间的夫系。在收集的数据处理中,用相关概 念来描述两个变量之间的相依关系。它有两种形式。一种是线性相关,指两个变量之 间可用线性方程来描述。另一种是非线性相关,指两变量之间需用非线性方程来描述。 不过,这些都是与时间无关的随机变量之间的关联性。在时间序列分析中,需要了解 与时间有关的信息在不同时刻的取值有无内在的关联性,这就需要引入相关函数的概 念。时间序列在一个时刻的瞬时值与另一个时刻的瞬时值之间的依赖关系,可用自相 关函数来描述。在t ,t + a 时刻的样本记录x ( t ) ,x ( t + a ) 的自相关性可以通过在观察时 间t 上对这两个值的乘积作平均得到。t 趋于无穷时,平均乘积的极限将接近一个正 r 确的自才目关函数。用公式表示,就是:疋( 口) 一熙户呼弦1 0 f + 口渺,零均值化后的样 本自协方差函数和样本自相关函数可作为自协方差函数和自相关函数的估计。 样本自协方差函数:r k4 万n 善- - 薯玉+ k 七1 0 , 1 , 2 1 1 式( 2 - 2 ) 样本自相关函数:见一墨kt 0 , 1 , 2 一1 一式( 2 3 ) 一般来说,平稳时间序列的自相关函数是由指数衰减和衰减正弦波组成。即自相 关函数的尾部不可能在延迟某步之后等于零,而只是按负指数律衰减。因此,a r 过 程的自相关函数序列具有拖尾的特性。 2 2 2 偏自相关函数 m a ( q ) 过程的自协方差或自相关函数在q 步滞后就截止为零,截尾性是m a 序列 6 第二章a r m a 预测模型算法及其应用 特有的标志,据此可以推测出m a ( c o 模型的阶数。而a r ( p ) 过程的自相关函数没有截 止点,拖尾性是a r 和a r m a 序列的共有特性。为了构造出某种函数使得a r ( p ) 过程 在滞后p 步之后能够截止,引入偏相关函数的概念。a r ( p ) 模型的偏相关函数是p 步 截尾的,并且也只有a r 过程的偏相关函数具有截尾的特性。 2 2 3a r m 模型的定阶原则 如上所述,我们可以依据样本的自相关、偏相关函数的截尾性和拖尾性,辨别模 型类别,识别模型的阶数。 具体的a r m a 模型数学表达式为: i,i22:9:!c:二了一2 1 p _ p 妒i ,】:一j ,_ g 1 。6 i 毒。l 。- 6 1 2 暑:一2 。- - - 扫。芒;1 9 i ( :4 :i j 4 ( :) = ;1 - 。;呈略r j ,i , i ;i = ;1 式( 2 _ 5 ) l 。,( - :) ;2 ;妻e :,t 。; i rl :墨1 - 式( 2 _ 6 ) b = 竺= = 二二二二二二二二二羔协2 - 7 8 ) ) 厂p-。l5:i:jf:i:12粼式。29) 弋见:唬n 式( 2 1 0 ) 【p i ;缟j d b ,式( 2 1 1 ) 因此,自相关系数n 是破和鼠的函数,自相关函数从肛开始,呈指数衰减。若魂 o , 自相关函数的指数衰减,是平滑的:若碱 0 ,九是平滑指数衰减;若唬 0 ,九的 指数衰减是振荡的。积,的符号与肛相同,也由仇一倪) 所决定1 4 j 。 计算出观测到的时间序列的自相关函数和偏自相关函数的值之后,就要根据他们 7 北京化工大学硕士学位论文 表现出来的性质,选择适当的a r m a 模型拟合观测值序列。这个过程实际上就是要 根据样本子相关系数和偏自相关系数的性质估计自相关阶数p 和滑动平均阶数q ,因 此模型识别过程也称为模型定阶过程。 平稳时间序列a r m a ( p ,q ) 模型定阶的基本原则如表2 1 : 表2 - 1 平稳时间序列a r m a ( p ,q ) 的主要特征 t a b l e2 - 1t h ef e a t u r e so f 舭( p ,q ) m o d e l p q 模型定阶 拖尾,指数衰减( 或) 正弦衰减 p 阶截尾a r ( p ) 模型 q 阶截尾拖尾,指数衰减( 或) 正弦衰减m a ( q ) 模型 拖尾,指数衰减( 或) 正弦衰减 拖尾,指数衰减( 或) 正弦衰减a r m a c o ,q ) 模型 选择适当的时间序列模型建模,通过考察样本自相关系数与偏自相关系数的性质 进行初步识别1 5 j : 若平稳时间序列的偏相关函数是截尾的,而自相关函数是拖尾的,则可断定此序列 适合a r 模型。 若平稳时间序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定此序列 适合m a 模型。 若平稳时间序列的偏相关函数和自相关函数均是拖尾的,则此序列适合a r m a 模型。 对于第三种情况,即平稳时间序列的偏自相关函数妒和自相关函数0 均不截尾, 且衰减缓慢收敛,则该时间序列可能是a r i m a ( p ,d ,q ) 模型,d 为差分的阶数。 要想拟合a r i m a 模型,必须先利用差分把它变成a r m a ( p ,q ) 模型,并确定是否 平稳,然后确定参数p 和q 。根据a r m a ( p ,q ) 模型的定义,它的参数p ,q 与自 相关函数及偏自相关函数有关。自相关函数描述观测值和前面的观测值的相关系数; 而偏自相关函数为在给定中间观测值的条件下观测值和前面某间隔的观测值的相关 系数。a r i m a ( p ,d ,q ) 模型的形式类似于a r m a ( p ,q ) 模型,但数据必须经过 特殊处理。特别当时问序列非平稳时,不能直接利用a r m a ( p ,q ) 模型,但可以利 用有限差分是非平稳序列平稳化,实际应用中d 一般不超过2 。若时间序列存在周期 波动,则可按时间周期进行差分,目的是将随机误差有长久影响的时间序列变成仅有 暂时影响的时间序列,即差分处理后新序列符合a r m a ( p ,q ) 模型,原序列符合 a r i m a ( p ,d ,q ) 模型1 6 1 。 2 3 服从模型的定阶的步骤 用a r m a 模型预测要求序列必须是平稳的,也就是说,在研究的时间范围内研究 对象受到的影响因素必须基本相同。具体的说,即前提条件是作为预测对象的时间序 8 第二章a r m a 预测模型算法及其应用 列是一组零均值的平稳随机序列。但是大多数时间序列都是平均值非零的非平稳时间 序列,所以在应用a r m a 模型之前,对时间序列先进行零均值化和差分平稳化处理。 ( 1 ) 零均值化处理指对均值不为零的时间序列中的每一项数值都减去该时间序列的 平均数,构成一个新的均值为零的时间序列。( 2 ) 差分平稳化处理差与平稳化处理指 对零均值的非平稳时间序列进行差分,使之成为平稳的时间序列。若所给的序列并非 平稳序列,则必须对所给序列做预处理,使其平稳化,然后用a r m a 模型建模1 7 1 。 建模的步骤为: ( 1 ) 序列的预处理,判断该序列是否为平稳非纯随机序。若为非平稳序列,对该序 列进行处理使其符合a r m a 型建模的条件即处理后的序列是平稳非白噪声序列; ( 2 ) 出观察值序列的样本自相关系数( a c f ) 和样本偏相关系数( p a c f ) 的值: ( 3 ) 根据样本自相关系数和偏自相关系数。选适当的a r m a 模型进行拟合; ( 4 ) 估计模型中的未知参数的; ( 5 ) 检验模型的有效性。若拟合模型通不过检验,转步骤3 ,重新选择模型再拟合; ( 6 ) 利用拟合的模型,预测序列的将来走势1 8 j 。 图2 - 1a r m a 模型建模步骤 f i e , 2 - 1m o d e l i n gs t e p so f a r m a 9 北京化工大学硕士学位论文 2 4a r 姒模型的定阶原则在应用中的局限性及解决方案 但是在实践中,这个定阶原则在操作上具有一定的困难。因为由于样本的随机性, 样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的样本自相关系数或偏自 相关系数仍会呈现出小值振荡的情况。 这种现象导致我们必须思考,当样本自相关系数或偏自相关系数在延迟若干阶之 后衰减为小值波动时,什么情况下该看作相关系数截尾,什么情况下该看作相关系数 在延迟若干阶之后拖尾。这实际上没有绝对的标准,很大程度上依靠分析人员的主观 经验。 因此,本文考虑到a r m a 模型的定阶准则在工程实践应用中的困难,采用了循环 定阶的方法,采用逐步增加阶数个数的方法,并用f 检验逐步自动定阶,简单而有效 的解决的上述问题【9 l 。 图:2 - 2a r m a 模型建模步骤 f i g 2 - 2m o d e l i n gs t e p so fa r m a n = n + l 经过研究,a r m a 模型的残差平方和( r s s ) ,经过不同阶数的组合运算,即: f ;_ a , = a o + i 笔_ ,其中a o = r s s ( 2 n + 2 ,2 n + d ,a 1 = r s s ( 2 n ,2 n 1 ) ,f 符合参数 4n 一4 n 一4 。 。 一 为f ( 4 ,n 4 n - 4 ) 的f 分布。其中n 为样本数据总数。当模型的f 检验落在置信区间之内 时,我们就认为模型的拟合精度达到了预测的要求。 1 0 第二章a r m a 预测模型算法及其应用 2 5a r g a 模型针对设备状态c v 值的预测实例 本文中所讨论的c v 值,意为t h ep e r f o r m a n c ec o n f i d e n c ev a l u e ,即表征设备运行 状态的健康评价值。c v 值分布于从o 到1 的区间中,越接近于1 表示设备的状态越 健康,反之越接近于0 ,表示设备可能出现了问题或者故障,应该立即通知相关人员 检修。通过对c v 值的预测,我们可以提前获知设备的运行状态是否良好,以便出现 故障时能够及时报警,避免因设备问题造成生产的安全隐患和损失。因此c v 值对化 工生产有着重要的现实意义。本文即是采用了化工厂某设备的真实c v 值,并应用对 a r m a 模型其作出预测,以检验该方法的可行性。 该设备的c v 值共2 2 1 个点,原始图如下图2 - 3 所示,数据见附录一: 图2 - 3 设备的c v 值原始时序图 f i g 2 - 3c vv a l u e so ft h eo r i g i n a le q u i p m e n tt i m i n gd i a g r a m 显然,该时间序列有明显的向下运行的趋势,表明该设备的健康状况在恶化,是 一个非平稳时间序列,则必须对所给序列做预处理。本文采用差分方法进行平稳化处 理,即使序列的后一项减去前一项,以去掉序列的趋势项【删。差分后平稳化序列如图 2 4 所示: 北京化工大学硕士学位论文 图2 _ 4 平稳化的c v 时序图 r i g 2 - 4t h es t a b l ec vv a l u e so ft h et i m i n gd i a g r a m 接下来,本文按照前面所描述的经典的a r m a 建模的步骤来确定a r m a 模型的 阶数。即判断该平稳时间序列的自相关函数和偏自相关函数的截尾的状况。本文采用 经典的统计学软件s a s ( s 日唧s r l l a u 。a n a l y s i ss y s t e m ) 对该时间序列的自相 关函数和偏自相关函数进行了分析研究。 具体的代码如下: d a t a a ; i n p u tm i l k ; t i m e = i n t n x ( m o n t h , y e a r d , _ n _ - 1 ) ;设定数据横轴单位 f o r m a tt i m ed a t e ;格式化横轴坐标 c a r d s ; c v t i m e s e r i e s输入将要分析的时间序列 r u n ;运行程序 p r o ca r i m ad a t a = a ; p r o eg p l o t ; p l o tm i l k t i m e ; s y m b o lv = s q u a r ei = j o i nc = r e d ; p r o ca l i n l ad a t a = a ; 1 2 第二章a r m a 预测模型算法及其应用 i d e n t i f yv a r = m i l k ; r u n ; 平稳化后的c v 时间序列的自相关函数和偏自相关函数的图序如图2 5 和图2 6 所示: a u t o c o r r e i a tl o n 8 b s c o v a r i a n c ec o r r e l a t l o l l19878 54 3210l28456788ls t de r r o r 0 l 2 3 4 5 8 7 8 9 1 0 l l 1 2 1 3 1 4 1 5 1 8 1 7 1 8 1 9 2 0 2 1 2 2 2 3 2 4 0 0 1 2 7 8 8 0 0 1 0 7 8 0 0 0 1 0 7 4 9 o 0 1 0 4 3 6 0 0 0 9 7 1 8 7 0 0 0 9 6 3 5 8 0 0 0 9 0 2 1 7 0 0 0 8 8 3 7 8 0 0 0 8 2 4 0 8 0 0 0 7 8 4 5 4 0 0 0 7 6 8 3 5 o 0 0 6 9 3 8 4 0 0 0 6 8 3 5 4 0 0 0 6 4 6 8 9 0 0 0 6 1 1 0 4 0 0 0 6 0 4 1 2 0 0 0 5 6 6 1 7 0 0 0 5 3 2 3 6 0 0 0 5 1 3 4 0 0 0 0 5 0 6 2 2 0 0 0 5 0 4 8 1 0 0 0 4 7 4 9 8 0 0 0 柏2 5 8 0 0 0 4 4 4 9 l 0 0 0 4 2 7 7 7 1 0 0 0 0 0 0 8 4 2 8 7 0 8 4 0 5 5 o 8 1 6 0 4 0 7 5 9 9 8 0 ? 5 3 4 8 0 7 0 5 4 8 0 8 9 1 0 8 0 6 4 4 4 1 0 6 1 3 4 9 0 6 0 0 8 3 0 5 4 2 5 6 0 5 3 4 5 l o 5 0 5 7 0 0 4 7 7 8 2 0 4 7 2 4 1 0 4 4 2 7 4 0 4 16 3 0 0 4 0 1 4 7 0 3 9 5 8 6 0 3 9 4 7 5 0 3 7 1 4 3 0 3 7 7 3 7 0 3 4 7 9 i o 3 3 4 5 1 u r k st w os t a n d s r de r r o l t 图2 - 5c v 时序的自相关函数图序 f i g 2 - 5a u t o c o r r e l a t i v ef u n c t i o no fc v s e r i e s p e r tl a ia u t o c o r r e i a ti o n s c o r r e l a tl o n一13 8 7 6 543 210l2 345 8 7 8 91 堆凇 拳堆水水冰水 - $ 串 - - 书水水水凇水串水准,帕瞄岫r 术 串术 凇 啦 水水水凇窜唯 水水 水球水水韶串串书 凇水水:i c 凇水 水 堆凇啦水 带 母 凇 图2 - 6c v 时序的偏自相关函数图序 f i g 2 - 6p a r t i a la u t o c o r r e l a t i v ef u n c t i o no fc vs e r i e s 从以上两幅自相关函数和偏自相关函数的图序可以看出,自相关函数的截尾在第 079824837253853634984627b6,828813012495524304521 2878,653202930 2277528155 ,f410l93cu65305,6nu4,fnvv6 8 1 3 e u o口nv3u680u012口v口
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 野生动物监测工改进竞赛考核试卷含答案
- 2026年新科教版初中七年级道德与法治上册第三单元发现自己做自己卷含答案
- 2026年新科教版初中九年级数学上册第三单元圆的性质综合应用卷含答案
- 货装值班员发展趋势评优考核试卷含答案
- 铜管乐器制作工安全意识强化水平考核试卷含答案
- 集材工岗前岗位责任制考核试卷含答案
- 巧克力原料处理工岗前实操知识技能考核试卷含答案
- 溶剂油装置操作工班组安全模拟考核试卷含答案
- 日间手术患者术后康复指导标准化
- 新生儿数据库数据完整性监控策略
- 水泵吊装施工方案
- IT-IT开发-通用-L1题目分享
- 2022年浙江衢州市大花园集团招聘31人上岸笔试历年难、易错点考题附带参考答案与详解
- 火龙罐技术课件
- 美的中央空调系统投标书正文
- 劳动纠纷应急预案
- 培训中心手绘技能培训马克笔单体表现
- cobb肉鸡饲养管理手册
- 妙用人工智能工具绘制“山水诗城”画卷-初识AI绘画 了解手写数字识别-体验人工智能 第四单元第5课时
- YC/T 205-2017烟草及烟草制品仓库设计规范
- GB/T 9065.3-2020液压传动连接软管接头第3部分:法兰式
评论
0/150
提交评论