已阅读5页,还剩31页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 随着微电子工业和先进制造技术的发展,设备的结构越来越复杂,成本也越 来越高。提高设备利用率对生产效率的改进方面起着至关重要的作用,是降低生 产成本的关键因素。本文主要研究的对象是半导体封装测试工厂的设备故障数据。 通过对历史故障数据的分析,实现对设备故障的预测,从而对设备维修维护策略 提供参考,最终实现提高设备利用率的目标。 本文研究的故障数据取自不同的串联机械系统,而不同的机械系统是由几个, 甚至十几个不同的设备组成的。针对这样复杂的数据,本文主要利用时间序列的 方法建立预测模型。把故障数据看成时问序列的一组动态数据。这些动态数据往 往是非平稳的,需要考虑对序列进行平稳化处理。 针对数据非平稳性的特点,本文尝试利用差分的方法对数据进行平稳化处理。 平稳化效果较为理想,故尝试建立a r i m a 预测模型,并进行预测分析。预测分析 结果表明了该方法的可行性。 针对一些数据表现出阶段性的趋势,本文尝试一种新的叠合预测模型。在这 种叠合预测模型中,序列 被分解成确定性趋势部分扣。 与随机部分 k 的叠加。 在实证研究中,把经过预处理的故障数据看成时间序列的一组动态数据。对动态 数据进行分解,一组为确定性趋势序列,用以剔除故障数据表现出阶段性的趋势: 另一组为随机序列,表现故障数据的随机因素。对确定性趋势序列利用非线性自 回归的方法进行预测,同时,对随机序列建立a r m a 模型实现预测。最后,再综 合两个部分的预测结果实现对原始数据的预测。预测结果表明了该方法的可行性。 关键词:故障预测,平稳化处理,a r m a 模型,a r i m a 模型,非线性自回归模型 一a b s t r a c t 一 一一 a b s t r a c t w i t ht h ed e v e l o p m e n t o fm i c r o e l e c t r o n i c s a n dm a n u f a c t u r i n gi n d u s t r y ,t h e s t n i 二t u r eo fd e v i c e si sb e c o m i n gm o r ec o m p l i c a t e d w h i l et h ec o s ti sb e c o m i n gh l g h e r d a va f t e rd a y i m p r o v i n gt h eu t i l i z i n ge f f i c i e n c yo fe q u i p m e n t i se s s e n t i a lt oa d v a n c et h e p r o d u c t i o ne 讯c i e n c ya sw e l la st or e d u c et h ep r o d u c t i o n c o s t t h em a i ns t u d yo b j e c to t t h i st h e s i si st h ee q u i p m e n tf a i l u r ed a t af r o ms e m i c o n d u c t o rp a c k a g i n g t a c t 伽e s f h l s t h e s i sp r e d i c t st h ef a i l u f ed a t ab ya n a l y z i n gt h eh i s t o r y f a i l u r ed a t a , 觚dt h e np 删d e s s o m es u g g e s t i o n s0 fe q u i p m e n tm a i n t e n a n c es t r a t e g y t oa p p 蝴c ht h 雒g e tmm e i n c r e a s eo ft h ep r o d u c t i o ne f f i c i e n c y t h ef a i l u r ed a t as t u d i e di n t h i s t h e s i sc a m e f r o md i f f e r e n tm e c h a n l c a is y s t e m s w h i c ha r ec o m p o s e do fs e v e r a ld i f f e r e n td e v i c e s t h i st h e s i sm a i n l ya p p l l e st i m es e 麟 m e t h o dt ot h o s ec o m p l i c a t e d d a t at og e tt h ef o r e c a s t i n gm o d e l t h ef a i l u r ed a t am a y b e r e g a r d e da s as e to fd y n a m i cd a t ai n t i m es e r i e s t h ed y n a m i cd a t a a r eu s u a i i y n o n s t a t i 伽a r ya n d n e e d e dt ob et r a n s f o r m e di n t os t a t i o n a r yd a t a f i r s t t h ed i f f e r e n c em e t h o di su s e dt ot r a n s f o r mt h en o n s t a t i o n a r y d a t ai n t os t a t i o n a r y d a t a a i l dm er e s u i t i ss t i l lp e r f e c t s ot h ea r i m a m o d e li se s t a b l i s h e d t o m a 譬e p r e d i c t i o na n a l y s i s , a n dt h e r e s u i ts h o w st h a tt h em e t h o di sa v a i l a b l e c o n s i d e r i n gt h ep h a s et r e n do fs o m ed a t a ,t h et h e s i s t r i e san e wc o n g r u e n c e f o r e c a s t i n gr o o d e i i nt h i sm o d e l ,t h ed e t e r m i n i s t i c t r e n ds e q u e n c e m f c a n b es e p a r a t e d 舶mas t o c h a s t i cs e q u e n c c y f i nt h es e q u e n c e | 墨 i nd e m o n s r a i o n s u d y 1 a 1 1 u r e d a t ap r e t r e a t e di sr e g a r d e da sas e to fd y n a m i c d a t ai nt i m es e r i e s n ed e l e m l l n i s j c t r e n ds e q u e n c ef r o mt h ed y n a m i cd a t ai s u s e dt od e l e t et h ep h a s et r e n do ft h ef a l l u r e d a t a , a n dt h es o c h a s t i cs e q u e n c es h o w st h e s t o c h a s t i cf a c t o ro ft h ef a i l u r ed a t a t h e t h e s i sf o r e c a s t st h ed e t e r m i n i s t i ct r e n ds e q u e n c ew i t hn o n l i n e a ra u t o r e g r e s s i v e m e t h o d w h i l ei tf o r e e a s t st h ef a n d o ms e q u e n c eb ye s t a b l i s h i n ga r m a m o d e l i nt h ee n d , a f o r e c a s t “t h eo r i g i n a ld a t a c o m e so u tw i t ht h ei n t e g r a t i o n0 ft h o s em o k m d so t f o 聪斌r e s u i t s ,a n dt h ef e a s i b i l i t y o ft h ef l e wc o n g r u e n c em o d e li s o b t a i n e db yt h e p r e d i c t i o nr e s u l t i i a b s t r a c t k e y w o r d s :f a u l tf o r e c a s t ,s t a t i o n a r yp r o c e s s i n g ,a r m am o d e l ,a r i m am o d e l , n o n l i n e a ra u t o r e g r e s s i v em o d e l i i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作 及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为 获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与 我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的 说明并表示谢意。 签名:聋盛塞 日期:肋纱年纱月矽日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘, 允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全 部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:辛低表 导师签名:彳夸彦秀 l ,、 日期:上功x 年争月多日 第一章引言 1 1 研究的背景及意义 第一章引言 随着微电子工业和先进制造技术的发展,设备的技术越来越先进,功能越来 越强大,结构越来越复杂,维修维护难度越来越高,同时半导体工艺对设备的依 赖程度越来越大,这就对半导体设备的故障诊断修复时间和维修成本等提出了更 高的要求。设备维修经历了从故障后维修到定期检修,再到后来的预知维护保养 的过程,故障诊断技术也从传统的以经验为主逐渐过渡到以量化分析为基础。如 何提高维修效率和降低维修成本成为故障诊断策略优化的重要目标。所以研究如 何通过对故障的历史数据分析,实现对设备故障的预测,从而对设备进行提前维 护,减少设备由于故障引起的停机时间,提高设备利用率,具有一定的经济意义 和社会价值。 预测的核心是建立符合预测对象的预测模型,而预测模型的建立将应用各类 数学理论知识。 1 2 国内外研究现状和发展态势 故障历史数据是高度依赖时间变化的动态数据,据此建立预测模型描述机械 设备的劣化趋势,推知系统将来的行为。在此基础上,根据事先制定的停机阂值, 能确定机械设备保证安全运行的时间,估算设备使用寿命。 预测的核心是建立符合实际的预测模型,目前常用的故障预测模型主要有: 1 ) 曲线拟合1 1 j 曲线拟合是一种最简单的预测模型。将历史数据通过回归分析,应用最小二 乘法或其他数学方法,拟合出与历史数据最符合的曲线,通过曲线外推的方法进 行机械工况预测。这种方法原理简单、实施方便,常用于一些简单装置的监控系统 中,但由于该方法没有考虑到数据的动态性,往往预测误差较大。 2 ) 时间序列模型【2 - 3 】 一般的线性平稳模型有a r m a ( a u t o r e g r e s s i v em o v i n ga v e r a g em o d e l ) 模型、 1 电子科技大学硕士学位论文 a r ( a u t o r e g r e s s i v em o d e l ) 模型和m a ( m o v i n ga v e r a g em o d e l ) 模型。a r m a 模型是 a r 模型和m a 模型的结合。高阶a r 模型可近似拟合a r m a 模型,且可用于非 线性预测。 大量研究表明,a r 模型的自回归参数对状态变化规律反映最敏感,因此采用 a r 模型的自回归参数作为特征向量来分析系统的状态变化应该是十分有效的。但 由于a r 模型预测方法是建立在平稳随机过程假设基础上的。对于实际运行设备的 状态参数,一般得不到线性平稳的时间序列,尤其故障发生时更是如此。因而时 间序列模型的应用范围受到限制。 3 ) k a l m a n 滤波模型【4 叫 6 0 年代初,k a l m a n 和b u c y 最先提出状态空间方法,以及递推滤波算法,也 即k a l m a n 滤波器,通过对系统状态估计误差的极小化,得到递推估计的一组方程, 由于它同时得到了系统3 的预报方程,因此在预报领域也得到大量的应用。采用 k a l m a n 滤波器对测量数据进行处理,可以在基本上不增加计算量的情况下明显地 提高辨识精度,与其他方法相比,具有计算量小,预报精度高的特点。k a l m a n 滤 波器也有其局限性,只能用于线性系统。为了克服k a l m a n 滤波器对非线性系统进 行故障预报的问题,人们研究出一些改进的k a l m a n 滤波器,即使在系统含有未知 噪声的情况下,仍然具有较强的预报能力。 4 ) 灰色模型1 7 - 8 j 灰色模型预测的基础是灰色系统理论。部分信息已知,部分信息未知的系统 称为灰色系统。由于相关信息不充分、欠完整、不确定的系统大量存在,使得灰 色模型预测农业、气象、经济、交通、工业等领域获得了成功的应用。影响机械 设备工作状况的因素很多,其中既有确定性因素,又有非确定性因素,即“灰色 。 因此,灰色模型适用于机械故障预测。 g m ( 1 ,1 ) ( g e r ym o d e l ) 模型是目前最常用的灰色预测模型,它通过一个变量的 一阶微分方程揭示数列的发展规律。有关研究表明,g m ( 1 ,1 ) 适用于具有相对确定 性规律的数列,如加速发展的机械故障。而对于随机序列,则不宜采用g m ( 1 ,1 ) 模型。此外,g m ( 1 ,1 ) 模型用于机械故障短期预测效果比较好,而在中、长期预测 中应慎用。 5 ) 人工神经网络模型防1 0 】 人工神经网络是一个并行和分布式的信息处理网络结构,该结构一般由多个 神经元组成,每个神经元有一个单一的输出,它可以连接到很多其它的神经元, 其输入有多个连接通路,每个连接通路对应一个连接权系数。人工神经网络具有 2 第一章引言 较强的非线性映射能力,能逼近任意非线性函数,因而能较好地反映出机械设备 实际工作状态的发展趋势与状态信号的关系。同时,人工神经网络能进行多参数、 多步预报,在故障预测方面具有很好的应用前景。 6 ) 模糊模型【l l 】 模糊模型是除人工神经网络模型之外的又一种重要的非线性映射模型。在模 糊故障预测中,模糊知识的表示方法借用故障症状之间的隶属关系,建立相 应的模糊关系矩阵。这一过程也就是利用模糊集合理论与模糊逻辑关系,根据系 统输入与输出数据辨识系统模糊模型的过程。模糊模型适用于对复杂系统的预测, 但由于模糊预测系统还处于研究阶段,有些问题还需着重解决。 在机械故障预测中,建立符合实际的预测模型是关键的一步。针对机械故障 的特点,在提高模型精度和适用范围方面,呈现出以下发展趋势: 1 ) 多参数预测1 1 2 j 从机械振动信号中可以提取许多诊断指标( 特征参数) ,反映机械系统的运行 状况,但找不到一个诊断指标能完整和充分地描述所有类型的故障。 2 ) 组合预测 机械故障发展过程中包含多种趋势,其中既有确定性趋势,又有随机性趋势, 特别是早期的微弱故障更是如此。因此,为了准确预测机械故障,应综合使用多 种预测模型。组合预测模型由于具有信息利用充分、精度高等特点而受到重视, 成为研究的重点之一。 g m ( 1 ,1 ) 模型与a r 模型的组合预测模型【1 3 j 。g m ( 1 ,1 ) 模型在短期预测中优势 突出,但不太适用于长期预测。这是因为g m ( 1 ,1 ) 模型适用于拟合具有相对确定 性趋势的数据,而对完全的随机数列拟合效果很差。而a r 模型能预测随机数列。 有关研究表明,将二者结合起来,用于预报具有增长性和波动性的二重性时间序 列,有很高的精度。因此,引入组合预测模型,用g m ( 1 ,1 ) 模型描述机械故障发 展中的确定性趋势,用a r 模型描述机械故障中的随机趋势,有望实现机械故障的 中长期预报。 灰色马尔可夫模型f 1 4 】是由灰色模型和马尔可夫概率矩阵预测模型结合构建的 一种组合预测模型。这种模型兼有灰色模型和马尔可夫概率矩阵预测模型的优点, 用g m ( 1 ,1 ) 模型预测故障宏观发展变化的规律,并以此为基准,划分若干个动态 的状态,再用马尔可夫转移概率来刻画状态量的微观波动规律。适用于机械故障 有较为确定的发展趋势,而随机波动又比较大的情况。 将模糊模型与神经网络相结合,可以在神经网络框架下引入定性知识1 1 熨。这 3 电子科技大学硕士学位论文 种网络结合了模糊方法与神经网络的优势,较一般神经网络具有更大的针对性。 a r i m a ( a u t o r e g r e s s i v ei n t e g r a t e dm o v i n ga v e r a g em o d e l ) 矛nr b f ( i r a d i a lb a s i s f u n c t i o n ) 网络进行组合预测的方法【】, 6 1 ,该方法综合运用a r i m a 良好的线性拟合能 力和r b f 网络强大的非线性映射功能,将两种预测模型有机地组合在一起,综合 各自优点,以期有效改善模型的拟合能力,获得最优预测效果。 1 3 本文主要研究内容与方法 本文主要研究的对象是半导体封装测试工厂的机械故障数据。通过对历史故 障数据的分析,实现对设备故障的预测,从而对设备维修维护策略提供参考,最 终实现提高设备利用率的目标。这些数据取自不同的串联机械系统,而不同的机 械系统是由几个,甚至十几个不同的设备组成的。针对这样复杂的数据,本文主 要利用时问序列的方法建立预测模型。把故障数据看成时间序列的一组动态数据。 这些动态数据往往是非平稳的,需要考虑对序列进行平稳化处理。 在第二章中,针对数据非平稳性的特点,本文尝试利用差分的方法对数据进 行平稳化处理。平稳化效果较为理想,故尝试建立a r i m a 预测模型,并进行预测 分析。预测分析结果表明了该方法的可行性。 在第三章中,针对一些数据表现出阶段性的趋势,本文尝试一种新的叠合预 测模型。在这种叠合预测模型中,序列) 被分解成确定性趋势部分 聊,) 与随机部 分 m 】的叠加。在实证研究中,把经过预处理的故障数据看成时间序列的一组动态 数据。对动态数据进行分解,一组为确定性趋势序列,用以剔除故障数据表现出 阶段性的趋势;另一组为随机序列,表现故障数据的随机因素。对确定性趋势序 列利用非线性自回归的方法进行预测,同时,对随机序列建立a r m a 模型实现预 测。最后,再综合两个部分的预测结果实现对原始数据的预测。预测结果表明了 该方法的可行性。 1 4 本章小结 本章首先对本论文的研究背景及意义进行了阐述,接着介绍了故障预测的国 内外研究现状和发展态势,并针对本文要研究内容提出本文的研究方法。 4 第二章a r i m a 预测模型及实证研究 第二章a r i m a 预测模型及实证研究 2 1a r i m a 预测模型 2 1 1 时间序列的分解 时间序列分析的主要任务就是对时间序列的观测样本建立尽可能合适的统计 模型。合理的模型会对所关心的时间序列的预测、控制和诊断提供帮助。大量时 间序列的观测样本都表现出趋势性、季节性和随机性的特征,或者只表现出三者 中的其二或其一。这样,可以认为每个时间序列,或经过适当的函数变换的时间 序列,都可以分解成三个部分的叠加。 置;i n , + 薯+ y( 2 1 ) 其中,趋势项 肌d 与季节项奴) 是非随机函数,且季节项是周期函数。 m ) 称为残 量或随机噪声项,是一个平稳随机序列。将时间序列 墨) 分解为三项的叠加,可 以识别、估计、和提取出确定性成分后,对平稳噪声项 e 建立线性模型。 一般假定分解式( 2 一1 ) 满足: e ) = 0( 2 2 ) 从而 昱( 墨) = 以+ s ,( 2 3 ) 2 1 2a r m a 模型的定义 a r m a 模型是针对无趋势性和季节性的平稳时间序列建立的模型。a r m a 模型【1 7 - 1 8 1 1 全称为自回归移动平均模型( a u t o r e g r e s s i v em o v i n ga v e r a g em o d e l ,简记 a r m a ) ,由博克思( b o x ) 和詹金斯( j e n k i n s ) - t - 7 0 年代初提出的经典时间序列模型, 重要应用于平稳时间序列的建模及预测。它是自回归模型( a u t o r e g r e s s i v em o d e l , 简记a r ) 和移动平均模型( m o v i n ga v e r a g em o d e l ,简记m a ) 的结合。其一般形式 为: 电子科技大学硕士学位论文 k c p l y 一1 一驴2 z 一2 一一驴p y p = f + 臼l f - l + 口2 f - 2 + o q f g ( 2 - 4 ) 式中, k 为平稳序列, g , 为独立同分布随机变量序列;左边为模型的自回归 部分,非负整数p 称为自回归阶数, 妒,驴:,驴。 称为自回归系数;右边为模型 的移动平均部分,非负整数q 称为移动平均阶数, 岛,臼:,0 。 称为移动平均系 数。p 、q 分别是偏自相关函数值和自相关函数值显著不为零的最高阶数。 应用算子多项式m 徊) 、o ( b ) ,式( 2 4 ) 可以写成: 西( b ) y = o ( 曰) s 。 ( 2 5 ) 式中, 由( - 8 ) = 1 一艿一仍b 2 一一驴。b p( 2 - 6 ) o ( 曰) = 1 + o , b + 0 :b 2 + + 眈b 9( 2 7 ) 其中,b 为滞后算子,如 b y , = y 一。,b p y = y 一。( 2 :8 ) 2 1 3a r i m a 模型的定义 a r m a 模型是一种平稳时间序列模型。可是,在实际问题中,时间序列并不 平稳,往往具有趋势性和季节性。最常用的是采用b o x j e n k i n s 方法,即差分方法, 丞消除其趋势性、季节性,使得变换后的序列是平稳序列,并假设为a r m a 序列, 然后用平稳时间序列模型进行建模。a r i m a 模型【1 7 。8 l 全称为求和自回归移动平 均模型_ j ( a u t o r e g r e s s i v ei n t e g r a t e dm o v i n ga v e r a g em o d e l ,简记a r i m a ) ,正是通过 差分法获得的一种非平稳时间序列模型。应用算子多项式可表示为: 垂) v 4 置= o ( b ) , ( 2 - 9 ) 式中,) 为非平稳序列, 巳 为独立同分布随机变量序列。v 是差分算子,d 是差分的阶数,有 v x ,= ( 1 一b ) x ,= 置一置一,( 2 1 0 ) v d x 。= ( 1 一b ) d ( 2 - 1 1 ) 其中, 6 第二章a r i m a 预测模型及实证研究 v d = c 1 一b ,d = 1 一( ) b + ( 兰) 曰2 + + c 一1 ) 4 。1 ( d :1 ) b 4 - l + c 一1 ) d b d c 2 1 2 , 这样的时间序列 x t t g 可表示成 置= c o + c l t + + 巳一l f 扛1 + z ( 2 - 1 3 ) n d 1 。1 l ;1j # l k = v 4 x ,( 2 1 4 ) 其中,o ,g ,c d _ l 是随机变量。可以看出,a r i m a ,d ,g ) 序列 五) 是a r 蚴, g ) 序列 k ) 的d 重求和再加上一个多项式趋势。 2 1 4 时间序列的平稳性检验 a r m a 模型的研究对象要求满足平稳性,对时间序列的平稳性检验通常有参 数检验法和非参数检验法两大类:其中非参数检验法中的游程检验法 1 9 - 2 0 1 较为实 用。该方法的主要思想是:时间序列的值与序列的均值进行比较,相应于原序列 可以得到一个符号序列,在符号序列中的每一段连续相同的符号序列叫做一个游 程。设序列的长度为,j 和2 分别是记号序列中“+ ”与“”连续出现的次数, 游程总数为尺。游程总数r 是序列平稳性的一个检验统计量。 通常平稳性检验的判断原假设为:“样本数据出现的顺序没有明显的趋势,就 是平稳的。”在数据序列的量很大时,即咒一时,在原假设下,可以证明: e ( r ) :i 2 n i n _ 2 + 1 ( 2 1 5 )、。 n 1 + n , 、。 v a r 僻) = 面2 n i n 面2 ( 2 顶n 1 n 矸2 - n 百1 - 百n 2 ) ( 2 1 6 )、 ( 。+ 2 ) 2 ( l + 乞一1 ) 、7 z = 嵩划( 0 ,1 ) 因此,可以用正态分布表得到p 值和检验结果。 用近似公式得到拒绝域的临界值: _ :糌“熹, 7 ( 2 - 1 7 ) 这时,给定水平州舌,可以 ( 2 1 8 ) 电子科技大学硕士学位论文 屹2 器”矗】 ( 2 - 1 9 ) 在实际应用过程中,一般是在给定显著水平口= 0 0 5 下进行双边检验。由式 ( 2 。1 8 ) 并1 1 ( 2 1 9 ) n 可算得0 2 = 0 0 2 5 时的下限r ,和上限 。如果游程总数r 满足 r t 1 9 6 时,应当拒绝原假设。否则,接受原假设。 2 2 实证研究 2 2 1a r i m a 预测模型的基本步骤 在本文的实证研究中,把一组故障数据看成时间序列的一条现实动态数 据。对动态数据建立a r i m a 模型实现预测分析的基本步骤为: 1 ) 根据时间序列的散点图、自相关函数和偏自相关函数图以a d f 单位根检 验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。 2 ) 对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的 增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数 据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异 于零。 3 ) 根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函 数是截尾的,而自相关函数是拖尾的,可断定序列适合a r 模型;若平稳序列的 偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合m a 模型;若 平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合a r m a 模型。 9 电子科技大学硕士学位论文 4 ) 进行参数估计,检验是否具有统计意义。 5 ) 进行假设检验,诊断残差序列白噪声性。 6 ) 利用已通过检验的模型进行预测分析。 2 2 2 原始数据及预处理 来自生产线上的故障数据是以设备的停机开始时间和结束时间来表现的,通 过统计可转化为每一班次的设备故障率。设备故障率的计算公式为: 设备故障率= 再面:幕* 1 0 0 ( 2 - 2 2 ) 其中,生产时问为设备正常工作的时间。由于每一班次的设备的操作时间( 停机 时间+ 生产时间) 可能不同,考虑到时问序列预测模型对数据的要求,本文利用 设备故障率进行实证研究。 连续采集某一设备的故障率数据进行分析和预测。共1 5 0 个数据,选取前1 2 0 个数据构建模型,后3 0 个数据对模型进行预测验证。 利用s p s s 软件得到原始数据仪 时间序列图,如图2 - 1 所示。 故 障 率 零 班次 图2 - 1 原始数据时间序列图 从图2 1 可以看到,数据符合随机性分布,但为非平稳序列,且有些班次的 故障率存在异常偏离情况。这种的偏离情况就故障数据本身来说是正常的,而对 于建立时间序列模型进行预测时,需要考虑这种异常偏离情况可能会最终的预测 1 0 第二章a r i m a 预测模型及实证研究 产生的影响。通常要对异常数据进行合理替换。 本文利用s p s s 的b o x p o l t ( 箱式图) 1 2 3 l 找出异常数据,如图2 2 所示。在图2 2 中,框图中间的黑粗线为中位数,方框为四分位数间距的范围,上下两个细线之 间的距离是1 5 倍四分位数间距,之外的数据点称为离群值( o u t l i e r ) 或及值 ( e x t r e m ev a l u e ) ,其中离方框上下界的距离超过四分位数间距1 5 倍的为离群值, 以“o ”表示;超过四分位数间距3 倍的为及值,用“掌,表示。 从图2 2 可以看到,第2 0 个数据存在异常偏离情况,即是一个及值。本文将 这个及值数据利用除它以外的最大值来替代,即第2 0 个数据替换成1 8 5 6 。这 种的替代方法主要考虑到及值数据对于序列的建模及预测会产生较大的影响,同 时考虑如果直接剔除会改变实际存在的异常偏离情况,而本文所用的替代方法将 避免异常偏离情况的过大影响,也保持了数据本身的偏离性。通过数据预处理产 生的时间序列 k 如图2 3 所示。 电子科技大学硕士学位论文 故 障 壅 、 零 、一, 班次 图2 - 3 k ) 时间序列图 从图2 3 可看出,数据符合随机性分布,但为非平稳序列,且阶段性的上升 与下降的趋势。尝试利用差分的方法对数据进行平稳化预处理。对原数据进行一 阶差分,并利用游程检验法检验序列 k ) 的平稳性。检验结果显示概率p 值为o 2 3 , 大于显著性水平0 0 5 ,因此接受平稳性假设。故差分序列 z f ) 满足a r m a ( p ,q ) 模 型,即序列 m 满足a r i m a ( p ,1 ,譬) 模型。 2 2 3a r i m a 模型的建立 对序列 k 】建立a r i m a ( p ,1 ,g ) 模型,即对差分序列 z f ) 建立a r m a ( p ,q ) 模 型,需要先进行时间序列的模型识别。利用差分序列 五 的自相关图和偏自相关 函数i 羽( a c f & p a c f ) 判断a r m a 模型的阶次p 、q 的取值范围,即根据样本的自 相关、偏自相关函数的拖尾性和截尾性判断序列所适合的模型。序列相关函数的 拖尾性是指相关函数都受负指数控制,在平稳过程情况下尾部呈现指数衰减;序 列函数的截尾性则是指通过其在时滞k 处的绝对值与零是否有显著性差异而确 定。在实际应用过程中,一般是在给定显著水平口- - 0 0 5 下,序列相关函数在时 滞k 处及其后的绝对值小于或等于1 9 6 ( r 为序列的长度) ,接受原假设“序 列的相关函数具有截尾性”,否则反之。 利用s p s s 软件做差分序列 z f ) 的自相关图和偏自相关函数图 ( a c f & p a c f ) “- 2 列,如图2 4 所示。 1 2 第二章a r i m a 预测模型及实证研究 l 0 5 n 0 5 = 1 0 一i 一一 _ iii 一_ _ - - - 一 u - 。5 三晰觚e 岫 譬 巴 _ c o 喇叭童l o - _ i 。i ii - 。_ i _ _ i i _ 一 c d 哂矗,u t i b c o 踟t 岫n u n c a e rt a g 他i r i l b e r 图2 4 差分序列 z r ) 的自相关图和偏自相关函数图( a c f & p a c f ) 图2 4 中,坐标横轴的上下两条线间的区域表示:在显著性水平口= o 0 5 下, 接受原假设“系数为零”的9 5 的置信区间。当柱体超出这个置信区间,拒绝原 假设。由自相关图可以看到,在第5 步滞后的自相关系数显著不为零,而第5 步 之后都接受“系数为零”的假设,故有0 s qs 5 。同样的,由偏相关图可以得到 0s p s6 。 在0s p s 6 , 0sq s 5 内,尝试对序列 k 】- 建立a r i m a ( p ,1 ,q ) 模型。利用a i c ( 赤池信息量) 准则判定较为理想的模型。表2 2 显示了各模型的a i c 值。 表2 - 2 不同a r i m a 模型的a c 值 模型a l c 值模型a c 值模型a c 值 a r i m a ( 6 ,1 ,o ) 5 9 8 2 4 a r i m a ( 6 ,1 ,1 ) 5 8 7 1 1 a r i m a ( 6 ,1 ,2 ) 5 8 8 9 2 a g i m a ( 5 ,1 ,0 ) 6 0 1 4 7 a r i m a ( 5 ,1 ,1 ) 5 8 5 6 7 a r i m a ( 5 ,1 ,2 ) 5 9 7 4 4 a r i m a ( 5 ,1 ,3 ) 5 8 9 2 6 a r i m a ( 4 ,1 ,1 ) 6 0 3 4 2 a r i m a ( 4 ,1 ,2 ) 5 9 2 1 7 a r i m a ( 4 ,1 ,3 ) 5 8 7 0 l a r i m a ( 4 ,1 ,4 ) 5 9 0 7 0 a r l m a ( 3 ,1 ,1 ) 6 0 1 5 0 a r i m a ( 3 ,1 ,2 ) 6 0 2 7 4 a r o m a ( 3 ,1 ,3 ) 5 8 7 3 0 a r i m a ( 3 ,1 ,4 ) 5 8 2 2 0 t m i m a ( 3 ,1 ,5 ) 5 8 4 9 2 a m m a ( 2 ,1 ,1 ) 5 9 9 8 6 a r i m a ( 2 ,1 ,2 ) 6 0 1 8 7 a r i m a ( 2 ,1 ,3 ) 6 0 0 6 0 a r i m a ( 2 ,1 ,4 ) 5 8 2 4 8 a r i m a ( 2 ,1 ,5 ) 5 8 2 0 9 a r i m a 0 ,1 ,1 ) 5 8 8 5 8 a r i m a ( 1 ,1 ,2 ) 5 8 9 9 2 a r i m a ( 1 ,1 ,3 ) 5 9 2 0 l a r i m a ( 1 ,1 ,4 ) 6 0 3 4 9 a r i m a ( 1 ,1 ,5 ) 5 9 0 8 2 a r i m a ( o ,1 ,5 ) 5 8 7 5 5 1 3 电子科技大学硕士学位论文 通过比较得模型a r i m a ( 2 ,1 ,5 ) 的a i c 值是最小的,即a r i m a ( 2 ,1 ,5 ) 模型 是更为理想的预测模型。在利用模型进行预测之前,还需要检验残差序列是否满 足白噪声假设。本文利用残差序列的自相关图( a c f ) 诊断残差序列白噪声性。图 2 - 5 显示了残差序列的自相关图( a c f ) 。 , 一一_ 一i 一 _ - _ i - 一- _ 一 l2 34 5 6 7 89 坩1 11 21 3h1 51 6 t a gn u m b e r c u 佻 k o d f i d d l t 图2 - 5 残差序列的自相关图( a c f ) 图2 5 中,坐标横轴的上下两条线问的区域表示:在显著性水平口= 0 0 5 下, 接受原假设“系数为零”的9 5 的置信区间。当柱体超出这个置信区间,拒绝原 假设。由图2 5 可以看到,每一步滞后的自相关系数都接受“系数为零”的假设。 由此可推断残差序列是白噪声的【2 2 】。所以a r i m a ( 2 ,1 ,5 ) 是较为理想的模型,故 对序列 k ) 建立a r i m a ( 2 ,1 ,5 ) 模型,实现预测。 2 2 4 预测结果分析 对前1 2 0 个数据建立a r i m a ( 2 ,1 ,5 ) 模型,可预测得第1 2 1 个数据的预测值。 利用s p s s 软件计算得第1 2 1 个数据的预测值为9 7 2 。 运用外延递推的方法,可以实现对后3 0 个数据的预测。由前1 2 1 个数据建立 模型实现对第1 2 2 个数据的预测,由前1 2 2 个数据建立模型实现对第1 2 3 个数据 的预测,由此类推。 后3 0 个数据预测模型与预测值见表2 3 。 1 4 加 5 们 巧 蛐 u u 第二章a r i m a 预测模型及实证研究 表2 3 后3 0 个数据预测模型与预测值 序号模型预测值( )序号模型 预测值 ,世、 1 a r i m a ( 2 ,1 ,5 ) 9 7 21 6 a r i m a ( 3 ,1 ,4 ) 1 0 7 3 2 a r i m a ( 2 ,1 ,5 ) 1 0 5 21 7 a r i m a ( 3 ,1 ,4 ) 9 4 7 3 a r i m a ( 2 ,1 ,5 ) 8 9 61 8 a r i m a ( 3 ,1 ,4 ) 7 8 4 4 a r i m a ( 5 ,1 ,2 ) 6 6 01 9 a r i m a ( 2 ,1 ,5 ) 7 1 3 5 a r i m a ( 5 ,1 ,2 ) 8 8 42 0 a r o m a ( 2 ,1 ,5 ) 7 2 6 6 a r i m a ( 5 ,1 ,2 ) 8 8 82 1 a r i m a ( 2 ,1 ,5 ) 9 9 8 7 a r i m a ( 5 ,1 ,2 ) 7 6 9 2 2 a r o m a ( 2 ,1 ,5 ) 1 1 7 6 8 a r i m a ( 3 ,1 ,4 ) 7 9 42 3 a r i m a ( 2 ,1 ,5 ) 8 2 8 9 a r i m a ( 3 ,1 ,4 ) 9 0 5 2 4 a r i m a ( 2 ,1 ,5 ) 7 1 3 1 0 a r o m a ( 3 ,1 ,4 ) 1 0 2 9 2 5 a r i m a ( 2 ,1 ,5 ) 9 7 9 1 1 a r i m a ( 3 ,1 ,4 ) 8 5 12 6 a m m n 2 ,1 ,4 ) 1 0 1 8 1 2 a r i m a ( 2 , 1 ,5 ) 6 7 22 7 a r i m a ( 2 ,1 ,4 ) 9 0 0 1 3 a r o m a ( 2 ,1 ,5 ) 1 0 1 22 8 a r o m a ( 5 ,1 ,2 ) 1 0 1 7 1 4 a r i m a ( 3 ,1 ,4 ) 9 4 92 9 a r i m a ( 5 ,1 ,2 ) 9 5 9 1 5 a r i m a ( 3 ,1 ,4 ) 8 2 13 0 a r t , t a ( 5 ,1 ,2 ) 9 6 0 预测值与实际值的拟合图见图2 - 6 。从图2 - 6 可以看出,预测值能够较好地与 实际值拟合,并计算得平均绝对误差为1 7 1 。考虑到设备故障数据可能受到的 来自串联机械系统的其他设备的影响,这样的预测结果是比较理想的。由此可得, a r i m a 模型对设备故障率的预测是有效的。 电子科技大学硕士学位论文 1 6 1 4 1 2 毋1 0 糌8 迸6 辎4 2 0 l234567891 0 l l1 21 3 1 4 1 5 1 6 1 7 1 8 1 92 0 2 l 2 2 2 3 2 4 2 5 2 6 2 7 2 8 2 93 0 班次 2 3 本章小结 图2 6 预测值与实际值的拟合图 本章通过对实际生产中的数据分析,把故障数据看成时间序列的一组动态数 据。对动态数据建立a r i m a 模型,并进行验证,预测分析结果表明了该方法是 可行的。时间序列预测法相对于人工神经网络模型、模糊模型等方法是比较简便 的。采用时问序列模型进行预测,有利于工厂安排生产计划,制定预防性维修计 划,从而减少意外停机造成的损失。本章基于半导体封装设备提出建模和预测方 法,希望对于工业生产的其它领域也有借鉴意义。 1 6 第三章a r m a 与非线性自回归的叠合预测模型及实证研究 第三章a r m a 与非线性自回归的叠合预测模型及实证研究 3 1 叠合预测模型结
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电力工程施工员现场管理考试题目及答案
- 磨具制造工安全知识宣贯知识考核试卷含答案
- 装订工达标测试考核试卷含答案
- 耐火炉窑装窑工成果水平考核试卷含答案
- 苯基氯硅烷生产工成果水平考核试卷含答案
- 2026年特殊教育学校学生职业教育与就业转衔测试
- 2026年旅游出行安全知识竞赛题库
- 2026年DDI角色扮演模拟题及答案
- 氯丁橡胶装置操作工复测能力考核试卷含答案
- 2026年洋河股份面试情景模拟题及创新思维测试
- 2026年电商运营爆款打造全流程拆解
- 医联体康复医疗分级诊疗的成本控制策略
- 地铁线路设计规划模型数学建模
- 临床需求导向的AI研发策略
- 2025年中考八年级地生模拟试试卷附答案
- 2026年咨询工程师咨询实务考前冲刺重点知识考点总结记忆笔记
- 光伏发电建设项目三级安全教育培训考试试卷附答案
- 2025四川安全员c2证考题库全套及答案解析
- 旅行管家实务课件
- 宿管员基础知识培训课件
- 曹禺的《日出》教学课件
评论
0/150
提交评论