(电力电子与电力传动专业论文)基于主元分析的电机状态监测方法的研究.pdf_第1页
(电力电子与电力传动专业论文)基于主元分析的电机状态监测方法的研究.pdf_第2页
(电力电子与电力传动专业论文)基于主元分析的电机状态监测方法的研究.pdf_第3页
(电力电子与电力传动专业论文)基于主元分析的电机状态监测方法的研究.pdf_第4页
(电力电子与电力传动专业论文)基于主元分析的电机状态监测方法的研究.pdf_第5页
已阅读5页,还剩71页未读 继续免费阅读

(电力电子与电力传动专业论文)基于主元分析的电机状态监测方法的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

a bs t r a c t a b s t r a c t :t h es t a t em o n i t o r i n go ft r a i no p e r a t i n ge q u i p m e n ti sak e yp o i n to ft r a i n t r a v e l i n gp r o c e s s f o rt h ec o m p l e xo p e r a t i n ge q u i p m e n t ,i ti s d i f f i c u l tt oa c h i e v et h e e x a c tm a t h e m a t i c a lm o d e lo ft r a v e l i n gp r o c e s s s ot h i sw i l ll i m i tt h ea p p l i c a t i o no f p r o c e s sm o n i t o r i n gm e t h o d sb a s e do ns y s t e mt h e o r y w i t ht h ea p p l i c a t i o no ft h e c o m p u t e rt e c h n o l o g y , d i f f e r e n tk i n d so fs e n s o r sa n di n t e l l i g e n tm e t e r s ,l a r g ea m o u n t o f d a t aa r es a m p l e da n dc o l l e c t e d i ti so n eo ft h em o s ta c t i v er e s e a r c ha r e a si nt h ef i e l do f p r o c e s sc o n t r o lt h a th o w t ot r a n s f o r mt h e s ec o l l e c t e dd a t ai n t ov a l u a b l ei n f o r m a t i o n ,a n d m i n ed e e p 1 e v e li n f o r m a t i o na b o u tp r o c e s so p e r a t i o nt oi m p r o v et h ep e r f o r m a n c eo f m o n i t o r i n g s t a t i s t i c a lp r o c e s sm o n i t o r i n g ( s p m ) i sad a t a - d r i v e nm e t h o d ,w h i c hi sb a s e do n m u l t i v a r i a t es t a t i s t i c a lm e t h o d o l o g i e sf o ro n l i n ep r o c e s sm a l f u n c t i o nd e t e c t i o na n d d i a g n o s i st h r o u g ha n a l y s i sa n di n t e r p r e t a t i o no fc o l l e c t e dm e a s u r e m e n t i no r d e rt o r e a l i z es t a t em o n i t o r i n go ft r a i no p e r a t i n ge q u i p m e n t ,ad e t e c t i v ee x p e r i m e n ts y s t e m w a ss e tu pi nl a b ,u s i n ga s y n c h r o n o u sm o t o ra st h es i m u l a t i o no b j e c to f t r a c t i o nm o t o r t h em a i nw o r k so ft h i sd i s s e r t a t i o ni ss t a t e da sf o l l o w s : 1 、p r i n c i p a lc o m p o n e n ta n a l y s i s ( p c a ) w a su s e dt op r o c e s sm u l t i v a r i a t ed a t ao fm o t o r t oa c h i e v es t a t em o n i t o r i n g t h i sm e t h o dc a nr e d u c et h ed i m e n s i o no fm o t o ri n d e xa n d m a k es t a t em o n i t o r i n ge a s i e r a n dt r a d i t i o n a lp c aw a si m p r o v e di n t h i sp a p e r , w h i c h w a sp r o v e dt ob ee f f e c t i v eo nt h e o r ya n de x p e r i m e n t 2 、al o to fs t a t em o n i t o r i n ge x p e r i m e n t sw e r ec a r d e do u to ne x p e r i m e n ts y s t e m ,a n d p c am o d e lw a se s t a b l i s h e db yh i s t o r i c a ld a t a t h ee x p e r i m e n tr e s u l t sv a l i d a t e dt h a tt h e a p p r o a c hc a nb u i l da l la c c u r a t em o n i t o r i n gm o d e la n dd e t e c ta b n o r m a ls t a t eo fm o t o r e f f e c t i v e l y 3 、as o f t w a r es y s t e mo fs t a t em o n i t o r i n gw a sd e v e l o p e df o rt h ee x p e r i m e n ts y s t e mi n l a b t h i ss y s t e mc a na c h i e v ed a t ac o l l e c t i o n ,d a t as t o r a g e ,r e a l t i m ed a t ad i s p l a ya n d s t a t em o n i t o r i n gw i t ht w os t a t i s t i c s k e y w o r d s :s t a t em o n i t o r i n g ;p r i n c i p a lc o m p o n e n ta n a l y s i s ;t r a c t i o nm o t o r ;d a t a p r e p r o c e s s l n g c l a s s n o :t p 2 7 4 a e c p v k d e m p c a m s p c p c a p c s p l s p v r s s p e s p m 索引 a v e r a g ee i g e n v a l u e c u m u l a t i v ep e r c e n to f v 撕a n c e k e r n e ld e n s i t ye s t i m a t i o n m u l t i - p r i n c i p a lc o m p o n e n ta n a l y s i s m u l t i v a r i a t es t a t i s t i cp r o c e s sc o n t r o l p r i n c i p a lc o m p o n e n ta n a l y s i s p r i n c i p a lc o m p o n e n ts p a c e p a r t i a ll e a s ts q u a r e s p e r c e n to f v 撕a n t e r e s i d u a ls p a c e s q u a r e dp r e d i c t i o ne r r o r s t a t i s t i c a lp r o c e s sm o n i t o r i n g 平均特征值法 方差累计贡献率法 核函数法概率密度估计 多向主元分析法 多元统计过程监控 主元分析法 主元子空间 偏最小二二乘法 方差贡献率 残差子空间 平方预测误差 统计过程监控 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研 究成果,除了文中特,i m j j t l 以标注和致谢之处外,论文中不包含其他人已经发表或 撰写过的研究成果,也不包含为获得北京交通大学或其他教育机构的学位或证书 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作 了明确的说明并表示了谢意。 学位论文作者签名: 签字日期:年月日 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国 家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学雠文储躲批 签字日期刀矛彳年6 月同 导师签名: 签字日期枷产珈 致谢 本论文的工作是在我的导师张和生副教授的悉心指导下完成的,从论文的选 题、系统方案的设计、实验问题的解决等方面都凝聚着导师的大量心血。张和生 老师严谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢 他这两年来对我热心的关怀和教诲,无论为人为学,都使我收获良多。至此论文 完成之际,向我的导师表示衷心的感谢和诚挚的敬意! 本论文的研究过程中,还得到了实验室同研究组的同学们在学习上和生活上 给予了我很大的关心和帮助,在此向他们表示衷心的感谢。 在读研究生期间,我得到了家人和朋友在生活上给我的关心和支持,在此对 他们的付出表示深深的谢意。 最后,承蒙各位专家、教授的评阅和评议,你们提出的宝贵意见将使作者受 益匪浅。谢谢! 引言 l 1课题研究背景及意义 1 引言 本课题的研究内容源于轨道交通安全与控制国家藿点实验审开放课题:“基于 数据融合的轨道交通安全评估与预测( 项目编号:s k l 2 0 0 7 k 0 1 1 ) ”,目标是在 实验室搭建一套列车运行设备模型系统平台,以三相异步电动机为实验对象,模 拟实现列车运行设备的状态监测。 安全是铁路运输工作的永恒主题。作为大容量公共交通工具,轨道交通系统 的安全性直接关系到广大乘客的生命财产安全。没有铁路稳定的安全,就难以使 国家的运力资源得以充分发挥。铁路交通事故起数多,造成经济损失大,死亡人 数多,严重危害了我国经济社会的健康发展。 2 0 0 7 年4 月1 8 同,全国铁路j 下式实施第六次大面积提速,列车运行速度越来 越高,重载列车越柬越多、客货混跑及列车密度高居世界第一的现状决定了我国 铁路行车安全的任务非常艰巨。在众多列车交通事故之中,列车脱轨是危害列车 行车安全的严重事故。2 0 0 4 年7 月2 2 同七耳其的萨卡里亚省帕蝌考瓦镇发生火车 脱轨翻车事故,造成1 3 9 人死亡,7 4 人受伤:2 0 0 5 年4 月2 6 开西部兵库县发生 火车脱轨事故,造成1 0 7 人死亡4 0 0 多人受伤,为日本4 0 多年来展为严重的一 起事故。 幽】1i :耳其火午脱轨乖故 f i g u r e l 一1t h e t r a i nd m i la c c i d l i n t u r k e y 吲1 - 2r 本火市脱轨珥故 f i g u r e l - 2 t h e t r a i n d e r a i la c c i d e n t i nj a p a n 列车牵引设备是列车的重要组成部分之一,对列车乃至整个交通系统的安全 具有举足轻重的作川。列车的牵引歧备的t 要电气部件包括:乖引变脏器、主变 流器、牵引电动机、辅助电机系统、 乜气控制系统、微机及电气拄制系统、控制 电源和辅助电源等8 ,楚【2 i 。机车电机尤其是牵引 n 动机一旦发生故障町能造成重大 北京交通大学硕士学位论文 的交通事故,带来巨大经济损失和物质损失。因此,对牵引电动机进行状态监测, 及时、全面的掌握其运行状态,对于及时消除事故隐患,减少列车行车事故,确 保铁路行车安全具有重要现实意义。 1 2 状态监测技术 1 2 1状态监测技术概述 状态监测技术是当前国内外迅速发展的一项关于系统管理方面的新技术。系 统状态监测是通过对各种检测、测量得到的信息进行监视、分析和判别,并结合 系统特性及历史数据对系统工作状态给出评价的过程。通过对系统运行状态进行 严密监测,及时察觉异常状况,报警并给出状态信息,大大提高了人们掌握系统 工作状态的能力,是故障诊断技术的重要组成部分【4 1 。状态监测一般流程如图1 3 所示。 过程系统 i 数据 信号采集 采集 f _j 登信号。 f 信量鲁程 利 数据压缩 数据 模型广i 取瑁肛卅h 处理 l 一一jl 孟缩信息 特征提取 i 特征 i 正常过毒 刮 变蠢磊定 故障 l 特征变化 检测 故障过程e | 故障推断 y 一i 故障( 时间,事件) , 故障分类 故障 :类型,位置 诊断 | 大小原因 故障对策 图1 3 状态监测的一般流程 f i g u r e l 一3f l o wc h a r to fs t a t em o n i t o r 2 引言 状态监测主要优点是:可以在系统运行中或基本不拆卸全部系统设备的情况 下,掌握系统的运行状态,判断产生故障的部位和原因,并预测、预报将来可能 发生的问题。因此,它是防止意外事故,避免计划外停机,实现预知维修的有效 措施。同时也是提高维修质量和效率、确保系统设备完好有效地重要手段。由此 可见,这项新技术的推广与实施,有利于克服以往在维修工作中长期存在的“过 剩维修和“维修不足 的现象,从而达到降低设备寿命周期费用及提高设备综 合效率的目的。 系统状态监测主要应用于系统设备运行过程中对实时运行状态初步的识别。 其主要功能是在系统运行过程中,对系统的各种状态变量及其信息进行检测,同 时需要对得到的信息进行及时的分析、判断,并结合系统现有的特性及其历史正 常过程对系统的实时工作状态做出评价的过程。系统的状态监测为进一步的故障 诊断做必要的信息和数据准备,是故障诊断系统运行的前提及实现自动化测试、 诊断的基础【4 】。 1 2 2状态监测技术的主要目的和组成 1 、主要目的: 保证系统运行过程的安全和可靠; 降低生产成本,减少事故发生率,减少过程维护费用。 2 、主要组成: 获得可表征系统运行信息或可检测参数; 在线过程监测; 在线故障诊断及定位: 系统维护及监测模型的更新; 过程运行中的文件管理。 1 2 3状态监测技术的意义及应用 对系统进行及时的状态监测将有助于分析系统各组成部分运行状态的好坏, 预测可能存在的事故隐患及不安全因素,合理的进行设备维护与检修决策,实现 按设备的状态进行检修,从而降低运行维护成本,增加运行效益,对提高系统运 行的安全性、可靠性有着十分重要的意义。 系统状态监测的应用范围及其发展前景都非常广,可以广泛适用于各种工矿 企业、轨道交通、航空、航天等高科技产业以及电力冶金、化工、石油及其机械 3 北京交通人学硕士学位论文 行业。 1 3状态监测技术的研究现状 目前已经研究出很多状态监测方法,根据系统采用的特征描述的差异形成了 不同的状态监测方法类型,常见的状态监测方法有三种: l 、基于知识的方法 基于专家经验的方法。根据现场专家的丰富经验,建立一个过程运行状态知 识库,运用合理的推理方法,根据现场得到的数据推理出运行过程是否正常的结 论。 其优点是不依赖于过程模型。缺点是对于大型复杂的工业过程,无论是数据 还是每一控制回路的经验都很繁多,极可能会导致知识爆炸,使得整个推理过程 陷入瘫痪;另外,知识描述、因果分析、规则建立及建立广义模型完全依赖领域 专家的个人经验和知识范围,因而很困难。 2 、基于神经网络的方法 基于神经网络的状态监测算法需要大量的训练数据,这些数据应该包含有运 行过程的各种状态下的过程特征。通过训练,可以得到运行过程正常时各过程变 量之间的相互关系以网络权值这种数据结构形式存储起来。依靠神经网络能自动 学习、自行分类等特点实现状念监测的功能。故障诊断可以通过将观测到的故障 与先前的故障特征比较来完成。 其优点是适用于分类,适合监测非线性对象。缺点是训练速度比较慢,收敛 性难以证明,同时不易于收集包括各种故障的训练对象。 3 、基于数据驱动( d a t a d r i v e n ) 的方法 随着信息产业技术的飞速发展,工业生产过程的自动化水平不断得到提高和 普及,生产过程中过程变量的数据已经可以采集并长期储存起来,它们对过程的 历史、现状以及未来的运行情况都是不可缺少的宝贵资源。如何利用好这些数据, 从中提取有价值的信息是基于数据驱动的状态监测方法的研究目标。这种方法的 主要思路是:将生产过程中已有的数据信息利用统计方法进行抽象处理,建立起 符合生产要求的较为理想的数学统计模型。然后用实时采集的过程数据与用历史 数据建立的统计模型相比较,从而实现在线的实时状态监测,达到监视系统状态 的目标。 这种方法的优点是:不需要知道系统洋细的理论模型。因此,相对于自i 两种 算法的监测方法来说简单的多,是今后状态监测技术发展的趋势。 4 引言 1 4主要研究工作及论文结构 根据课题的要求,在实验室搭建了一套包括一台异步电动机、多类型传感器 组、信号调理电路、数据采集卡和p c 上位机的牵引设备状态监测实验系统,用异 步电动机模拟列车牵引电动机作为研究对象,研究面向列车牵引设备的状态监测 方法。 1 4 1技术路线 本课题采用的技术路线如图l - 4 所示。 实验系统 研制 理论研究 课题基础 状态监测 动机h 喊话赫激卜 信号调理电路 软件 数据降维、多维指标聚合 m a t l a b 离线验证 状态监测统计量研究 - 多元统计过m a t l a b 程监控技术 主元分析 数据处理 v c + + 编 理论基础 程基础 理论基础实现方法 图l 一4 课题技术路线图 f i g u r e1 - 4t h ep r o j e c t st e c h n o l o g yr o a d m a p 1 4 2主要研究工作 结合项目课题,本论文主要做了如下研究工作: 对状态监测理论、多元统计过程监控技术和主元分析方法做了较为深 入的研究和分析,确定了采用主元分析方法作为处理来自异步电动机 多维传感器数据的方法; 5 北京交通大学硕士学位论文 针对传统主元分析方法采用标准化作为数据预处理导致部分信息丢失 这一问题,提出了一种改进的主元分析方法,并证明了该方法与传统 主元分析相比能保留更全面的数据信息; 利用m a t l a b 软件对异步电动机的正常历史数据进行主元分析,建 立相应主元模型,确定主元模型的相关参数,对异步电动机的状态进 行离线监测; 设计上位机监控软件,实现异步电动机运行时状态数据的采集和显示, 状态降维显示和和统计量监控显示,从而实现对异步电机的状态监测。 1 4 3论文结构 本论文共分了六个章节对课题研究进行了叙述。 第一章为引言部分,主要介绍了课题的背景和意义,状态监测技术的概念、 意义及其研究现状,以及主要研究工作和论文结构。 第二章介绍了论文的理论基础知识,简要介绍了多元统计过程监控技术的特 点和方法,重点介绍了多元统计过程监控技术中的主元分析方法基本知识,包括 其几何意义,主元的推导过程,以及主元个数的确定。 第三章指出传统的主元分析方法在数据预处理方面存在缺陷,针对该缺陷对 传统主元分析方法进行改进,并从理论上证明了改进方法的优势。 第四章为实验部分,主要介绍了实验系统平台的设计与搭建,并在实验平台 上应用改进主元分析方法对一台三相异步电动机进行离线状态监测,证明了改进 主元分析方法与传统方法相比能够提取更全面的数据信息,构造了较为准确的主 元分析模型,并通过大量实验进行状态监测验证,给出了各个实验的主元得分图 和统计量监测图,基本实现了对异步电动机运行状态的状态监测。 第五章主要介绍了上位机软件设计,以v c 抖6 0 为开发工具开发了状态监测 软件,该软件可以实时显示异步电动机的三相电流、转速、定子温度、主元得分 和数据统计量,实现了对异步电动机的在线状态监测。 第六章为结论部分,对本课题进行了总结,对后续的研究工作进行了展望, 并指出了本论文研究的不足之处。 6 多元统计过程监控技术与土元分析方法 2 多元统计过程监控技术与主元分析方法 随着测量技术的发展,已经能够对牵引电动机的更多状态指标进行实时采集, 并可以将这些数据长期保存下来。这些实时历史数据是进行牵引电动机状态监测 的宝贵资源。从应用的角度来考虑,基于数据驱动的状态监测方法具有更强的实 用性和可操作性。作为数据驱动方法的一大分支,基于多元统计分析的状态监测 方法具有处理高维大容量数据的优势,因此更适合在变量众多、相关性强以及数 据量大的情况下使用,目前已经逐渐成为状态监测领域的研究热点。 2 1多元统计过程监控技术 多元统计过程监控m s p c ( m u l t i v a r i a t es t a t i s t i cp r o c e s sc o n t r 0 1 ) 技术是首先在 社会学、经济学和化工领域研究应用的一类数据驱动技术。七十年代末,首次被 k o w a l s k i 等应用于化工领域,随后,多元统计过程监控技术逐渐延伸至其他的工 业过程中。如今现代化的工业系统中包含着大量相互之间极为相关的子系统。各 子系统之间既有自己独立的功能,又相互之间进行紧密耦合。如果对各子系统进 行独立监测,可能将相邻子系统的正常反作用误作故障信息而经常性发出错误警 报,也可能因为故障信息被耦合作用掩盖了而漏报非正常运行状态。为了能够对 整个系统进行实时、准确的状态监测,客观上需要一个能够“包罗万象”的二体 化监测系统,处理很多的多重相关的检测变量信息。在此处理过程中,多元统计 过程监控技术的模型降阶压缩技术逐步显示出独有的特点,并得到越来越多的关 注。随后,多元统计过程监控技术得到了迅猛的发展,成为当今世界状态监测与 故障诊断方法研究的主流。 多元统计过程监控技术能够对复杂大系统的运行状态给出总体指导意义的信 息。多元统计过程监控技术主要由主元分析法p c a ( p r i n c i p a lc o m p o n e n ta n a l y s i s ) 、 偏最小二乘法p l s ( p a r t i a ll e a s ts q u a r e s ) 、多向主元分析法m p c a ( m u l t i p r i n c i p a l c o m p o n e n ta n a l y s i s ) 茅h 核函数法概率密度估计k d e ( k e m e ld e n s i t ye s t i m a t i o n ) 等多 元统计学中的各种方法组成。 多元统计过程监控技术最主要的特点是它们不需要对被控对象的运行机制深 入了解,只要有足够的、合适的统计数据就可以用多元统计过程控制技术建立统 计学模型并根据该模型进行状态监测,所以说多元统计过程控制技术足基于观测 数据的技术。通过利用高速计算机处理大量多重相关的过程变量观测数据并从中 提取系统的统计特性,多元统计过程监控技术无须了解系统的深层物理机制就能 7 北京交通大学硕+ 学位论文 对一个复杂工程系统的大量的具有不同物理属性的、属于不同子系统的、多重相 关的过程测量数据进行一体化数字建模,该模型可以较全面地概括该复杂工程系 统的行为特性,包括各子系统之间的相关、耦合等关系。 在多元统计监控过程中,取得能够反映整个过程情况的数据十分重要,它直 接关系到多元统计过程监控过程的好坏。我们急需要得到关于过程输入输出情况 的数据,也需要得到反映过程运行情况的数据。多元统计过程监控技术正是通过 对系统历史数据的统计分析结果与实时得到的过程数据进行比较分析,以发现过 程的变化,并追寻引起这种变化的主要原斟1 0 】。因此,应用多元统计过程监控技 术的一个重要前提是需要大量的系统过程的历史数据。 多元统计过程监控技术主要是通过对这些相关过程数据进行投射变换,在一 个低维的投射空间里获得一组数目大为减少的,相互独立的新变量,这些新变量 数目很少但却能够概括整个工程系统的行为特性;然后用它们建立数字模型,通 过比较模型和实际系统的统计行为来进行工程系统的综合状态监测与故障诊断。 这样的投射变换主要有两个目的,一是数据降维,一是使得数据正交。 数据降维是多元统计过程监控技术中的一个重要概念,它建立在如下的观察 基础上:在大多数工业过程中,虽然被监测的变量很多,但真正的所谓的驱动因 素( d r i v i n gf a c t o r s ) 的数目往往要少的多。国外学者经研究指出:大多数情况下工业 过程中的驱动因素往往只有两三个。数据降维的目的就是通过数学处理去除冗余 信息,找出驱动因素。理想情况下,数据降维后所得数据与原数据相比,所包含 的有用信息量几乎不变,但是数据量大大减少,从而极大地减轻进一步深入分析 的计算量。由于数据降维舍弃了冗余信息,而系统噪声在经过多元统计过程监控 技术处理后往往体现为冗余信息,所以数据降维通常还能在一定程度上起到降噪 的作用。 当然,尽管多元统计过程控制技术的优点很多,它也不可避免的有自己的缺 点。首先,由于它的核心思想是对统计数据进行处理,所以要实现多元统计过程 监控必须对目标过程有一定的统计数据积累。其次,多元统计过程监控技术把采 集到的原始数据投影变换到一个新的数据空间中所得到的新变量并不是一些实际 的物理量,所以它们的物理意义往往难以描述。因此,多元统计过程监控技术分 析结果需要用过程操作人员的经验、知识进行解释,需要根据过程的机理去解释、 运用。数据的采集、统计分析计算、图表只是统计过程监控技术的一部分,更重 要的是需要有过程操作人员的参与。 总的来讲,多元统计过程监控技术为复杂系统的状态监控提供了另一种思路、 另一种相对而言较简单的方法,尽管有一些小的不足,但还是非常值得深入研究。 本文主要研究多元统计过程监控技术之一主元分析方法,及其在牵引电动机 8 多元统计过程监控技术与主元分析方法 状态监测中的应用。 2 2主元分析方法 主元分析( p c a ,p r i n c i p a lc o m p o n e n ta n a l y s i s ) ,又译为主成份分析,是多元统 计过程监控技术中最常用的方法。它常和其它多元统计技术相结合使用。首先对 不同子系统的随机过程信号进行压缩处理,建立一个统一的大系统降维统计模型 p c a 模型,然后提取系统p c a 模型输出数据的统计特征参数,通过分析处理 这些统计特性参数监测大系统的运行状态,再进一步用人工智能技术来诊断具体 的故障位置和性质,为系统基于状态的维护提供决策支持。由于主元分析技术将 所有的测量变量视为一个整体,对它们进行一体化处理,所以各变量、各子系统 间的相互耦合关系也被保留在p c a 模型中。相对于生硬地将一个系统拆分成若干 子系统分别进行研究的方法,基于主元分析技术建立的模型对工程系统各子系统 的物理变化的敏感性大大增加,从而提高了早期发现故障的可能性。 2 2 1基本思想和几何意义 为了更全面、更准确的反映出事物的特征及其发展规律,往往要考虑与其有 关系的多个指标( 变量) 。这样就产生一个如下问题:一方面人们为了避免遗漏重 要信息而考虑尽可能多的指标,另一方面随着考虑指标的增多增加了问题的复杂 性,同时由于各指标均是对同一事物的反映,不可避免的造成信息的大量重叠, 这种信息的重叠有时候甚至会抹杀事物的真正特征和内在规律。基于上述问题, 人们希望能够将多维指标进行聚合来降低指标维数,生成较少的几个变量,并且 聚合的过程中没有明显的信息损失。主元分析正是利用降维的思想,在损失很少 信息的前提下把多个指标转化为几个综合指标的一种多元统计方法【l l 】。 p c a 的数学模型是,设有m 维指标的随机变量x = ( ,t ,) ( x r k ”) , 令 l f l2 p l i 五+ p 2 l 恐+ + i x m i 乞2 p 1 2 + 岛2 屯+ + 2 1 【t ,2p i m x l + 岛m + + 写成矩阵的形式是 t = x p ( 2 1 ) 9 北京交通大学硕士学位论文 其中p 是正交矩阵。要求t 的各分量是不相关的,并且t 的第一个分量的方差 是最大的,第二个分量的方差次之,依次类推。p c a 通过保留前几个方差大的分 量( 主元) ,忽略后几个方差小的分量来降低数据集的维数。这样在研究复杂问题 时就可以只考虑少数几个主元,提高分析效率。 以一个二维变量为例说明主元分析的几何意义【l l 】。假设一个要研究的过程仅 包括两个变量五,而。根据这两个变量参数的变化,将参数的数据点绘在二维平面 上,如图2 1 所示。样本点间的差异显然是由于五和恐的变化引起的,从图上看样 本点沿x 。和x ,方向都具有较大的离散性,其离散程度可以分别用五的方差和毛的 方差测定。如果仅考虑五或中的任何一个分量,那么包含在另一个分量中的信 息将会损失。我们的目的是考虑五和而的线性组合,使原数据可以由新的变 y l , 表示。在几何上表示就是将坐标轴按逆时针方向旋转矽角度,得到新的坐标y 。和 y ,可以看出样本点的差异主要体现在y 。轴上,当只所体现的差异占了大部分, 如8 5 以上,则可以将y ,忽略,只考虑y 。,这样两个变量就缩减为一个,简化了 问题,提高了分析效率。可以称乃,y :分别为五,而的第一主元和第二主元( 严格的 定义后面在给出) 。 一般情况下,如果样本有m 个变量,若样本之间的差异能有m 个变量的k 个 ( 后 m ) 主元来概括,那么我们就能用k 个主元来代替原来的m 个变量。 x 2 j 、 7 xl 图2 1 主元分析几何意义 f i g u r e2 - 1t h eg e o m e t r i cm e a n i n go f p c a 由上面的分析可以知道,主元分析的过程无非就是坐标系旋转的过程,各主 元表达式就是新坐标系与原始坐标系的转换关系,在新坐标系中,各坐标轴的方 向就是原始数据变差最大的方向。 1 0 多元统计过程监控技术与主元分析方法 2 2 2主元计算推导过程 设过程中有研个过程变量。主元分析过程的实质上是对原坐标系进行平移和 旋转变换,使得新坐标系的原点与样本点集合的重心重合,新坐标系选取的第一 轴与数据变异的最大方向对应,新坐标系的第二轴与第一轴标准正交,并且对应 于数据变异的第二大方向依此类推。这些新轴分别称为第一主轴、第二主 轴若舍弃少量信息后,由主轴p 。,p :,p k 构成的子空i 、日j 能够十分有效的表示原 数据的变异情况,则原来的朋维空间就被降至后维,这个新生成的尼维子空间被称 为后维主超平面。可以用原样本点集合在主超平面上的投影来近似的表示原样本点 集合。 主元的严格定义如下:设一个有刀个样本点和所个变量的样本集合矩阵为 x ( x r “”) ,协方差矩阵为( r “) 。考虑一个线性组合:t = ,其中 t = ( t ,t :,t 。) ( t r 肼”,t ,r 删1 ) 为原始变量在主超平面上投影的综合变量: p = ( p i ,p 2 ,p 。) ( p r “”,p ,r “1 ) 为变换矩阵。 如果满足下列条件: ( i ) t ,与t ,( f ,) 不相关。 ( 2 ) t f = x p f 的系数满足p j p f = i ( f = 1 ,2 ,聊) 。 ( 3 ) t 是x 满足条件( 2 ) 的一切线性组合中方差达到最大者;t ,是与t 不相 关的一切x 的线性组合中方差达到最大的,t i 是与t ,t n ( i = 1 ,2 ,m ) 都 不相关的一切x 的线性组合中方差达到最大的。 则称t ,t ,t 。分别为x 的第一主元,第二主元,第m 主元。 通常不同的变量会有不同的单位,对同一变量单位的改变会产生不同的主元, 主元倾向于多归纳方差大的变量的信息,对于方差小的变量就可能体现的不够, 存在“大数吃小数”的情况。为使主元分析能够均等的对待每个原始变量,消除 不同变量不同量纲的影响,需要对样本数据x 进行标准化处理。 设x = ix , 2 屯lt 2 。 恐。 12吒。 ,标准化公式为: 毛:- - x j ,( 扛l ,2 ,- ,j = l 2 ,m ) ( 2 2 ) s : 其中弓= 丢窆i = 1 为指标_ 的样本均值,_ = 准差。为了方便书写,将标准化后的样本集合仍然记为x 。 为的样本标 北京交通大学硕士学位论文 下面根据主元的定义来推导求取主元的方法。首先求取第一主元,设t 。为第一 主元,t 。是变量而,屯,的线性组合,有 t l = x p i ( 2 3 ) 要求得t 。能携带最多的原变异信息,即要求t 。的方差取到最大值,t 。的方差为: 玩小。) = 扣i | 2 = ! 以p r x 7 x p 。= p i p 。 ( 2 - 4 ) 其中= 三x 7 x 是样本集合矩阵x 的协方差矩阵。由于x 经过了标准化处理, 此时的也是x 的相关系数矩阵。 式( 2 4 ) 可以看成是数学表达式,则问题就转化为一个优化的问题,定义目 标函数为: 以酬( p 。) :了p i p l ( 2 - 5 ) 利用拉格朗日算法求解,由主元定义可知: p r p 。= 1 定义拉格朗同函数为: l ( p i ,a ) = p i p i - 2 a ( p j p i - i ) ( 2 6 ) ( 2 7 ) 其中 是拉格朗日算子。对求p ,的偏导,并令其为0 ,有 署毛旷2 伯= 。 协8 ) 由上式可得: e p l = a p l ( 2 9 ) 由此可知,p 。是协方差矩阵的一个特征向量,a 是它对应的特征值。由式 ( 2 - 4 ) 和式( 2 9 ) 可得: v a r ( t i ) = p j p i = p r ( a 1 p 1 ) = a 1 p r p l = 丑 ( 2 1 0 ) 因此,欲使t 。的方差达到最大值,p 。所对应的特征跟丑必定要取最大值,即 要求的p ,是协方差矩阵的最大特征值五所对应的特征向量。这里,p 。称为第一 主轴,第一主元t 即可由式( 2 3 ) 求得。 依此类推,可求得x 的第f 主元t ,和第f 主轴p ,( f m ) 。p ,是协方差矩阵的 第f 个次大特征值丑所对应的特征向量。则第f 主元t ,为 t f = x p f ( 2 11 ) v a r ( t i ) = 三p j x 7 x p f = 名 ( 2 1 2 ) 刀 1 2 多元统计过程监控技术与主元分析方法 由此有,v a r ( t 。) v a r ( t :) v a r ( t 。) 。因此,用数据变异大小来反映数据中 的信息,则第一主元t ,携带的信息量最大,t :次之,依此类推。 综上所述,第f 主轴p ,是协方差矩阵的第i 个次大特征值名所对应的特征向 量,称为负载向量( 1 0 a d i n gv e c t o r ) ,而由所有m 个负载向量( 列向量) 构成的矩 阵p 称为负载矩阵。第i 主元t ,为原始变量在主超平面的第i 主轴上的投影构成的综 合变量,将一个样本向量通过投影得到的转换向量称为主元得分向量( s c o r e v e c t o r ) 。可以严格证明主元之间以及主元所对应的负载向量之间都是正交的。 通过上述分析,可以得到计算主元的基本方法: 计算样本集合矩阵x 的协方差矩阵; 计算的m 个特征值a 五丸,以及所对应的特征向量p 。,p :,p , 并且要求他们是正交的; 求取主元向量t 为:t = x p 。 其中的元素t 。为 t = x p = p h x l , j = l p j x j j = t 式中,勘是主轴巩的第个分量。 2 2 3数据的重构与降维 ( 2 1 3 ) 从上一节的推导中可以得知,提取主元的过程实际上就是一步一步分解样本 集合矩阵的过程,即将x 分解成主元t ,负载向量p ,的外积,即: x = t p r = t ,p j ( 2 一1 4 ) i = l 如果忽略次要因素,只保留前k 个主元,把被忽略的部分看成残差项,则有: k,” x = t i p j + t i p j = t + e ( 2 15 ) i = 1i = k + l 式中,e = t 。,t :,t 。】,e = p l ,p :,p 。】,e 为残差项。 因此,利用少数主元可以重新构造过程数据,即x 的估计值: k x = z t ,p ? = 瓦= x e ( 2 1 6 ) j - i 当k = m 时,主元分析过程相当于在原m 维空间做了一次坐标变换,而没有任 1 3 北京交通大学硕士学位论文 何信息损失;当k m 时,主元分析中的新变量咒则是将x 做正交变换后舍弃部分 信息而得到的,其变换矩阵为e 。 观测数据与重构数据的差构成残差矩阵: e = x _ x = x - x e 一一7 ( 2 1 7 ) = x ( i - e 巧) = x p m 一。咚i = t m 一。曝。 式中,l i = t ,t m ,t 。】,匕一t = p 州,p m ,p 。】。 文是与k 个最大的特征值相对应的负载向量所张成的观测空间,它描述了过程 中所产生的大部分系统的变化,称为主元子空间p c s ( p r i n c i p a lc o m p o n e n t s p a c e ) 。e 是与m 一尼个最小特征值对应的负载向量所张成的观测空间,它描述了 过程中的随机变化,一般指的是随机噪声,称为残差子空间r s ( r e s i d u a ls p a c e ) 。 图2 - 2 测量空间的分解 f i g u r e2 - 2d e c o m p o s i t i o no fm e a s u r e dv e c t o r 由于主元子空间描述了系统变化而残差子空间描述了随机变化,那么通过适 当确定主元个数k ,就可以使得系统变化从随机变化中解耦,从而可以把两种类型 的变化分开进行监控,达到状态监测的目的。 2 2 4主元个数的确定 采用p c a 是为了在力保数据信息丢失最小的原则下降低受控指标的个数,其 中数据的信息用方差表示。方差越大,所表示的系统信息就越有效。因此指标( 主 元) 个数的确定应遵循一定原则,既要有效降低指标的维数,又不会引起数据中 有用信息的明显损失。下面介绍两种最常用的确定主元个数的方法。 ( 1 ) 方差累计贞献率法 方差累计贡献率法c p v ( c u m u l a t i v ep e r c e n to f v a r i a n c e ) 是根据主元分析理论 中样本协方差矩阵的最大特征值所对应的特征向量即是第一主轴方向,该特征值 1 4 多元统计过程监控技术与主元分析方法 就是第一主元的方差,类似的,第二主元的方差和方向是由协方差矩阵的第二大 特征值及对应的特征向量来决定。每个主元的方差和总方差的比值称为该主元对 样本总方差的贡献率p v ( p e r c e n to f v a r i a n c e ) 。 方差贡献率的计算公式为: p v , : l ( 2 1 8 ) 朋 一 一 乃 方差累计贡献率的计算公式为: k c p v k = p v ( 2 一1 9 ) i = l 其中石为需要分析的数据矩阵x 的协方差矩阵的特征值,且 a 五丸0 。一般情况下,当前k 个主元的方差累计贡献率达到8 5 以上, 可以认为已求的k 个主元可以综合原数据足够多的信息,即确定主元个数为k 。 ( 2 ) 平均特征值法 平均特征值法a e ( a v e r a g ee i g e n v a l u e ) 选取所有大于特征值均值的特征值作 为主元特征值,同时舍弃那些小于均值的特征值,选取的特征值个数即为确定的 主元个数。特征值的均值计算公式为: m 石= 三y 丑m 是变量个数 ( 2 1 9 ) 2 3 本章小结 本章首先简要的介绍了多元统计过程监控技术的发展情况,然后对多元统计 过程监控技术中的一个方法一主元分析法做了重要介绍。给出了主元分析的几 何意义,推到了求取主元的过程,并从故障检测应用的角度给出了数据重构的概 念和降维的方法,为主元分析状态监测方法的应用提供了理论基础。 1 5 改进主元分析方法及其状态监测应用 3 改进主元分析方法及其状态监测应用 3 1传统主元方法的不足 从2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论