(计算机应用技术专业论文)相对主元分析理论及其应用研究.pdf_第1页
(计算机应用技术专业论文)相对主元分析理论及其应用研究.pdf_第2页
(计算机应用技术专业论文)相对主元分析理论及其应用研究.pdf_第3页
(计算机应用技术专业论文)相对主元分析理论及其应用研究.pdf_第4页
(计算机应用技术专业论文)相对主元分析理论及其应用研究.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

河南大学研究生硕士学位论文第1 页 摘要 主元分析( p c a ) 是多元统计分析中常用的方法之一,目前己在故障 诊断、数据压缩、信号处理和模式识别等领域中均有广泛的应用。然而, 传统p c a 方法因忽视量纲对系统的影响,致使选取的主元难以具有代表 性;而在进行量纲标准化后,又因得到的特征值常常是近似相等的而无法 进行有效的主元提取,这些问题都将影响p c a 算法在实际中的应用。本 文在已有工作的基础上,针对传统p c a 算法研究存在的问题,建立了一 种相对主元分析( r p c a ) 的新方法,并将其应用到过程监控和数据压缩 中,取得了以下成果: 1 深入探讨了量纲标准化前后p c a 对系统结构所产生的影响,在此 基础上,引入分布“均匀”、相对化变换以及相对主元等概念,建立了一种 相对主元分析的新方法。该方法首先对系统进行量纲标准化;其次再根据 系统的先验信息分析来确定各分量的重要程度;然后在系统能量守恒的准 则下,赋以系统各分量相应的权值;最后利用己建立起的相对主元模型, 对系统实施r p c a 。理论分析和仿真实验均表明,采用r p c a 方法选取出 的主元更具代表性和显著几何意义。 2 针对实际应用中数据压缩可能不充分、主元个数取舍不当将导致 监控结果不准确以及异常点干扰等问题,研究基于r p c a 的过程监控及数 据压缩应用技术。首先提出一种马氏距离的方法,消除因异常点和数据丢 失而引起的误报警问题;然后再建立起反映数据压缩能力的性能指标,从 而验证与传统p c a 方法相比较,r p c a 在过程监控和数据压缩中的有效 性。该方法能更多地利用系统的先验信息,方便主元的选取,从而极大地 提高相对主元的代表能力。 3 分析主元子空间中r 2 统计量均值的变化以及残差子空间中胼z 统 计量均值的变化,在此基础上,给出一种确定系统比重因子的方法。 关键词:p c a ;r p c a ;分布“均匀”;比重因子;过程监控;数据压缩 第l l 页河南大学研究生硕士学位论文 a bs t r a c t p r i n c i p a lc o m p o n e n ta n a l y s i s( p c a )i s o 髓eo ft h em o s ti m p o r t a n t m e t h o d sf o rs t a t i s t i c a lc o n t r o lo f “l u l t i v a r i a t ep r o c e s s ,w h i c hh a sb e e nw i d e l y 毽s e 莲a lp f e s e 蘸专i 旌s 稳c 瓤是e l d sa sf 矗毽l 鑫i a 鬈n o s i s ,d 鑫鑫e o 搬p f e s s i o 纛,s i g 鞋鑫l p r o e e s s i n 鏊,p a l e f 热r e e o g n i z i 靛g a 投蠢s oo n , h o w e v o 岛i 慧l r a d i t i o n a lp c a , b e c a u s eo ft h en e g l e c tf 6 ri n f l u e n c eo fd i m e n s i o n so ns y s t e m ,t h es e l e c t e d p r i n c i p a lc o l n p o n e n t s( p c s )o f t e n f a i lt oh a v ef e p r e s e n t 撞t i v e i 迸o r e o v e r , a e e o r d i 箍g l o t h eo b t a i 建e d a p p r o x i l 鞋鑫t e l ye 鼋珏鑫le i g e 觳v 鑫l 骚e s a f t e f d i m e n s i o n l e s ss t a n d a r d i z a t i o n ,i ti sm o r ed i f 巍c u l t yt os e l e c tp c se f 如c t i v e l y t h e s eq u e s t i o n sa l lw i l li m p a c tt h ea p p l i c a t i o no fp c aa l g o r i t h m si nt h e p r 鑫e i e a ls y s l 嚣l 建s 。转鑫s e 莲。廷纛ep r e v i o 毽sw o 攮s ,a 鼗白麓爹r o v e d 鑫i 窑o r i 专h l 矬c 簌l l e 莲 a sf e l a t i v e p r i n e i p a le o l 毪p q n e n la n a l y s i s( r p e a )i sp r o p o s e dw i l h i t s a p p l i c a t i o ni n i t op r o c e s sm o n i t o r i n g a c h i e v e m e n t so b t a i n e da r ea sf b l l o w s : 1 d i s c u s st h ei n n u e n e eo fd i m e n s i o n l e s ss t a n d a r d i z a t i o no ns y s t e m s t r 毽e t u r ei 娃莲e t a i l ,b a s e 瘥。蕤w h i e h 鑫程n o wa l g o 纛t 纛l 挂e a i l e da sr p c ai s p f o p o s e db yi 薹l l r o d u e i 瓤g “r o t u n d i t y ”s c a l t e 如r e l a t i v et r a n s 孙r ! n ( r t ) ,r e l a t i v e p r i n c i p a lc o m p o n e n t s ( r p c s ) a n ds oo n 。f i r s t l y ,s t a n d a r d i z et h es y s t e mf o r d i l 致e 致s i o 毅l e s s 。 s o e o 毂鑫l y ,嚣o e o f d i 慧g 鼍o p r i q r ii n 两f l 建a l i 藏,a 羹a l y z e 鑫羲纛 d e t e f m i 鼓et h ed 翻曛奄f e 瓤t 主】麓p o r t a 魏 l e v e l sq fd 主:疆i e r e 藏| v a r i a b l e s a 慧dt h e 登 a l l o e a t o 、v e i g h t sf b re a c hv a r i a b l eu n d e rt h ec r i t e r i o no fc o n s e r v a t i o n o f s y s l e me n e r g y 。f i n a l l y , u l i l i z et h e f e l a l i v e - p r i n c i p a l c o m p o n e n l l n o d e l e s t a b l i s 魏e di 髓t h i sp a p e fl o a 瑟a l y z 孝s y s t o l 疑 b o t h h o o r e t ea 琏a l y s i s 鑫n d s i 懋u l 鼓i o 豢h a v e媳o w 魏l h 敷r p c ss e l e c 专e d b y o u r搬棼h o da r e檄o f e r e p r e s e n t a t i v ea n dt h e i rs i g n i f i c a n c eo fg e o l n e t r yi sm o r en o t a b l e 。 2 。s l 毽d yo 珏r p e aw i l hi t s 鑫p p l i e 鑫专i o 爨。黢p r o e e s sl n o 纛i o r i n g 鑫藏d 耋鑫专鑫 e o m p r e s s ,a i l n i n g a lt h e p r o b l e 激sh a p p e 瓣e di np r a c t i c a la p p l i e 鑫l o n f o f o x 鑫薹n p l e ,d 鑫l ae o 礅p r o s s i o 珏芏n a yb ei n s u f 彝c i e n c y ,薹n o n i 专o r i n 鏊r e s u l t sa r en o t e x 魏e t l yb o c a u s eo ft h eu n p r o p e r l yp cs e l e e t i o n ,a n do u t l i e rp r o b l e l n se x i s 。 f i r s t l y ,鑫l n 8 h a l a n o b i sd i s t a n c e ( m d m e t 魏o di sp r o p o s e dt or e 遗毽c o f a l s e 河南大学研究生硕士学位论文第1 i i 页 魏l a f l 致s 蠹o l no u t l i e r sa n dd a t al 疑i s s i n g ;a n dt h e nad a t ac o n l p r e s s i o na b i l i t y p e r f o r m a n c ei n d e xi sb u i l tt ov e r i f | yv a l i d i t yo fr p c a o np r o c e s sm o n i t o r i n g 馥n dd a t ac o n l p r e s s i o n 。b ye o z 懿p a f i 藏gw i t 纛t r a d i l i o n 鑫 p c al n e 量l 莲,l 纛e 羹e w o 魏ee 鑫建b e t t o 聪专i | z ep r i o rs y s l e l 拄i 簸内 黢l a i o n ,鏊l a k e 圭h ep c ss e l e e t i o 鑫e a s i o r a n dt h e r e b yg r e a l l yi m p r o v et h er e p r e s e n t i n ga b i l i t yo fr p c s 3 a n a l y z et h ec h a n g eo fr 2s t a t i s t i c sm e a ni np c ss u b s p a c e 馥sw h i l ea s i 鬟? 譬s 专a 专i s t i e sl 辕e 鑫ni 建f e s i 莲u a ls u b s p a e e ,o nt 黾eb a s i so f 、甏h i e h ,al 慧e 魏o dl o d e 专霉f l n i 羹ep f o p r t i o 魏a lf a e t o fi sg i v e n k e yw o r d s :p c a ;r p c a ;r o t u n d i t y s e a t t e r ;p r o p o f t i 。n a l 惫e t o r ;p r e e s s l 捻。嚣i o 蜓建g ;d 鑫t 鑫e o i 建p r e s s i o 登 第1 v 页河南大学研究生硕士学位论文 符号说明: r实数域 r ”实栉维列向量空阀, 膨们,r 夕 掰黜 磁瓣矩阵的榘合 a ,b ,c 矩阵;a = 】影黜( r ) x ,y ,弘歹l 向量;x = 降,】r “ 0 pm 鼍y ,玉跫爨 a t a g 掰黜的转置 a 。 葛奇异矩障a 心。嚣的逆 d e t a a 材。的行列式 :掰蝴上的2 缒阵范数 嚣aa g 坂。的迹 m a ) 【 a ;a 彭的最大僮 关于学位论文独立完成和内容创新的声明 本人向河南大学提出硕士学位申请。本人郑重声明:所呈交的学位论文是 本人在导师的指导下独立完成的,对所研究的课题有新的见解。据我所知,除 文中特别加以说明、标注帝致谢的地方外,论文中不包括其他人已经发表或撰 写过的研究成果,也不包括其他人为获得任何教育、科研机构的学住或证书而 使用过的材料。与我一同工作酌同事对本研究所做的任何贡献均已在论文中作 了明确的说明并表示了谢意。 釜位申请人( 学位论文作者) 釜名: 塑坠 ,2 0o 毫年6 月序目 关于学位论文著作权使用授权书 本人经河南大学审核批准授予硕士学位。作为学位论文的作者,本人完全 了解并同意河南大学有关保留、使用学住论文的要求,即河南犬学有权向国家 图书馆、科研信息机构、数据收集机构和本校图书馆等提供学位论文( 纸质文 本和电子文本) 雕供公众检索、查阅。本人授权河南大学出于宣扬、展览学校 学术发展和进行学术交流等目酌,可从采取影印、缩印、扫描和拷贝等复制手 段保存、汇编学位论文( 纸质文本和电子文本) 。 ( 涉及保密内容的学位论文在解密后适用本授权书) 学位获得者( 学位论文作者) 签名:趟迫 2 06 鼋年g 月,9 日 学位论文指导教师签名:羔晕厶! 马 2 06 9 年g 月c 。曰 河南大学研究生硕士学位论文第1 页 第量章绪论 1 1 问题的提出 生元分析( p r i n c i p 址c o m p o n e n t 觚a l i y s i s ,p c a ) 是多元统计分析中常用的方法 之一,它以有限长度的多维变量时闻序列构成的随机矩阵舞基硝,通过建立数隧 较小靛综合变量,嫠其能更集孛缝反映原来变量中新包含麴变化信息,并有效分 离系统信息与噪声。慰前,p c a 已在故障诊断、数据压缩、信号处理和模式识 别等领域中均有广泛的应用【1 3 】。 然而,传统静p c a 方法却常存在如下不是: 筐先,传统p e a 方法是先通过计算随枫矩阵协方差阵的特缝值,随后 辩依据特征值的大小来确定各级主元变量。然而,特征值是与相应分变量协 方差的大小密切相关的,而各个变量协方差的大小又与对应分量所使用的量 缀( 单位) 密切褶关。正是叁于各变量量缀的不同,才使得在传统方法中出现 了方差大的分变量不定就是实际系统中起主导作用的变量的反常现象 4 】。例 如,在运动目标中,位移、速度和加速度分别为三个有不同量纲的变量,并 且位移与速度或加速度褶艮,它的量值会较大,测量时所产生的误差也就会 较大,然藤实瓣中,速度或船速度的懿变纯将对黧标熬运动状态裔更大酶影 响。从另方蕊来说,使用传统p c a 方法是通过将得到的原始随机变量经 过线性变换( 即线性组合) 后确定主元的,因此,所得到的主元是原系统中 几个具有指定物理含义鹣系统多交量静线性组合。箨么,它鸯身其体的物理 含义又如俺解释昵? 更进一步地,当所确定的主元失去物理意义对,再对其 进行检测、监控和诊断也就可能没有价值。 针对上述一类问题,许多研究者已经做了大量工作,主要方法是在计算 特薤值时,以楣关簸阵来代替协方差阵 绷。这样去除了量纲差异带来的虚假 影响,但也同时豢来德方题阅题。第一,根据信号分析前后能量守恒的准则, 随机矩阵在相对变换后要保持能量不变。传统p c a 方法保证了p c a 变换前 后能量守恒,然而弓| 入量纲标准化之后系统藐量是否守恒? 系统结构是否发 生变化? 第二,量纲标准佬之后系统随机矩阵可能大多呈现“均匀”分毒的现 象,即由相关矩阵计算得到的特征值大小是近似相等的,因而,很难提取出 有代表性的主元,同时又不容易对数据实施有效地的压缩和对故障信号的特 第2 页河南大学研究生硕士学位论文 征提取。 另外,从实际应用来看,传统p c a 方法在提取系统统计特征时没有考 虑到以下几个闻题: 1 ) 数据压缩可能不充分,引起主元个数增多; 2 ) 主元个数的取舍可能导致监视结果不准确。在传统p c a 建模过程中, 不同的监控参数其重要牲也有所不同,若较小的主元中包含重要的系统信 息,舍弃较小主元,将导致重要的信息丢失,否则,主元个数增多将导致系 统监控复杂; 3 ) 异常点闻题。鄹p c a 模型的监测统计量在正常运行下超出控制限, 从而弓l 起误报警的行为。有时,一两个异常点就能完全决定主元主轴的方向,从 而不能建立可靠的过程监控模型。 1 2 国内外研究现状 p e a r s o n 于1 9 0 1 年提出了主元分析的概念,随后h o t e l l i n g 、j e j a c k s o n 等学者对其进行了发展【7 1 。p c a 是一种常用的多变量二阶统计过程监控方法, 可对含有噪声和高度相关的测量数据进行冗余分搴斤和特征提取。它的主要任 务是对多维变量时间序列构成的有限长度随机矩阵进行降维,虽然,有时需 要用数目巨大的系统变量才能较完善地描述一个复杂系统,但是,在通常情 况下,系统的大部分变异性仅须用少数几个主元变量便可以说锈。丽利用这 少数的主元变量就可以有效地代表或解释原始系统变量孝别构成的随机矩 阵的特征结构,从而实现对信号的压缩与系统的故障检测与诊断1 8 ,9 1 。 科学网在1 9 9 9 2 0 0 0 两年间共鉴定了2 0 0 0 多篇关于p c a 的文章,p c a 在农业、生物、化学、气象学、入罄统计学、生态学、经济学、食物研究、 基因学、地质学、物理学、质量管理、通信理论、模式识别、图像处理以及 故障检测和诊断等领域均有大量的应用i l o 】。 m a e g r e 窑o f 提到了凡种p c a 在工业过程监测中的应焉。r 蠢e h 和c 遗皴 在利用主元分析进行故障检测时,结合角度辨识的方法进行故障诊断f 1 2 l 。 d u n i a 和q i n 给出了确定主元个数的故障最优重构方法,并且由故障方向矢 量表示了故障的可检测性、可重构性和可识别性条件1 1 3 j 引。l e o 和r a n d y 给 出了计算每交量对善2 和s p e 贡献的方法l 择l ,可用来进行教障识别。王海 海南大学研究生硕士学位论文第3 页 清等导出了,r 2 和s p e 统计量均值与过程数据统计参数之间的关系,分析了 影响p e a 梭测行荛豹嚣素黻及工况变化与故障在p c a 下兹不爨被检测行趣 淞l 强。 尽管p c a 在统计过程监测等领域已有很多成功的解决方案,但它的应 用范围还仅限于分析变量闻具有线性关系的静态数据中,丽且由于实际生产 过程中量缀的不蘑雩| 起主元变量选取的差异段及物理意义翁缺失,篌褥过程 监控可能没有价值,因此许多学者对p c a 方法进行推广。非线性主元分析 ( n o n l i n e a rp c a ) 结合神经网络处理非线性的能力,进一步改善了常规p c a 难于处理测量变量闻菲线性关系嚣弱限 t 删。鲁捧主元分折f r 娃b 疆熨p c a ) 遴避 定方法建立相关参数的鲁棒估计减轻或消除异常点权重,从丽提高统计模 型的质量,使得估计对异常点不敏感【排冽。量纲标准化( s t a n d a r d i z a t i o n a 藏a l y s i s ) 过程消除了不阕量纲对主元选取的影响,以得到均值为零,方差 为单霞的随机矩阵,然丽它霰都没有考虑到各交量在系统中的不同重要性, 文成林和熏天真等人在此基础上提出相对主元分析( r e l a t i v ep c a ) 的概念, 在主元分析的过程中引入比重因子,体现了系统特征并方便了主元选取【冽。 1 3 选题意义和研究内容 随着测量技术的发展及d c s ( d i s t r i b u t e dc o n t r o ls y s t e m ) 的广泛使用, 现代工韭生产过程中豹大量实时数据可戥被采集及存镳。两基于最新调查显 豕,9 3 以上的数据在进入业务系统以后,铁来得裂使用。嚣对如此海燕数 据,人们受到了来自“信息爆炸”、“混沌信息空间”( i n f o r m a t i o l lc h a o t i cs p a c e ) 和“数据过剩”( d 教ag l u t ) 等诸方面带来粒巨大压力。j o h nn a i s b e t t 在大趋 势( m e g 鑫专r e 魏d s ) 一书中营经这样感叹:“w 毫鑫f ed f o 弼i 鑫g 撼i 娃岛r 氆鑫专i o 觳,v b 饿 s t a r v i n gf o rk n o w l e d g e ”c 堋。因此,如何充分利用这些数据的深层次信息并从 中提取出有用的知识,提高过程的监控能力,使得特征提取技术变得越来越 重要。 在实际王业生产过程中发现,传统主元分桥方法没有考虑不同变量奠量 纲不同对主元选取造成的虚假影响以及系统中不同分量的重裳性有所差肄, 可能导致数据压缩不充分,进两引起主元数星增多的反常现象。另一方西, 出于不同变量对故障懿敏感度不同,直接应用传统p c 轰对生产过程进行监 第4 页河南大学研究生硕士学位论文 控通常无法获得令人满意的结果。比较典型的现象是,当过程稳定运行于某 一正常操作模式下时,往往出现大量的连续报警。文成林和王天真等人提出 相对化交换的概念,将不同交量的相对重要性引入到系统中,方便了主元的 选取。但是,这一理论体系并不十分完善,且没有考虑在实际系统监控中的 应用。因此,开展基于r p c a 的特征提取和系统监控方法研究是十分必要的, 它能有效地利用现有的优化方法,对系统结构特征进行学习,获取比重因子, 实现对系统的特征提取和过程监控,进丽避免不必要的经济损失和事故发 生。 本论文在国家自然科学基金、国家自然科学基金重点项目以及浙江省国 际合作重点项目等谍题的共同资助下开展以下两方面的研究,箕主要内容包 括: ( 一) 相对主元分析部分 1 对量纲标准化过程引起分布“均匀”等问题进行详细地分析; 2 从理论上进一步完善相对化交换( r e l a t i v en a n s f o r m ,盯) 和相对主 元分析( r p c a ) 方法; 3 确定影响系统比重因子的般方法。 ( 二) 多元统计过程监控及特征提取部分 1 研究与传统p c a 方法相比,在利用爻p c a 进行数据压缩时,相对主 元( r e l a t i v ep r i n c i p a lc o m p o n e n t s ,r p c s ) 的代表能力,即数据压缩力, 同时考虑用r p c s 重构原始数据时的数据重构力问题; 2 针对在实际生产过程进行故障检测与诊断时所遇到的异常点及数据 丢失等润题,开展基于r p e a 方法熬故障检测与诊断效能的仿囊研 究,将原始随机矩阵分解成预测空间和残差空间,考虑在不同空间中, 典型故障信号的检测与诊断。 1 。4 本文的主要工作安排 本论文的主要工作安排如下: 第一章绪论。对主元分析的研究现状进行了回顾,指出现有方法中存 在的问题,并概述了论文研究的意义和内容。 第二章详绥介绍传统p c a 方法麓理论基赭,讨论了基于p c a 的过程 海南大学研究生硕士学健论文第5 贾 监控策略。 第三章首先在探讨传统p c a 算法性能的基础上,指如量缨标准他过 程瓣系统结构的影响;然后再辩雩| 入糖对纯变换,分布“均匀”等概念,建立 起一种相对纯主元分析方法;最后定义了比重因子选取的一般规则,并绘缀 r p c a 的几何意义和仿真研究。 繁霆章研究基予r p c a 殴特征提取闻题。针对在实际监控过程中遏劐 的异常点和数据丢失等阈题,开展基予r p c a 方法的故障捡测与诊断效能的 仿真研究。定义数据压缩力和重构力概念,并讨论了r p c a 下的数据压缩及 重构能力。 第五章首先研究主元子空阊和残差子空闻中统计量的变化;然后考虑 弓l 入敏感度作为比重因子,来考察不满变量的重要性;最后遴过对k 致鼓e s s e e e 鑫s t 氆鞠过程监控结果鼢分析表明,本方法可以显著减少误报警并提高检测 的正确率。 , 最后,对论文的工作进行总结釉展望。 本章小结 首先,分析了传统主元分析方法存在的问题,并详细论证建立相对主嚣 分析方法的重要性和必要性;其次,介绍了国内外在研究主元分析解决实际 翔题时靛诸多方法,并指凄了它们的蜀限性;接下来给选本论文麴研究意义 和主要的研究思路;最蒋给毒了本论文的主要工作安排。 第6 页河南大学研究生硕士学位论文 第2 章基础知识 p c a 是多元统计分析中常用的方法之一,它以有限长度的多维变量时间 序列构成的随机矩阵为基础,通过建立数嚣较小的综合变量,使其能更集中 地反映原来变量中所包含的变化信息,并有效分离系统信息与噪声。目前, p c a 已在故障诊断、数据压缩、信号处理和模式识别等领域中均有广泛的应 用。 2 1 传统p c a 理论基础 2 量1 代数意义 对一个给定的多变量系统,设用来描述系统的嚣维变量为 x ( 女) 兰【x l ( 是) ,x 2 ( 是) ,x 。( 女) 】1 震” 焉由它的一段长度有限的系统变量时闻序列构成的随机阵为 x := x ( 七,七十一1 ) = 【x ( 尼) ,x ( 七+ 1 ) ,x ( 七+ 一1 ) 】 若用x ,表示系统的第f 个分量序列构成的有限长度时间序列 x ,:= x ,( 露,露+ 一1 ) = 【x ,( 宓) ,x ,( 露+ 1 ) ,x ,( 东+ 一1 ) 】( 2 1 ) 则矩阵x 又可以被表示为 x = x 1 x , : x ” ( 2 - 2 ) 若再记上述随机矩阵x 的协方差阵x 为 x = e 【x ( 七,七+ 一1 ) 一e x ( 后,露+ 一1 ) ) 】【x ( 后,七十1 ) 一e x ( 七,j j + 一1 ) 】t ,( 2 3 ) 那么,通过求解 阻一三x l = o( 2 - 4 ) 和 t z 一三x ) 尹;= o ,= l ,2 ,鞭( 2 5 ) 河南大学研究生硕士学位论文 第7 页 就可以分别求出矩降x 的特征值k 和对应的特征向量 p ,= 溉,p 舯,p 卅】t ,且有 :矽,。p ,= p ,t 尹,= :6 。= = :;! :薹:;, z ,。,= = t ,2 ,z e 2 _ 6 , 因此 其中 隽了便于撬述,鹱定坶个特征傻互不棱等且有五 蠢2 气。 注释2 。l :若特征值有重根时,式( 2 5 ) 的形式会有相应的变化1 2 7 】。 由式( 2 5 ) 求出的特征向量p ,并结合式( 2 2 ) ,可以褥 l := ,l ( 静,露十1 ) = ( p 1 ) tx = p l ,x , ,= l 贽 ,2 := ,2 ( 惫,露+ l v 1 ) = ( p2 ) tx 。p2 j x ( 2 7 ) j = ! y zp 下x - y :拦y ( 最,七+ 一1 ) 拳 ( 2 - 8 ) 若再定义 ,( 七) = 如1 ( 尼) ,1 ,:( 露k ,l ,。( 是) 】t 则随机矩阵v 亦可表示为 矿然p ( 露) ,v ( 足+ 1 ) , ,( 豇+ 一1 ) 】 由于p 是正交矩阵,因此分析和研究随机矩阵x 的统计特性就等价地变为分 析随机矩阵v 的统计特性。 为了最貔地获取蘧规矩辫的变化量,羼黠最夺纯噪声对p c a 麴影嫡, 选取与鞭沏 嚣) 个最大特征值相对应的向量v ;,v :,v 掰被典型地保留。如果 x 哪 ; 。芦 然 x f i、,一p,t | l 、, t i一 ; 十 0 参 ,l抻 p ; j i 珂 矿 拧 p, 2矽尹_-l 霹p 1,;,l;,;,j 矾晚: 蚊 第8 页河南大学研究生硕士学位论文 可以用前搬个主兀来代表数据中的主要变化,那么可以得到f = 豳的分解【:8 】 x = p 矿= 尹;, ,2 l = 尹,+ p ,t ( 2 9 ) 为主元模型 为建模误差。显然有 则有 性质2 1 若记 x ,= 匕吒= 尹, ,= l = c 匕= p , , = 蹬+ l 匕= 【a ,仍,死】 k :h t ,吃t ,t r t = ,1 ,魏】 k :h t ,t ,t ! r v a r ( 矽,) = e 卜,一e 一e 】t c w ( 扩,v ,) = e - ,一 妒, 】l ,一e 矽, 】t v 鑫v ,) = ( 尹,) 了三x p ,= 九,i = l ,2 ,嚣 c o v ( ,v j ) = ( p ,) 乍三x p j = o ,f 歹 证明: 性质2 。l 的证鹗过程是平凡的。由式( 2 5 ) 和式2 6 ) ,有 ( 2 - l o ) ( 2 1 1 ) 驴。j 只 + 层,m + 毛, 搬 只x = l l 中其 河南大学研究生硕士学位论文第9 页 嘛咐锄y 嘞和,嚣倭,等 2 。1 2 几何意义 献几何观点来看,主元分橱的实质就是将原坐标系逶行平移和旋转交 换,使得新坐标熬原点与数据样本群豹重心重会。设原始交量有限长度对阉 序列构成的随机矩阵x 的分布为熙 x ) ,x 】。在以e x 为中心的超椭球上, x 的密度是常数l 瞳一e x r ( 暑x ) 。防一e x ) 】嚣c 2( 2 1 2 ) 而此超椭球的备轴分别为 c 0 五舻f ,f = l ,2 ,嚣 其中五和p ,分别是协方差阵x 的一特征值和对应的特征向量。 不妨令基 x ;= o ,刘 x 彳 三x ) 。1 x = 2( 2 一1 3 ) 由 二x = 五p ,( p ;) 苫 ( 2 一1 4 ) 知 ( 剐= 喜毒罗俐t ( 2 1 5 ) 所戬 x 彳喜b 产= 舢t x 尸”咖+ 扣芏x , x j 彰 。 ( 2 - l6 ) 其中p 。乍x ,p 。彳x 为x 的主元。那么,式( 2 16 ) 也可以写为 第1 0 页河南大学研究生硕士学位论文 亡2 ;( 矽1 ) 了爹l + ( v 2 ) 了 ,2 + + ( ) 了 ( 2 17 ) 八1 八2 人” 如果 是最大的特征值,那么超椭球的主轴沿着p ,的方向,其余较次要 的坐标轴依次沿着由p 2 ,p 。所确定的方向。主元分析的几何解释如图2 - l 所示。蚕中有两个主元,分别是p g 雾l 和p c 襻2 ,它们之闻是正交的。第一个 主元给出了过程变化的主要趋势,而相比之下,第二个主元可认为是噪声因 素,因此可以选择忽略第二主元1 3 0 】。 j 劢刚1 。久乓- 一 、| | | 7y _ 抛 ! 1 图2 1p c a 的几何解释 x 2 。1 3 主元的选取 建立主元模型关键的问题是如何选择合适的主元个数。当所选主元个数 太少时,将会丢失较多信息,造成模型误差变大;当采用的主元过多时,将 会过多地引入过程数据中的测量噪声,也会造成模型误差增大】。通常情况 下,采用方差累计贡献率( c u m u l a t i v ep e r c e n tv a r i a n c e ,c p v ) 法来确定主元个 数辫 3 2 】,郎 唧= 再0 面 1 0 溉狨t 加+ 式中是人为设定的控制限,一般取8 5 。 若定义a = 讲凹队。,九2 ,九。】,根据性质2 1 有 砥1 ) = + 九:+ + 天。篇t r ( p t 三x p ) = t r ( 三x p 丁p ) = t r ( 三x ) 即 河南大学研究生硕士学位论文第l l 页 k + 九2 + 笼。= l l + 2 2 + 。 这里。( 江l ,2 ,狞) 是x 的主对角线元素。所以累计贡献率又可以改写成 = 志 1 0 0 2 1 4 一个说明性例子 l 乍为砑究杨树形状的部分,测定2 0 株杨树树叶,每个叶片测定了四 个变量,变量名称及测量值列于表2 1 【3 3 】。运用p c a 方法求得所有特征向量 和特征根,并选取累计贡献率大于8 5 的前两个分量作为主元,如表2 2 所 示,如果舍去其余主分量,损失的信息仅为l 。4 。 表2 1 杨树树时潞量缝 样本号 时长墨 2 ,3 处宽溉l ,3 处宽款 l ,2 处宽兢 11 0 89 5ll811 0 29 09 5 1 17 110 3 1 3 0 9 51 4 01 2 5 4ll 霹 8 5l1 3l 8 5 1 1 3 8 71 2 l11 0 61 2 09 01 2 211 4 78 76 79 78 8 89 46 68 88 6 9ll58 4ll81 0 6 1 09 0 7 510 39 6 1 l1 17 6 08 4 7 6 1 21 3 霹7 3l 49 2 1 3】5 07 3】o9 6 1 4 1 4 0 6 49 58 7 15 1 2 6 7 59 6 9 0 第1 2 页河南大学研究生硕士学位论文 1 61 184 35 95 2 1 713 65 58 97 5 181 4 56 3 9 78 4 1 91 6 l6 毒1129 4 2 0 15 56 01o o8 3 表2 2 特 歪向量及特征馕 主元 第一主元y 1第一主元n第一主元y 3 第一主元y 。 变是 叶长蕾o 1 4 8 50 9 5 4 4 o 2 5 1 50 0 6 1 4 2 3 处宽矗 o 5 7 3 5o 0 9 8 4o 7 7 3 4o 2 5 1 4 l 您处宽溉 o 。5 5 7 7e 。2 6 9 50 5 5 8 50 。5 5 1 7 l 2 处宽玩 o 5 8 1 4o 。0 8 2 4o 1 6 2 9o 。7 9 2 9 特征值 2 9 2 0 01 0 2 3 7o 0 4 8 90 0 0 7 4 c p v 7 2 9 9 9 69 8 s 9 1 49 9 8 1 4 41o o o o o o 从表2 2 可以看出: 1 ) 第一主元敦是表示“叶宽”的综合变量。这是因为,第一主元对原始 变量x 2 ,x 3 ,x 4 的系数相差不多,但对x ,的系数较小,而x :,x 3 ,x 。正是杨树叶宽 的指标; 2 ) 第二主元y ,是表示“叶长”的综合变量。同上,墨对第二主元的贡献 远远大予其它三个; 3 ) 第三主元y ,主要由变量x ,弘决定,二者符号相反,即这个主元表示 叶片2 3 处宽和l 3 处宽的对比度,是表名叶片“逐渐变尖”程度的综合因子; 4 ) 类似地,可以说明第四主元敦是表示叶片上部“消尖程度”的综合因 子。 该结果表明了,叶片之间的主要差异为叶宽,其次为叶长。少,儿是表 示叶形的综合变量,而且其贡献很小,说明这些杨树叶片酶形状差异很小。 图2 2 给出了这2 0 个样本在主元坐标系中的分布图,可以看出,全部 叶片可以大致分成两组,由图中虚线隔开。事实上,样本1 1o 取自树种 p g e l r i c a ,样本“一2 0 取自树种p t t ,而如果仅仅考虑原始数据是很难作 河南大学研究生硕士学位论文第1 3 页 如这种区分的。 2 2 基于p c a 的过程监控 图2 2 主元分布圈 2 2 1 简介 工韭生产过程中存在着大量高度相关的测量变量,这些交量在每露剩 懿采样簦郝蕴含着生产过程是否正常、产品矮量是否合格等信息。虫予变量 间的高度相关性,故障或扰动会导致许多变壁采样值的异常,因而仅监视各 个独立的过程变量,对于过程监测、故障检测及诊断并无裨益。主元分析方 法将生产过程中大量高度福关懿过程变量投影到一个包含簇空闻绝大多数 信息的低维子空闻中,从丽使缛故障检测与诊断等研究工作大为简化【3 4 】。 2 2 2 基于p c a 的故障检测 p c a 统计过程检测模型描述了正常工况下各过程变量阊密耪料平衡、熊 量平衡以及操雅限铡等约束掰造成麴关联。具体故障检测方法就是将过程中 得到的数据向量投影到两个正交的子空间( 预测空间和残差空间) 上,并分 别在相应予空间上建立统计量来进行假设检验,判断过程逡行的状况。 根据式( 2 9 ) 中掰确立的主元模型,在新的对猁素,过程自量x 穗) 可被分 解为 x ( 女) = 奠( 女) + 舅( 霓)( 2 一1 8 ) 第1 4 页河南大学研究生硕士学位论文 其中氲七) = p 。蠓x ( 老) 是x ( 露) 在主元子空间上的投影,堇( 七) = ( 1 一p 。联) x ( 七) 是 x ( 庀) 在残差子空间上的投影。 统计指标r 2 表示x ( 惫) 在主元子空间上投影的大小,郎 r 2 = l l 圣( 嘉) | | ; ( 2 。1 9 ) 9 一统计量也搿q 做平方预报误差( s q u a r e 纛p f e d i c t i o 娃e r r o r ,s p e ) ,它度量 了x ( 是) 偏离主元模型的程度,鄹 删= 敝硎; ( 2 2 0 ) 如果过程运行正常,应网时满足【3 5 娜1 丁2 o ( 3 一1 5 ) 则稼式( 3 1 3 ) 是对原始系统隧机矩阵x 所傲的相对化交换,w 是相瘦豹相 对化变换算子,x r 是相对化交换詹的随机矩阵。式( 3 - 1 5 ) 中的p ,称为蹴重因 子,是一种根据实际系统而定的先验信息,它分别作用在每个变量上,其大 小体现了韬应分变量在系统中麴楣对重要程度;嬲;是对应随机变量的标准化 因子,事实上,依攥不同的系统,鸯多种标准优选择方式,如 ,七= l ,2 ,( 3 1 6 ) 两上节提刘的式( 3 8 ) 是其中最常丽的一种。科模型舞图3 1 所示。 若定义随机变量的相关系数如下: p 长i ( 囊) ,x ,( 磁) = c 。v x 露xx 歹_ 多孑影二i 戛l i 丽 则有 性质3 。6 x r 蕊9 爹? r = 爹嚣x ) v 砥x r ) = v 甜( 麟) = 2 v 州x ) 性质3 7 相对化变换不改变随辊变量之鲻蕊相关性,鞠 第2 4 页河南大学研究生硕士学位论文 p 砖,( 是) ! x r ( 磁) = p & ,( 露) ,戈,( 搬) p 各,( 露) ,x 于( 觏) = c 。v x ,女xx 多z :j 了磊i :i 而 3 _ ,7 ) p&,(七),x,(黼)。二7wic。:jxx露i:7:岁孑毛i三ii赢。3,8, 一c o v x i ( 七) ,x ( ,栉) ) 黝缈燃懒1x 黪翁臻i 漤黪4 蛹搿孵翰缘杉绺,i # 霹琴 标准纯因子渤,三= = 比重因予, 琵警鑫照蠡o i :& i 赫妊- 磊锄;蕊茹锄施施蒯醯嚣赫;籀弼荔s g

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论