




已阅读5页,还剩54页未读, 继续免费阅读
(控制科学与工程专业论文)基于混合数据挖掘方法的配电网故障诊断系统研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 电力系统的可靠性和供电质量关系着国民经济的发展和人们同常生活水平的提高。 当配电网发生故障尤其当保护和断路器发生误动或拒动以及通信装置故障造成信号改 变或丢失时,会形成变异的故障模式,从而造成警报模式复杂化,给配电网故障诊断造 成更多的困难。现有的研究方法在处理变异模式时难以保证故障定位的高容错性,会出 现错判或漏判,其实用价值受到一定限制。因此如何在配电网系统发生事故时能尽快判 定故障,为故障解列和恢复供电提供依据,减少停电损失,已成为配电网故障诊断研究 的重要课题。 本文针对单一数据挖掘方法在配电网故障诊断中存在的容错性差、诊断速度不高等 缺点,采用了将粗糙集方法和神经网络方法相结合的混合数据挖掘方法对配电网故障进 行诊断。首先对各种应用于配电网故障诊断的人工智能方法进行研究,分析它们在配电 网故障诊断中的特征以及存在的主要问题,然后以保护、断路器作为条件属性,配电网 的故障区域作为决策属性,考察各种故障情况并建立决策表,并利用布尔逻辑与可辨识 矩阵相结合的属性约简算法对算例构造的决策表进行约简,删除其中不必要的属性,再 利用人工神经网络调用最简规则集进行学习训练,这样既减少了神经网络的学习训练时 间,又提高了故障诊断的准确度。此方法充分利用了粗糙集理论的知识约简能力和人工 神经网络的容错学习能力,提高了系统的泛化能力,弥补了各自的不足。 本文最后采用了v b 语言作为开发工具,调用m a t l a b 神经网络工具箱建立了一个简 化的配电网故障诊断系统,并通过配电网实例验证了该方法的正确性和有效性。 关键词:数据挖掘,粗糙集,人工神经网络,配电网,故障诊断 i n t e l l i g e n th y b r i ds y s t e mb a s e do nd a t am i n i n g f o rd i s t r i b u t i o ns y s t e mf a u l td i a g n o s i s s o n gk a i ( c o n t r o ls c i e n c ea n de n g i n e e r i n g ) d i r e c t e db yp r o f l i ur u n h u a a b s t r a c t t h er e l i a b i l i t ya n dp o w e rq u a l i t yo fp o w e rs y s t e mi s d i r e c t l yr e l a t e dt o n a t i o n a l e c o n o m i cd e v e l o p m e n ta n dt h el e v e lo fp e o p l ed a i l yl i v e se l e v a t i o n w h e nt h ed i s t r i b u t i o n n e t w o r kf a i l u r e s ,e s p e c i a l l yw h e nt h ep r o t e c t i o na n dc i r c u i tb r e a k e rt r i p p i n go rm a l f u n c t i o n o c c u r sa n ds i g n a lc h a n g e so rl o s sc a u s e db yc o m m u n i c a t i o n sd e v i c ef a i l u r e ,i tw i l lf o r m v a r i a t i o nf a i l u r em o d ew h i c hr e s u l ti nc o m p l i c a t i o no fa l a r mm o d ea n d b r i n gm o r ed i f f i c u l t i e s t ot h ed i s t r i b u t i o ns y s t e mf a u l td i a g n o s i s p r a c t i c a l i t yo fe x i s t i n gr e s e a r c hm e t h o d si ss u b je c t t oc e r t a i nr e s t r i c t i o n sb e c a u s ew h e ni td e a lw i t hv a r i a t i o nm o d e ,i ti sd i f f i c u l tt og u a r a n t e et h e h i g hf a u l tt o l e r a n c ea n dt h e r ew i l lb em i s c a r r i a g eo fj u s t i c e s oi th a sb e c o m eav e r y m e a n i n g f u lr e s e a r c ht o p i ct od e t e r m i n ef a u l t ,p r o v i d i n gab a s i st od i s c o n n e c t i o na n d r e s t o r a t i o no fp o w e rs u p p l ya n dr e d u c i n gt h eo u t a g ec o s tw h e nt h ed i s t r i b u t i o nn e t w o r k s y s t e mf a i l u r e s i nt h i sa r t i c l e ,iu s eh y b r i dd a t am i n i n gm e t h o d st h a tc o m b i n er o u g hs e ta p p r o a c ha n d n e u r a ln e t w o r ki no r d e rt oo v e r c o m et h ed e f e c to fs i n g l ed a t am i n i n gm e t h o di nf a u l t t o l e r a n c ea n dl o ws p e e dt h a te x i s ti nd i s t r i b u t i o ns y s t e mf a u l td i a g n o s i s b a s e do nt h ea n a l y s i s a n ds t u d yp r e d e c e s s o r sf o rt h ed i s t r i b u t i o nn e t w o r kf a u l td i a g n o s i s ,ir e s e a r c ho nav a r i e t yo f a r t i f i c i a li n t e l l i g e n c em e t h o d su s e di nd i s t r i b u t i o nn e t w o r kf a u l td i a g n o s i sa n da n a l y s et h e c h a r a c t e r i s t i c sa n dt h em a i np r o b l e m se x i s t e n c ei nd i s t r i b u t i o nn e t w o r kf a u l td i a g n o s i s u s i n g h y b r i d d a t a m i n i n gm e t h o di n t h ed i s t r i b u t i o nn e t w o r kf a u l td i a g n o s i s ,f i r s t l y s e e i n g p r o t e c t i n gt h ec i r c u i tb r e a k e ra sac o n d i t i o na t t r i b u t ea n dt h er e g i o n a ld i s t r i b u t i o nn e t w o r ka s ad e c i s i o na t t r i b u t e a tt h es a m et i m e ,e x a m i n eav a r i e t yo ff a u l t c o n d i t i o n sa n dt h e e s t a b l i s h m e n to fd e c i s i o n - m a k i n gt a b l et h ef a i l u r et os t u d yav a r i e t yo ff a u l tc o n d i t i o n sa n d t h ee s t a b l i s hd e c i s i o n m a k i n gt a b l e t h e n ,u s i n ga t t r i b u t er e d u c t i o na l g o r i t h mt h a tc o m b i n a e d w i t hb o o l e a nl o g i ca n dd i s c e m i b i l i t ym a t r i x c a nt or e d u c t i o na ne x a m p l ed e c i s i o nt a b l e c o n s t r u c t e da n dd e l e t eu n n e c e s s a r ya t t r i b u t e s u s i n ga r t i f i c i a ln e u r a ln e t w o r kt h a tc a l l e dt h e m o s ts i m p l es e to fr u l e sf o rl e a r n i n ga n dt r a i n i n g ,w h i c hi sn o to n l yr e d u c e st h et i m et h a t n e u r a ln e t w o r kt r a i n i n gl e a r n ,b u ta l s o i m p r o v ed i a g n o s t i ca c c u r a c y t h i sm e t h o dt a k e s a d v a n t a g eo fk n o w l e d g er e d u c t i o nc a p a c i t yo fr o u g hs e tt h e o r ya n df a u l t t o l e r a n ta b i l i t yo f a r t i f i c i a ln e u r a ln e t w o r k s i ti m p r o v e st h ea b i l i t yo fg e n e r a l i z a t i o na n dm a k eu pf o rt h e i r s h o r t c o m i n g s a tl a s t ,t h i sa r t i c l eu s ev bl a n g u a g ea sd e v e l o p m e n tt o o la n du s i n gm a t l a bn e u r a l n e t w o r kt o o lb o xt oe s t a b l i s has i m p l i f i e dd i s t r i b u t i o nn e t w o r kf a u l td i a g n o s i ss y s t e m i ti s v e r i f i e dt h r o u g ht h ed i s t r i b u t i o nn e t w o r ke x a m p l e st h a tt h em e t h o di sc o r r e c t n e s sa n d e f f e c t i v e n e s s k e yw o r d s :d a t am i n i n g ,r o u g hs e t s ,a r t i f i c i a ln e u r a ln e t w o r k s ,d i s t r i b u t i o nn e t w o r k s , f a u l td i a g n o s i s i i i 关于学位论文的独创性声明 本人郑重声明:所呈交的论文是本人在指导教师指导下独立进行研究工作所取得的 成果,论文中有关资料和数据是实事求是的。尽我所知,除文中已经加以标注和致谢外, 本论文不包含其他人已经发表或撰写的研究成果,也不包含本人或他人为获得中国石油 大学( 华东) 或其它教育机构的学位或学历证书而使用过的材料。与我一同工作的同志 对研究所做的任何贡献均已在论文中作出了明确的说明。 若有不实之处,本人愿意承担相关法律责任。 , 学位论文作者签名: 日期: o 年d 乡月。日 学位论文使用授权书 本人完全同意中国石油大学( 华东) 有权使用本学位论文( 包括但不限于其印 刷版和电子版) ,使用方式包括但不限于:保留学位论文,按规定向国家有关部门( 机 构) 送交学位论文,以学术交流为目的赠送和交换学位论文,允许学位论文被查阅、 借阅和复印,将学位论文的全部或部分内容编入有关数据库进行检索,采用影印、 缩印或其他复制手段保存学位论文。 保密学位论文在解密后的使用授权同上。 学位论文作者签名:型lj 指导教师签名:2 4 立晔 日期:2 0l 。年0 6 月d e 1 日期:h 口年口6 月驴f 日 中国石油大学( 华东) 硕上学位论文 1 1 课题研究的背景与意义 第1 章绪论 电力工业是国民经济的基础产业,为国民经济的发展提供动力支持。改革开放以来, 伴随着我国经济社会的快速发展,电力工业也取得了长足的进步。配电网是电力系统中 起分配电能作用的网络,按电压等级来分类,可分为高压配电网,中压配电网,低压配 电网。配电网的作用是给各类用电负荷和各个配电站供给电源。配电网中的设备种类繁 多,覆盖面广且易受到外界条件的干扰,造成配电网维护任务重且较难管理。随着我国 经济的增长、供电规模和范围不断扩大,在配电网建设中如何对电力设施进行更好的保 护、如何对电能质量进行更好的控制以及如何提高供电的安全性与经济性等,都成为人 们关注的热点问题。而传统的配电网存在设备陈旧、抵御外力破坏和恶劣天气的能力差 等突出问题,己不能适应电网规模日益扩大的趋势,导致配电网不能满足用户日益增长 的用电需求。因此,采取各种措施努力提高供电可靠性和稳定性,减少非计划停电的时 间,加快恢复供电的速度和保持较高的电能质量,对保障人们正常的生产生活有着非常 重要的意义【1 1 。 配电网故障的智能诊断是实现电网自动化的基本要求,也是智能配电网的重要组成 部分。配电网直接与用户相连接,与社会生产和人们的生活有着非常密切的关系,配电 网一旦发生故障,就会给人们生活带来极大的不便,给社会生产造成巨大损失。配电网 故障智能诊断系统的实现为经济的发展和人民生活水平的提高提供重要的技术保障,当 配电网发生故障时,故障诊断系统会根据电力系统继电保护的相关信息对配电网发生的 故障进行实时分析和判断,自动处理故障报警信息、判断故障位置,为值班工作人员提 供相关的诊断依据并隔离故障区域,提高了供电的可靠性,保证了配电网安全有效的运 行【2 】o 由于目前绝大多数电力系统的故障发生在配电网上,配电网故障诊断是在技术层面 上提高电力系统安全可靠运行的重要手段。它是实现故障的快速隔离、排除和恢复供电 的i j 提和基础,也为电力部门和用户之间提供了一种良好的沟通渠道【3 1 。如何对配电网 中出现的故障进行及时准确地分析和定位,建立一套高效、经济的配电网故障诊断系统, 成为目前配电网研究的一个重要课题,有着重要的理论意义和实用价值。另外由于现有 的一些配电网故障诊断方法存在很多不足,诊断的结果难以令人满意,因此需要对配电 网故障诊断方法进行有效的改进。 l 第l 章绪论 1 2 配电网故障诊断方法的研究现状 由于人工智能技术具有较强的学习能力,容易计及人的经验且能够较好地模拟人类 处理问题的过程,因此在配电网故障智能诊断这一领域得到了广泛的应用。当前已有多 种人工智能技术应用到配电网故障诊断中去,如模糊理论、优化技术、专家系统、p e t r i 网络、数据挖掘等,本节将分别介绍其相应的故障诊断方法及存在的主要问题。 1 2 1 模糊理论 模糊理论( f u z z yt h e o r y ) 是一个具有完整推理体系的智能化技术,它把经典集合理论 模糊化,并引入近似推理和语言变量的模糊逻辑。把模糊理论应用到配电网故障诊断中 去,解决了专家系统在处理不确定信息能力时准确率较低的缺陷,从而提高了配电网故 障诊断系统的容错性和准确率。而且其在表述专家经验时使用语言变量这种工具,因 而与人的日常表达习惯更为接近。但是它不具备学习能力,可维护性差,尤其当系统数 据量较大时诊断速度较慢【4 】。文献 5 】提出了基于径向基神经网络与模糊理论融合的配电 网故障诊断方法,使得蕴含在径向基神经网络权重中的知识转变为等值模糊控制系统中 用语言表述的规则,使配电网诊断知识更加易于理解,且诊断过程非常透明,从而克服 了神经网络解释能力差的缺陷。文献【6 】将模糊理论与p e t r i 网相结合,克服了p e t r i 网容错 性较差的缺点,且提高了电力系统故障诊断的精度。文献 7 利用模糊理论中的模糊外展 推理技术建立数学模型,然后利用t a b u 搜索进行技术寻优,使故障诊断的容错性得到大 大提高。 1 2 2 优化技术 优化技术的核心思想是首先将配电网故障诊断问题描述为优化问题,然后建立数学 模型,用优化方法对其进行求解引。建立故障诊断的解析模型是目前优化技术用于配电 网故障诊断的主要方法。文献【9 】提出了基于停电区域的电力系统故障诊断的一种新的解 决方法。该文献首先提出了应用无源信息识别停电区域的方法,从而有效地把故障诊断 问题缩d , n 某一些小的局部网络中去。在停电区域中,根据停电元件、保护动作信息和 断路器构造了新的只在停电区域中识别故障元件的0 1 规划模型。该模型结构简单、求 解速度快,使故障诊断的速度得到了大大的提高。文献最后采用了贪婪算法对该电力系 统故障诊断模型进行求解。经算例计算证明,所提出的电力系统故障诊断的数学模型是 正确合理的。 2 中国石油大学( 华东) 硕士学位论文 1 2 3 专家系统 专家系统是一个智能计算机程序系统,其内部含有大量的某个领域专家水平的知识 与经验,能够利用人类专家的知识和解决问题的方法来处理该领域问题。随着人工智能 技术的不断发展,专家系统在配电网故障诊断中也获得了越来越广泛的应用,它是最活 跃的人工智能应用研究领域之一【1 0 】。但是在实际应用中它仍然存在一些缺陷:( 1 ) 专家 系统比较大时,专家系统推理完成诊断的速度慢。( 2 ) 大型专家系统的维护难度非常大。 ( 3 ) 专家系统的容错能力较差。( 4 ) 一般的专家系统并不具备学习能力。 针对专家系统的这些缺陷,近些年来许多专家学者们提出了一些行之有效的解决方 法。文献 1 1 ,1 2 1 提出了将专家系统与模糊理论相结合的方法,文献 1 3 提出把基于事例 推理与基于规则推理进行有效融合,形成混合推理的专家系统,在使用中可不断地增加 新事例来提高系统诊断复杂故障的性能。文献 1 4 1 提出将粗糙集理论与专家系统相结合 的方法,文献 1 5 提出了b p 神经网络和专家系统相结合的方法,这两种融合方法都是用 来解决单独使用专家系统时容错性较差的缺点。针对配电网规模比较大时,专家系统规 则匹配方法的诊断速度较慢的缺点,文献【1 6 】介绍了一种将专家系统与p e t r i 网相结合的 方法,这种方法克服了当配电网规模较大时,专家系统规则匹配方法的诊断速度较慢和 难于用精准的数学模型描述的缺陷,有效地提高了配电网故障诊断的速度。 1 2 4 p e t r i 网络 p e t r i 网是完全从过程的角度出发为复杂系统的分析与描述设计提供的一种有效的 建模工具,能自然的描述同步、冲突、并发、资源争用等系统特性,具备数学图论相支 持的理论严密性及形式化步骤,同时还带有执行控制机制。目前它广泛地应用在电力系 统的计算机智能计算及辅助分析中【1 7 】。文献【1 8 将p e t r i 网和编码原理相融合建立冗余嵌 入p e t r i 网,具有计算简单、故障诊断速度快、实时性好、容错性强、准确度高等优点, 可以有效地提高电力系统故障诊断的性能。文献 1 9 】将模糊理论与p e t r i 网相融合,建立 了电力系统故障诊断的模糊p e t r i 网模型,具有较好的故障诊断效果。文献 2 0 】提出了基 于故障群组合优化的p e t r i 网故障诊断方法,大大增强了变电站故障诊断系统的容错能 力。文献 2 1 1 提出了一种基于p e t r i 网和概率信息的电力系统故障诊断方法,具有诊断速 度快、容错性较好、精度高、实时性较强等优点。文献【2 2 提出了基于一种改进的p e t r i 网的电网故障诊断模型,该方法适用于大型、多重故障的配电网故障诊断,具有较高的 准确性。 3 第l 章绪论 近年来数据挖掘技术成为国际上较为活跃的研究领域,它是数据库技术与人工智能 相结合的产物。已有部分研究者尝试把数据挖掘技术引入到电力系统的故障诊断中去, 并取得了一些成功的案例。有关数据挖掘技术在配电网故障诊断中的应用方法将在下面 章节作较详细的介绍。 1 3 数据挖掘及其在配电网故障诊断中的应用现状 数据挖掘又叫数据库中的知识发现,它是从不完整的、模糊的、大量的、有噪声的 和随机的数据中,提取人们事先不知道的、隐藏在其中的、但又是可信的、有价值的和 潜在的信息和知识的过程【2 3 1 。将数据挖掘技术引入到配电网故障诊断中去,能够及时地 诊断出配电网的故障区域并提出相应的解决方案,可实现配电网管理与监控的现代化和 智能化,从而有效地提高配电网的安全性和稳定性。 1 3 1 数据挖掘的常用技术 在各个领域的实际应用中,最常用的数据挖掘技术主要有粗糙集、神经网络、聚类 分析和关联规则等,下面分别对这些技术进行介绍: ( 1 ) 粗糙集。粗糙集理论的主要思想就是在保持分类能力不变的前提下,通过知识 约简导出问题的决策或分类规则。粗糙集方法和数据挖掘关系密切,目前已经在决策树、 关联规则等方面得到了广泛应用。目前对粗糙集研究的主要趋势是,粗糙集和神经网络 相结合、和模糊集相结合、以及和遗传算法相结合来用于数据挖掘2 4 1 。粗糙集为数据挖 掘提供了一种新的工具和方法,并拥有广阔的应用前景。 ( 2 ) 神经网络。人工神经网络是数据挖掘的重要方法之一,它是以人脑为基础的抽 象模型,可以模拟真实人脑神经网络的功能和结构。人工神经网络是由大量神经元通过 极为完善和丰富的连接,以及若干基本特征的某种理论简化、抽象和模拟而构成的种 信息处理系统。在数据挖掘中,对神经网络的改进重点是为了解决两个问题:知识获取 和知识表达。知识获取是给定一个已经训练好的神经网络,从中提取显示的知识( 一般 是符号形式) 。知识表达是使神经网络中抽象的权值代表一定的知识。神经网络是由多 个神经元连接而成的多层网络,可以模拟复杂的人脑思维系统。实质上,神经网络是一 个自适应函数估计器且不依赖于模型,即它不需要模型就可以实现任意的函数关系。其 突出优点是能够并行处理,并具有适应能力、学习能力和很强的容错能力。目前,神经 网络已经在目标跟踪、信号处理、故障诊断、专家系统、机器人控制、模式识别、组合 优化和预测系统等众多领域得到了广泛的应用【2 5 1 。 4 中国石油大学( 华东) 硕士学位论文 ( 3 ) 聚类分析。聚类分析是人类一项最基本的认识活动,正所谓“物以类聚”。它 将数据集分成若干个不同的类,使得在不同类中的数据尽可能相异,而同一类的数据对 象尽可能相似。聚类是一个无监督的学习过程,它同分类的根本区别在于:聚类是在不 知道对象特征的基础上要找到这个特征,而分类需要事先知道所依据的对象特征,因此, 在很多的工程实践中,聚类分析可以作为一种数据预处理的过程,是进一步处理和分析 数据的基础。作为数据挖掘的功能,聚类分析可以作为一个对特定类进一步分析、观察 每个类的特征和获得数据分析情况的独立工具。通过聚类人们能够识别稀疏和密集的区 域,因而发现全局的分布模式以及数据属性之间的意义的相互关系。数据挖掘技术的一 个突出特点是处理复杂的、巨大的数据集,这对聚类分析技术提出了特殊的挑战,它要 求聚类算法要有可伸缩性、处理高维数据的能力、处理不同类型属性能力、处理噪声数 据的能力、发现任意形状聚类的能力、对于输入记录的顺序不敏感、有很强的可用性和 可解释性、用于决定输入参数的领域知识最小化以及在一定约束条件下聚类等能力。目 前很多学者和专家提出了大量的聚类算法。算法的选择取决于聚类的目的、应用以及数 据的类型【2 6 】。 ( 4 ) 关联规则。对关联规则的研究是现在数据挖掘领域主要的研究方向之一。关联 规则是用来揭示数据与数据之间未知的相互依赖的关系,它的任务是给定一个事务的数 据库d ,在基于可支持度置信度的框架内,发现项目与数据之间大量有意义的相关联 系,生成所有的可信度和支持度分别高于用户给定的最小可信度和最小支持度的关联规 则。目前专家学者对关联规则的挖掘问题进行了大量的研究,主要涉及关联规则的挖掘 理论的探索、增量式关联规则挖掘、原有算法的改进和新算法的设计、模糊关联规则挖 掘、并行关联规则挖掘以及关联规则的应用推广等问题【2 7 】。 1 3 2 数据挖掘在配电网故障诊断中的应用现状 配电网故障诊断,是指在调度中心综合各种自动化检测设备进行的电力系统级故障 诊断,用来判定故障性质和确定故障区域的行为,辅助调度员进行相关决策分析。随着 通信技术和计算机技术的不断发展,故障录波器和数字式保护等智能电子装置越来越多 地应用到配电网中去。在配电网受到扰动或发生故障时,这些监控设备会自动记录大量 的故障信息数据。为了充分实现这些故障信息数据的采集和利用,这些年来开展了一系 列配电网故障信息系统的建设,并取得了一定的成绩,但目前故障诊断的准确性和故障 信息的综合利用仍不是很理想【2 引。一方面,虽然很多电力公司经过这么多年的运行,不 5 第1 章绪论 断积累了大量的配电网历史故障数据,但目前传统的数据处理手段能力很有限,只能对 数据进行较初步的处理和分析,并不能挖掘出其中更深层次的知识。同时电力公司的高 层希望能够应用隐含在其中更深层次的知识,辅助做出正确的决策,却因对数据挖掘知 识的欠缺而挖掘不出有用有价值的信息。另一方面,当配电网发生大面积复杂故障时, 从各变电站、输电线路传输到调度中心的故障数据是海量的,这就需要一套精准的智能 配电网故障诊断系统。如何充分利用海量的历史故障数据,并结合多信息源的特点,通 过信息的有效融合来提高配电网故障诊断的准确性,这些都需要作更进一步的科学研 究、探讨【2 9 1 。因此,无论是在线的实时故障诊断还是离线的分析应用,研究数据挖掘技 术以及信息融合技术在配电网故障诊断系统中的应用都具有重要现实意义和理论价值。 同时鉴于配电网系统具有数据种类繁杂、数据量大、配电网系统对数据的要求高和 数据质量差的特征,迫切需要一种能快速、准确地处理海量数据的技术。但是,目前在 配电网发生故障时,调度自动化系统把采集到的海量数据在很短的时间内全部提供给调 度员,以致调度员工作量特别庞大,往往造成对故障的误判与错判,极易造成事故的进 一步扩大【3 们。 由于数据挖掘技术具有非常强大的数据分析功能,在寻找配电网发生故障的原因和 发生故障的区域时,可充分利用其分析技术,并制定相应的辅助决策规则,采取措施减 少故障修复的时间或故障发生的概率,从而提高配电网的稳定性和可靠性。 在配电网故障诊断方面,文献【3 l 】提出利用基于粗糙集的数据挖掘模型,粗糙集的 最佳属性约简用g a 的全局寻优能力来求得。在配电网故障诊断中,文献【3 2 】分别提出了 五种基于数据挖掘的故障诊断模型:常规神经网络的故障诊断模型、常规粗糙集理论和 分布式规则型神经网络组合的故障诊断模型、常规粗糙集的故障诊断模型、广义粗糙集 和规则神经网络相融合的故障诊断模型以及常规粗糙集和改进的神经网络相融合的故 障诊断模型,达到了不同方法的互补,充分发挥了各自的优势,从而使模型的性能得到 更进一步的提高。文献 3 3 根据高压输电线发生故障时形成具有时空特征的离散事件序 列信息,提出了基于事件序列数据挖掘原理的高压输电线故障诊断模型。 但是,数据挖掘技术不会代替配电网故障诊断领域专家学者所起的作用,它只是提 供了一个强大的数据分析工具,帮助调度员更容易、更深入地分析数据,而且数据挖掘 中得到的模型必须要在实际的生产实践中进行论证。有些配电网故障可能都己经具有一 些重要的诊断模型,这些模型可能是电力系统方面专家作了很多次试验和调查、花了很 长时间,甚至是经过很多次失败之后总结得来的。我们进行数据挖掘要做的工作就是要 6 中国石油大学( 华东) 硕上学位论文 使这些模型得到的有根据,同时要更方便、更容易。 1 4 课题的主要工作和内容安排 当配电网发生故障尤其是当保护和断路器发生误动或拒动和通信装置故障造成的 信号改变或丢失时,会形成变异的故障模式,从而使得故障后的系统响应复杂化,给配 电网故障诊断造成更多的困难。如果此时调度员对故障发生漏判或误判,可能会导致事 故进一步扩大等严重后果。因此,有必要研究一种容错性强,适应实际运行情况的配电 网故障诊断方法,以协助调度人员迅速识别故障,保证电力系统的安全稳定地运行。 数据挖掘,又称为数据库中知识发现,它是一个从大量数据中抽取挖掘出未知的、 有价值的模式或规律等知识的复杂过程。目前,随着配电网的自动化程度越来越高,现 己存储了大量的报警记录、检修记录、事故处理记录、运行记录等,为数据挖掘技术的 应用创造了条件。本文尝试将混合数据挖掘方法应用到配电网故障诊断中去,利用该方 法从电网存储的大量运行、监测和检修数据中提取故障诊断所需的知识,对配电网故障 进行准确、有效的判断,这是一项既具有一定理论意义,又有实际应用价值的研究课题。 首先应用粗糙集方法对故障信息进行预处理,可减少信息表达的属性数量,再根据处理 后的信息结构,进行神经网络的构建与训练。该方法简化了神经网络的结构,缩短了训 练时间,提高了泛化能力,充分发挥了粗糙集理论和神经网络的优势,弥补了各自的缺 点【3 4 j 。本文的主要研究内容如下: 第l 章绪论。本章深入学习解本论文研究的背景、意义以及国内外现状,研究数 据挖掘的常用技术以及数据挖掘在配电网故障诊断中的应用现状。 第2 章基于粗糙集方法的配电网故障诊断决策表属性约简。学习粗糙集方法的基 本理论、基本方法和重要性质,在此基础上研究布尔逻辑与可辨识矩阵相结合的属性约 简算法,最后建立一个简单的配电网算例,并利用该算法对配电网原始故障决策表进行 属性约简。 第3 章神经网络在配电网故障诊断中的应用。认真学习人工神经网络的基本概念、 特点、算法及其应用。深入研究b p 神经网络和径向基神经网络应用于配电网故障诊断模 式识别的具体算法,在此基础上运用m a t l a b 对配电网故障模型进行仿真和计算,并对 仿真和计算的结果进行对比分析。 第4 章基于混合数据挖掘方法的配电网故障诊断。把粗糙集方法和神经网络方法 优缺点进行必要的分析比较,阐述采用混合数据挖掘方法进行配电网故障诊断的特点。 7 第l 章绪论 同时在研究人工神经网络模型、类型、仿真及学习训练特性的基础上,结合粗糙集理论 的属性约简方法和神经网络的自我组织、自我学习、具有一定的泛化能力且容错能力比 较强的特点,把粗糙集方法和神经网络方法进行有效融合,形成了混合数据挖掘方法, 并应用到配电网故障诊断算例中去。本章需要完成基于混合数据挖掘方法的配电网故障 诊断系统的算法描述,并对算法流程进行了详细阐述,最后用配电网故障诊断算例说明 该方法的正确性和准确性。 第5 章配电网故障诊断系统的开发及验证。本章以第四章中较大规模的配电网算 例为基础,采用v b 编程语言实现基于混合数据挖掘方法的配电网故障诊断系统用户界 面的设计;采用具有神经网络工具箱且编程效率高、数值计算能力强的m a t l a b 编程语 言实现故障信息的属性约简以及网络训练和诊断;并采用a c t i v e x 自动化技术与c o m 组 件技术相结合的方式来实现m a t l a b 程序与v b 程序的无缝联接和软件界面的统一;最 后通过配电网故障算例验证了该诊断系统软件进行故障诊断的准确性和有效性。 最后,结论与展望中对本文的工作进行回顾和总结,对工作中存在的一些问题进行 了探讨,并对本文的下一步工作做了展望。 8 中国石油大学( 华东) 硕士学位论文 第2 章基于粗糙集方法的配电网故障诊断决策表属性约简 粗糙集理论是一种以熵集为基础的理论。一方面,从该理论中提出的正区域与独立 约简的概念出发,可以演变成为对实际的生产生活有着重要应用价值的一系列理论;另 一方面,它是归纳机器学习的理论基础。关联规则所使用的方法是目前数据挖掘中最为 典型的研究动机,因此建立在熵集的基础上,由粗糙集理论研究派生的研究方法与研究 成果同样可以适用于关联规则的研究。实际应用中,基于粗糙集理论设计的算法所面临 的问题与关联规则在算法上所面临的问题是一样的,即都是海量数据如何处理的问题。 尽管关联规则的研究课题有其自身的特殊性,但是在约简问题上与粗糙集理论本质上是 相同的。而且粗糙集理论比关联规则方法有更好的发展前景【3 5 】。 粗糙集理论是数据挖掘中的一个重要方法,在科学研究中的很多领域都发挥了非常 重要的作用。它的贡献主要体现在以下三个方面: ( 1 ) 独立约简,它部分解决了数据挖掘的平凡性问题,是一个有数学基础的结构目 标。 ( 2 ) 粗糙集理论可以成为归纳机器学习的理论基础。 ( 3 ) 在粗糙集理论中,一个给定信息系统正区域的本质是在样本集合中无矛盾样本 的数量,正区域起着非常重要的作用。 2 1 粗糙集的基本理论 粗糙集理论的主要思想就是在保持分类能力不变的前提下,通过知识约简导出问题 的决策或分类规则。目前粗糙集理论已经被成功地应用到机器学习、故障诊断、决策分 析、过程控制、模式识别等领域3 6 1 。下面对粗糙集理论中的一些重要概念作简要介绍。 2 1 1 可辨识矩阵 可辨识矩阵是粗糙集理论中一个很重要的概念,在原系统中的潜在知识不受到任何 影响前提下,任意复杂的信息系统都可以被容纳到一个可辨识矩阵中去,从而使系统分 析知识的能力得到了很大的提高3 7 1 。 对可辨识矩阵可作如下定义: 令b 是条件属性集合,u 为论域且u = 乃,y 2 , , s = ( u ,b ) 为一个信息系统, 6 ( y ) 是第y 条记录对应属性6 上的值,e 为决策属性,d , j 为可辨识矩阵中第f 行第列 的元素。 0 第2 章基于粗糙集方法的配电网故障诊断决策表属性约简 1 0e ( m ) = e ( y j ) ( 吃) = 6 b ,6 ( 咒) 6 ( 乃) ) e ( m ) e ( 乃) ( 2 - 1 ) 卜1 6 ( 以) = b ( y j ) ,e ( 儿) e ( y j ) 上式中f ,j = l ,2 ,刀。 由式2 1 可以看出,当两条记录之间决策值相同时,可辨识矩阵中的元素值为0 ; 当两条记录之间决策值不同且条件属性值也不完全相同时,可辨识矩阵中的元素值为属 性值不同的属性组合;当两条记录之间决策不同但属性值完全相同时,则属于冲突记录, 此时可辨识矩阵中的元素值为1 。由此可得可辨识矩阵只有以上三种值的的可能。 2 i 2 约简与核 知识库中的知识通常可能会存在冗余的现象,所以对冗余属性的约简就显得非常必 要了。约简可以代替整个属性集合而不降低分类能力,而且约简可能不是唯一的【3 8 】。即 约简是可以区分所有对象的最小属性子集。核表示属性集中对于所有约简都不可缺少的 属性集合,它是属性集的所有约简的交集。与约简不同,核一定是唯一的,但有可能是 空集【3 9 1 。 2 1 3 知识的依赖性 知识的依赖性可作如下的形式化定义:令k = ( u ,r ) 为一个知识库,尸,q 互r 。 ( 1 ) 当且仅当p q 且q p ,知识q 与知识尸等价( 记作p 三o ) 。 ( 2 ) 当且仅当i n d ( p ) i n d ( q ) ,知识q 依赖于知识尸( 记作pjq ) 。 ( 3 ) 当且仅当pjo 与qjp 均不成立,知识q 与知识尸独立( 记作尸q ) 。 2 2 改进的粗糙集属性约简算法 2 2 1 决策表属性约简概述 决策信息系统又称决策表,有大量的领域样本信息蕴含在其中。决策表中的一个样 本与一个基本决策规则相对应,如果把所有这样的决策规则一一列举出来,便可得到一 个决策规则集合。但是这样的决策规则集合在实际的工程实践中没有应用价值,因为表 中的基本决策规则适应性很差,只是按部就班地记录了一个又一个样本的情况,不能适 应新的、其他的情况。对决策表进行约简是为了从决策表中抽取得到适应度大的规则, 使得一类具有相同规律特性的样本与经过约简处理后的决策表中一个记录相对应,这样 1 0 中国石油大学( 华东) 硕士学位论文 得到的决策规则就具有很强的适应能力【加1 。 在对智能数据进行分析研究中,原始决策表信息系统中的知识( 条件属性) 的重要 性并不相同,其中某些条件属性甚至是冗余的。冗余属性的存在,一方面对人们做出正 确而简洁的决策形成干扰;另一方面也是对资源的浪费。所谓决策表的属性约简,就是 要在保持条件属性相对于决策属性的分类能力不变的前提下,删除其中不重要的或不必 要的属性。通常来说,对同一决策表可能存在多个相对约简,即一个决策表的条件属性 对于决策表属性的相对约简不是惟一的。skmw o n g 和wz i a r k o 已经证明了找出一个 决策表的最小约简是n p h a r d 问题。属性组合的爆炸问题是导致n p h a r d 问题的主要原 因。通常人们希望得到的决策规则的规则数最少,或者得到的约简结果包含的条件 数目应尽可能少。 2 2 2 基于布尔逻辑与可辨识矩阵相结合的属性约简算法 属性约简实际上就是从决策表系统的条件属性中去掉不必要的或者对得到决策不 重要的条件属性的过程。假如一个决策表中含有个条件属性,除去所有属性都不选情 况下,则总共会有2 一1 种约简的可能4 2 1 。由于常用的粗糙集属性约简算法存在运算效 率低、算法复杂等缺陷【4 3 1 ,本节采用改进后的粗糙集属性约简算法即布尔逻辑与可辨识 矩阵相结合的属性约简算法对原始决策表进行属性约简,该算法简化了运算过程,提高 了运算效率,在条件属性约简和求解核属性中更具有优越性,下面对该算法进行详细的 介绍。 令是决策表u 的可辨识矩阵,u 中所有条件属性集合为b = b 1 ,b 2 ,钆) ,n 中所 有条件属性组合集合为t ( t 中没有重复项) 。我们假设有f 个条件属性在丁中,e 表示 每个属性组合,可得cf r , c ,丁且c i c ,o ,= 1 , 2 ,+ 5 ) 。 令 c a r d ( c ,) = 刀,则c f 中每个条件属性组合数为q 。e = 1 , 2 ,聊) 。在可辨识矩阵中 c a r d ( c i ) = 1 的元素项,由可辨识矩阵定义可知,必须保留该元素项,因为除了 c a r d ( c ,) = 1 的元素项,其他属性无法区分决策不同的两条记录,且该属性符合决策表中 核属性的概念。因此,决策表的核属性( 核属性可能为空) 就是矩阵中所有条件属性组 合数为l 的属性。令d 0 是n 中的核属性的集合,皿。为其中的元素,则有d 0 b ,d j 。d o _ 且c a r d ( c i 。) = 1 。令6 l ,b z ,k 和q ,c 2 ,巳为除核属性外的其他两个条件属性组合,岛和 c i 用布尔变量表示,目的是便于进行数学逻辑运算,从而形成式2 2 ,这个逻辑表达式 第2 章基于粗糙集方法的配电网故障诊断决策表属性约简 是用合取范式来表示的: q = ( b lv b 2v vb m ) ( c lvc 2v v )( 2 - 2 ) 进一步分析可知,至少分别有一个属性为约简之后的条t 爿= y g 性存在于6 l ,6 2 ,吒和 q ,乞,巳之间,q 的两个析取式均由布尔变量包和c ,构成,且两个析取式的值均为l , 可得q = 1 。为了得到析取范式,则需要把q 转化成式2 - 3 的形式: q = ( b l q ) v ( 包人岛) v v ( 6 2a c 。) v ( 6 2 乞) v v ( 6 卅a c n ) ( 2 3 ) 我们通常希望得到最全面的属性约简组合,因此最终的约简结果需要把核属性与式 2 3 中的每个合取式属性组合。 基于布尔逻辑与可辨识矩阵相结合的属性约简算法具体描述如下: ( 1 ) 用可辨识矩阵的形式表示决策表,并将可辨识矩阵中属性组合数为l 的属性放 入最终属性约简集合,即r e d u c t = c o ( 把决策表进行属性约简得到的条件属性集合便是 r e d u 订) 。 ( 2 ) t 为不包含核属性组合,需要我们从可辨识矩阵中找出,即t = t r 。 r = c j :c jnr e d u c t 0 ,江1 , 2 ,s ( 2 - 4 ) ( 3 ) 将所有不包含核属性的条件属性组合用合取范式的形式表示,即 q = 人 vq 。t :( i = 1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 景区舞蹈演员合同协议书
- 厂房大清包劳务合同范本
- 招商第三方委托协议合同
- 租赁合同车位安全协议书
- 劳动合同过期了脱密协议
- 大厂小卖部转让合同范本
- 怎样签租房安全合同协议
- 摄影工作室加盟合同范本
- 设计2025年合同范本
- 收益分成的民宿合同范本
- SHSG0522023年石油化工装置工艺设计包(成套技术)内容规定
- 中国石化加油站视觉形象(vi)标准手册
- 《一次函数的图像》-完整版课件
- 《室内空间设计》第二章课件
- 危大工程巡视检查记录
- Python基础课件(共282张PPT)
- DB44∕T 1836-2016 不锈钢美容工具
- 高一新生入学家长会发言稿
- 第三章:巷道断面设计
- (完整word版)门禁系统施工工艺
- 社会团体名称预先核准申请书双重登记
评论
0/150
提交评论