




已阅读5页,还剩60页未读, 继续免费阅读
(电力系统及其自动化专业论文)基于数据挖掘技术的配电网故障诊断研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
a b s t r a e t r e s e a r c ho fd i s t b u t i o nn e t w o r k sf a u l t d i a g n o s i sb a s e do nd a t am i n i n g a b s t r a c t t h ea i mo ft h i st h e s i si st oi m p r o v eo n ap r a c t i c a le l e c t r i cp o w e rd i s t r i b u t i o nf a u l t d i a g n o s i ss y s t e m an e we l e c t r i cp o w e rd i s t r i b u t i o nf a u l td i a g n o s i si n a c c o r d a n c e w i t hd a t am i n i n gi sp r o p o s e da f t e rd i s s e r t a t i n gt h ec u r r e n tp o w e rd i s t r i b u t i o ns y s t e m a n di t ss u p p o r t i n gs y s t e ma n da n a l y z i n ga p p l i c a t i o nc h a r a c t e r i s t i co fv a r i o u sk i n d so f a r t i f i c i a li n t e l l i g e n c ei nf a u l td i a g n o s i s f i r s t l y , t h er e q u i r e m e n t sa n ds i g n i f i c a n c eo fe l e c t r i cp o w e rd i s t r i b u t i o nf a u l t d i a g n o s i ss y s t e ma n dt h ec u r r e n td i a g n o s i sm e t h o d sa sw e l la st h ed i s a d v a n t a g e s a r e d i s c u s s e di nt h et h e s i s d a t am i n i n gi st a k e na sam a j o rt o o lu s e di nd i s t r i b u t i o n n e t w o r k t h em e t h o do fr o u g hs e t s ,a r t i f i c a ln e u r a la n dd e c i s i o nt r e ei nd a t am i n i n g a l ed i s c u s s e d r o u g hs e tt h e o r yi sap o w e r f u lt o o li nd e a l i n gw i t hv a g u e n e s sa n di r r e l e v a n t i n f o r m a t i o n i tc a nb eu s e dt or e d u c ef e a t u r e sa n de x t r a c tr u l e s i nt h i sp a p e r , r o u g h s e tt h e o r yi sa p p l i e dt oe x t r a c tr u l e so f d i s t r i b u t i o nn e t w o r k t h et e s tv e r i f i e st h a ti ti s d r a s t i c a l l ye f f e c t i v e t h ed i s t r i b u t i o nn e t w o r k sf a u l td i a g n o s i si sac o m p l i c a t e dn o n - l i n e a rm a p p i n g n e u r a ln e t w o r k sa r ew i d e l ya p p l i e dt op a t t e r nr e c o g n i t i o n t h e yc a nm a pc o m p l i c a t e d o n - l i n e a rf u n c t i o n sa ti n f i n i t ep r e c i s i o n i nt h ep a p e r , a ni m p r o v e db pn e t w o r k sa r e t r a i n e da sac l a s s i f i e ro ft h ed i s t r i b u t i o nn e t w o r k sf a u l t t h e n ,s e t t i n g 印as i m p l e s y s t e mo ff a u l td i a g n o s i sa b o u td i s t r i b u t i o nb yt h ev i s u a lb a n dm a t l a b ,a n dt h e r e s u l t so f a ne x a m p l ea r eg i v e n i nt h ep a p e r , d e c i s i o nt r e em e t h o di sf i r s t l ya p p l i e dt or e a l i z et h ed i s t r i b u t i o n n e t w o r k sf a u l td i a g n o s i s s a m p l e ss h o wt h a tt h i sm e t h o di se f f e c t i v ef o rt h e d i s t r i b u t i o nn e t w o r k sf a u l td i a g n o s i s k e yw o r d s :d i s t r i b u t i o nn e t w o r k ;d a t am i n i n g : f a u l td i a g n o s i s ;r o u g hs e t ;a r t i f i c i a l n e u r a l ;d e :c i s i o nt r e e i i 广西大学学位论文原创性声明和使用授权说明 原创性声明 本人声明:所呈交的学位论文是在导师指导下完成的,研究工作所取得的成果和相 关知识产权属广西大学所有,本人保证不以其它单位为第一署名单位发表或使用本论文 的研究内容。除已注明部分外,论文中不包含其他人已经发表过的研究成果,也不包含 本人为获得其它学位而使用过的内容。对本文的研究工作提供过重要帮助的个人和集 体,均已在论文中明确说明并致谢。 论文作者签名: 域蓬勃 学位论文使用授权说明 搠每6 其五日 本人完全了解广西大学关于收集、保存、使用学位论文的规定,即: 按照学校要求提交学位论文的印刷本和电子版本: 学校有权保存学位论文的印刷本和电子版,并提供目录检索与阅览服务; 学校可以采用影印、缩印、数字化或其它复制手段保存论文; 在不以赢利为目的的前提下,学校可以公布论文的部分或全部内容。 请选择发布时间: 曰即时发布口解密后发布 ( 保密论文需注明,并在解密后遵守此规定) 论文作者签名:残蓬勃导师签名:爷互御年歹月刀日 第一章绪论 第一章绪论 1 1 配电网故障诊断研究的意义 配电网是电力系统电能发、变、送、配中最后一个向用户供电的环节。配 电网设备繁杂,用户众多、覆盖面广,地理情况变化多样,且易受外界条件的 影响,造成了配电网重要保障较大,工作繁重。随着经济和社会的快速发展, 用电负荷的增加,供电质量、供电可靠性要求的提高,而传统的配电结构、运 行、管理等方式已不能适合电网增长的需求,造成了配电网与用户需求的矛盾 日益突出。因此,加强配电网的建设,提高配电网的自动化水平,实现配电网 更有效更科学的管理变得非常重要。 配电网的故障诊断是配电网自动化的一个重要组成部分【”。配电两直接与用 户相连,直接关系着社会生产与人们的生活,一旦配电网发生故障,就会给社 会生产造成巨大损失,给人们生活带来极大的不便。配电网故障诊断高自动化 水平的实现是经济发展和人民生活质量提高的重要保障。配电网发生故障后, 故障诊断系统根据监测系统得到的相关信息对配电网发生的故障进行实时分析 和判断,提出正确有效的健全区域停电恢复策略,帮助调度员准确的确定故障 位置,隔离故障区域,快速恢复故障区域供电。 ,。 电力系统由于运行、维护、绝缘老化等原因,发生故障是不可避免的。为 了快速监测及消除故障,确保系统安全稳定运行,增强供电可靠性和连续性, 实现配电网络的故障定位以及快速故障恢复等,就需要一个优质的配电网故障 诊断系统。另外由于现有的一些故障诊断方法存在种种不足,难以取得令人满 意的结果,因此配电网故障诊断方法的改进迫在眉睫。 电力系统的故障绝大多数发生在配电网上【2 l ,配电网故障诊断是从技术上提 高配电网安全可靠运行的重要手段。准确的故障定位、分析故障原因,提出故 障恢复方案能够减少停电时间,加快线路的恢复,减少因停电造成的经济损失。 因此,配电网的监测和故障诊断的研究有着重要的理论意义和实用价值。 1 2 配电网故障诊断的研究现状 目前在国内外应用的配电网故障定位典型算法有以下几种类型:故障电流 第一章绪论 判别法、专家系统的方法、人工神经网络的方法、基于模糊理论的方法、基于 优化技术的方法和基于数据挖掘的方法。 1 2 1 故障电流判别法阻” 此方法是以图论知识为基础的,根据配电网的扩扑模型进行故障诊断。其 所用的基本原理就是首先根据配电网络的结构写出网络描述矩阵和根据故障信 息写出的配电网络故障信息矩阵;进而由网络描述矩阵和故障信息矩阵相乘后 等到一个粗略的描述矩阵,随后对粗略的描述矩阵进行规格化处理就得到故障 判断矩阵。这种方法是根据系统潮流的变化来判断的,由于发生故障时,系统 的结构和参数变化,使得潮流的计算和分析处理的耗时大,会影响诊断速度和 快速故障的恢复处理。另外正常运行时某些线路潮流值小接近于零( 如线路情 载运行) ,故用潮流来判断故障,也不能保证诊断的准确性。所以电力系统故障 诊断用传统的数学方法,因系统规模、复杂程度和不确定因素等的限制,系统 故障诊断难以达到理想的效果。 1 2 2 专家系统方法”哪 专家系统是人工智能领域中发展最早也比较成熟的分支之一,它利用计算 机技术将相关专业领域的理论知识和专家的经验知识融合在一起,通过数据库、 知识库、推理机、人机接口、解释程序和知识获取程序的有机连接,达到具备 解决专业领域问题的能力。 一般地说,专家系统是一个具有大量专门知识与经验的程序系统,它根据 某个领域的专家提供的知识和经验进行推理和判断,模拟专家的决策过程,以 解决那些需要专家决策的复杂问题。专家系统的应用领域不同,采用的知识表 示方式也可以有所不同,常用的知识表示方法有谓词逻辑、语义网络、产生式 规则、框架和黑板等。 专家系统在配电网络故障诊断中的典型应用是基于产生式规则的系统,即 把保护、断路器的动作逻辑以及运行人员的诊断经验用规则表示出来,形成故 障诊断专家系统的知识库,进而根据报警信息对知识库进行推理,获得故障诊 断的结论。基于产生式规则的故障诊断专家系统得以广泛应用主要是由故障诊 断和基于产生式规则的专家系统的特点所决定的。输电网络中保护的动作逻辑 以及保护与断路器之间的关系易于用直观的、模块化的规则表示出来;基于产生 2 第一章绪论 式规则的专家系统允许增加、删除或修改一些规则,以确保诊断系统的实时性 和有效性;能够在一定程度上解决不确定性问题;能够给出符合人类语言习惯的 结论并具有相应的解释能力等。专家系统虽然能够有效地模拟故障诊断专家完 成故障诊断的过程,但是在实际应用中仍存在一定缺陷:( 1 ) 获取完备的知识库 是形成故障诊断专家系统的瓶颈。如果建立的知识库不完备,可能导致专家系 统推理混乱并得出错误的结论,而知识获取及验证其完备性是比较困难的,这 在很大程度上限制了故障诊断专家系统的发展。( 2 ) 专家系统在推理时要搜索、 匹配知识库内一定的规则集才能得出结论,所以当系统比较大时完成诊断的速 度将非常慢。实用的故障诊断专家系统通常只有1 0 0 条3 0 0 条规则。( 3 ) 当配电 网络的结构或自动装置的配置发生变化时,专家系统的知识库要进行相应的修 改,然而增加或修改规则后很有可能会造成不完整或不致的知识库,为此必 须对知识库再次进行校核,校核的难度比较大,所以大型专家系统的维护难度 很大。( 4 ) 一般专家系统不具备学习能力,一旦发生知识库没有涵盖的新故障情 况,专家系统将发生诊断错误或得不到结果。( 5 ) 专家系统的容错能力较差。在 故障后保护装置或断路器错误动作的情况下,专家系统因缺乏有效的方法识别 错误信息,容易造成诊断错误在这些局限性中,前面四点是由专家系统的结构 所决定的,不容易得到根本解决;而最后一点可以通过将专家系统与模糊理论结 合起来,对知识进行模糊推理得到改善,这也是专家系统近几年发展的主要趋 势。 1 2 3 人工神经网络方法o ”“伽 人工神经网络是模拟人类神经系统传输、处理信息过程的理论化数学模型, 是一种大规模并行分布处理系统。它的最大的特点是采用神经元及它们之间的 有向权重连接来隐含处理问题的知识,具有很强的自学习能力,在学习完成之 后,还具有一定的泛化能力和容错能力,即使输入信号带有一定的干扰噪声, 仍能给出正确的输出结果。它的这些优点对于在配电网故障定位中的应用具有 重要的意义。人工神经网络配电网络故障诊断中的应用主要在故障定位和故障 类型识别两个方面。 a n n 以配电网络中所有可能获得的保护和断路器的状态作为输入,所有可 能的故障位置作为输出,并以0 ,l 二进制来表明输入、输出相量激活与否。 a n n 在故障诊断中应用的主要问题为:( 1 ) a n n 在使用之前需要大量的、 第一章绪论 有代表性的样本供其学习,且学习算法收敛的速度一般比较慢。学习完成之后, 如果系统结构发生变化,则需要增加新的样本重新学习。( 2 ) a 1 呵n 通常只能给出 一个介于0 1 之问的数字作为输出,对诊断结果缺乏解释能力,这不利于运行人 员理解诊断结果。( 3 ) 对运行人员来讲,a n n 的工作过程是一个黑箱。因此,尽 管a n n 具有一定的容错能力( 当存在自动装置不正常动作时仍能给出正确的诊 断结果) ,但是它不能提供信息帮助运行人员推断不正常动作的装置。( 4 ) a n n 学习完成之后具有较好的内插结果,但外推时则可能误差较大,特别是当系统 非线性较强或具有病态特性时误差更为严重。( 5 ) 如何设计适用于大型配电网络 的a n n 故障诊断系统仍然是一个有待于进一步研究的问题。a n n 一直是一个 比较活跃的研究领域,但研究开发a n n 故障诊断系统时,应对上述问题给予充 分的考虑。 1 2 4 基于模糊理论的方法”1 模糊理论是将经典集合理论模糊化,并引入语言变量和近似推理的模糊逻 辑,具有完整的推理体系的智能技术。在电力系统中,由于保护或断路器的误 动、拒动,信道传输干扰,保护动作时间偏差等因素的影响,输、配电网络故 障诊断存在不确定性,而模糊理论可适应不确定性问题,擅长模拟人类思维中 的近似推理、使用语言变量来表述专家的经验,得到问题的多个可能的解决方 案,并根据其模糊度的高低进行优先程度排序,进而得出问题的最佳解决方案。 由此可以看出,基于模糊理论的方法比较适用于故障诊断问题,目前,模糊理 论已被引入输电网络故障诊断领域,在配电网故障定位中也得到了应用。 在电力系统故障诊断的应用中分两类情况:第一类认为诊断所依据的信息 正确,但故障与对应的动作保护装置和断路器状态之间存在不确定的关联关系, 用模糊隶属度来对这种可能性进行描述的度量;另一类则是认为诊断所依据的 报警信息的可信度不为1 ,而根据系统网络拓扑与故障所发生动作保护断路器 状态赋予报警信息的可信度,再由e s 或a n n 给出故障诊断结果的模糊输出。 基于模糊理论的故障诊断系统,虽然可以增强处理不确定性的能力,但是 采用模糊理论进行电网故障诊断,需寻求有效的手段对电网中的各种不确定性 进行客观地模糊表达,需要充分利用历史统计数据和经验知识。当诊断对象的 结构发生变化时,如何对模糊知识库进行快速、有效的更新维护也是需要研究 的问题。 4 第一章绪论 1 2 5 基于优化技术的方法2 州 基于优化技术算法,也是国内外学者提出的进行电网故障定位的一种新思 路,根据电网故障的特点设定假想事故集的目标函数,利用各种优化算法根据 适应度值对假想事故集进行更新,直至搜索到适应度最大的假想事故集,作为 最终故障诊断的结果。其实质是将故障诊断问题转化为无约束的o 1 整数规划问 题进行寻优处理。这类方法的基本思路是:根据保护动作原理,将故障诊断问 题表示为o l 整数规划问题,然后用优化方法求解。配电网故障诊断中使用的 优化方法主要有:遗传算法、模拟退火算法和基于覆盖集理论的方法。 但是该方法在信息发生畸变时,出现复杂的故障模式的时候,难以保证诊 断结果的可靠性。 1 2 6 数据挖掘的方法嘲 数据挖掘近年来在国际上较为活跃的研究领域,是人工智能与数据库技术 相结合的产物。它是利用数据挖掘的各种算法从大量数据中挖掘出隐含与其中 的知识。近年来,已有研究者开始把数据挖掘技术引入到电力系统的故障诊断 中,并取得了一些成功的经验。数据挖掘技术在电力系统故障诊断中的应用目 前正处于起步阶段,解决如何把诊断对象与数据挖掘算法结合,确定出诊断对 象的诊断模型以及如何把数据挖掘和传统的人工智能技术相结合是进一步深入 研究的课题。 1 3 本文所做的工作 本文尝试研究数据挖掘技术在配电网故障诊断中的应用。利用该技术从电 网存储的大量运行、监测和检修数据中提取故障诊断所需的知识,这是一项开 拓性的研究课题,既具有一定理论意义,又有实际应用价值。 开展配电网智能故障诊断是提高配电网安全性、经济性的重要保障,智能 故障诊断是技术最成熟、应用最为广泛的方法。目前,随着配电网的自动化程 度越来越高,己经存储了大量的运行记录、报警记录、检修记录、事故处理记 录等,因此,为数据挖掘技术创造了条件。数据挖掘是能根据用户定义的任务 从这些数据中自动地获取与任务相关的知识过程。将数据挖掘技术应用于配电 网故障诊断知识的自动获取是本课题的主要目标。本文的主要研究内容如下: s 第一章绪论 1 3 1 数据挖掘技术的研究 本课题的着眼点是数据挖掘技术的应用研究,而要想应用数据挖掘技术, 首先必须掌握它。包括:( 1 ) 数据挖掘处理模型的研究。由于数据挖掘是一个多 阶段、反复的多次处理过程,所以建立一个能将各个处理阶段有机地结合在一 起的处理过程模型,对于我们使用数据挖掘系统是很重要的。( 2 ) 数据挖掘算法 的研究。数据挖掘的各种算法主要应用机器学习、统计学和数据库领域的知识 数据挖掘的功能有多种,实现每种功能的算法又有多种,但不同的算法有不同 的优缺点。所以只有理解了这些算法,才能选择出适合我们挖掘任务的最佳算 法。( 3 ) 数据挖掘应用的研究。研究把数据挖掘技术运用于配电网故障诊断中的 可能性和必要性。 1 3 2 配电网故障特征的自动提取 目前,故障诊断知识库需要是通过人工建立的,知识工程师将专家的经验 提炼为计算机可以应用的形式。但这种方法会遇到很多困难,如专家知识表述 的含糊性和不确定性。本文探索用数据挖掘的方法,让计算机自动发现与故障 有关的特征,自动提取故障的判别规则,以实现故障诊断的智能化。本文给出 了用租糙集方法对配电网故障特征进行自动提取的数据挖掘方法应用实例。 1 3 3 配电网分类器的选择和训练 故障诊断的实质是对设备的工作状态或工作模式进行识别和分类。分类也 是数据挖掘中一项非常重要的任务。分类的核心问题是分类器的选择和训练。 在数据挖掘中,分类的方法有很多种。在选择分类器时,应考虑它的准确性、 训练时间、鲁棒性、可解释性和可伸缩性。目前尚未发现一种对所有数据都占 优的数据挖掘算法,故只能根据我们的任务选择一种“尽可能好”的分类器。鉴于 神经网络具有较强的学习能力、容错能力和实现复杂的非线性映射能力。本文 尝试将神经网络方法用于配电网故障的分类中 1 3 4 配电网决策树的构建 在数据挖掘中,决策树也是一种很重要的分类方法,并且有着广泛的应用。 决策树是一个类似于流程图的树结构,其中每个内部节点表示在一个属性上的 测试,每个分枝代表一个测试输出,而每个树叶节点代表一个分类。在生成决 6 第一章绪论 策树的过程中,包含了下列简单的思想:在构造树的每层时,选择一个具有最 大信息增益的属性,使得依据该属性的值,对象集被剖分成几个不相交的子集。 该方法的特点是:不需要领域知识,只在形成的样本集上学习,而且容易转换 成分类规则。本文对多变量决策树的方法进行了研究,并尝试将该方法应用于 配电网中。 7 第二章数据挖掘技术 第二章数据挖掘技术 2 1 数据挖掘技术的发展状况 许多人把数据挖掘视为另一个常用的术语“数据库中的知识发现”( k d d ) 的 同义词。由于在产业界、媒体和数据库研究中,“数据挖掘”( d a t am i n i n g ) 比“数 据库中知识发现”( k d d ) 这个词更流行,因此,现在多用“数据挖掘”这个术语。 k d d 一词首次出现在1 9 8 9 年举行的第十一届国际联合人工智能学术会议土。 到目前为止,由美国人工智能协会主办的k d d 国际研讨会己经召开了数次,规 模由原来的专题讨论会发展到国际学术大会,研究重点也逐渐从发现方法转向 系统应用,注重多种发现策略和技术的集成,以及多种学科之间的相互渗透。 i e e e 的k n o w l e d g ea n dd a t ae n g i n e e r i n g 会刊率先在1 9 9 3 年出版了k d d 技术专 刊。并行计算、计算机网络和信息工程等其他领域的国际学会、学刊也把数据 挖掘和知识发现列为专题和专刊讨论,甚至到了脍炙人口的程度。 目前,数据挖掘不仅被许多研究人员看作是数据库系统和机器学习方面一 个重要的研究课题,而且被许多工商界人士看作是一个能带来巨大回报的重要 领域。世界上许多公司( 如i b m ,i n f o m i x ,o r a c l e ) 都投入巨资对其进行研究,并开 发了一些产品。从数据库发现出来的知识可以用在信息管理、查询响应、决策 支持、过程控制等许多方面,如医疗诊断和预测、气象、地质和金融数据分析, 超市或银行环境中的客户行为分析,电网报警诊断与预测等等。与国外相比, 国内的数据挖掘研究相对较晚,1 9 9 3 年国家自然科学基金开始对数据挖掘研究 进行支持。1 9 9 9 年4 月在北京召开的第三届亚太地区k d d 国际会议响应热烈, 收到论文1 5 8 篇。目前国内许多高校和科研单位在从事数据挖掘的基础理论和 应用的研究,如北京系统工程研究所、北京大学、华中理工大学、复旦大学、 浙江大学,西安交通大学、中科院等单位都在不同的方面对数据挖掘进行研究。 同时,国内也出现了介绍数据挖掘知识的主页。 2 2 数据挖掘概述啪明 数据挖掘就是从大量的、不完整的、有噪声的、模糊的、随机的数据中, 提取出隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。 3 第二章数据挖掘技术 早期的数据挖掘总是伴随着数据仓库一起出现,因为预处理所建造的数据 集的最理想方式就是数据仓库。而现在的数据挖掘概念己经远远超过数据理解 而使用数据仓库系统进行分析处理这一狭隘观点。数据挖掘其实是一个逐渐演 变的过程,电子数据处理的初期,人们就试图通过某些方法来实现自动决策支 持,当时机器学习成为人们关心的焦点。随后,随着神经网络技术的形成和发 展、人们的注意力转向知识工程,直接给计算机输入己被代码化的规则,而计 算机是通过使用这些规则来解决某些问题。数据仓库技术的发展与数据挖掘有 着密切的关系。数据仓库的发展是促进数据挖掘越来越热的原因之一。但是, 数据仓库并不是数据挖掘的先决条件,因为有很多数据挖掘可直接从操作数据 源中挖掘信息。 数据挖掘过程中各步骤的大休内容如下: l 、数据准备 ( 1 ) 数据的选择。 根据用户的要求从数据库中提取与数据挖掘技术相关的数据,数据挖掘将 主要从这些数据中提取知识。在此过程中,会利用一些数据库操作对数据进行 处理,形成真实数据库 ( 2 ) 数据预处理 研究数据的质量,为进步的分析做准备,并确定将要进行的挖掘操作的类 型。 ( 3 ) 数据的转换 将数据转换成一个分析模型,这个分析模型是针对挖掘算法建立的。一个 真正适合挖掘算法的分析模型是数据挖掘成功的关键。 2 、数据挖掘 对所得到的经过转换的数据进行挖掘。除了完善选择合适的挖掘算法外, 其余一切工作都能自动地完成。这个阶段进行实际的挖掘操作,包括的要点有: 决定如何产生假设;选择合适的工具;发掘知识的操作;证实发现的知识。 3 、结果分析 解释并评估结果。其使用的分析方法一般应视数据挖掘操作而定,根据最 终用户的决策目的对提取的信息进行分析,把最有价值的信息区分开来,并且 通过决策支持工具提交给决策者。因此,这一步骤的任务不仅是把结果表达出 来,还要对信息进行过滤处理,如果不能令决策者满意,需要重复上述过程。 9 第二章数据挖掘技术 4 、知识的同化 将分析所得到的知识集成到业务信息系统的组织结构中去。 其基本过程可以用图2 1 表示: 图2 - 1 数据挖掘的基本过程 f i g 2 - 1t h ep r o c e s so f d a t am i n i n g 2 3 数据挖掘常用方法。删 数据挖掘涉及的学科领域和方法很多,本节对数据挖掘中常用的粗糙集、 神经网络技术和决策树方法的应用进行介绍,数据挖掘中其他技术的应用见相 关文献。 2 3 1 粗糙集理论 粗糙集理论是一种研究不精确、不确定性知识的数学工具,由波兰科学家 z p a w l a k 在1 9 8 2 年首先提出的。经过近2 0 年的发展,该理论已渗入到人工智 能的各个分支,在模式识别、机器学习等方面都有成功的应用。粗糙集理论的 要点是将分类与知识联系在一起,而作为一种数学理论,它使用等价关系来形 式化地表示分类,这样,知识就可以理解为:使用等价关系集r 对离散表示的 空间u 进行划分,知识就是r 对u 划分的结果。由此,在u 与r 的意义下, 知识库可以定义为:属于r 中的所有可能的关系对u 的划分,记为: k 彳( u ,r ) 进而,为了描述知识的确定程度,粗糙集理论引用上近似与下近似的概念, 并以这些概念来定义u 中的一个子集集合b 与被关系r 划分之后的u 的相合程 度,称为粗糙度,粗糙集并由此而来。 不仅如此,粗糙集理论还包含了求取大量数据最小不变集合( 成为核) 与求取 最小规则集( 称为约简) 的理论,这事实上就是人工智能研究中关于机器学习与 “从数据库中进行机器发现”所需完成的任务。 粗糙集方法有几个优点:不需要预先给出额外信息,如概率统计中要求的 1 0 第二章数据挖掘技术 先验概率和模糊集中要求的隶属度;可以去掉冗余输入信息,简化输入信息的 表达空间;算法简单、易于操作粗糙集理论存在的主要问题是:实际问题处 理中,对噪声较敏感,抗干扰能力比较差,如果对象的条件属性值受噪声干扰, 将直接影响分类精度。 本文第三章将对粗糙集方法进行研究,并给出了应用租糙集对配电网故障 特征进行提取的例子。 2 3 2 人工神经网络技术 人工神经网络技术,是数据挖掘中应用最广泛的技术。神经网络的数据挖 掘方法是通过模仿人的神经系统来反复训练学习数据集,从待分析的数据集中 发现用于预测和分类的模式。神经元网络对于复杂情况仍能得到精确的预测结 果,而且可以处理类别和连续变量,但神经元网络不适合处理高维变量,其最 大的缺点是不透明性,因为其无法解释结果是如何产生的及其在推理过程中所 用的规则,所以神经元网络更适合于结果比可理解性更重要的分类和预测的复 杂情况,可用于聚类、分类和序列模式。 神经网络具有的分布并行处理、非线性映射、自适应学习的优点包括其对 噪声数据的高承受能力,以及它对未经训练的数据分类模式的能力,再加上最 近已提出了一些由训练过的神经网络提取规则的算法,这些因素推动了神经网 络在数据挖掘分类和预测等方面的应用。 本文第四章将对神经网络方法进行研究,并给出了应用神经网络对配电网 故障进行模式识别的例子。 2 3 3 决策树 决策树是一个递归树结构,树的每个叶节点反映一个决策分类。每个内部 节点与一个特定属性关联,以该属性的值标识节点到其每个子节点的道路。在 树的生成,即学习算法的生成过程中,包含了下列简单的思想:在构造树的每层 时,选择一个具有最高信息增益的属性,使得依据该属性的值,对象集被剖分 成几个不相交的子集。每个子集表示为树的一个子节点,以该属性的相应值标 识到这些子节点的弧。对每个子节点,依次选择新的属性并且此过程在每个子 树持续递归下去。 一个简单的决策树如图2 2 所示。 第二章数据挖掘技术 图2 - 2 决策树 f i g , 2 2d e c i s i o nt r e e 因此,为了使用决策树分类一个对象,需遍历决策树,即从根节点开始, 依据节点的属性值选择子树。最终,分类是按照所达到的叶节点的决策属性的 值决定。 当判定树创建时,由于数据中的噪声和孤立点,许多分枝反映的是训练数 据中的异常。用剪枝方法处理这种过分适应数据问题。通常这种方法使用统计 度量,剪去最不可靠的分枝,这将导致较快的分类,提高树独立于测试数据正 确分类的能力。 本文第五章尝试决策树方法在配电网故障诊断中的应用。 2 4 数据挖掘在电力系统中的应用1 l 、电力系统中运用数据挖掘技术的可能性 电力系统具有数据多、数据种类繁杂、数据质量差、电力系统对数据的要 求高的特征,上述特征使得它迫切需要一种能快速处理海量数据的技术支持。 2 、数据挖掘的特点 ( 1 ) 计算效率高,数据挖掘只需要用到对其有用的或有意义的输入,免去了 对系统的完全描述,提高了计算效率。 ( 2 ) 数据挖掘可以利用通过对历史和当前数据的分析得到的知识对未来进行 预测,从而使人们对系统潜在的问题有根明确的认识。 ( 3 ) 运用数据挖掘技术避免建立精确数学模型的困难。 3 、数据挖掘在电力系统中可用的方面: 第二章数据挖掘技术 近年来,数据挖掘已经广泛应用于工业、医学、金融等行业,尤其在商业 和银行领域应用极为迅速,我国也通过国家自然科学基金和国家8 6 3 高科技计 划对其进行了重点资助,但其在电力系统中的应用才刚刚起步,主要集中在以 下几个方面: 电力系统安全稳定性分析 电力系统的安全稳定性受众多的因素影响( 包括一些未知因素) ,而且用于 仿真的模型参数有效性也有待验证,在这种情况下,如何利用仿真,实测的历 史数据找出目标电网的安全稳定规律,是数据挖掘的一个热点,其挖掘内容主 要包括:安全稳定实时预测模型的构建、安全稳定的可视化。 负荷模型分析和预测 负荷预测根据历史负荷数据预测未来负荷变化趋势。建立历史负荷数据仓 库,采用数据挖掘方法,自学习地发现负荷变化规律,建立负荷模型,在此基 础上进行负荷预测的结果将会更加合理。 电力系统故障诊断 电力系统经过多年的运行,已经积累了大量、充足的故障数据,如何利用 这些数据,找出偶发故障之后掩藏的客观规律,是电力工作者研究的重点。鉴 于数据挖掘技术强大的数据分析功能,可利用其集成的多种分析技术找出故障 原因,并制定相应的辅助决策规则,采取措施减少故障发生概率,提高电力系 统运营的可靠性和经济效益。 电力系统仿真模型的性能评估 大区域电网的互联和电力市场的逐步实现使得电力系统运行环境日趋复 杂,在这种情况下,对电力系统仿真的要求也越来越高,此时,为保证第系统 的安全稳定运行,必须对仿真模型的性能进行评估。以控制模型的参数设计为 例,鉴于电力系统的高维性、非线性,一般情况下我们仅利用有限的运行模式、 扰动类型对其进行评估,以检验其控制效果,但这种测试方法无法覆盖整个仿 真空间,一旦实际运行环境与仿真环境有所偏离,控制的效果就要大打折扣。 为解决该问题,可利用数据挖掘技术智能生成目标电网可能的仿真空间,对各 种系统模型分别进行测试,评估其性能,并总结为规则,以便从总体上把握模 型的性能、应用条件及应用范围。 电力市场环境下的电力用户行为分析 在电力市场环境下,调度运行人员需要在保证系统安全稳定运行的基础上 第二章数据挖掘技术 提高电力运营的经济效益,为达到这一目标,可先利用数据挖掘技术找出各类 电力用户的固有行为特点,并总结为决策规则,而后,有针对性的制定相应的 调度方案和供电策略,降低能源损耗,增加电力企业的运营利润。 电力系统异常值监测 在电力系统的数据中,通常会存在与数据一般规律不相符的异常沼气对象, 这类异常数据有可能是由于测量误差、传输误差造成的,其通常蕴含着系统的 一些内在特殊性质。因此,监测并分析电力系统数据集中多年埋藏的异常数据 具有较强的实用价值,这方面的挖掘被称之为异常挖掘。 迄今为止,数据仓库和数据挖掘技术在电力系统中的应用还十分有限,主 要局限在普通工商业决策分析和某些特定的技术分析问题上。由于电力企业管 理者和电力系统研究者对此技术的理解和重视还不够,使得数据仓库和数据挖 掘技术并没有得到推广。但是,随着电力市场的发展,为了保障电力系统的安 全、可靠、经济运行,传统的数据库技术和方法分析各种信息系统产生的大量 数据已经无法满足要求,这正为数据仓库和数据挖掘技术创造了广泛应用的条 件。 2 5 数据挖掘在配电网故障诊断中的应用前景 将数据挖掘技术应用在配电网故障诊断中,不但有必要,而且有成功的可 能,这主要有以下理由: 1 目前,随着通信技术和信息技术的发展,供电公司对各种设备的监测手 段越来越完善,而且随着存储成本的不断下降,诊断信息越来越丰富,为数据 挖掘的成功应用提供了坚实的基础。 2 诊断过程是一个决策过程,正确的决策建立在对知识的掌握基础上。掌 握的知识越丰富、越可靠,决策的正确性就越大。数据挖掘技术可以从大量的 数据中发现隐含的知识和规律,弥补人类在处理大量信息方面的不足所以, 在对配电网进行诊断时,需要数据挖掘技术,而这种需要是数据挖掘成功的动 力。 3 过去,各种智能诊断方法( 如神经网络、模糊逻辑等) 在配电网故障诊断中 只有具体应用,并没有一个完整的体系将各种方法分类和融合,缺乏一个统一 的客观信息挖掘过程模型。现在,数据挖掘理论将现有的各种先进方法和算法 1 4 第二章数据挖掘技术 进行了一次有效的整合,明确了整个信息挖掘的体系、功能和过程,为各种先 进理论和技术在状态监测和故障诊断中的应用奠定了良好的基础,从而使整个 过程变得清晰、明确、易于实施。 但是,数据挖掘永远不会代替故障诊断领域专家所起的作用,它只是提供 了一个强大的工具,知识帮助用户更深入、更容易的分析数据,它并不能告诉 某个模型对用户的实际价值,而且数据挖掘中得到的模型必须要在现实中进行 验证。每个设备可能都己经具有一些重要的诊断模型,这些模型可能是领域专 家花了很长时间,作了很多调查和试验,甚至是经过很多失误之后得来的。数 据挖掘要做的工作就是使这些模型得到的更容易、更方便,同时又有根据。 2 6 本章小结 本章对数据挖掘技术进行了归纳总结,首先,进行了数据挖掘的发展状况、 含义、处理过程以及功能,接着介绍了数据挖掘中的常用方法,然后介绍数据 挖掘在电力系统以及配电网中的应用前景 第三章基于租糙集理论的配电网故障特征提取 第三章基于粗糙集理论的配电网故障特征提取 3 1 引言 随着变电站监控系统的广泛应用、调度自动化系统的功能和性能的不断提 高,电网调度运行的自动化程度己经达到了很高水平。而继电保护监控、系统 故障及继电保护动作行为的分析、继电保护管理等工作的自动化则相对滞后, 其技术手段己经不能满足电网调度运行管理自动化发展的需要。 为适应电网调度运行管理自动化的总体要求,建设基于现代网络通信技术 的继电保护、安全自动装置和故障录波器等涉及电网异常时动作装置的故障信 息处理系统,即“继电保护故障信息处理系统”,不仅可以实现继电保护及相关数 据和信息的高效利用和充分共享,实现故障信息分析及继电保护运行,使继电 保护专业管理现代化,而且对提高电网安全运行的调度系统信息化、智能化水 平,从整体上提升电网调度运行管理水平都具有重要意义。 继电保护故障诊断实质上是一个模式分类问题,要建立故障现象与故障原 因之间的精确数学模型是十分困难的,近年来人们己经把研究的热点转移到基 于人工智能的方法上。然而,现场获取的故障信息往往存在信号改变或丢失而 且包含大量噪声,同时,对故障诊断而言,某一故障特征可能体现在多个测量 信号中,也就是说,征兆之间存在一定的冗余性。所以,将粗糙集理论用于继 电保护故障信息的挖掘,可以在不需要任何继电保护故障信息先验知识的情况 下,针对不完备故障模式快速准确地获得诊断结果,利用最少地故障信息准确 判断出引起故障的事件。因此,本文采用基于粗糙集的数据挖掘技术,通过给 定的特征向量对其进行分析、发现和区分其中的冗余特征值并且在此基础上进 行诊断规则的提取和模式的识别。 3 2 粗糙集理论”,嘲 粗糙集( r o u g h s e t ,r s ) 理论是一种处理不确定和不精确问题的新的数学工 具。它的最大特点是不需要提供求解问题时所需处理的数据集合之外的任何先 验信息,如统计中要求的先验概率和模糊集中要求的隶属度,即能有效地分析 和处理不精确、不一致、不完整等各种不完备数据,并从中发现隐含的知识,揭 1 6 第三章基于粗糙集理论的配电网故障特征提取 示潜在的规律。它是研究不完整数据及不精确知识的表达、学习、归纳的一套 方法,以对观察和测量数据进行分类为基础,通过对数据进行分析、t 近似分类, 推理数据问的关系,从中发现隐含的知识,揭示潜在的规律,能从实例中获取 知识,能有效处理不确定或不精确知识的表达,并能根据不确定、不完整的知 识进行推理,实现规则的自动获取。 随着数据挖掘的兴起,粗糙集理论也受到数据挖掘研究者的重视进而受到 研究者的广泛关注。粗糙集和数据挖掘密切相关,它为数据挖掘提供了一种新 的方法和工具。首先,数据挖掘研究的实施对象多为关系数据库,关系表可看 作是粗糙集理论中的决策表,这给粗糙集方法的应用带来了极大的方便。第二, 现实世界中的规则有确定性的,也有不确定性的。从数据库中发现不确定的知 识,为粗糙集方法提供了用武之地。第三,从数据库中发现异常,排除知识发 现过程中的干扰也是粗糙集方法的特长。第四,运用粗糙集方法得到的知识发 现算法有利于并行执行,这可极大地提高发现效率。对于大规模数据库中的知 识发现来说,这正是求之不得的。第五,数据挖掘中采用的其他技术,如神经 网络方法,不能自动地选择合适的属性集,而利用粗糙集方法进行预处理,去 掉多余属性,可提高发现效率,减小错误率。第六,粗糙集方法比模糊集方法 或神经网络方法在得到的决策规则和推理过程方面更易于证实和检验。 3 3 粗糙集的基本概念 l 、信息系统和决策表 信息系统( i n f o r m a t i o ns y s t e m ) 是粗糙集理论所研究的对象。如果要应用粗糙 集理论,那么必须事先将所研究的对象表示为信息系统。信息系统是一个数据 集,经常表示为一张数据表。该数据表的每一行代表一个对象,这些对象可以 是事例、事件等。而数据表的每一列是对象的属性,这些属性可以是对象的特 征、度量等。信息系统s 可较形式化的表示为s = ,其中: ( 1 ) u 是有限非空的对象集合,通常称为域; ( 2 ) a 是有限非空的属性集合,对每个属性a a ,都有映射a :u v - ,其中 v a 是属性a 的值域。 如果信息系统s 的属性集合a 可分为条件属性集合c 与决策属性集合d 两 部分,即a f f i cud ,且cnd = ,这种信息系统也可称为决策表( 或决策系统) 。 2 、上近似、下近似、边界区 第三章基于粗糙集理论的配电网故障特征提取 给定一个有限的非空集合u ,r 为u 上的一族等价关系。r 将u 划分为互 不相交的基本等价类,记作u r ,二元组1 0 ( u ,r ) 构成一个近似空间。设x u , f u r 集合x 关于r 的下近似星r 定义为: _ r x = y p u r :y x j ( 3 - 1 ) 鱼是由那些根据知识r 判断肯定属于x 的对象所组成的最大集合,称为x 的正区,记作p o s r ( x ) 。 集合x 关于r 的上近似肘定义为: 融= y 妒e u r :y ix 中 ( 3 - 2 ) 足r 是由所有与x 相交非空的r 的等价类的并集,是根据知识r 判断所有 可能属于x 的对象组成的最小集合。 e g 。( x ) = u 一尼r 称为集合x 的负区,它表示了根据知识r 可以判断 肯定不属于x 的对象组成的集合。 集合x 关于r 的边界区b n r ( x ) 定义为: b r ( x ) = 肘一丛 ( 3 - 3 ) 边界区为集合x 的上近似和下近似之差,它表示了根据知识r 既不能判断 肯定属于x ,也不能判断肯定不属于x 的对象所组成的集合。如果b n r ( x ) 是空集,则称x 关于r 是清晰的,反之,如果b n r ( x ) 是非空的,则称集合 x 关于r 的粗糙集。 图3 1 直观的描述了上近似、下近似和边界区的关系。设椭圆部分所围成的 区域为集合x ,整个矩形所围的区域为论域u 。 3 、逼近精度 豳一r o s ( x ) 皿批p ) e - x e u ( x ) 图3 - l 粗糙集示意图 f i g 3 - 1e x a m p l eo fr o u g hs e t 1 8 第三章基于粗糙集理论的配电网故障特征提
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025磁盘制作复制委托合同
- 茶叶知识直播考试内容及答案
- 现代俄语文学题目及答案
- 2025整车货物的运输合同
- 物体表面采样试题及答案
- 2025年公安辅警考核试题及答案
- 2025高考地理试题分类汇编:农业含解析
- 营运车辆保养课件
- 2025汽车租赁合同范本(简化版)
- 2025年人教版七年级语文上册月考试卷(含答案)
- 2024年河南省郑州市二七区四中小升初数学试卷(含答案)
- 园区消防安全联动制度
- 《慈善法》知识竞赛题库与的答案(完整版)
- 托管运营合同范文
- 显微根管治疗的护理配合
- 电气工程专业导论
- 汽车机械基础课件 项目三 汽车构件静力学分析
- 腰椎间盘突出症课件(共100张课件)
- 设备设施维护保养管理制度
- 浙江省七彩阳光联盟2024-2025学年高三上学期8月返校联考语文试题 含解析
- 消防安全教育主题班会课件
评论
0/150
提交评论