(水利水电工程专业论文)水电机组故障诊断系统数据挖掘技术的研究.pdf_第1页
(水利水电工程专业论文)水电机组故障诊断系统数据挖掘技术的研究.pdf_第2页
(水利水电工程专业论文)水电机组故障诊断系统数据挖掘技术的研究.pdf_第3页
(水利水电工程专业论文)水电机组故障诊断系统数据挖掘技术的研究.pdf_第4页
(水利水电工程专业论文)水电机组故障诊断系统数据挖掘技术的研究.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

(水利水电工程专业论文)水电机组故障诊断系统数据挖掘技术的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西华大学学位论文独创性声明 作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行 研究工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢 的地方外,本论文不包含其他个人或集体已经发表的研究成果,也不 包含其他已申请学位或其他用途使用过的成果。与我一同工作的同志 对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。 若有不实之处,本人愿意承担相关法律责任。 学位论文作者签名:盈燕位 指导教师签名: 会私乏 日期: + 如f 凡s 7日期2 夕,厂2 7 西华大学学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定, 在校攻读学位期间论文工作的知识产权属于西华大学,同意学校保留 并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查 阅和借阅,西华大学可以将本论文的全部或部分内容编入有关数据库 进行检索,可以采用影印、缩印或扫描等复印手段保存和汇编本学位 论文。( 保密的论文在解密后遵守此规定) 学位论文作者签名:互燕龙 指导教师签名:分刃疋 日期: 锄j z 7 日期:2 口厂歹27 西华大学硕士学位论文 摘要 随着信息技术的进步以及计算机技术和网络技术的迅速发展,水电机组故 障诊断系统中采集的大量数据( 包括统计数据、试验数据) 可以方便地被存储在各 种数据库中。但采用传统的数据分析方法对这些数据进行分析和处理,不仅耗 时而且难以有效地发现数据中隐含的知识。 近几年,人工智能技术与数据库技术的交叉渗透取得了令人瞩目的进展,而 基于人工智能技术与数据库技术而发展起来的数据挖掘技术也受到了人们的普 遍关注。它所需要的基础条件如:海量数据集、先进计算机、成熟的数据挖掘方 法等都已基本具备。所以,将数据挖掘技术应用于故障诊断系统中是可行的。 本论文以某水电站状态监测系统数据库中存储的水电机组运行数据为样本 数据,引入数据挖掘技术,从分析数据的角度上去挖掘各运行数据与机组状态之 间的关系并建立相应的挖掘模型,该模型能够很好的解释水电机组的运行状态, 同时可以运用挖掘模型提取的科学规律对机组未来的发展趋势进行预测。 本文利用s q ls e r v e r 2 0 0 5 构建机组运行数据仓库,在数据准备过程中对数 据进行预处理,提高了数据质量;通过对决策树算法、聚类分析算法、神经网络 算法和时序算法的对比分析后,采用决策树算法和时序算法建立了水电机组数据 挖掘模型;最后应用建立的数据挖掘模型对机组状态参数进行预测。通过现场数 据验汪,其预测的准确性较高。这表明将数据挖掘技术与水电机组状态监测和故 障诊断技术相结合是合理可行的,为水电机组状态监测和故障诊断系统知识获取 提供了一个有效的解决方法。 关键词:水电站;水轮发电机组;故障诊断;数据挖掘;s q ls e r v e r 2 0 0 5 水电机组故障诊断系统数据挖掘技术的研究 a b s t r a c t w i t ht h ep r o g r e s s i o no fi n f o r m a t i o nt e c h n o l o g ya n dt h er a p i dd e v e l o p m e n to f c o m p u t e rt e c h n o l o g y a n dn e t w o r k t e c h n o l o g y , l a r g ea m o u n t s o fd a t ac o l l e c t e d ( i n c l u d i n g s t a t i s t i c a ld a t a ,t e s td a t a ) b yf a u l td i a g n o s i ss y s t e mo fh y d r o e l e c t r i c g e n e r a t o rs e t sc a n b ee a s i l ys t o r e di nv a r i o u sd a t a b a s e s h o w e v e r , u s i n gt h et r a d i t i o n a l m e t h o do fd a t at oa n a l y z ea n dd e a lw i t ht h e s ed a t a ,n o to n l yw a s t et i m eb u ta l s o d i f f i c u l tt oe f f e c t i v e l yf i n dt h eh i d d e nk n o w l e d g ei nt h ed a t a i nr e c e n ty e a r s ,c r o s s p e n e t r a t i o no fa r t i f i c i a li n t e l l i g e n c et e c h n o l o g ya n d d a t a b a s et e c h n o l o g yh a sm a d er e m a r k a b l ep r o g r e s s ,o nt h eb a s i so ft h ed e v e l o p m e n t o fa r t i f i c i a li n t e l l i g e n c ea n dd a t a b a s et e c h n o l o g y ,p e o p l ep a ym o r ea t t e n t i o nt od a t a m i n i n gt e c h n o l o g y t h eb a s i cc o n d i t i o n ss u c h a s :m a s s i v ed a t as e t s ,a d v a n c e d c o m p u t e r s ,s o p h i s t i c a t e dd a t am i n i n gm e t h o d sa r eb a s i c a l l yi np l a c e t h e r e f o r e ,t h e a p p l i c a t i o no f d a t am i n i n gt e c h n o l o g yi n t h ef a u l td i a g n o s i s s y s t e mi s f e a s i b l e i nt h i sa r t i c l e ,t h eh y d r o e l e c t r i cg e n e r a t o rs e t so p e r a t i n gd a t aw h i c hb es t o r e di n h y d r o p o w e rs t a t i o nm o n i t o r i n gs y s t e md a t a b a s ei sm a d ea ss a m p l ed a t a o nt h eb a s e o fa n a l y s i sd a t a ,u s i n gd a t am i n i n gt e c h n o l o g yt om i n et h er e l a t i o n s h i pb e t w e e nt h e o p e r a t i n gd a t aa n dt h ec o n d i t i o no fh y d r o e l e c t r i cg e n e r a t o rs e t s a n dt h e n ,t oe s t a b l i s h t h ea p p r o p r i a t em o d e l t h em o d e lc a nw e l l e x p l a i n t h e o p e r a t i o n a l s t a t eo f h y d r o e l e c t r i cg e n e r a t o rs e t s ,w h i l et h es c i e n t i f i cl a w sw h i c ha r ee x t r a c t e db ym i n i n g m o d e lc a na l s ob eu s e dt op r e d i c tt h ef u t u r et r e n d so fs e t s t h i sa r t i c l eu s e st h es q ls e r v e r 2 0 0 5t ob u i l du n i to p e r a t i o nd a t aw a r e h o u s e ,i n o r d e rt op r e p r o c e s st h ed a t ai nt h ep r o c e s so fd a t ap r e p a r a t i o n ,a n dt oi m p r o v e dd a t a q u a l i t y ;a n dt h e na n a l y z e db yd e c i s i o nt r e ea l g o r i t h m ,c l u s t e r i n ga l g o r i t h m ,n e u r a l n e t w o r k sa l g o r i t h ma n dt i m i n ga l g o r i t h m ,u s et h ed e c i s i o nt r e ea l g o r i t h ma n dt i m i n g a l g o r i t h mt oe s t a b l i s hh y d r o p o w e ru n i t sd a t am i n i n gm o d e l ;f i n a l l yu s i n g t h e e s t a b l i s h e dd a t am i n i n gm o d e l st op r e d i c tt h es t a t ep a r a m e t e r s t h r o u g ho n - s i t ed a t a v a l i d a t i o nr e p r e s e n t st h a tt h ep r e d i c t i o na c c u r a c yi sh i g h i ts h o w st h a tl i n k i n gt h ed a t a m i n i n gt e c h n o l o g yt of a u l td i a g n o s i ss y s t e mo fh y d r o e l e c t r i cg e n e r a t o rs e t si sf e a s i b l e , a n dp r o v i d eae f f e c t i v es o l u t i o nm e t h o dt o a c q u i r ek n o w l e d g ef o rf a u l td i a g n o s i s s y s t e mo fh y d r o e l e c t r i cg e n e r a t o rs e t s k e yw o r d s :h y d r o e l e c t r i cs t a t i o n ;h y d r o e l e c t r i cg e n e r a t o rs e t s ;f a u l td i a g n o s i s ; d a t am i n i n g ;s q ls e r v e r 2 0 0 5 i i 1 4 论文的主要研究内容3 2 数据挖掘概述4 2 1 数据挖掘概念4 2 2 数据挖掘的过程4 2 3 数据挖掘的功能5 2 4 数据挖掘的任务6 2 5 数据挖掘的常用方法7 3 水轮发电机组振动故障的基本理论1 0 3 1 水轮发电机组的结构1 0 3 1 1 水轮机的结构及类型1 0 3 1 2 水轮发电机的结构和类型1 1 3 1 3 水轮发电机组的布置方式1 1 3 2 水轮发电机组振动故障的特点1 2 3 3 水轮发电机组振动故障的振因分析。1 3 3 3 1 机械原因引起的振动1 3 3 3 2 水力原因引起的振动1 5 3 3 3电磁因素引起的振动1 6 3 4 水轮发电机组振动故障的危害1 7 4 故障诊断系统数据挖掘技术应用1 9 4 1 数据准备1 9 4 2 数据挖掘工具选择1 9 4 3 数据挖掘模型建立2 2 4 3 1 组织数据挖掘源数据2 2 i 水电机组故障诊断系统数据挖掘技术的研究 4 3 2 分析处理源数据2 2 4 3 3 建立模型2 8 4 4 处理和使用模型3 0 4 4 1 决策树模型3 0 4 4 2 聚类分析模型:j 3 2 4 4 3 神经网络模型3 3 4 4 4 时序算法模型3 4 4 5 预测结果对比分析3 6 4 6 模型应用4 1 总结与展望:5 l 5 1 总结5 1 5 2 展望5 2 考文献5 3 读硕士学位期间发表的论文及科研成果5 5 谢5 6 i v 话华大学硕士学位论文 1 引言 1 1课题来源及名称 1 1 1 课题来源: 流体及动力机械省部共建教育部重点实验室( 西华大学,s b z d 一1 0 ) ; 流体机械省高校重点实验室( 西华大学,s g x z d 9 5 0 卜1 0 ) 一 西华大学水利水电工程校级重点学科( x z d 0 8 1 5 0 9 ) 。 1 1 2 课题名称: 水电机组故障诊断系统数据挖掘技术的研究 - 1 2 课题研究的目的和意义 近年来,随着水电机组单机容量的提高,机组尺寸逐步的增大,比转速不断 的提高,机组结构的日趋复杂,相对刚度的减弱,人们对于大型水轮机的运行稳 定性日益重视。同时,随着科学技术的高速发展,机组运行的自动化程度越来越 高,无人值班、少人值守,远程控制的水电厂日益增多,对机组运行稳定性的要 求亦日趋严格,自动化程度也越来越高。此外,机组设备在运行过程中会不断受 到泥沙磨损、空蚀破坏、机械磨损及其它机械或电气损伤,导致机组效率下降, 寿命缩短,若不及时进行诊断并适时检修将有可能引发事故,造成巨大的经济损 失。俄罗斯萨扬水电站8 、1 7 事故的严重后果和恶劣影响表明,水电站安全事关 国家经济发展和社会安定大局,机电设备重大事故会导致灾难性后果。 随着科学技术的不断发展,尤其是信号处理、知识工程和计算智能等理论技 术的发展,模糊推理技术、诊断推理技术、神经网络技术、专家知识库技术等先 进技术与故障诊断技术的融合与渗透,水电机组检修方式正由传统的事后检修和 按计划进行检修向现代的以状态监测与故障诊断为基础的状态检修方式发展。而 故障诊断是状态检修中最关键的环节,它是以水轮机的状态监测为基础,根据所 获得的监测数据,提取反映水轮机运行状态的特征值,并对这些特征值进行分析 诊断,判断水轮机是否存在故障。 同时随着数据库和网络技术的广泛应用,加之使用先进的自动数据生成和采 集工具,数据库的容量越来越大,其中所存储的机组运行数据越来越多,如何从 众多的数据中快速地挖掘出有用的特征数据,并通过分析这些特征数据预测其发 展趋势,已成为目前研究的重点和难点问题。 水电机组故障诊断系统数据挖掘技术的研究 2 0 世纪8 0 年代发展起来的数据挖掘技术( d a t em i n i n g ) 在对海量数据进行 分类、聚类、预测等分析上显示出强大的生命力,尤其是人的分析和分辨能力不 能胜任的高维海量数据方面。数据挖掘作为一种新的知识发现手段,将数据挖掘 与工业设备状态监测和故障诊断技术相结合,为突破传统状态监测和故障诊断系 统知识获取的瓶颈,提供了一个全新的解决方法,已经引起了故障诊断领域的重 视。 因此在现有的故障诊断系统的基础上应用数据挖掘技术从数据库存储的海 量原始数据中提取人们感兴趣的、隐含的、尚未被发现的有用的信息和知识,以 提高故障诊断系统运行的效率和准确性,是值得深入研究的。这不仅是对水电机 组的故障诊断分析有用,对其它行业的诊断分析也具有很大的参考价值。 本课题主要针对故障诊断系统研究热点数据挖掘技术,对故障诊断系统 数据库中存储的海量原始数据进行分析、筛选,以提取对故障诊断有用的特征数 据,并预测其发展趋势,提高故障诊断系统的有效性和准确性。同时可以运用挖 掘模型提取的科学规律对可能发生的故障进行预测,以提高维修质量和设备的可 靠性,降低维修成本,提高机组的可利用率,显著提高水力发电企业的经济效益。 1 3 国内外研究现状 数据挖掘也称为数据库中的知识发现( k n o w l e d g ed i s c o v e r yi nd a t a b a s e s , k d d ) 。1 9 8 9 年8 月,知识发现这个术语首次出现在美国底特律召开的第1 l 届国际人工智能联合会议的专题讨论会上。此后,由美国人工智能协会主办专门 研究探讨数据挖掘技术的国际研讨会l d ( k n o w l e d g ed i s c o v e r ya n dd a t e m i n i n g ) 会议已经召开了1 8 次,规模由原来的专题讨论会发展到国际学术大会, 研究重点也逐渐从发现方法转向系统应用,注重多种发现策略和技术的集成,以 及多种学科之间的相互渗透。i e e e 的k n o w l e d g ea n dd a t ae n g i n e e r i n g 会刊率 先在1 9 9 3 年出版了k d d 技术专刊。1 9 9 8 年在美国纽约举行的第四届知识发 现与数据挖掘国际学术会议上不仅进行了学术讨论,并且有3 0 多家软件公司展 示了他们的数据挖掘软件产品,不少软件已在北美、欧洲等国得到了广泛应用, 并收到明显的经济效益。 与国外相比,国内对数据挖掘和知识发现的研究稍晚,而且没有形成整体力 量。1 9 9 3 年国家自然科学基金首次支持中科院对该领域的研究项目。此后,国 内的许多科研单位和高等院校相继开展数据挖掘与知识发现的基础理论及其应 用研究,这些单位包括清华大学、北京大学、中科院计算技术研究所、空军第三 研究所等。其中,北京系统工程研究所对模糊方法在知识发现中的应用进行了较 深入的研究,北京大学也在开展对数据立方体代数的研究,华中科技大学、复旦 2 西华大学硕士学位论文 大学、浙江大学、中国科技大学、中科院数学研究所、吉林大学等单位开展了对 关联规则开采算法的优化和改造;南京大学、四川大学和上海交通大学等单位探 讨、研究了非结构化数据的知识发现以及w e b 数据挖掘。香港城市大学用数据挖 掘技术对发电机组的监测数据进行过滤;上海交通大学图像处理和模式识别研究 所试图利用数据挖掘技术,从数据库和生产过程中采集大量数据,并自动生成模 糊控制规则、自动学习故障诊断知识模型,求解优化问题。目前国内己形成高校、 研究所及企业的梯队式研究、开发和应用层次。 目前对数据挖掘的研究主要集中在以下3 个方面n 训: ( 1 ) 数据挖掘理论研究。目标是建立完整的数据挖掘理论体系,建立通用、 有效的处理模型,用科学的方法论指导知识发现的过程,使之成为一种主流技术。 近年来在这方面涌现了许多处理模型和系统框架。 - ( 2 ) 挖掘技术和算法研究。这也是目前最集中的研究领域。由于数据挖掘是 应用需求推动下跨学科发展的产物,所以各学科中的许多技术成果都可以移植到 数据挖掘中。传统的统计方法、决策树、聚类,近年来十分活跃的关联规则、粗 糙集理论、人工神经网络、遗传算法等在数据挖掘中都有应用j 但由于数据挖掘 面对的是大量数据,因此对这些领域中的许多技术不能照搬照用,如人工神经网,:一 络,由于获取的知识是以权值形式表示的隐含形式,因此一般不适合单独应用数 据挖掘,往往需要与其它方法相结合。 ( 3 ) 应用研究。如股票价格分析与预测,金融风险分析,信用卡欺诈分析, ,? 气象预报,生物工程等,随着i n t e r n c t 的普及与发展,对i n t e r n e t 数据的挖掘, 如站点访问模式分析,成为当今一个十分活跃的应用领域研究方向。 1 4 论文的主要研究内容 本文归纳总结了数据挖掘技术的基本理论,并将数据挖掘技术与水电机组状 态监测和故障诊断技术相结合。利用s q ls e r v e r 2 0 0 5 提供的用于创建和使用的 数据挖掘模型集成环境,以现有的水电机组运行数据作为样本数据,建立水电机 组运行数据的挖掘模型,并利用该模型预测水电机组状态参数的发展趋势。为突 破传统状态监测和故障诊断系统知识获取的瓶颈,提供了一个有效的解决方法。 3 水电机组故障诊断系统数据挖掘技术的研究 2 数据挖掘概述 2 1 数据挖掘概念 数据挖掘在人工智能领域,习惯上又称为数据库中的知识发现。数据挖掘还 有被译为数据采掘、数据开采和数据发掘等,但至今为止数据挖掘还未有一致的 定义。文献 1 对数据挖掘有如下定义: 定义1 g p i a t e t s k y , w j f r a w l e y 等定义数据挖掘为从数据库的大量数据中揭 示出隐含的、先前未知的、潜在有用的信息的非平凡过程。 定义2 有人简单的认为,数据挖掘就是数据库中知识发现的过程。 定义3 有人认为,数据挖掘就是发现数据中隐藏的模式和关系的过程。 定义4 有人认为,数据挖掘就是从大量数据中提取或挖掘知识。 定义5f a y y a d 等在“知识发现9 6 国际会议 上认为,知识发现是从数据 库中发现知识的全部过程,而数据挖掘则是此全部过程中一个特定的关键一步。 这种观点将数据挖掘的对象局限于数据库。 定义6 数据挖掘广义的定义为在一些事实或观察数据的集合中寻找模式的 决策支持的过程。 2 2 数据挖掘的过程 在实施数据挖掘之前,先制定采取什么样的步骤、每一步都做什么、达到什 么样的目标是必要的,有了完整的计划才能确保数据挖掘工作能够有条不紊地进 行并取得成功。实际上数据挖掘是一个交互和往复的过程,其中许多地方需要用 户的决策和干预。b r a c h m a n 等人在1 9 9 6 年提出一种实用的过程视图,而其后 f a y y a d 等人提出的多阶段模型由于其通用性而被广泛接受瞳1 。它包含多个处理步 骤,各个步骤之间相互影响,反复调整,形成一种螺旋式的上升过程,如图2 1 所示。 数据挖掘的过程主要包括: ( 1 ) 确定数据挖掘目标。了解应用领域及相关的经验知识,从用户的观点 出发确定数据挖掘的目标。 ( 2 ) 建立目标数据集。根据挖掘目标,从原始数据中选择相关数据集,并 将不同数据源中的数据集成起来。 ( 3 ) 数据清洗和预处理。数据集成之后必须利用领域专门知识对数据进行 清洗,目的是清除噪声数据和与挖掘主题不相干的数据。 4 西华大学硕士学位论文 图2 1 数据挖掘的过程 f i g 2 1 t h e p r o c e s so fd a t am i n i n g ( 4 ) 数据降维和转换。在对数据库和数据子集进行预处理之后,常常需对 数据进行一定的降维和转换,目的是将数据转换为适于数据挖掘处理的形式。 ( 5 ) 选择数据挖掘算法。选择合适的数据挖掘算法完成数据分析。数据挖戳二。豁 掘算法包括决策树、关联规则、神经网络、粗糙集、遗传算法等。 ( 6 ) 模式评价和解释。根据用户的决策目的对数据挖掘发现的模式进行评 价,并将这些模式或描述这些模式的数据以可视化技术和知识表示技术展示给用 户,让用户能够对模型结果做出解释,同时评价模式的有效性。 、 2 3 数据挖掘的功能 数据挖掘的目标是从数据库大量数据中发现隐含的、潜在有用的知识。数据 挖掘的功能一般可以分为描述和预测两大类。描述类任务主要刻画了数据库中数 据的一般性,预测类任务是在对当前数据分析的基础上进行推断,为此进行预测。 数据挖掘的功能主要有以下几种n 2 1 : ( 1 ) 概念描述。概念描述是指通过对某类对象关联数据的汇总、分析和比较, 得出对此类对象内涵的描述,并概括此类对象的有关特征。实现概念描述的主要 方法是特征化与比较。特征化是指提供给数据汇集的简洁汇总,通过面向属性的 归纳删除属性或概化属性,聚集合并相等的元组,累计对应的计数值,得到理想 水电机组故障诊断系统数据挖掘技术的研究 规则,是数据挖掘中数据预处理的重要方法。而比较则是提供两个或多个数据 集的比较描述,通过数据收集、相关分析、同步概化,最后导出比较的结果。 ( 2 ) 关联分析。关联分析是指从海量的数据中发现项集之间相关关系、因果 构,以及项集的频繁模式。关联分析是数据挖掘的一个重要且最为活跃的研究 域,其主要目的是从给定的数据集中发现频繁出现的项集模式,并找出其中有 的关联,又称为关联规则。 ( 3 ) 分类。分类在数据挖掘中是一项非常重要的任务,它的目的是发现一组 多组能够描述数据集典型特征的函数或模型,利用这些函数或模型能够识别未 数据的属性或类别。分类挖掘的主要技术有统计方法、机器学习方法和神经网 络方法。 ( 4 ) 聚类。聚类是将一些抽象或具体对象的集合,利用聚类的方法分成由许 多类似对象组成的多个类的过程。与分类分析方法不同,聚类是在没有给定划分 类的情况下( 如没有预定的分类表、没有预定的类目) ,根据信息相似度进行信 息聚类的一种方法。所以,聚类分析的输入数据集是一组未标记的对象。聚类的 目的是根据一定的规则,合理的进行分组或聚类,并用显示或隐式的方法描述不 同的类别。 ( 5 ) 时序演变分析。时序演变分析是针对事件或对象行为随时间变化的趋势 或规律,并以此来建立模型。它主要包括序列或周期模式匹配、时间序列数据分 析和基于类似性的数据分析。 2 4 数据挖掘的任务 数据挖掘的任务分为三类,即数据发现( d a t ad i s c o v e r y ) 、预测建模( p r e d i c t i v e m o d e l i n g ) 以及判断分析( f o r e n s i ca n a l y s i s ) n 一 。 ( 1 ) 数据发现:是指在数据库中发现隐含的模式而没有关于模式形态的假 设。也就是说在不对用户产生任何负担的条件下主动发现知识模式。在大的数据 库中,用户根本不知道如何回答问题才能获取需要的知识模式。此阶段的关键问 题是丰富的知识模式表达和发现,以及高质量的信息提供,这些决定了知识发现 技术的质量和能力。 ( 2 ) 预测建模过程:从数据库中发现规律,预测未来。预测建模允许用户提 交未知属性值的记录,系统根据数据库的知识模式判断属性值当发现过程获得 模式时,预测建模过程就将模式用做知识发现过程 ( 3 ) 反常数据分析:是利用已抽取的知识模式发现反常数据的过程。为了发 现反常数据,必须首先发现规则,然后探测在一定阈值内偏离正常情况的值。即 发现过程发现了知识模式,而反常数据分析辅助找到非正常的数据形式。 6 西华大学硕士学位论文 2 5 数据挖掘的常用方法 当前先进的数据挖掘工具都提供多种可供选择的数据挖掘算法。这是因为一 种算法不可能完成所有不同类型的数据挖掘任务;没有一种数据挖掘的方法可以 应付所有的要求。对于某一种问题,数据本身的特性会影响用户所选择的工具。 以下是比较常用的几种数据挖掘方法: ( 1 ) 决策树。决策树方法首先利用数据库中的互信息寻找具有最大信息量的 属性字段,将这个属性字段作为决策树的一个结点,然后再根据该属性字段的不 同取值分别建立树的分支,最后按照以上方法在每个分支子集中重复建立树的下 层结点和分枝。采用决策树方法,它的优点是即使实际中决策树非常复杂,但是 每一条从根结点到叶子结点的路径的含义仍然可以理解,精度较高。它的缺点是 决策树方法很难基于多个变量组合发现规则,不同决策树分枝之间的分裂也不光 滑。 决策树方法的起源是概念学习系统( c o n c e p tl e a r ns y s t e m ,c l s ) ,然后发展, 到i d 3 方法而到达高潮,后来又演化为能处理连续属性的c 4 5 。著名的决策树 方法还有c a r t 和a s s i s t a n t 。目前决策树方法在数据挖掘中主要应用于分类。 ( 2 ) 神经网络。神经网络方法主要是模拟人类的直觉思维。这种方法是以生 物神经网络作为基础,根据生物神经网络的特点,通过简化、归纳,总结出一类 并行处理网络。神经网络方法主要利用其并行处理的方法和非线性映射的思想, 用神经网络本身的结构来表达输入和输出的关联知识。 基于神经网络的数据挖掘种类很多,但最常用的是基于自组织神经网络的数 据挖掘和基于模糊神经网络的数据挖掘两种。自组织神经网络的过程是一种无师 学习的过程,通过学习提取数据中的重要特征或某种内在的知识。模糊神经网络 是将模糊处理功能引入神经网络之后发展起来的一种数据挖掘方法,该方法不仅 可以增加神经网络的输出表达能力,而且会使系统变得更稳定。 在上述两种基于神经网络的数据挖掘中驱动数据挖掘的神经网络实际上是 以神经网络为工具的联机分析处理技术,该技术特别适用于针对某种规则、定理、 专家知识、法定限度等监督或约束下的动态监测监控、预报预测,以及事物数据 库、动态数据库、i n t e r n e t 信息库等的数据挖掘。例如地震预测预报、灾害( 火 灾、水灾等) 动态监测、数据驱动下的资源动态监测等。 ( 3 ) 关联分析。关联分析可以分为两种,即关联规则和时序分析。关联规 则挖掘是寻找数据项中的有趣联系,决定那些事情将一起发生。r a g r a w a l 等 人在1 9 9 3 年首先提出了关联规则挖掘问题,它是描述数据库中一组数据项集之 长厉害:难以决定正确的数据;容易忽略离群数据。 ( 4 ) 粗糙集。1 9 8 2 年,波兰科学家z p a w l a k 首先提出的粗糙集理论是一种 研究不精确、不确定性知识的数学工具。它在处理信息含糊性上有几个优点:无 需提供出问题所需处理的数据集合之外的任何先验信息,如统计中要求的先验概 率和模糊集中要求的隶属度;算法简单、易于操作瞳1 。粗糙集理论的主要思想就 是在保持分类能力不变的前提下,通过知识归约、简化,导出问题的决策或分类 规则朝。 粗糙集理论的优点是能够在缺少先验知识的情况下,对数据进行分类处理。 在该方法中知识是以信息系统的形式出现的,先对信息系统进行归约,再从经过 归约后的知识库中抽取得到更准确、更有价值的一系列规则。基于粗糙集的数据 挖掘算法实际上就是对大量数据构成的信息系统( 即决策表) 进行简约,得到一 种属性归约集的过程,最后抽取规则。 ( 5 ) 遗传算法。遗传算法是一种基于生物自然选择与遗传机理的随机搜索算 法3 。其基本思想是基于达尔文的进化论和m e n d e l 的遗传学说。该算法是由 m i c h i g a n 大学教授h o l l a n g 及其学生于1 9 7 5 年创建。 采用遗传算法完成数据挖掘任务,首先要对实际问题进行编码,编码方法可 8 西华大学硕士学位论文 以是十进制编码,也可以是二进制编码。然后,定义遗传算法的适应度函数,由 于算法用于规则归纳,所以适应度函数主要由规则覆盖的正例和反例来定义。随 机产生一组规则,对产生的每一个规则应用数据库中给定的个体例子进行判断, 根据适应度函数计算其适应度。应用选择、交叉、变异运算对改组规则进行进化, 再利用选择运算产生下一代规则,这样经过若干代迭代后遗传算法满足终止条 件,从而得到一组理想规则。接下来,利用这些规则对数据库中的数据进行加工, 删除规则覆盖的例子,对剩余数据继续采用以上遗传算法,去挖掘第二组规则。 重复以上步骤,直至数据库中的所有例子都被覆盖或者满足事先约定的终止条 件。最后应用规则优化算法对所有规则进行优化,使之得到最简规则。 ( 6 ) 模糊集。模糊集理论是1 9 6 5 年美国自动控制专家查德( l a z a d e h ) 教 授首先提出来的,模糊集是基于模糊数学的一种处理方法,其基本出发点是针对 许多信息和数据的模糊性,如雨点的大小,人的高矮,收入的多少等,这些信息 本身缺乏一个确定的结果,经常只能描述一些元素之间的某种联系的程度口1 。 模糊集与粗糙集都是针对数据进行模糊性处理的方法,但两者还是存在很大 的不同。从集合的对象间的关系来看,模糊集主要研究数据集合本身的模糊性, 而粗糙集研究的是数据集合之间的不可分辨性;从研究对象来看,模糊集强调的 是同类间的不同对象对数据集合的隶属关系,重在隶属程度。因此,模糊集是数 据挖掘中常用的聚类方法之一。粗糙集以不可分辨性为基础,研究的是不同类别 对象组成的集合之间的关系,重在分类。因此,粗糙集是数据挖掘中常用的分类 方法之一。模糊集在数据挖掘上的应用十分广泛,包括模糊神经网络、模糊分类、 模糊聚类、模糊关联规则发现等。 一一 9 襄 带瞎 水电机组故障诊断系统数据挖掘技术的研究 3 水轮发电机组振动故障的基本理论 3 1 水轮发电机组的结构 水轮发电机组是对水轮机、发电机及其联系部分的总称,简称“机组”。通 常,水轮发电机组需要配有水轮机进水阀、调速器、励磁装置等附属设备。水力 发电的基本过程为:水能通过水轮机转换成旋转的机械能并传递给发电机,再由 发电机将旋转的机械能转换为电能。因此,水轮发电机组的主要作用就是将水能 转换为电能协】。 3 1 1 水轮机的结构及类型 根据转轮内水流运动的特征和转轮转换水流能量形式的不同,现代水轮机可 以划分为反击式和冲击式两大类。 反击式水轮机利用水流的动能与势能。水流充满整个水轮机的流道,整个流 道是有压封闭系统,水流是有压流动,水流沿着转轮外圆整周迸水,从转轮的进 口至出口水流压力逐渐减少。根据水流在转轮内运动方向的特征及转轮构造的特 点,反击式水轮机分为混流式、斜流式、轴流式和贯流式。另外根据转轮叶片能 否转动,将斜流式、轴流式和贯流式又分别分为定浆式和转浆式。 冲击式水轮机仅仅利用水流的动能。借助特殊的导水装置( 如喷嘴) ,把高 压水流变为高速的自由射流,通过射流与转轮的相互作用,将水流能量传递给转 轮。转轮和导水装置都安装在下游水位以上,转轮在空气中旋转,水流沿转轮斗 叶流动过程中,水流具有与大气接触的自由表面,水流压力一般等于大气压,从 转轮进口到出口水流压力不发生变化,只是转轮出口流速大小和方向改变了。转 轮不是整周进水,因此过流量较小。根据转轮进水特征,冲击式又分为切击式、 斜击式和双击式。 以反击式水轮机为例,现代水轮机一般是由引水部件、导水机构、转轮和排 水部件所组成。对于不同类型的水轮机上述四大部件在型式上虽各有不同特点, 但作用是一致的呻】: 引水部件:以最小的水力损失把水流引向转轮前的导水机构,并使水流能均 匀而轴对称的进入导水机构,同时让水流具有一定的速度环量。 导水机构:形成与改变进入转轮的水流速度环量,引导水流按一定方向进入 转轮。并通过改变导叶的位置,引起导叶出流速度方向和大小的改变,使得水轮 机流量变化来调整出力。 1 0 西华大学硕士学位论文 转轮:将水流的能量转换为转轴上的旋转机械能,对水轮机的性能、结构、 尺寸等都起着决定性的作用,是水轮机的核心部分。 排水部件:使转轮出口处水流压力下降,形成一定的真空,来回收转轮出口 水流中的部分动能和转轮高出下游水面的那一段动能。同时将转轮出口水流引向 下游。 3 1 2 水轮发电机的结构和类型 水轮发电机由固定部件、转动部件及其过渡部件组成。固定部件主要有机座、 机架、空气冷却器、定子铁芯及绕组等;转动部件主要有转轴、轮毂、转子支架、 磁轭及磁极等;过渡部件主要有推力轴承、导轴承、电刷装置及空气气隙等。 立式发电机主要包括转子、定子、上机架、下机架、推力轴承、导轴承、空 气冷却器、励磁机和永磁机等。 发电机转子由主轴、轮辐、支臂、磁轭、端压板、风扇、磁板、制动板等组 成。发电机定子由机座、铁芯、线圈等部件组成。推力轴承要承受水轮发电机组t 转动部分的全部重量及轴向水推力,并把这些力传递给荷重机架。 3 1 3 水轮发电机组的布置方式 1 一 水轮发电机按其位置方式可分为卧式和立式两种。卧式水轮发电机适用于中 小型机组。一般低中速的大、中型机组多采用立式发电机。根据推力轴承位置的 不同不过,立式水轮发电机又分悬式和伞式两种;悬式水轮机发电机的推力轴承一 在上机架上,而伞式水轮发电机的推力轴承在下机架上或支撑于水轮机项盖上的 推力轴承机架上。悬式机组适用于机组转速在l o o r m i n 以上。其优点是推力轴 承损耗小,装配方便,运转较稳定;缺点是机组较高,消费钢材多。伞式机组适 用于1 5 0 r m i n 以下,其中机组无上导的称为全伞式,有上导的称为半伞式。它 的优点是机组高度降低,可降低厂房高度,节约钢材;缺点是推力轴承损耗大, 安装维护不方便。 本课题立足于对水轮发电机组振动故障的研究,综合所有的水轮发电机组类 型来看,立式轴流转桨式水轮发电机组在振动监测方面最具有代表性,这种机组 的摆度和振动成因复杂,而目前国内外采用的各种减振措施都只能将机组的振动 限制在一定的范围内,不能完全消除。所以以这种结构机组为对象进行研究的振 动监测成果颇具有代表性。它的结构示意图如图3 1 所示。 既可直接激发并维持机组的振动,也可间接地激发或维持机组振动。由于水轮发 电机组工作的特殊性,其振动故障与一般动力机械相比,有较大的差异,具有祸 联性、复杂性及故障和特征的非一一对应性。 1 、水轮发电机组振动的祸联性 祸联性表现在不仅组成系统整体的各部分相互影响,而且引起机组振动的诸 因素间又有相互影响和制约。如水压力脉动引起的机组轴系的竖向振动,将导致 1 2 西华大学硕士学位论文 转子轮缘磁扼及磁极的振动,致使发电机转子和定子间的空气间隙不均匀,由此 便产生了不对称磁拉力,反过来又会加剧或阻尼机组转动部分的振动。 因此,对于水轮发电机组的振动,除需要考虑机组本身旋转部分或固定部分 的振动外,尚需考虑流动液体的动水压力造成的电站引水系统、水轮机过流部件 的影响及发电机电磁力对机组振动的影响。 2 、水轮发电机组振动的复杂性 水轮发电机组振动的复杂性主要表现在: ( 1 ) 往往几种振源同时存在;要分清主次及其相互关系很难。 ( 2 ) 既有个别部件或部位振动,又有各部件和部位的祸联振动。 ( 3 ) 既有一般的迫振和共振,又有倍频和自激振动。 ( 4 ) 激振力种类多,各种激振力的组合随机组运行工况( 启停空转、空载励磁、 带负荷、调相等) 不同而异。 3 、水轮发电机组振动故障和特征的非一一对应性 水轮发电机组振动的故障特征往往有多方面的反映,不同的故障其特征存在 着显著的交叉,故障和特征之间并不是一一对应的关系,而且一种故障在特征上 有多方面的反映。同时,某一部位的超常振动可能是几种故障的叠加,而某一故 障引起的振动也会在几个部位不同程度地反映出来。 水轮发电机组振动的这些特点综合表现在机组上,使得人们难以用准确的语 言对其振动程度与存在与否进行描述,这无疑给故障分析带来一定困难,这也是 水轮发电机组故障诊断技术发展缓慢的一个原因。 3 3 水轮发电机组振动故障的振因分析。 水轮发电机组的振动,都属于有阻尼振动,按其形式可分为受迫振动和自激 振动。受迫振动是由干扰力引起的,而干扰力的存在与否与振动无关,即振动停 止,干扰力依然存在。自激振动中维持运动的干扰力是由物体运动产生或所控制 的,干扰力的大小是物体运动参数的函数。根据干扰力的不同形式,机组振动可 分为机械振动、水力振动和电磁振动三类3 。 3 3 1 机械原因引起的振动 机械原因引起的振动称为机械振动,其干扰力来自机组的机械部分,主要有 以下几个方面。 1 、转子的弓状回旋和共振 当转动部分质量不平衡时,由于离心力的作用,将使转动部分产生所谓的“弓 水电机组故障诊断系统数据挖掘技术的研究 回旋 ,当转速很小时,挠度也将很小;随着转速的升高,挠度也明显增大; 转速与转动部分临界转速相近时,挠度剧烈增加,形成共振现象;当转速超过 界转速很多时,挠度值明显减小。为了避免出现危险地共振现象,一般大、中 机组转动部分的临界转速设计值都大于该机组1 2 0 的飞逸转速值,而某些高 小型机组,其额定转速有可能超过转动部分临界转速,这些机组在开停机操作 ,应尽快升速、减速,避免机组在共振区停留时间过长。 2 、机组转子的振摆 转子的振摆主要表现为大轴摆度增大,轴向支撑垂直振动增大。转子振摆的 要原因是转子的总轴向力( 转动部分重量和轴向水推力) 的重心没有通过推力 承的中心,使推力轴承支柱因受力不均而产生不均匀的轴向变形,在转子旋转 ,总轴向力也跟随着旋转,各轴承支柱的压缩变形跟着变化,镜板摩擦面产生 动,承重机架垂直振动增大,大轴摆度增大。振摆频率与转速频率相同。 3 、转子抖动 在运行中,因导轴承间隙过大或过小而润滑不足时,会发生摩擦而产生大轴 抖动”现象。 4 、转轴振动与支座振动的关系 引起振动的机

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论