(电力系统及其自动化专业论文)电力系统暂态稳定评估的关联规则挖掘.pdf_第1页
(电力系统及其自动化专业论文)电力系统暂态稳定评估的关联规则挖掘.pdf_第2页
(电力系统及其自动化专业论文)电力系统暂态稳定评估的关联规则挖掘.pdf_第3页
(电力系统及其自动化专业论文)电力系统暂态稳定评估的关联规则挖掘.pdf_第4页
(电力系统及其自动化专业论文)电力系统暂态稳定评估的关联规则挖掘.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

(电力系统及其自动化专业论文)电力系统暂态稳定评估的关联规则挖掘.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西南交通大学硕士研究生学位论文第1 l 页 a b s t r a c t d a t am i n i n gt e c h n o l o g yi sa p r o m i s i n ga n df l o u r i s h i n gf r o n t i e ri na r t i f i c i a l i n t e l l i g e n c e f i e l dr e c e m l y , w h i c hc a ne x t r a c tu s e f u li n f o r m a t i o nf r o m h u g e a m o u n t sd a t as e tt h a ti si n c o m p l e t ea n dn o i s y ,c o m p a r e dw i t hc l a s s i c a lt h e o r yo f p o w e rs y s t e m t r a n s i e n t s t a b i l i t ya s s e s s m e n t ,d a t am i n i n gi n v o l v e s m o r e a d v a n t a g e sw h e t h e ri np r e v i s i o no rc a l c u l a t i o ne f f i c i e n c y f i r s t ,”d e s c r i p t i o nt o d a t ao v e r a l lc h a r a c t e r i s t i ca n dt h ef o r e c a s tt ow h o s ed e v e l o p i n gm e n d ”e x a c t l yi s o n eo ft h ed a t am i n i n ga d v a n t a g e s s e c o n d ,d a t am i n i n go n l yn e e d ss o m ei n p u t p a r a m e t e r s ,n o tt h e e n t i r ed e s c r i p t i o no ft h em o d e l ,w h i c hm i g h ti m p r o v et h e e f f i c i e n c ya n dr e a lt i m ed e c i s i o n m a k i n g a so n eo ft h em o s ti m p o r t a n tm e t h o d s o fd a t am i m n g ,a s s o c i a t i o nr u l e st e c h n o l o g yc o u l df i n dt h el u r k i n gr u l e so f d i f f e r e n ta t t r i b u t e s t h e r e f o r e ,a s s o c i a t i o nr u l e st e c h n o l o g yi sa p p l i e di np o w e r s y s t e mt r a n s i e n ts t a b i l i t ya s s e s s m e n ti nt h i st h e s i s a c c o r d i n gt oi e e e l 6m a c h i n es y s t e m ,t r a n s i e n ts t a b i l i t ys i m u l a t i n gi s c a r r i e do n t 。m e e t i n gt h ed a t aa n dt h ea s s o c i a t i o nr u l e sa l g o r i t h md e m a n d t h e p a p e rp r o v i d e sad a t am i n i n gp r e p r o c e s ss t u d y i ta d o p t sf c mt oa d j u s tt h e n u m b e ro ft h ed i s c r e t i z a t i o np o i n t sa n du s ei n f o r m a t i o ne n t r o p yt e c h n o l o g y m a k i n gc o n t i n u o u sa t t r i b u t ev a l u ed i s c r e t e a l lt h ep r o c e s s e sa r ei l l u s t r a t e db y m a t l a bp r o g r a m m i n g ,m o r e o v e r , t h eu s u a la s s o c i a t i o nr u l e sa l g o r i t h m s ,s u c ha s t h ec l a s s i c a la p r i o r ia l g o r i t h m ,i n v o l v eo n l yo n ed i m e n s i o n a n dh e n c e ,b a s e do n t h ed e e pr e s e a r c ha n ds t u d yo fa p r i o r i ,t h i st h e s i sp u t sf o r w a r da ni m p r o v e d a l g o r i t h mw e l ls u i t e df o rt h em i n i n go fm u l t i d i m e n s i o n a la s s o c i a t i o nr u l e s f i n a l l y , t h et h e s i sf i n d st h ea s s o c i a t i o nr u l e so fd i f f e r e n ta t t r i b u t e sa n dt h e nm i g h t p r o v i d e u s e f u la n d h e l p f u lk n o w l e d g e f o r p o w e rs y s t e m t r a n s i e n t s t a b i l i t y a s s e s s m e n ta n dp r e d i c a t i o n k e yw o r d s :t r a n s i e n ts t a b i l i t ya s s e s s m e n t ;a s s o c i a t i o nr u l e s ;d a t ap r e p r o c e s s f c m ;k m e a n s ;e n t r o y ;d i s r e t i z a t i o n ;m u l t i d i m e n s i o n 西南交通大学硕士研究生学位论文第1 页 第1 章绪论 1 1 电力系统暂态稳定评估的研究现状 电力系统在大扰动后( 如故障、切机、切负荷、重合闸操作等情况) ,如 果能保持同步运行,并具有可以接受的电压和频率水平,则称此电力系统在 这一大扰动下是暂态稳定的。在电力系统规划、设计、运行和控制时都要进 行大量的暂态稳定分析。通过暂态稳定分析还可以研究各种稳定措施的效果 以及稳定控制的性能,因此有很大的意义。 现有的暂态稳定评估方法可分为以下几大类: 1 时域仿真法 时域仿真法是最成熟也是最经典的方法,它适应面广,精确可靠,能同 时研究第一摇摆和后续摇摆失稳,也可通过反复迭代求解稳定指标。但是, 其计算量过大,同时在线应用时感兴趣的时间尺度仅在几秒钟之内,难以满 足大系统在线暂态稳定评估对速度的要求口j 。 时域仿真法的基本方法是,将电力系统各元件模型通过电力网络形成全 系统模型,这种模型是一组联立的代数方程组和微分方程组,然后以故障前 系统稳态潮流解为初值,求扰动过程中和扰动过程后的数值解即通过积 分方法求得全系统状态变量和代数变量随时间变化的曲线,通过同步机转子 间的相对摇摆曲线来判别系统的稳定性。 整个系统的模型在数学上可以统一描述成如下一般形式的微分代数方程 组: 赦7 d t 2 f ( 。,y ( 1 - 1 ) 【o = g ( x ,y ) 式( 卜1 ) 中,x 表示微分方程组中描述系统动态特性的状态变量:y 表示代 数方程组中系统的运行参量。微分方程组主要包括: ( 1 ) 描述各同步发电机暂态和次暂态电势变化规律的微分方程: ( 2 ) 描述各同步发电机转子运动的摇摆方程: ( 3 ) 描述同步发电机组中励磁调节系统动态特性的微分方程; ( 4 ) 描述同步发电机组中原动机及其调速系统动态特性的微分方程; 西南交通大学硕士研究生学位论文第2 页 ( 5 ) 描述各感应电动机和同步电动机负荷动态特性的微分方程; ( 6 ) 描述直流系统整流器和逆变器控制行为的微分方程: ( 7 ) 描述其他动态装置( 如动态无功补偿装置s v c ,可控串联补偿t c s c 等f a c t s 元件) 动态特性的微分方程。 代数方程组主要包括: ( 1 ) 电力网络方程,即描述在公共参考坐标系x y 下节点电压与节点注入 电流之间的关系; ( 2 ) 各同步发电机定子电压方程( 建立在各自的d q 坐标系下) 及d - q 坐 标系与x - y 坐标系间联系的坐标变换方程; ( 3 ) 各直流线路的电压方程: ( 4 ) 负荷的电压静态特征方程等。 在列出上述微分方程组和代数方程组后,应用各种数值解法进行求解。 数值解法的基本过程如图卜l 所示。 图l 一1 中,在计算暂态稳定前,先要进行潮流计算,算出扰动发生前系 统的稳态运行状态。然后由潮流计算结果,计算出作为随后求解微分方程式 的初始条件,即系统稳态运行情况下的状态变量x ( 0 ) 。框( 3 ) 的内容是根据 系统中各元件的数学模型形成相应的微分方程,并根据所用网络求解方法形 成相应的代数方程。 暂态过程计算从框( 4 ) 开始。在一般暂态稳定计算程序中,积分步长t 通常预先设定,在计算过程中傈持不变。将第一个故障或操作的时刻取为 t = 0 ( 框4 ) 。这里,因状态变量不能突变,有x ( 0 ) = x ( 0 ) 。以后,每经过个 步长的计算,时间t 依次累加t 。 框( 5 ) 到框( 1 0 ) 是一个积分步长内的暂态过程计算。首先,判断该时刻是 否发生故障或操作( 框5 ) 。如果发生,则根据故障或操作的具体内容对微分 方程或代数方程进行修改( 框6 ) ,还需要新求解网络方程并计算故障或操作 后瞬间的y ( t ) ( 框7 和框8 ) ,因为非状态变量在发生故障或操作瞬间将产生 突变。 框( 9 ) 是暂态稳定计算的核心部分,其内容是根据t 时刻的x ( t ) 和 y ( t ) ( 应用多步积分法时还需用到以前时刻的取值) ,计算出t + a t 时刻的x ( t + a t ) 和y ( t + t ) ,通常采用的方法是交替求解法或联立求解法。然后 进行稳定性判断( 框( 1 0 ) ) 。如果已经判断出系统不稳定,便转到框( 1 3 ) ,停 止计算并输出计算结果,否则经过框( 1 1 ) 将时间向前推进( t = t + a t ) ,进行 西南交通大学硕士研究生学位论文第3 页 下一步长的计算,直至所计算的暂态过程持续时间达到预先给定的时间t - = ; 为止( 框1 2 ) 。t m 。的选取与具体的分析要求有关,如果只需要判断第一摇 摆周期的稳定性,则通常取t m 。= l 一1 5 s ;而如果需要判断第二、三摇摆周期 的稳定性,择取t 。= 3 5 s 。至于框( 1 0 ) 中稳定性的判断,目前通常采用以 任意两台发电机转子间的相对角度超过某预先给定的角度值( 例1 8 0 。) 作 为失去稳定的判据【2 j 。 l 输入原始数据和信息 l ( 1 1 l 扰动前系统的潮流计算,计算初始值“o ) l 图i - i 数值解法基本过程 目前,数值解法仍是电力系统运行及规划中普遍使用的方法。该方法的 优点是分析结果直观、可靠,可以模拟电力系统中各种控制器的控制过程。 彻 m m m 西南交通大学硕士研究生学位论文第4 页 同时,该方法几乎没有模型限制,可用于数百台机组、数千条线路、数干务 母线的大规模电力系统,可以模拟各种复杂的故障及保护动作。该方法的不 足是在稳定极限分析中要反复仿真逼近稳定极限,因而计算分析时间较长, 同时不能进行稳定性指标分析,限制了它在在线暂态稳定分析中的运用p 】。 2 直接法 直接法克服了时域仿真法计算速度慢的缺点,从系统角度去看稳定问题, 故可做出快速判断,而不必计算整个系统的运动轨迹,即不必逐步积分计算。 它是基于l y a p u n o v 稳定性理论,通过系统状态量方程来建立描述系统的暂态 能量函数,利用同步发电机的暂态能量来判别系统的稳定性并进行稳定裕度 分析,主要的直接法有三种p 】:基于单机无穷大等值的扩展等面积准则法 ( e x t e n d e de q u a la r e ac r i t e r i o n e e a c ) ,基于最大势能搜索的势能边界面法 ( p o t e n t i a le n e r g yb o u n d a r ys u r f a c e p e b s ) ,基于相关不稳定平衡点求解的相 关不稳定平衡法( c o n t r o l l i n gu n s t a b l ee q u i l i b r i u mp o i m c u e p ) 。此外还有从 p e b s 发展的b c u 法,以及将积分和直接法相结合的混合法及q u e p 法等。e e a c 法是一种不同于l y a p u n o v 函数,但却非常严格的直接法,它保持了原积分空 间的完整性,仅把观察空间等值为单机无穷大系统,并保存了原多机动态过 程的稳定特征,目前,e e a c 法在实际工程中已得到应用。 直接法的基本思想是:根据暂态稳定性的定义,在遭受扰动后如果系统 是稳定的,则它最终将过渡到一个稳定运行状态,这一平衡状态一定是静态 稳定的。对于故障后稳态运行情况下各个状态变量的取值,用状态空间中的 点x 表示,称为稳定平衡点。系统能否稳定决定于故障切除时间t 。,对应地 用状态空间的点x 。表示。临界切除时间k 对应的点表示为x 。,然后便可以 直接进行稳定性判断,而无需再对t 。时刻以后系统的暂态过程进行计算【4 】。 直接法以其能够定量量度稳定裕度,适合于灵敏度分析,计算快速等优 点受到较多关注,成为仿真方法的一种重要补充。它将扰动后的系统看作初 态下的自治系统来研究其稳定性,使时域仿真的计算时间缩短到扰动停止时 刻,大大加快了暂态稳定的判别速度。但直接法也存在难以克服的缺点,如 对复杂模型缺乏有效的能量函数构造方法,尤其是l y a p u n o v 定理本身只能 提供稳定的充分条件,而不是充要条件,使得评判结果过于保守,降低了评 估结果的准确性1 5 j 。 3 人工智能和模式识别 电力系统暂态稳定评估的问题可简化为仅仅区分稳定和不稳定状态的两 西南交通大学硕士研究生学位论文第5 页 模式分类问题。该方法为大型电力系统的快速稳定评估提供了一种新的求解 方法。由于不需要建立系统的数学模型,能直接从样本中寻求状态参数与稳 定性或稳定指标之间的映射关系,求解稳定指标不需要重复试探,计算量受 系统规模影响较小,整体评估速度很快。但缺乏标准的实现方法,精度对样 本规则选取,输入变量的选取等因素极为敏感,设计不当时评估的可靠性和 稳定性较差。人工智能的出现为模式识别方法带来了新的活力,它以其固有 的离执行速度使得它在暂态稳定评估领域具有良好的应用前景【6 j 。 1 2 数据挖掘概述 1 2 1 数据挖掘产生背景及定义 数据挖掘又称为数据库中的知识发现,出现于2 0 世纪8 0 年代后期。在 1 9 8 9 举行的第十一届国际联合人工智能会议( i j c a i 8 9 ) 上,首次出现数据库知 识发现( k n o w l e d g ed i s c o v e r yi nd a t a b a s e ,即k d d ) 的概念。1 9 9 3 年,a g r a w a l 提出了交易数据库中的关联规则挖掘,从此数据挖掘在世界范围内广泛兴 起。目前数据挖掘作为一种技术和一门学科,已经被国内外研究领域广泛认 可,并且具有自己的机构、刊物和会议,已出版了大量的书籍。世界各国内 知名大学的研究机构和各大公司的研究部门都投入了大量精力对其进行研 究,并取得了诸多成果。美国斯坦福大学智能数据库系统实验室歼发出了大 量的商用化数据挖掘系统,女g d b m i n e r ,它包含了许多先进的挖掘算法,可在 多种平台上运行,并与许多主流的数据库管理系统( 如s q l s e r v e r ,0 r a c l e 等) 。i b m 公司的a l m a d e n 实验室所进行的q u e s t 项目同样也是数据挖掘研究 领域的佼佼者。同时还有许多大学的研究机构和学者对该领域的发展做出了 重要贡献,如加拿大s i m o nf r a s e r 大学的j i a w e if l a n ,芬兰赫尔辛基大学的 m a n n i l a 等都是此领域的著名专家【7 j 。世界有名的g a r t n e rg r o u p 咨询公司曾 预测,在今后的3 至5 年内,对工业界将产生重要影响的五项关键技术,其中 数据挖掘与人工智能排名第一i s 】。 对于数据挖掘的定义,目前存在两种观点:一部分人认为数据挖掘是指 数据库中的知识发现;另一部分人则认为数据挖掘是数据库知识发现过程中 的一个处理步骤j 。 : 按照现在较流行的说法,数据挖掘( d a t am i n i n g ) 就是从大量的、不完全 的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们 事先不知道的,但又是潜在有用的信息和知识的过程1 9 】。 西南交通大学硕士研究生学位论文第6 页 从该定义可以看出,数据挖掘是知识发现过程中最核心的一个步骤。 知识发现包括以下四个主要步骤: 1 数据预处理:根据数据挖掘的目的需要,确定需要挖掘的数据,并对 原始数据进行预处理,以使之适合进一步的挖掘工作。 2 数据挖掘:利用特定的算法从数据中提取知识,知识的表示形式包括 概念、规则和模式。 3 模式评估:评价知识的重要性、置信度和有趣度等,对模式进行解释, 评估模式的合理性和可用性。 4 知识表示:使用可视化和知识表示技术,向用户提供有用的知识。 可见,数据挖掘只是数据库知识发现过程中的一个重要步骤。它是利用 确定的算法从准备好的数据中挖掘或提取有用知识的过程。 数据挖掘的技术包括以下六个方面【9 1 : 1 关联分析( a s s o c i a t i o n a n a l y s i s ) :关联分析是分析数据集中某些实例共 同满足的、存在于属性之间的关联性。关联分析可以揭示同类实例间未知的 依赖关系。依据这种关联性可以从一个实例的信息来推断另一实例的信息。 2 分类( c l a s s i f i c a t i o n ) :分类是指在已知数据集( 即训练集) 上学习或构 造一个分类模型( 即分类器,c l a s s i f i e r ) 。利用分类模型能够依据未知实例的 特征来推断其类别。可见分类模型具有预测和决策功能。 3 聚类分析( c l u s t e r i n ga n a l y s i s ) :聚类分析的原理是:给定n 维空间中 的m 个向量,把每个向量归属到c 个聚类中的某一个,使得每个向量与其聚 类中心的距离最小。聚类分析是一个全局最优问题。应用较广的算法为k 均 值算法,但它不一定能得到全局最优解。一般的聚类分析算法需要占用较多 的系统资源。 4 预测( p r e d i c t i o n ) :预测是指依据历史数据和现有数据推测未来发展趋 势的技术。预测方法总体上分为两大类:定性预测和定量预测。定性预测又 称直观预测,受人为因素的影响大。定量预测又分为因果分析法( 如回归分 析法) 、时间序列分析法( 如移动平均法、平滑指数法) 。除时序预测外,广 泛使用的另一类预测技术是分类预测。预测作为智能决策的种手段将在未 来的商业智能中发挥重要的作用,正如l a g o s t a 所言:数据挖掘的未来属 于预测分析。 5 偏差检验( d e v i a t i o nd e t e c t i o n ) :偏差检验技术用于提取数据中的偏差 和异常。令人感兴趣的偏差主要包括三个方法:( 1 ) 不符合标准的异常;( 2 ) 西南交通大学硕士研究生学位论文第7 页 与父类或者兄弟类有很大差别;( 3 ) 某个域( 如时间、空间) 内相邻两个区间 的信息演变,例如某一地区两个季度销售收入的变动。 6 数据可视化( d a t av i s u a l i z a t i o n ) :数据可视化以更形象、更直观的二 维三维图形来展示数据挖掘所得出的知识或模式,是对图表功能的拓展。 1 2 2 数据挖掘的应用领域 1 2 2 1 主要应用领域 当前数据挖掘应用主要集中在电信、零售、银行、保险、基因工程、网 络日志分析等方面,并逐步扩展到制造业、农业、电子政务、教育、软件工 程、智能交通和军事研究等领域,以下通过一些具体的例子加以说明。 1 零售业 零售业是数据挖掘的主要领域,通过对客户购买行为进行分析有助于识 别顾客的购买行为,发现购买模式和预测趋势。改进服务质量,提高货品的 销售比例。这种应用最早出现在美国,世界著名的沃尔玛超市利用数据挖掘 关联规则从售货数据记录中发现顾客的购买模式,从而调整了商品的相对摆 放位置,既方便了顾客,又促进了销量。在线购物活动中,通过提醒顾客是 否购买关联商品,同样也促进了销量。b e r r y 和l i n o f f 1 0 l 对零售数据挖掘 和客户关系管理进行了专门研究。 2 金融领域 金融事务需要搜集和处理大量的数据,由于银行在金融领域的地位、工 作性质、业务特点以及激烈的市场竞争决定了它对信息化、电子化比其它领 域有更追切的要求。利用数据挖掘技术可以帮助银行产品开发部门描述客户 以往的需求趋势,并预测未来。美国f i r s t a r 银行使用m a r k s m a n 数据挖掘工 具,根据客户的消费模式预测何时为客户提供何种产品。f i r s t a r 银行市场 调查和数据库营销部经理发现:公共数据库中存储着关于每位消费者的大量 信息,关键是要透彻分析消费者投入到新产品中的原因,在数据库中找到一 种模式,根据消费者是否有家庭财产贷款、赊帐卡、存款证或其它储蓄、投 资产品,将它们分成若干组,然后使用数据挖掘工具预测何时向每位消费者 提供哪种产品。 3 电信领域 通过对电信业务中的通话记录进行分析,电信公司或呼叫中心通过挖掘 大量通话录,能找出电话呼叫方是谁、被叫方是谁、通话时间有多长、电话 西南交通大学硕士研究生学位论文第8 页 线是否同时持传真和语音等细节信息。客户服务呼叫中心能利用这些信息以 及客户资料挖掘有价值的增值服务模型,如确定电信模式、捕捉盗用行为。 对于特定客户可以进行特殊的服务。c h e n 等人【l l 】报道了在数据仓库框架下 的可伸缩电信串联传输分析方面工作。 4 生物医学领域 目前,数据挖掘在医学界已经有了广泛的应用,其运用领域从新药物的 开发研究和癌症治疗的突破,到通过大规模序列模式和基因功能的发现,以 及疾病的预测防范。关联规则已应用于传染病的风险预测【1 2 】,癌症病人的资 料分析中“。 5 计算机应用领域 计算机网络入侵监测系统:网络安全管理部门利用数据挖掘发现的知识 检测黑客程序的入侵【i ”。在信息系统的安全管理中,采用基于规则的访问控 技术结合系统日志文件,借助数据挖掘技术能检测出未授权用户对受保护数 据非法访问。面向提高服务质量的w e b 结构重组:通过挖掘w e be | 志发现 用户访问为知识,重新组织w e b 结构,提高服务质量i i ”。 1 2 2 2 在电力系统中的应用 我国近年来也紧跟国际潮流开展了相关的研究与开发工作,在电力系统 领域中的应用主要集中于下面几方面:电力系统故障分析、负荷预测模型的 构建、设备运行状态监视、电力系统动态安全分析等。 1 故障分析 电力系统的故障受理系统在业务处理中积累了大量的数据,利用数据挖 掘技术可以从这些数据中对电力系统故障提供可靠的描述,寻找设备与其外 在表现之间的相关关系,并发现不同事故发生时产生的某些关系,从而合理 安排检修计划,减小气候和负荷变化对产生故障的影响,提高供电质量。文 献 1 6 论述了用数据挖掘技术对变压器油中各种气体成分进行聚类分析,从 而可以在预先不知道变压器故障类型的情况下得出变压器油中各种气体成分 含量与故障之间的直接关系,为专家们判断变压器故障提供了十分有利的依 据。 2 负荷预测和电力用户的特征提取 各国的电力部门都在进行结构改革,引进竞争型的市场机制是发展的大 方向和必然趋势。电力公司必须制定出合理的经济模型及具有竞争力的实时 电价表,并对电力用户进行准确分析,只有将市场分成有意义的群组和分析 西南交通大学硕士研究生学位论文第9 页 出用户的特点,并能预测出短期市场需要及长期价格预测方法,才能协助市 场经理和业务执行人员更好地制定出有益的决策和设计新的市场运作。而电 力用户的多样性及随机性,用常规的算法很难划分用户群组和分析出用户的 特点。目前人们把数据挖掘也应用到了这一方面【1 7 】,例如用时间序列模型使 用已有的数据序列进行预测负荷,用自适应决策树对存储在数据库中的5 0 0 个用户每0 5 h 的用电记录、季节、气候和其他一些相关的属性进行聚类分析, 不仅划分了用户群组行为模式及其负荷要求情况,制定出合适的收费表,而 且分析出用户与其他属性相关联的一些特点。与之类次目标,可运用具有自 组织的人工神经网络和模糊逻辑相结合,或用关联规则对客户的模式和用电 需求进行划分,这样可预测出客户使用的模式,从而改进发电管理等,并防 止电价冲击对电力系统安全性造成冲击,增加自身的竞争力。 3 设备运行状态监视 系统运行人员借助给予状态监控和预诊断技术的综合智能系统,对电力 系统设备的使用情况进行扫描,发现问题可以及时地安排电力设备检修,延 长电力设备使用寿命,降低检修成本,并保证系统的高可靠性。如在发电厂 中建立一个针对2 个发电机组的运行信息系统,通过关系数据库与神经网络 等技术相结合,数据挖掘技术可自动发现某些不正常的数据分布,暴露运行 中的异常变化和各种因素,协助检修工程师迅速找出问题发生的范围,并采 用可视化界面查询机组运行情况,及时检修和采取对策l l ”。 4 电力系统动态安全分析【l 驯 电网互联和电力市场的发展导致电力系统的动态行为越来越复杂,在线 安全评估不可能用单个指标来全面衡量系统得安全性,而应该用各个专门模 块来分析安全稳定的各个方面后再获得综合评价,以提供全面的安全评估。 目前利用数据挖掘中的模糊决策树的自动推理能力,根据计算机仿真系统和 随机采样所给出的各种情况下的相关数据,推导出确切、综合的相关信息, 将其转化为更明确、更适合与决策分析的形式表达出来,这样就可以将基于 计算机的系统安全评估仿真系统中的逐步搜索法转化为电力系统安全知识。 通过使用这些知识进行实时系统分析或离线的仿真训练,可使运行人员更深 入地进行系统动态安全性分析,并得到更准确的紧急控制和恢复策略。 1 3 基于数据挖掘的暂态稳定评估方法综述 由于电力系统是一个非常复杂的动态系统,具有强非线性、高维、时变 西南交通大学硕士研究生学位论文第10 页 等特性,因此现有的暂态稳定评估方法如时域仿真法、能量函数法都一定程 度上具有局限性。另外随着计算机、通讯、网络等技术的飞速发展,电力系 统数据来源更加广泛,包括系统中各种装置所采集的实测数据及数字仿真数 据,如s c a d a 系统、p m u 动态测量、管理信息系统、地理信息系统等实测 数据,和各种仿真软件如e m t p 、b p a 、p s s e 等仿真获得的数据。工程技 术人员,特剐是控制中心的调度员,陷于“数据丰富”而“知识贫乏”的困境, 不能从海量的数据信息中获取有价值的“知识”,难以保证电力系统安全稳定 的运行。数据挖掘的特点之一就是对海量数据的处理能力。因此数据挖掘技 术同电力系统的实际需求相吻合。 就暂态稳定问题而言,它同电力系统的运行方式有着密切的联系。在电 力系统运行方式变化时,经验丰富的现场运行人员常可粗略地预测出某些状 态量,如母线电压、线路潮流等。这是因为运行人员通过长时间的运行,掌 握了代表电力系统安全运行水平的关键部位的状态量和其他一些量的关联关 系,他们可根据电力系统中控制量和扰动量的变化趋势,预测出这些关键部 位在运行方式变化时的状态量,这在很大程度上是一种经验的积累。若将这 种积累以数学的形式表示出来,方法之一就是利用数据挖掘的统计思想l l 。 数据挖掘以其自身的特性,适合用于处理电力系统暂态稳定评估这样复杂的 非线性问题。它的优势在于:1 ) 基于数据挖掘技术的暂态稳定评估不受电力 系统复杂的数学模型的限制;2 ) 数据挖掘的关联规则技术可形成直观的规则 以指导人们在电力系统暂态稳定评估中进行决策控制,为防治大事故的发生 提供更好的理论依据及实际意义。 提到数据挖掘的使用技术,就不能不提到关联规则。关联规则的发展是 数据挖掘中最成功和最重要的任务之一,也是当今数据挖掘中一个非常活跃 的研究领域。由于关联规则挖掘可以发现用传统的方法无法发现的项与项或 属性与属性间的关系规律,因此具有重要的研究价值。电力系统暂态稳定评 估中的关联规则主要体现在从海量数据中发现属性与属性间的频繁模式、相 关性或因果关系,以便从宏观上把握电力系统所有组成元素间的关联特性。 例如:在考虑所有可运行方式下,数据属性参数的变化与系统安全稳定程度 之间的关联规则。针对本领域的需要,追踪国内外的相关算法,并作如下的 分析介绍。 关联规则挖掘首先由a g r a w a i 等 2 0 l 在1 9 9 3 年提出,是关于挖掘顾客交易 数据库中项集闯的关联规则的问题,其核心是基于频繁项集理论的递推方法。 西南交通大学硕士研究生学位论文第11 页 之后关联规则的挖掘问题受到关注并进行了大量的研究,包括关联规则挖掘 算法优化。其中最有影响的算法是a p r i o r i 算法,由a g r a w a l 和s r i k a n t l z l j 提 出。其余算法大多是以a p r i o r i 为核心,有些是其变体,比如类剪枝方法,使 用h a s h 表1 2 2 1 ,划分技术【2 3 ) ,选样方法 z 4 1 。另外,还有一些算法是a p r i o r i 算法 的扩充,包括序列模式挖掘 2 5 1 ,e s p i s o d e s 挖掘【2 6 】,挖掘否定的关联规则1 2 7 l , 挖掘事务间关联规则 2 s j 等。文献 2 9 】提出了频繁闭合项集的挖掘,而有效的 挖掘算法由文献【3 0 】提出。挖掘频繁模式而不产生候选的方法由文献 3 1 】提 出。在文献 3 2 中,这种挖掘以概化关联规则的形式研究,并提出兴趣度度 量,以删除冗余规则。使用量化属性的静态离散化和数据立方体,文献 3 3 】 研究了多维关联规则的挖掘。文献 3 4 】, 3 5 】,和【3 6 讨论了强关联规则的兴 趣度问题。挖掘关联规则的有效增量更新问题f 1 3 c h e u n g ,h a n ,n g 和w o n g p “ 提出。 暂态稳定数据关联规则的挖掘属于量化多维关联规则挖掘,最关键的问 题之一是要将连续属性离散化,因此我们尝试采用聚类和信息墒技术对数据 进行预处理。文献 3 8 讨论了数量型属性关联规则的问题,文中的挖掘算法将 数量型属性划分成为多个区间,但是这样的方法存在划分边界过硬的缺点。文 献 3 9 用模糊集来软化划分边界,并提出数量型属性模糊关联规则的概念,但 是文中没有给出将数量型属性划分成模糊集的算法。本文进行k m e a n s 和f c m 算法进行聚类,通过实验数据证明采用f c m 算法具有更好的聚类效果,同时应 证了模糊聚类软化边界:然后,本文结合信息理论中熵的概念,从寻找一个 合适的属性离散化方法。 信息论是由s h a n n o n 奠基的一门崭新的数学学科。1 9 4 8 年,美国工程师 c e s h a n n o n 在贝尔电器研究所出版的专门杂志上,发表了“通信的数学理 论”,在这一开创性的文章中,给出了信息度量的数学公式,为信息论的创立 做出了独特的贡献。信息熵的概念也由此提出。信息熵可以用来度量信息系 统的不确定度【帅1 。离散化的过程就是把连续属性的取值范围或取值区间划分 为若干个数目不太多的子区间,其中每一个子区间对应着一个离散的数值。 其实,离散化的过程就是选取离散断点的过程。以信息论的观点,离散化方 法的基本思想是将连续属性值划分到离散的区间,使各区间所包含的信息量 尽可能地相等。因此,离散化方法的关键是选择( 或定义) 一个每个区间相对 于决策属性的信息量的合适度。我们选择一个信息熵函数来确定离散断点, 从而度量每个离散区间的信息量。 西南交通大学硕士研究生学位论文第1 2 页 1 4 本文主要工作 1 将关联规则挖掘1 立用于电力系统暂态稳定评估中。深入研究关联规则 挖掘算法及其特点,将其与电力系统暂态稳定评估应用相结合; 2 利用仿真软件p s t 2 0 建立i e e e l 6 机系统数据,综合分析研究得出数 据预处理的第一步数据选取数据,即暂态稳定初选特征数据: 3 针对量化关联规则挖掘数据离散化的问题,本文找到一个合适的矢量 空间聚类算法,在不改变样本空间数据结构的基础上,提供一定的候选离散 断点供选择进行属性离散; 4 离散化的要求就是用尽可能少的断点完成在改变样本空间数据结构的 划分。针对这一要求,本文引入信息熵的概念,尝试寻找一个合理的信息熵 函数从上面提供的候选离散断点中,选择合适的离散断点。并将离散区间映 射为连续的离散数字标识,从而进一步进行关联规则挖掘: 5 a d r i o r i 算法是一种找频繁项集的基本算法,它常常被用于单维关联 规则的挖掘,本文在对a p r i o r i 算法包括它的一些变形算法进行了深入研究的 基础上,对其进行改进使之适用于多维关联规则挖掘,并编程实现多维关联 规则挖掘; 6 分析总结阀值设定的原则,并通过一系列的实验,改变阀值设萱,最 终挖掘出规则并进行评价总结。 西南交通大学硕士研究生学位论文第13 页 第2 章本课题相关数据挖掘技术 2 1 聚类分析 2 r1 聚类概述 聚类则是数据挖掘领域中的一个重要的研究课题,所谓聚类是将物理或 抽象的集合分组成为类似的对象组成的多个类的过程。由聚类生成的簇是一 组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其它簇中的 对象相异。在许多应用中,可将一个簇中的数据对象作为一个整体处理。但 是分类问题和聚类问题根本不同。分类是训练例子的分类属性值,而聚类则 是在训练例子中找到这个分类属性值。当分析一个较大的、复杂的、连续有 许多变量的数据库和完全未知的结构时,聚类是一个非常有用的工具。在数 据挖掘运算开始时,聚类经常是最好的应用技术,它能发现具有相似记录的 数据空间领域。此外,数据挖掘工具和技术( 包括聚类) 能用于发现有用的规 则和模式一“。 聚类与数据挖掘中的分类不同,在分类模块中,对于目标数据库中存在 哪些类这一信息我们是知道的,我们要做的就是将每一条记录分别属于哪一 类标记出来;与此相似丑又不同的是,聚类是在预先不知道目标数据库到底 有多少类的情况下,希望将所有的记录组成不同的类或者叫做“聚类” ( c l u s t e r ) ,并且使得在这种分类情况下以某种度量为标准的相似性,在同一 聚类之间最小化。而在不同聚类之间最大化。事实上,聚类算法中一大类算 法中的相似性都是基于距离的,而且由于现实数据库中数据类型的多样性, 关于如何度量两个含有非数值型字段的记录之间的距离的讨论有很多,并提 出了相应的算法。在很多应用中,由聚类分析得到的每一个聚类中的成员都 可以被统一看待。 在数据挖掘技术中,聚类分析主要有以下几种方法一j 。 1 划分法( p a r t i t i o n i n gm e t h o d s ) 划分法给定个有n 个元组或者记录的数据集,构造k 个分组,每一个 分组就代表一个聚簇,k n 。而且这k 个分组满足下列条件: 西南交通大学硕士研究生学位论文第1 4 页 ( 1 ) 每一个分组至少包含一个数据记录; ( 2 ) 每一个数据记录属于且仅属于一个分组( 这个要求在某些模糊聚类算法 中可以放宽) 。 对于给定的k ,算法首先给出一个初始的分组方法,以后通过反复迭代 的方法改变分组,使得每一次改进之后的分组方案都较前一次好,而所谓好 的标准就是:同一分组中的距离越近越好,而不同分组中的距离越远越好。 为了达到全局最优,基于划分的聚类会要求穷举所有可能的划分。 使用这个基本思想的算法有:k 一平均算法( k m e a r l s ) 、k 一中心点算法 f k - m o d e ) 、c l a r a n s 算法。 2 层次法( h i e r a r c h i c a lm e t h o d s ) 这种方法对给定的数据集进行层次的分解,直到某种条件满足为止。根 据层次的分解的形成方式,又可以分为凝聚的层次方法和分裂的层次方法。 这取决于聚集层次结构的形成是自顶向下的还是自底向上的。凝聚的层次方 法:这是一种自底向上的方法,将每一条记录看作一个类,然后根据一些规 则将他们聚合成越来越大的类,直到满足一些预先设定的条件。大多数的层 次聚集方法属于这一类。分裂的层次方法:这种自顶向下的方法是一个与凝 聚的方式相反的过程,将整个数据库作为一个大的类,然后按照一些规则将 这个类分成小的类,直到满足一些预定的条件,例如类的数目到了预定值, 最近的两个类之间的最小距离大于设定值。代表算法有:b i r c h 算法、c u r e 算 法、c h a m e l e o n 算法等。 层次方法的特点在于,一旦一个步骤( 合并或分裂) 完成,它就不能撤消。 其优点是不用担心组合数目的不同选择,计算代价会较小。其缺点是它不能 更正错误的决定。有两种方法可以改进层次聚类的方法:在每层划分中,仔 细分析对象间的“联接”,比如在c u r e 和c h a m e l e o n 算法中的做法:综合层 次凝聚和迭代的重定位方法,首先用自底向上的层次算法,然后用迭代的重 定位来改进结果,比如在b i r c h 算法中的做法。 3 基于密度的方法( d e n s i t y b a s e dm e t h o d s ) 基于密度的方法与其它方法的一个根本区别是:它不是基于各种各样的 距离的,而是基于密度的。这样就能克服基于距离的算法只能发现“类圆形” 的聚类的缺点。这个方法的指导思想就是,只要一个区域中的点的密度( 对象 或数据点的数目) 大过某个阈值,就把它加到与之相近的聚类中去。这样的方 法可以用来过滤“噪声”数据,发现任意形状的簇。代表算法有:d b s c a n 算 西南交通大学硕士研究生学位论文第1 5 页 法、o p t i c s 算法、d e n c l u e 算法等。 4 基于网格的方法( g r i d b a s e dm e t h o d s l 这种方法首先将数据空间划分成为有限个单元的网格结构,所有的处理 都是以单个的单元为对象的,都在网格结构( 即量化空间) 上进行。这么处理 的一个突出的优点就是处理速度很快,通常这是与目标数据库中记录的个数 无关的,它只与把数据空间分为多少个单元有关。代表算法有:s t i n g 算法、 w a v e c l u s t e r 算法、c l i q u e 算法。 5 基于模型的方法( m o d e l b a s e dm e t h o d s ) 基于模型的方法给每一个聚簇假定一个模型,然后去寻找能够很好的满 足这个模型的数据集。一个基于模型的算法可能通过构建反映数据点空间分 布的密度函数来定位聚类,它也可能基于标准的统计数字自动决定聚类的数 目。它的一个潜在的假定就是:目标数据集是由一系列的概率分布所决定的。 通常有两种尝试方向:统计的方案和神经网络的方案。 2 1 2 本文采用的聚类算法 1 k - m e a n s 算法 关于数据挖掘中的聚类算法有很多种,作为统计学的一个分支,聚类分 析已经被广泛地研究了很多年,主要集中在基于距离的聚类分析。其中最经 典的就是基于k m e b n s 的算法。k m e a n s 算法在聚类方法的分类中,属于划 分方法的一种。在划分方法中,首先要给定要构建的划分的数目k ,创建一 个初始划分。然后才有一种迭代的重定位技术,尝试通过对象在划分间移动 来改进划分。k m e a n s 算法以k 作为参数,把n 个对象分为k 个簇,以使簇 内具有较高的相似度,而簇间的相似度较低。相似度的计算根据一个簇中对 象的平均值( 被看作簇的中心) 来进行。该算法尝试找出使平方误差函数值 最小的k 个划分,通常都以局部最优而结束。 j b m a c q u e e n 在1 9 6 7 年提出的k - m e a n s 算法到目前为止用于科学和工 业应用的诸多聚类算法中一种极有影响的技术。它是聚类方法中一个基本的 划分方法,常常采用误差平方和准则函数作为聚类准则函数,误差平方和准 则函数定义为【4 副: 。 ( 2 - 1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论