(电力系统及其自动化专业论文)基于数据挖掘聚类和rbfnn模型融合的短期负荷预测方法.pdf_第1页
(电力系统及其自动化专业论文)基于数据挖掘聚类和rbfnn模型融合的短期负荷预测方法.pdf_第2页
(电力系统及其自动化专业论文)基于数据挖掘聚类和rbfnn模型融合的短期负荷预测方法.pdf_第3页
(电力系统及其自动化专业论文)基于数据挖掘聚类和rbfnn模型融合的短期负荷预测方法.pdf_第4页
(电力系统及其自动化专业论文)基于数据挖掘聚类和rbfnn模型融合的短期负荷预测方法.pdf_第5页
已阅读5页,还剩55页未读 继续免费阅读

(电力系统及其自动化专业论文)基于数据挖掘聚类和rbfnn模型融合的短期负荷预测方法.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

a b s t r a c t s h o r t t e r ml o a df o r e c a s t i n g ( s t l f ) i sv e r ye s s e n t i a lt ot h es a f e t ya n de c o n o m i c a l o p e r a t i o no fp o w e rs y s t e m a l t h o u g hs t l f r e s e a r c hh a sb e e nd o n ef o ra l o n gh i s t o r y , n e wm e t h o d sa r e a l w a y s b e e nf o u n dw i t ht h ed e m a n do fi m p r o v i n gf o r e c a s t i n g p r e c i s i o n s a n dt h ed e v e l o p m e n to fn e wr e l a t e dt h e o r i e s s t u d yw o r ko ft h i sp a p e r i n c l u d e st w os e c t i o n s :t h es t u d yo ft h el o a dc l u s t e r i n gm e t h o d sa n dt h es t u d yo fl o a d f o r e c a s t i n gm o d e l sb a s e d o nc l u s t e r i nm u l t i t u d i n o u sf o r e c a s t i n gm o d e l s ,t h es p a c ec h a r a c t e r i s t i c sd i s t r i b u t e do ft h e t r a i n i n gs a m p l e sh a sag r e a ti n f l u e n c eo nf o r e c a s t i n gp r e c i s i o n s t h ep a t t e r n ,w i t h o u t s e l e c t i n gi n p u tv e c t o r s ,w i l ll e a do nt o r e d u c eo ft h ep r e c i s i o na n di n c r e a s eo ft h e c o m p u t e r i n gt i m e t h e r e f o r et h ec l u s t e r i n ga n a l y s i so f t h el o a dd a t aa n dh o wt ou s e t h ec l u s t e r e dr u l e sa r ev e r yi m p o r t a n t t h i sp a p e rc o m p a r e st h ec l u s t e r i n gp e r f o r m a n c eo ft h ed i s t a n c ea l g o r i t h mb a s e d o nd a t am i n i n ga n dt h ec l a s s i f i c a t i o nb a s e d o nk o h o n e nn e u r a ln e t w o r k t h e c l u s t e r i n ga n a l y s i sa n de v a l u a t i o na r ei m p l e m e n t e df r o mi n n e rc l u s t e rd i s t a n c ea n d l o a dc u r v ea n db yp r a c t i c a ll o a dd a t af r o mt i a n j i np o w e rs y s t e mi nt h ey e a r2 0 0 0 t h e r e s u l ts h o w st h a tt h ec l u s t e r i n gm e t h o db a s e do i ld a t am i n i n gi sm u c hb e t t e rt h a n k o h o n e nn e u r a ln e t w o r k t h ef o r e c a s t i n gm o d e l so ft h i sp a p e ra r es t u d i e db a s e do na r t i f i c i a ln e u r a l n e t w o r k sp r i n c i p l e t h ec o r r e l a t i o nc o e f f i e i e n to ft h el o a ds e r i e si sa n a l y z e da n dt h e c o n c e p t o fe m b e d d i n gd i m e n s i o ni nr e c o n s t r u c t i o no fp h a s es p a c ei s a p p l i e d t o c o n f i r mt h ei n p u tv e c t o ro ft h el o a df o r e c a s t i n gm o d e l ar b f - n nm o d e li sp r o p o s e d u s i n gt h ec l u s t e r i n gr e s u l t o ft h el o a ds e r i e ss e g m e n t s t h ep r o p o s e dm e t h o dc a n i n c r e a s et h e p r e c i s i o n o ft h el o a d f o r e c a s t i n g a n di ti sa l s oc o n v e n i e n tt ob e i m p l e m e n t e d o n l i n el o a df o r e c a s t i n g t h i sp a p e r ss t u d yi ss i g n i f i c a t i v eo f t h e o r ya n d i sw o r t h f u l i nt h ep r a c t i c e k e y w o r d s :s h o r t t e r m l o a d f o r e c a s t i n g ,d a t am i n i n g ,c l u s t e r i n ga l g o r i t h m k o h o n e nn e u r a ln e t w o r k ( k - n n ) ,r b fn e u r a ln e t w o r k ( r b f n n ) ,c h a o t i ct i m es e r i e s 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的 研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得鑫鲞盘堂或其他教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示了谢意。 学位论文作者签名:签字日期:年月日 学位论文版权使用授权书 本学位论文作者完全了解鑫洼盘鲎有关保留、使用学位论文的规定。 特授权鑫洼盘鲎可以将学位论文的全部或部分内容编入有关数据库进行检 索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校 向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名导师签名 签字日期:年月日签字日期:年月日 第一章绪论 第一章绪论 概要:负荷预测的研究对电力系统安全和经济运行有重要的意义,本章在对国内外负荷预测 研究的现状进行分析和归纳的基础上,分传统方法和智能算法两部分进行阐述,指出各类方 法的优缺点及发展方向。对负荷预测的误差指标进行总结,并简述本文的主要工作。 1 1 课题研究的内容和意义1 ,2 i 电力系统运行的目标是必须为各类用户提供可靠且台乎标准的电能,同时在 保证系统运行的安全性的前提下,尽可能提高系统运行经济性,电力市场竞争机 制要求各电力公司制订合理经济模型及具有竞争力的实时电价,必须依赖于准确 和快速的负荷预测。对未来本电网内负荷变化的趋势与特点的预测,是每一级电 网调度部门和规划部门所必须具有的基本信息之一。电力负荷预测的水平已成为 衡量电力系统运行管理现代化的重要标志之一,是实时控制、运行计划和发展规 划的前提。 1 1 1 电力负荷预测周期分类 按预测周期的规律性来说,电力负荷预测可以分为超短期、短期、中期和长 期预测。 ( 1 ) 超短期预测:指未来l 小时或更短时间的负荷预测,通常用于质量控制需5 1 0 秒负荷值,用于安全监视需l 一5 分钟负荷值,用于预防控制和紧急状态处 理需1 0 - - 6 0 分钟负荷值。其意义在于可对电网进行在线控制,实现调度决策支持 系统,安全监视,状态估计等。 ( 2 ) 短期预测:指未来l 一7 天的负荷预测。主要用于火电分配、水火电协调、 机组经济组合和交换功率计划,电力负荷管理等。 ( 3 ) 中期预测:通常为1 月一1 年的负荷预测,用于水库调度、机组检修、交换 计划、燃料计划等。 ( 4 ) 长期预测:指几年到十几年并以年为单位的预测,目的是合理安排电源和电 网的建设规划,提供宏观决策的依据! 使电力建设满足国民经济增长和人们生活 水平的提高。 1 1 2 短期负荷预测的意义和要求 ( 1 ) 是能量管理系统( e m s ) 的一个重要模块,他所提供的未来负荷数据是电 力系统近期的变电建设、运行和计划的基本依据。准确的负荷预测对发电管理有 助于经济合理的安排电网内部发电机组的启停,对调度管理是维持电网运行的可 靠、安全稳定供电的重要依据,并可用作有效交易电量和降低系统的运营费用的 重要决策。 ( 2 ) 随着全球取消管制的电力市场的推进,合理的短期负荷预测有利于及时作出 适当的计划电力交易量,提出适当的运行计划和竞标策略,提高运行的经济性。 文献 3 指出在取消管制的电力市场条件下,如果未能按计划向用户提供合格的电 第一章绪论 能,所受的惩罚将非常严重。以澳大利亚为例,停电成本大约是a u d $ 5 0 0 0 k w h ( 2 0 0 0 年价格) 。因此,预测失误的经济代价是非常严重的。 短期预测的难点在于影响因素众多,它包含有内外部的随机因素,特别是许 多非负荷因素的影响。这些影响因素与预测值之间形成复杂的非线性关系。负荷 分类组成复杂,负荷特性逐年变化,如气候因素的影响随家用电器技术发展而难 以定量分析,负荷侧用电管理等政策也为准确预测带来了难度。目前尚没有一种 足够完善的理论方法适用于各种负荷预测的研究。 短期负荷预测的两个基本要求是: 1 精确性。指需具较高的预测精度。一般短期预测要求相对误差不超过3 5 。 2 时效性。指得到所要求的预测结果需要开销多少时间。电力市场对预测的快速 性要求更高,时效性差会降低预测的实用价值或导致预测的无效。 1 2 电力系统短期负荷预测方法的概述瞳1 负荷预测的研究已有几十年的历史,因此理论和方法很多,传统方法有:外 推法、相关法、时间序列法、卡尔曼滤波、灰色系统等;基于智能原理的方法, 如人工神经网络、专家系统、模糊理论,小波理论等也开始在预测中得到研究和 应用。鉴于方法众多,仅就传统方法、智能方法的原理及其优缺点作简介。 1 2 1 负荷预测方法研究综述 ( 1 ) 外推法。 根据己知的历史资料来拟合一条曲线,使得曲线能反映负荷本身增长趋势; 然后按曲线对未来预测求得某一点,从曲线估计该时刻的负荷值。常用曲线有直 线、指数曲线、幂函数曲线,s 型曲线等。拟合的方法主要有最小二乘法。外推 的实质是利用回归分析。得到描述负荷变化趋势最后的模型参数估计,如对季节 趋势预测可揭示负荷的周期特性。外推法的原理简单,使用方便,但由于负荷变 化趋势多种多样,简单的线性拟合难以实现准确性;多项式拟合的幂指数又难以 确定,且指数越高公式越复杂化:有限的几个增长模型不能囊括负荷趋势变化, 各种随机因素也是影响提高预测精度难点。趋势外推法一般仅用于长期预测。 ( 2 ) 回归法。 基于数理统计的回归分析方法,即通过对变量的观测数据进行统计分析,确 定变量之间的相关性来实现预测。主要分为线性回归和非线性回归。一元线性回 归是将负荷看成仅与某一因素有线性关系,事实证明负荷是受多个因素的线性组 合,所以一元线性回归模型不可取;多元线性回归将负荷看成多个因素的线性组 合,然而许多因素对负荷影响并非是线性的;非线性回归模型实质是将负荷看成 可线性化的非线性函数模型,如阱i n y 与x 有线性关系。因此准确选取非线性函数 就成为核心问题。回归模型主要用于中长期负荷预测。 ( 3 ) 相关分析法。 将电力负荷作为因变量,各种社会和经济因素( 如国民生产总值、人口和气 象资料等) 作为自变量,因变量与自变量之间的关系形成预测方程,可根据己知 某时刻的社会和经济因素值,代入方程解出负荷值。其优点是可清楚的看到负荷 第一章绪论 值和其它可测量因素间的关系;缺点是必须预知各自变量的值,它直接影响预测 的精度。该法用于长期负荷预测。 ( 4 ) 时间序列方法。 其实质也是回归法,它是将预测目标作为因变量,但回归法的自变量是各种 影响因素,而时间序列法的自变量则是历史负荷,因变量是待测负荷。时间序列分 析模型是广泛采用的类方法,常用的时间序列模型有:自回归( a r ) ,动平均 ( m a ) ,自回归一动平均( a r m a ) ,累计式自回归一动平均( a r i m a ) 模型等。 ( 一) 自回归模型( a r ) 自回归模型中因变量是待测的负荷,自变量是负荷自身的过去值。其描述的 过程为:现在值m 可由过程的过去值的加权值的有限线性组合及个干扰量日,来 表示。p 阶自回归模型a r ( p ) 为: m = 仍儿- l + p 2 y , - 2 + + 妒p m p + q ( 1 1 ) 式中,p 称为模型的阶,常数系数仍,妒。为模型的参数,干扰量q 为白噪声序列 在t 时刻的值。预测负荷与过去时刻的负荷有关,故称为自回归模型。 ( 二) 动平均模型( m a ) 在a r 模型中,理论上干扰的影响是在无限长的时间内都存在的。即一个初 始时刻的干扰将会影响到未来无限长时间内的负荷值。如假设干扰的影响仅表现 在时间序列中的有序的几个连续时间间隔内,然后完全消失,则获得动平均模型 ( m a ) ,也叫滑动平均模型。如初始时刻的干扰仅在前g 步内有影响。g i 喻m a 模型此4 ( g ) 的数学表达式为: y t = q 一舅q l 一一吒q 一。 ( 1 2 ) 式中,g 称为模型的阶,常数系数岛,只为模型的参数。对一阶模型g a o ) 可由式 ( 卜2 ) 推导出一个无限阶的自回归模型: m = - 0 1 ) 0 一日y f 2 一岛m 3 一+ q ( 1 3 ) 其实,所有有限阶的动平均模型均可用无限阶的自回归模型来表示,同样,有限 阶自回归模型也可用无限阶动平均模型来表示。 ( 三) 自回归一动平均模型( a r m a ) a r m a 模型是a r 模型和m a 模型的结合。模型的数学表达式为: m = 吼m l + 仍只一2 + + 尹p n p + a l q q _ l 一一d r 呻 ( 1 4 ) 许多实际的随机时间序列常常同时具有两个模型a a ( p ) 和心( g ) 的特性:如分别 令p = 0 、g = 0 ,得到的一m 材( o ,q ) 就是刎( g ) ,a r m a ( p ,o ) 就是a r ( p ) ,这三种 模型间有密切的联系。 ( 四) 累计式自回归一动平均模型( a r i m a ) “1 时间模型辨识的基本依据是对原时间序列的相关分析,即计算序列的均值、 自相关和偏相关函数,从而确定模型的类型。模型辨识后,利用原序列有关的样 本数据,对模型参数进行估计。外推法和时间序列法都是以回归分析法作为建模 的基本理论依据,故实质仍是回归法。 上述时间序列方法的主要缺点是:建模所需特征难以确定、对非平稳状态辨 识更具困难、难于实现非线性关系处理、输入变量数目限制、对样本要求苛刻等。 第一章绪论 随着负荷特性的缓慢变化,模型不能灵活适应。 ( 5 ) 卡尔曼( k a l m a n ) 滤波法”1 。 建立状态空间模型,把电力负荷作为状态变量,用状态方程和量测方程来描 述。卡尔曼滤波法递推地进行计算,适用于在线预测。该方法是在假定噪声的统 计特性已知的情况下得出的,实际上估计噪声的统计特性是存在困难的。 ( 6 ) 专家系统方法”1 : 专家系统是基于人工智能原理的符号处理系统,该程序能力相当于某个专门 领域的专家的知识和经验水平。由于负荷受许多因素的影响,因此借助预测人员 的丰富经验与判断能力是有益的,如在节假日,重大社会活动和突发事件的情况 下,专家启发知识起至关重要的作用。其知识获取具一定的难度,且知识自学习、 更新和可维护性较差。该原理一般与其他智能甄理相结合使用。 ( 7 ) 灰色系统理论”。 灰色是介于白色、黑色之间的系统,从信息角度出发即是部分信息已知,部 分信息未知的系统。对电力系统负荷而言,对其影响的有供电机组、电网容量、 生产能力、大用户情况、某些产品耗电情况等信息已知的。但是,影响负荷的其 他因素,如天气、管理政策的交化、地区经济活动等难以确切知道。鉴于此情况, 可将电力系统看成灰色系统。灰色预测建模的优点在于:要求负荷数据少、不要 求掌握分布规律和变化趋势,因此运算方便和易于检测。其局限性是仅适合具有 指数增长趋势的负荷指标,对非指数增长指标会形成拟合灰度较大,当数据离散 程度越大,预测精度越差。一般仅用于中、长期负荷预测 1 2 2 智能计算方法: 智能的含义很广,难于精确定义,智能计算方法属于软计算,它是一种计算 智能系统的信息处理方法。与上述传统方法的“硬计算”不同,软计算允许存在 不精确性和不确定性。软计算不是一个单独的方法论,而可以是方法论的协作体, 其主要协作技术有神经网络计算、模糊推理系统、遗传算法、混沌理论等。这些 方法和专家系统、t a b u 搜索、蚊群搜索、模拟退火、数据分析、自适应、自学习 等技术密切结合、互为补充的预测方法,概称为智能技术”7 。软计算在负荷预 测中已得的广泛研究和应用。 ( 1 ) 基于人工神经稠络( a n n ) 的负荷预测 从七十年代中期开始基于a n n 的短期负荷预测研究一直受到重视”1 。a n n 是一种通用的非线性自适应函数估计器。通过对研究目标的历史数据训练,可建 立起复杂的非线性映射模型。其优点是:对大量非结构性、非精确性规律具有自 适应拟合功能;具有联想记忆、自学习的性能;通过对历史负荷数据的训练可将 相关负荷知识存储于联结权重中;可将气候因素及与负荷敏感的因素与负荷变化 有机结合。 目前预测模型大多采用前馈n n 模型和b p 算法,其预测模型结构( 网络的 层数和神经元的个数) 的选取大多凭经验,b p 有学习速度慢和存在局部极小点等 问题。为克服该缺陷,已提出不少改进方法。如对a n n 神经元连接权重进行修 4 第一章绪论 正时,加入惯性项和变步长技术“”川,用共轭梯度a n n 法“”,文献 1 6 提出利 用遗传算法和基于拟牛顿法优化技术的学习算法。 a n n 的泛化能力是与预测精度有极密切关系,而a n n 泛化能力是与a n n 的结构和样本空间的分布有关,目前在a n n 预测模型构造依据论述不够;a n n 的外推能力的局限性,因对有导师的a n n 的是通过训练样本集来获取相应的负 荷知识,如当某些与负荷无直接相关气候因素突然随机变化就属于此类;又按负 荷数据的特殊性构造分类模型( 工作日、休息日、节假日等) ;根据电力市场对负 荷预测高精度和快速预测的要求。对a n n 预测模型进行深入研究,如研究特殊 的新型n n 或改进n n 结构是十分重要的。 ( 2 ) 模糊理论方法 由于影响电力负荷的因素存在不确定性,导致电力负萄预测精度也存在不确 定性,为此提出以模糊理论( f s 卜一f u z z ys e t t h e o r y ) 来研究负荷预测。模糊理 论用一组模糊i f - t h e n 规则来表示系统输入输出间的非线性映射关系,通过对输入 输出空间的划分,模糊推理系统可以逼近任意复杂的非线性系统。f s t 在处理非 线性问题和不确定性因素方面具优势,能从大量数据中抽取相似性的功能;f s t 是通过模糊逻辑规则来实现,而规则所对应属阶梯状的表面,当区域划分得不够 细时,模糊推理输出的表面比较租糙,直接影响预测精度。研究表明由f s t 原理 独立来完成高精度的负荷预测是困难的,预测的研究中广泛采用将f s t 与各类负 荷预测其它原理结合形成混合模型,可起到完善和提高预测精度的作用,已有的 具体研究为:模糊聚类法与n n 结合“”、模糊逻辑e s 与n n 结合“、模 糊处理与模糊n n 结合“”、组合最优算法的模糊评估。它们都取得了相应的效 果。 ( 3 ) 遗传算法“” 遗传算法是建立在自然选择和群体遗传学机理基础上的随机、迭代与进化的 搜索方法,五个基本要素是:对可行解空间的参数编码:祖先群体的设定: 适合度函数的设计:遗传操作的设计;控制参数的设定( 群体规模大小、 使用各种遗传算子操作的概率和迭代停止准则) 。遗传算法具全局优化能力,般 将遗传算法用于a n n 权值的优化,以克服b p 算法存在收敛性能和陷入局部最小 的不足,提高预测精度。文献 2 0 2 1 表明遗传算法在调整模型权系数,改进模型 结构方面作出贡献,能够在一定程度上提高预测的精度。 ( 4 ) 小波理论 小波分析自八十年代提出后,理论和实际应用都得到了迅速发展。小波分析 可对信号进行多尺度分析,有效的从信号中提取所需的特征信息,实现在时域和 频域的高分辨局部定位。小波变换在时域和频域都有良好的局部化性能,在实用 具有重要的意义。小波神经网络( w a v e l e t n e u r a l n e t w o r k 一一w n n ) 是一种新型 的数学n n ,具有比普通n n 更有效的函数逼近能力和较高的容错能力,在负荷 预测中w n n 也已有研究。从小波分析与n n 结合的方式可分为两类:小波变 换与n n 结合m 3 :小波分解与n n 融合“”。根据研究后类( w n n ) 的性能要优 于前一类。 第一章绪论 1 3 电力系统负荷预测的误差分析指标 对预测方法性能好坏的评估是建立在统计分析的基础上,般是通过各种预测 精度指标来衡量的,要使用统一的误差分析指标。常用的误差分析指标函数有: 百分比相对误差: p r e :a c t u a l ( i ) - f o r e c a s t ( i ) x 1 0 0 ( 1 5 ) a c t u a l ( i ) 平均绝对误差: m a e = - - 毗e q l a c t u a t ( f ) 一f o r c a s e ( 圳( 1 - 6 ) 平均绝对百分误差: m a p e :i 1 厶” a c t u a l ( i ) - f o r e c a s t ( i ) t 1 0 0 ( 1 - 7 ) 肘智a c t u a l ( i ) 平均误差平方和: m s e 2 玄善【咖甜( 7 ) 一f o 心c a s t ( ) 】2 ( 1 - 8 ) 相对平方差: a c t u a t ( i ) - f o r e c a s t ( i ) 2 r s e = 谍 一 ( 卜9 ) y , a c t u a l ( i ) - f o r c a s t ( i + 1 ) 2 相对曰误差: r d e := l a c t u a l ( i ) - f o r e c a s t ( i ) l ( 1 - 1 0 ) p e a l d o a d o f l h e d a y 均方根误差: r 舔= 在具体的负荷预测研究中,上述的性能评价指标的具体应用是与所研究预测 方法的类型有关的。 1 4 本文的主要工作 目前,电力系统短期负荷预测的方法众多,这些方法在实践中取得了一定的 成果。但是,这些方法在电力系统短期负荷预测研究中多注重于定量分析,缺乏定 性分析的有效手段,即缺乏从负荷数据及其相关数据中获得其内在的因果关系来 提高预测精度的方法。如对于神经网络方法,如何构造基于n n 的负荷预测模型 问题,末从负荷数据的内部性质去分析,用传统的统计分析方法难以获得隐含其 中的内在联系。为此在提高负荷预测精度始终未有实质性的突破,它已阻碍了电 力市场的运作。本课题的研究目标分两方面:是基于数据挖掘聚类技术在负荷 第一章绪论 预测中的应用研究。通过实际历史负荷数据对不同聚类方法进行仿真测试,对其 结果进行性能比较和分析,选择聚类原理和算法。研究和构造基于n n 的负荷预 测模型。并在聚类研究的基础上,研究如何运用聚类结果融入于负荷预测模型中 去。具体工作内容如下。 1 基于数据挖掘技术对负荷数据聚类的研究。 在对目前各种聚类原理和方法进行分析和归纳的基础上,选择两种适合于负 荷预测数据聚类原理和方法。即基于数据挖掘的距离聚类法和智能的k o h o n e n 神 经网络两种聚类方法,并以天津地区2 0 0 0 年负荷资料为聚类性能和仿真分析的依 据。从负荷曲线和类内距离两个指标进行分析评价,分析了两种聚类法结果的不 同的特点和具体问题,并对它们的聚类结果进行分析,得出基于数据挖掘的距离 聚类法性能和效果要好于智能的k o h o n e n 神经网络。 2 负荷聚类样本空间的应用准则研究 用d m 聚类算法对天津地区2 0 0 0 2 0 0 1 的负荷资料进行仿真、测试和分析, 聚类结果可基本分成冬,夏,春秋,长假期,但在日期上存在相互交叉( 即离散 性) ,因此进一步研究了负荷聚类结果,在分析处理的基础上提出了聚类负荷样本 空间的应用准则,以保证负荷预测模型对聚类结果的充分利用。在通过具体的预 测仿真和测试结果,证明依据提出聚类应用准则的负荷预测有效的提高了预测精 读。 3 基于r b f - n n 预测模型结构的输入维数研究 本文的负荷预测模型研究方向是以神经网络原理为基础,负荷预测基本模型 采用r b f n n ,它与一般b p n n 相比,不存在局部极小和收敛速度慢等缺点,而 且在逼近能力、需要样本量和学习速度等方面均优于b p 网络。 本文对负荷预测模型输入维数确定从两方面进行研究与结论:( 1 ) 根据已往负 荷预测n n 模型的输入维经验,进行基于负荷点之间的自相关系数研究,得出未来 预测点数据仅与该点前日期中的相同时刻的前三点的负荷值有较密切关系,与前 日期中的预测点后时刻的负荷值是无关的。从而简化了n n 结构和训练时间;( 2 ) 根据已研究和证明负荷序列是具混沌特性的本质,因此应按混沌动力学的行为和 混沌理论来分析。目前都是按相空间重构理论来研究,该理论依据分形理论的概 念提出用“嵌入维”来分析它的动态行为。将其引用到n n 的输入维应按饱和维数 确定。通过具体历史负荷序列的仿真和测试,负荷预测的精度得到稳定性的、有 效地提高,这就是从定性到定量的负荷预测方法的必然保证。 4 基于聚类负荷序列样本的r b f - n n 预测模型研究 在根据前面研究确定了基于r f b - n n 基本负荷预测模型结构的基础上,需将 聚类研究与该基本模型相融合完成整个的负荷预测。本文是按单步预测构造的基 本r b f - n n 模型,显然为日预测2 4 点日,则需2 4 个训练模型一为对全年作预测 必须按聚类分析数( n ) 构造不同负荷序列特性的预测模型,每类的样本相似性更 高,降低差异性,可取得更好的预测效果。因此全年实际的训练预测模型数应是 n 2 4 个( 如4 8 点日负荷序列应多一倍) 。本文通过对三类( 春秋日、高温日、 长假日) 负荷特征序列仿真、测试结果表明:在按聚类分析、相空间输入维构造 第一章绪论 的r b f n n 预测模型比一般的r b f n n 预测模型和b p n n 模型能更好的提高预测精 度,日绝对平均误差降低0 5 1 7 ,且相对误差 3 的出现率降低至1 5 。比 b p n n 有更强的适应性,如对双休日与工作日用一个训练模型就能实现好的预测 效果。 第二章数据挖掘及其在电力系统中的应用 第二章数据挖掘及其在电力系统中的应用 概要:数据挖掘( d a t am i n i n g 一一d m ) 技术仅近十年的历史,是人工智能与数据库技术发 展相结合的产物。该技术已在工业领域中广泛应用,并取得重要经济价值,而在电力系统中 开展研究和应用仪五年的对闻,属于刚起步阶段。为便于对本课题的研究工作的了解,本章 对数据挖掘的相关基本知识及其在电力系统中已进行的某些应用予以概述。 2 1 数据挖掘的发展和研究概述瞳4 3 们 2 1 1 知识发现和数据挖掘 面对信息社会中数据和数据库的爆炸式增长,但人类在分析数据和从中提取 有用信息的能力,远远不能满足实际需要。虽然数据库管理系统( d b m s ) 可以 高效实现数据录入、检索和维护等管理功能,但不能发现数据中的关联及其规则, 也不能根据现有的数据发现新知识或形成新决策。因此,数据库管理系统和人工 智能两种技术的发展和结合,推动了在数据库中的发现知识( k n o w l e d g e d i s c o v e r y i nd a t a b a s e s - - - - k d d ) 这一新技术产生。1 9 8 9 年8 月第一次k d d 专题讨论会在 美国底特律举行。k d d 是一门交叉性学科,涉及机器学习、模式识别、统计学、 智能数据库、知识获取、数据可视化、高性能计算、专家系统等领域,内涵广泛, 理论和技术难度大。1 9 9 5 年美计算机学会( a c m ) 会议提出数据挖掘,形象地把 大型数据库看成存放有价值信息的“矿藏”,通过有效地知识发现技术,从中挖掘 开采出有用信息。 d m 就是从大量数据中提取隐含在其中,人们事先未知的、但又潜在有用的信 息和知识,并最终表示成可被人理解的模式的过程。除了数据挖掘这一词语外, 还有用“知识提取”( k n o w l e d g e e x t r a c t i o n ) 、“信息发现”( i n f o r m a t i o n d i s c o v e r y ) 、 “智能数据分析”( i n t e l l i g e n t d a t a a n a l y s i s ) 、“信息收获”( i n f o r m a t i o n h a r v e s t i n g ) 等类似的词语。多数人认为d m 是k d d 过程中的关键步骤,如图2 1 所示。 图2 一ik d d 过程 ( 这个过程是交互进行的,可以从任何步骤返回到前面的步骤) 2 。i 2 数据挖掘与相关学科的区别和联系船。圳 由上述可知,d m 是运用机器学习的方法从数据库中提取有价值的知识的过 程,它是数据库技术和机器学习两个学科的交叉。 d m 技术和数据库技术的不同在于:数据库技术侧重于对数据存储处理的高 效率方法的研究,且一般从数据库中抽取数据是生成一定格式的报表:而d m 是 第二章数据挖掘及其在电力系统中的应用 对数据背后隐藏的特征和趋势进行分析,从而给出关于数据的总体特征和发展趋 势。d m 最终按一定的关联规则、模式等形式来表示知识,这些知识可以被人所 理解。 机器学习侧重于从数据中提取知识的新方法,而d m 利用数据库技术对数据 进行前端处理,再运用机器学习方法从处理后的数据中提取有用的知识。显然, d m 的特点可归纳为: ( 1 ) d m 是从研究问题领域中的具体数据库中提取知识,这些知识是隐藏于数据 库中,但人们往往没意识到或大量数据之间关联的复杂性难以明确这些知识的存 在; ( 2 ) d m 所使用的数据量可能很大,故叫对学习算法的效率和可扩充性就特别 重要; ( 3 ) d m 所处理的数据多数来自于现场,这些数据的完整性、一致性和正确性都 很难保证,如何将这些数据加工和转换成学习算法可以接受的数据形式,它也是 d m 中需深入研究的问题: ( 4 ) d m 可在数据库技术和人工智能所取得的研究成果的基础上,加快知识提取 过程; d m 与传统数据分析工具的实质区别在于探索数据关系时所用的方法。传统 数据分析工具是基于验证的方法,即用户首先对特定的数据关系作出假设,然后 用数据分析工具去验证给出假设的合理性。该验证方法的有效性受到许多因素的 限制,即假设的前提与目前数据源的前提是否一致是及其重要的。而d m 则与数 据分析工具相反,它是基于发现的方法,运用模式匹配和其他算法决定数据间的 关联关系。 2 1 3 数据挖掘的模型1 3 0 1 d m 技术所发现的知识,一般用知识规则形式表示。按规则的性质不同,可划 分为如下几种知识模型: ( 1 ) 分类模型( c l a s s i f y m o d e l ) :通过对已知问题类别按个体进行归纳,叭提取 能代表各群体共同的特征属性,即分类模式。 ( 2 ) 回归模型( r e g e r s s i o nm o d e l ) :能用所分析对象数据属性的历史数据预测未 来趋势。 ( 3 ) 时间序列模型( t i m is e r i e sm o d e l ) :是用已有的时间序列数据来预测未来。 与回归模型相比,时间序列模型更强调考虑数据序列的时间特性,如考虑时间序 列的周期特性,在电力系统负荷存在有日、周、月等周期性,还存在非周期性的 时间特性如节假日。 ( 4 ) 聚类模型( c l u s t e r i n gm o d e l ) :是将一个群体分成多个类,使同类个体尽 可能相似而不同类间个体差异尽可能大。与分类模型不同的是,聚类模型属于无 导师学习过程。 ( 5 ) 关联模型( a s s o c i a t i o nm o d e l ) :反映事物之间依赖或关联的知识,称为关 联规则。关联规则的一般形式是:如果a 发生,则b 有c 的可能发生,c 称为关 第二章数据挖掘及其在电力系统中的应用 联规则的可信度( 或置信度) 。 ( 6 ) 事件序列模型( e v e ns e q u e n c em o d e l ) :基于事件序列的d m 模型是指用事 件序列来发现在序列模型中与出现先后顺序有关的事物间的相关程度,从中挖掘 出离散事件序列生成所应遵循的规则。与关联模型很相似。不同的是序列模型的 对象是在时域分布的,发现的规则也与时间先后顺序有关。基于事件序列的知识 挖掘在生物基因统计学、预测网络通信中的警报、w e b 日志的d m 技术中得到成 功的应用。 2 1 。4 数据挖掘的分类 对d m 的分类有:依据所挖掘的数据源类型、所发现的知识类型及所用的技 术方法。 ( 1 ) 所挖掘的数据源通常是数据库或数据仓库。数据库的数据模型可以是关系的、 网状的、层次的或面向对象的,但由于关系数据库的一系列独特优点,成为当前 数据挖掘的主要实施对象,称之为关系数据挖掘。 ( 2 ) 按发现知识的抽象层次来分类的d m 。该知识层次可分为通用知识、初级知识 和多层次知识。所有的知识都可在不同的概念层次上被发现,随着概念树的提升, 从微观一中观一宏观,用以满足不同用户、不同层次决策的需要。 ( 3 ) 根据d m 的基础知识分类的不同,所用的技术方法也是不同的。按照驱动 方法把d m 分为自主数据挖掘、数据驱动挖掘、查询驱动挖掘和交互式数据挖掘 等。 用户的d m 活动主要有三类:模式发现、预测建模和分析评价。“模式发现” 是寻找隐藏在数据集中的模式的过程:“预测建模”是利用所发现的模式预测未来; “分析评价”是应用所得到得模式发现异常现象的过程。预测建模和分析评价都 需要把当前输入的新数据与以往的数据集进行匹配,因此需要保存过去的数据。 模式发现则不需要,一旦提取模式后,就可把过去的数据移去。所以d m 方法总 体分两大类:基于数据保持类方法和基于模式提取类方法。如图2 - 2 所示。 现代挖掘方法主要靠模式提取技术,同时,为了改善和提高数据挖掘得功能、性 能和效率,发展趋势是综合采用多种方法和技术。 2 1 5 支持数据挖掘技术的原理和方法1 2 4 - 2 9 l 由于d m 是人工智能和数据库技术相结合的产物。因此它的许多方法就来源 于机器学习、模式识别、人工智能领域的常规技术,如聚类( c l u s t e r i n g ) 、决策 树( d e c i s i o nt r e e ) 、统计等方法经过改进后可用于叫。 为研究d m 用于短期负荷预测,本节仅介绍与负荷预测相关的技术,有基于 传统数理统计等数学工具、人工神经网络、粗糙集理论、关联规则、进化计算技 术进行介绍,其它技术可参见相关文献。 ( 1 ) 基于传统数理统计等数学工具:应用数学工具或专业知识进行相关分析、回 归分析和因子分析等。目前在应用系统中对模型的分析已从原简单分析型发展为 基于高深数学的分形理论和混沌理论等的分析。 ( 2 ) 神经网络( n n ) 技术:该技术属于智能计算技术领域。在d m ( k d d ) 的应 第二章数据挖掘及其在电力系统中的应用 用方面,当需要从复杂或不精确数据导出概念和确定走向比较困难时,运用神经 网络特别有效。经过训练后的n n 就将知识存储于神经元之间的权值中,如同专家 系统的知识获取一样,所不同处是受训后的n n 所代表的知识模型具有非透明性。 图2 - 2 数据挖掘的分类 ( 3 ) 决策树:在知识工程领域中,决策树是一种简单的知识表示方法,它将事例 逐步分类形成不同的类别。由于分类规则比较直观,因而比较易于理解。在机器 知识获取领域内,已有不少实施决策树分类任务的有效算法 ( 4 ) 进化计算( e v o l u t i o n a r yc o m p u t a t i o n - - e c ) :e c 是模仿生物进化的一类计 算方法的统称。包括遗传算法( g a ) 、遗传编程( g p ) 、进化策略( e s ) 、进化规 划( e p ) 。它们的共同特点为:进化计算是在适应度函数约束下的智能式搜索, 在目标函数的驱动下“优胜劣汰”,经逐次迭代,逐步逼近目标。由于进化计算一 般采用了杂交、变异等操作扩大了搜索范围,因此能逼近全局最优解。其具有 框架式的算法和结构,一般只要完成编码和适应度选择,其余的遗传、杂交、变 异等操作都可以自动完成。 ( 5 ) 基于事例的推理方法( c a s e b a s e d r e a s o n i n g 一一c b r ) :该方法的思路 简单清晰。当预测未来或进行正确决策时,系统寻找与现有情况相类似的事例。 定量描述两个事例的相似程度,根据事例间的相似性度量可以采用不同的框架算 法,如一般最常用的几何距离原理、伪距离函数、b h a t t e h a r y y a 距离、j 一散度等。 动态规划算法可将分级决策和最优化原理相结合,能够按照“最优化原理”逐级 寻求形成相似的事例,成为基于事例推理的一种有效的工具,但是它不能根据研 究目标汇总系统经验或规则,即无继承性。根据研究目标选择最佳的解决方案, 这种相似性原理能用于很多问题求解,并获得好的结果。 ( 6 ) 粗糙集理论( r o u g h s e t t h e o r y - - r s t ) :r s t 是一种研究不精确、不确 定性知识的数学工具。它为d m 提供了一种新的方法和工具。其原因:由于d m 研究的实施对象多为关系型数据库,关系表可以被看作为r s t 中的决策表,它为 r s 的应用提供了方便;客观事物中的规则有确定和不确定的,从数据库中发现 不确定性的知识,r s 为d m 提供了理论算法;从数据中发现异常,排除k d d 过程中的噪声干扰也是r s 的优势;运用r s 方法去实现k d d 的算法,有利于 第二章数据挖掘及其在电力系统中的应用 并行执行,能极大提高发现效率:在d m 中,前述的其他算法,如a n n 方法, 不能自动的选择合适的属性集。而r s 方法能进行预处理,滤去多余属性,可简 化a n n 结构;r s 方法要比模糊集或a n n 方法在获得决策规则和推理过程方 面更易于证实和检测。 长期以来在数理统计分析、人工智能和知识工程的共同研究中提供了种类繁 多、特点各异的手段和方法,对d m 的开发研究工作给予了理论上的支持i 同时 近年来在智能计算和处理不确定性信息方法的研究,也促使d m ( 或k d d ) 技术 向更深层次发展。 2 1 6 数据挖掘的典型应用领域 d m 能够自动发现以前未知的模式,自动预测未来趋势和行为。已广泛应用 于一些领域: ( 1 ) 零售市场营销。这是d m 应用最早和经济效应显著的领域,主要功能是: 市场定位,消费者分析,预测销售趋势,优化营销策略,分析库存需求,选择零 售点,价格分析等。在民航系统中,可以帮助优化组合航线航班,发现提高航线 效益的机票预订方式。 ( 2 ) 金融。预测存贷款趋势,优化存贷款策略:抽取预测模式;监督交易活动, 发现交易规则。 ( 3 ) 信用保险。分析保险客户的要求和信誉,保险风险行为模式以及欺诈行为。 ( 4 ) 过程控制质量监督。鉴别产品制造过程中的缺陷;管理由异常行为引起

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论