(运筹学与控制论专业论文)夏季气候敏感型电力负荷的整日曲线预测方法.pdf_第1页
(运筹学与控制论专业论文)夏季气候敏感型电力负荷的整日曲线预测方法.pdf_第2页
(运筹学与控制论专业论文)夏季气候敏感型电力负荷的整日曲线预测方法.pdf_第3页
(运筹学与控制论专业论文)夏季气候敏感型电力负荷的整日曲线预测方法.pdf_第4页
(运筹学与控制论专业论文)夏季气候敏感型电力负荷的整日曲线预测方法.pdf_第5页
已阅读5页,还剩49页未读 继续免费阅读

(运筹学与控制论专业论文)夏季气候敏感型电力负荷的整日曲线预测方法.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 电力系统负荷预测是一项具有实际意义的研究课题。针对目前夏季电力负 荷为电网带来的神种问题,如高峰负荷供应不足引起拉闸限电。以及负载过高 导致电网不能安全稳定运行,本文研究了电力负荷短期预测领域中的相关问题, 旨在解决夏季工作日的气候敏感型负荷曲线的预测问题。本文在综述负荷预测 领域的传统方法和国内外最新研究进展的基础上,提出了一种针对整日负荷曲 线预测的混合型方法。该方法融合了时间序列的数据挖掘与分析技术,在预先 寻找负荷曲线的稳定点的基础上,依据曲线2 4 个分段之上稳定点的分布情况, 分段采用不同的处理方法,或是借助时序数据挖掘中的部分技术对曲线段做出 预测,或是依据时间序列分析中的a r m a ( p ,g ) 模型进行预测。该方法还在负荷 曲线的初步预测结果上,依据相邻点负荷值相差不会太大的事实,按照稳定点 尽量不动和整体调整最小的原则,建立线性规划模型对曲线做出平滑处理。此 外,我们应用某市的电网负荷数据和天气数据,对此日负荷曲线预测方法做出 了实际检验。 关键词:负荷预测,时间序列数据挖掘,时问序列分析技术,a r m a ( p ,g ) 模型, 线性规划 a b s t r a c t f o r e c a s t i n gt h ee l e c t r i cl o a di sa l li m p o r t a n tr e s e a r c hf i e l dw i t hp r a c t i c a ls i g - n i f i c a n c o a i m i n ga tm a n yp r o b l e m so ft h eg r i da r o u s e db yt h es u m m e re l e c t r i c l o a d ,s u c ha sc u t t i n go rr e s t r i c t i n gt h ee l e c t r i c i t yd u et ob e i n gs h o r to ft h ep e a k l o a d ,a n do v e r l o a d i n gw h i c hm a :k e 8t h e 鲥dt or u ni n s e c u r e l ya n du n s t e a d i l y , i n t h i sp a p e rw er e s e a r c hs o m ep r o b l e m si nt h e 矗e l do fs h e r t - t e r ml o a df o r e c 碰i n g i no r d e rt of o r e c a s tt h ea l l - d a yc u l - d eo fs u m m e re l e c t r i cl o a dw i t hw e a t h e rs e n - s i t i v i t y o nt h eb a s i so fs u m m a r i z i n gs o m et r a d i t i o n a la n du p t o d a t em e t h o d s i nt h ef i e l do ff o r e c a s t i n ge l e c t r i cl o a d ,am i x e dm e t h o dt of o r e c a s tt h ea l l - d a y l o a dc u r v ei sp r e s e n t e d ,w h i c hi n t e g r a t e st h ed a t am i n i n ga n da n a l y s i so ft i m e s e r i e s i tb e f o r e h a n df i n d sa n dp r e d i c t st h es t a b l ep o i n to fl o a dc u l e ,a c c o r d i n g t ot h e i rd i s t r i b u t i o n0 1 1t h e2 4s e g m e n t so ft h el o a dc t u v e ,a n dt r e a t st h e s es e g - m e n t sb yd i f f e r e n tm e a 血| s ,i n c l u d i n gs o m ed a t am i n i n gt e c h n i q u e so ft i m es e r i e s , o rt h ea r m a 加,q ) m o d e lo ft i m es e r i e sa n a l y s i s i nt h el i g h to ft h ef a c tt h a t l o a dv a l u eo f8p o i n tc a n tb em u c hd i f f e r e n tf r o mi t sn e i g h b o r s ,t h em e t h o da l s o s m o o t h e st h el o a dc u r v ea c c o r d i n gt ot h er u l e sw h i c ha r es h i f t i n gt h es t a b l ep o i n t a sl i t t l ea sp o s s i b l ea n dl e a s ta d j u s t i n gt h ew h o l ee u l w e ,w h i c hc a nb em o d e l e d a sal i n e a rp r o g r a m m i n gp r o b l e m b e s i d e s u s i n gt h e1 0 a da n dw e a t h e rd a t ao f s o m ec i t y , w eh a v et e s t e dt h i sm e t h o do ff o r e c a s t i n ga l l - d a yl o a dc u r v e k e y w o r d s :l 0 a df o r e c a s t i n g ,t i m es e r i e sd a t am i n i n g , t i m es e r i e sa n a l y s i s , a r m a ( p ,g ) m o d e l ,l i n e a rp r o g r a m m i n g 表格 3 1 基于l b 的最佳匹配算法2 1 5 1 分时段预测误差结果( 注:以上均为相对误差) 4 1 插图 相似序列的数种变形 欧式距离与d t w 的对比 最佳弯曲路径寻找结果 p a m 算法代价计算,。, 弯曲路径的两种限制范围( 灰色区域) 由序列q 生成的u 和l , j 1 7 7 的负荷序列( 单位:m w ) 与当日的平均气温( 单位:0 1 。g ) f 8 1 与z 1 4 8 的负荷序列( 单位:m w ) 三类不同的分段( 图中实心点表示稳定点) 平稳性和纯随机性检验 整日负荷曲线预测结果。,。,。 坞墙m 殂 站嚣孙嚣 1 2 3 4 5 6 l 2 3 4 5 3 3 3 3 3 3 5 5 5 5 5 第一章绪论 电力系统负荷预测是电力系统科学中的重要研究领域,同时也是一个与复 杂系统建模紧密关联的有实际意义的研究课题。它在电力系统规划、计划、调 度等部门都有应用,它直接关系着电力系统的规划设计及其安全、经济运行等, 也关系到用电管理工作的顺利开展。因此,随着社会的进步和经济的发展,以 及我国电力企业改革的深入和电力市场化进程的开展,电力负荷的预测越来越 受到电力部门的重视。 1 1电力系统负荷预测的内容及意义 负荷预钡0 ( l o a df o r e c a s t i n g ) 是根据历史负荷值,在满足一定精度的情况下 决定未来某特定时刻或时间段的负荷值。电力系统负荷预测是实现电力系统安 全、经济运行的基础,对一个电力系统而言,提高电网运行的安全性和经济性, 改善电能质量,都依赖于准确的负荷预测。根据预测时间跨度,通常分为超短 期、短期、中期和长期负荷预测。超短期负荷预测为一小时以内的。一般用于预 防性控制、紧急状态处理和安全监视;短期指日或周时间范围内的负荷预测,主 要用于确定机组起停、负荷优化分配、交换功率计划、和水火电协调等:月至年 的中期负荷预测,主要用于确定燃料计划、水库调度、检修机组等:数年至几十 年的为长期负荷预测,常用于网络和电源规划等f l ,2 1 。 负荷预测对现行市场化的电力运营的特别作用体现在如下几个方面: ( 1 ) 为电力市场化运营提供依据。在电力市场的环境下,电力负荷预测同 电力市场的发电公司、供电公司和输电公司三者的关系都很密切。对于发电公 司,负荷预测是制定发电计划、检修计划和报价的依据;对于供电公司,为其制 定购电计划提供依据;对于输电公司,负荷预测是进行电网规划,保障其安全和 经济运行的基础。 ( 2 ) 为电力用户带来实际意义。目前我国不少地方实施了蜂谷电表的安装, 用户总是希望了解负荷高峰、低谷出现的时间以便合理安排用电、减少电费,因 此公开的负荷预测信息能够为用户节约用电提供参考。 ( 3 ) 为电力需求侧管理提供理论依据。在电力市场化下,根据预测结果可 第一章绪论 有效地对电网实行削峰填谷,错峰避峰等负荷管理方式,从而有效降低电力成 本,提高电网安全度。 ( 4 ) 影响实时电价的制定。由于竞争机制的引入,发电企业在制定实时电 价的时候,需要兼顾赢利和价格优势。因此,负荷预测的结果可作为有价值的 参考,帮助制定合理的实时电价,从而保障经济效益。 1 2 本文所做主要工作的内容 本文研究的问题属于夏季电力负荷短期预测范畴,是对负荷预测中的气候 敏感型负荷进行的探讨。所谓短期是指,我们对未来一天的电力负荷曲线进行 预测,而这条曲线是由每五分钟一个值,每日共2 8 8 个值所组成。此处的气候敏 感型负荷是指,我们研究的是夏季电力负荷,气温高低为一个非常显著的影响 因素,另一方面也考察了每天的风速数据。 1 2 1 本文的背景及其特殊意义 目前,在全国范围内,天气因素对夏季电力负荷的影响越来越明显。具体 表现为:夏季降温负荷增长迅猛,最大负荷出现在夏季的电网,同时最大负荷的 增长速度也超过了电量的增长速度。而且由于异常气候出现时问的随机性交化, 使得电网最大负荷出现的时间范围也在进一步的扩大。由于这些原因,在我国 的部分省市,已成为导致夏季电力供应严重不足的因素之一,从而成为制约工 业生产和经济发展的一个不可忽略的因素。 面对夏季天气因素对电力负荷的影响日趋明显的形势,有关夏季气候对电 力负荷影响的研究课题也得到了广泛开展,其中有一些研究成果已经在实际运 行中得到了应用。但由于天气和负荷的变化本身都比较复杂,而且各个地区又 受地域和电网结构的影响,用电终端也存在巨大的差异性,使得目前仍然没有 一种公认的夏季负荷预测的通用模型,因此有关夏季电力负荷的预测有许多工 作要做,如夏季气象因素与电力负荷的关系,电力负荷随气象因素的变化规律 等问题,因此有必要对这些问题进行更为深入地分析和研究。这些问题的解决, 可以显著提高夏季负荷预测的精度和效率,具有很好的理论和应用价值 夏季电力负荷预测的结果,可以为制定夏季电网迎峰渡夏计划,实施电力 需求侧管理,如错峰、避峰、削峰填谷等,保障电力系统的经济、稳定运行,提 第一章绪论 高负荷率、降低单位成本,以及满足夏季高峰用电需求,间接消减限电拉电对 工业生产造成的负面影响,提供参考依据。 1 2 2 本文所做的主要工作 本文首先综述了电力系统负荷预测领域的国内外研究现状,尽量按照方法 分类对大量研究成果做了简短介绍。在兼顾几个传统方法的同时,我们主要聚 焦于国内外的最新研究进展。 我们还提出了一种针对夏季气候敏感型负荷的整日曲线预测方法这是 一种混合型预测方法,结合了序列数据挖掘中的部分技术和时间序列分析中 的a r m a ( p ,g ) 模型。该方法成功将温度因素对负荷的影响引入预测步骤,并且 将不受温度影响的那部分负荷曲线段也做了合适处理,从而有效地区别对待了 不同的曲线段,最终将它们组合为整日负荷曲线。 我们还采用某市的负荷数据和天气数据,应用此方法做了日负荷曲线的预 测检验。分析指出该方法存在的客观缺点和未来的工作方向。 全文共分五章,第一章为绪论部分,介绍了电力系统负荷预测的内容及意 义,和本文针对夏季的短期负荷预测的特殊意义。在第二章中,我们简要综述 负荷预测领域的研究现状,包括一些传统方法和目前的主流方法,其中也囊括 了若干国内外文献的研究成果。 第三章和第四章为本文的预备知识部分。第三章包括序列模式数据挖掘中 的p a m 算法、d t w 距离下的最佳匹配算法等内容,构成了我们提出的预测方 法中的一个环节。第四章时间序列统计分析中的a r m a ( p ,口) 模型,是我们处理 一类型特殊负荷点的有效手段,也构成了本文预测方法中的一个重要步骤。因 此,由于此两部分在本文方法中占有较大比例,我们将这两部分作为独立的两 章。此外,第三章和第四章中还引用了部分必不可少的概念、定义和定理等,我 们在不同地方做了引用标注,或在章节的开头部分,或在定义和定理等的名称 后。 第五章中,详述了本文提出的短期负荷预测方法,它们中的数个环节已于 第三章和第四章中讲述清楚,这部分仅做简要带过,但一些细节处理方法、另外 的步骤则详述于此章之中。在本章,我们首先概述该预测方法的每个步骤,其 次详述各个环节所采用的具体方法,最后我们通过实际数据检验了该预测方法, 第一章绪论蕾 并对预测结果进行简要分析。我们将总结和工作展望安排于本章最后一节。 第二章电力系统负荷预测方法的简要综述 电力负荷预测是近几十年来发展起来的课题,使用的理论和方法很多,其 中很多是统计学和人工智能领域中的一些典型方法,或者是其余如灰色系统理 论,小波分析等方法。本章将把负荷预测中的典型传统方法和新进展做简要的 概述,其中时间序列法由于是本文方法中的一个环节,将在后面章节中单独引 入。 2 1 负荷预测的传统方法 经验预测法1 ,2 1 主要用于长期负荷预测。该方法中的多数方法过于简单, 模型比较粗糙,因此误差较大,其中单耗法的分析最细致,但是它要求对本地区 的所有产品都要进行单位耗电研究,使得统计调查得工作量太大,阻碍了实际 应用 趋势外推法【i ,2 】是根据已知得历史资料来拟合一条曲线,使该曲线反映负 荷本身的增长趋势;然后按照该曲线对于要求的未来某一点,从曲线上估计出 该时刻的负荷值。常用的曲线主要是直线、指数曲线、幂函数曲线、s 型曲线等, 可根据实际电力负荷曲线情况来选用。拟合的方法主要是最小二乘法。使估计 值与预测值之间的偏差的平方和最小。外推法原理简单,使用方便,但由于负 荷的变化趋势多种多样,要找到合适的曲线函数并不容易,同时存在随机因素, 使得问题更复杂。趋势外推法主要用于长期预测。 回归分析法也是负荷预测中的常用方法,即根据历史数据的变化规律寻找 自变量和因变量之间的问归方程,确定模型的参数,据此作出预测。文献【3 】给 出了一种基于回归分析的方法,通过引入两个变量建立了节假日负荷模型,给 出了一个基于热度和凉爽度函数的温度模型,并且利用最小二乘法给出了负荷 模型参数的稳健估计。文献 4 1 将负荷变化分为季节性负荷变化、年度增长、最 近每日负荷变化三部分,提高了每日峰值负荷与天气状况的多重回归关系模型 的预测精度。文献【5 l 通过分析高峰负荷特点,建立了基于稳健回归模型的高峰 负荷预测方法,该方法具有较强的稳健性,对适应异常情况下的样本数据,能保 持较满意预测精度。 第二章电力系统负蘅穗舅方法的简蔓综述 6 卡尔曼( k a l m a n ) 滤波法 6 】,它把负荷视为状态变量,建立状态空间模型, 用状态方程x ( k + 1 ) = 圣( k ) x ( k ) + ( 耳) 和量侧方程z ( k ) = h ( k ) x ( k ) + y ( 确来描述。卡尔曼滤波算法递推的进行计算,适用于在线预测,具体计算方 法在f 7 1 中有所介绍。该方法是在假定噪声的统计特性己知的情况下得出的,事 实上估计噪声的统计特性是困难所在。 混沌预测法8 ,9 ,1 0 1 ,混沌是确定性系统中由于内在随机性而产生的一种 外在的、复杂的,貌似无规则的运动。自1 9 6 3 年l o r e n z 首次提出“蝴蝶效应”以 来,混沌理论在很多领域都得到了广泛的使用。电力系统混沌现象的研究开 始于8 0 年代,美国数学家k o p e l l 等将一个三机系统变换为一个两自由度系统, 用m e l n i k o v 方法研究其混沌现象,开创了崭新领域。文献f 1 1 1 利用混沌理论对电 力系统负荷数据进行了相空间重构,计算出了负荷时问序列的最大l y a p u n o v 指 数,证明电力系统负荷具有混沌特性,并运用嵌入相空间的局域线性法进行了 实际电力系统的负荷预测,并为负荷预测研究提供了一条新的思路。 灰色系统预测法【1 2 ,1 3 】,是被国内学者使用较多的一种方法,它将一切随 机变化量看作是在一定范围内变化的灰色量,即部分信息已知,部分信息未知。 目前较常用的为灰色模型中的g m ( 1 ,1 ) 模型以及诸多改进模型,如g m ( 1 ,1 ) 残 差模型等,它通过模拟负荷序列来达到预测的目的。普通的g m ( 1 ,1 ) 按如下过 程来操作。首先,将原始序列z ( 0 ) = z ( o ) ( 1 ) ,z ( 0 ) ( 2 ) ,z ( o ) ( n ) ) 生成一阶a g o 序 列x ( 1 ) = 卫( 1 ( 1 ) ,霉( 1 ( 2 ) ,x o m ) ,其中$ ( 0 ) 和z ( 1 ) 满足z ( 1 ( 七) = 墨lz ( o ( i ) 。 如果生成的一阶序列x 0 ) 具有明显的指数增长规律,则不必继续生成二阶序列, 否则继续生成高阶序列。当原始序列经累加生成后,变为具有指数增长规律 的序列后,而因为一阶微分方程的解具有类似指数的形式,所以可用微分方 程为生成列建立模型。通常假定其满足g 掣+ a x ( 1 ) = 钍,由此式求出时间相应 函数z ( 1 ) 伪+ 1 ) 的表达式。最后,将z ( 1 ) 伪- 1 - 1 ) 还原为岔( o ) ( 七+ 1 ) ,即得出原始序 列$ ( o ) 的g m ( 1 ,1 ) 灰色预测模型。原始的g m ( 1 ,1 ) 模型在数据离散程度大,或者 长期预测的情况下,容易出现预测精度差的原因,所以近些年出现了各种理论 上的重大改进模型。 2 2目前的若干主流方法及新进展 在最近几年的负荷预测研究领域中,涌现出了大量新颖方法,主要是随着 人工智能领域的发展而建立起来的,譬如人工神经网络,专家系统,模糊逻辑 第二章电力系统负荷预舅方法的俺舞嫁述 7 等,再如更近期的数据挖掘或知识发现技术等,均出现在目前负荷预测理论成 果中。此外,融合小波分析中的方法也在近期较为流行。根据近期的情况来看, 各种混合型的预测方法已经成为新的主流发展趋势。我们将在接下来概要介绍 一些新方法,关于三种主流方法以及包含它们的混合型方法将在后面单独介 绍。 文献【1 4 】提出了一种马尔可夫链和模糊聚类相结合的预测方法,它将样本 所属状态进行模糊划分再利用马尔可夫链对研究对象做状态分析,根据状态转 移进行预测,该方法在序列呈现较强随机性时有优越性。文献1 1 5 】介绍了一种支 持向量机( s v m ) 的预测方法,它是一次中期负荷预铡竞赛中的胜出者,并且给 出温度可能在中期预测中并不十分有用,而且引入时间序列会提高预测精度的 结论。文献f 1 6 】使用了一种混合校正方法,该方法是基于有关相似日的模糊逻 辑,最终将神经网络预测出的次日负荷曲线进行校正。文献f 17 1 提出了一种混合 型负荷预测方法,它用模糊线性回归预测工作日的负荷需求,周末的则用广义 指数平滑方法来预测,并且用负荷对温度的敏感性来改善结果。文献f 18 1 详细比 较了模糊逻辑、神经网络、a 刖莫型这三种预测方法,并在以分钟为单位的超短 期负荷预测中予以对比,得出前两者有较好的预测效果。文献 1 9 1 研究了负荷 预测中如何降低异常事件对结果的影响,这些异常包括历史数据的错误,非典 型日,电价调整引起的电力消耗习惯的改变等。文献 2 0 1 介绍了一种专家系统, 它能辅助选择最合适的中场期负荷预测模型,该系统首先做出详细的问题陈述, 包括预测算法和影响负荷的关键变量,再由知识库中的决策规则,最终选择出 最佳的模型 2 2 1 人工神经网络 人工神经网络预测法( a r t i f i c i a ln e u r a ln e t w o r k ,a n n ) 【2 1 ,2 2 1 ,其中使用 最广和较为成功的是具有一个隐含层的前馈神经网络。它的一个典型模型可以 被描述为如下的方程:厶+ 1 = ,( 厶,l t 一1 ,厶一。,姚,姚一l ,眦一,讧+ 1 ) + 件1 , 其中t 为时间,厶为t 时刻的负荷,眦为t 时刻观测到的影响因子向量,觑+ l 为 对c + 1 时刻的影响因子向量的预测值,1 为随机变化成分。目前在a n n 中广泛 使用的训练算法为误差反向传播f b p ) 算法,各种改进的学习算法也大多以此为 基础。 文献【2 1 】将各种不同结构的a n n 用于短期负荷预测,其中输入为过去的历 第二章电力系统负荷预滔方法的简要缭述8 史负荷数据,输出为待预测日的负荷。特别研究了含有一个和两个隐含层的神 经网络,尤其是当中采用了不同的神经元做实际测试。文献【2 2 】提出了一种用 于超短期负荷预测的神经网络,通常对训练数据能够代表各种可能的负荷值和 天气情况有较高的要求,但是该网络对这方面需求的敏感性大大降低,并且在 当前天气情况与训练数据有一些差别时有较好的预测效果。文献【2 3 l 研究了一 种自监督适应性神经网络方法用于短期负荷预测,它使用自监督网络来提取负 荷数据和温度之间的关联性特征,并且分别在提前一小时和一天的负荷预测试 验中取得了很好的精度。文献1 2 4 使用了广义回归神经网络( g r n n ) 的预测方 法,并用基于优迸策略的差分进化算法提高了全局寻优策略,该g r n n 具有很 强的非线性拟合能力。文献 2 5 】提出了利用基于模拟退火的g a u s s - n e w t o n 算法 的神经网络预测电力系统短期负荷,并将其和自适应学习率附加动量法神经网 络进行了比较。 关于a n n 相关的混合型预测方法目前也是一个主流研究方向。文献 2 6 1 研 究预测具有反常负荷的五种日期类型,它用两种模糊推理方法来预测反常日的 最大负荷和最小负荷,并与针对五种日期类型的五种a n n 模型的预测结果相结 合。文献f 2 刁利用平滑、差分、去基值、比例放大四种时间序列处理的方法,去偏 复自相关法的相空间重构和b p 网络训练三者结合,提出一种应用于小电网短期 电力负荷的新的混沌神经网络模型。文献【2 8 】利用径向基( r b f ) 神经网络的非 线性逼近能力对不考虑电价因素的预测日负荷进行了预测,再应用自适应神经 网络模糊系统对r b f 神经网络的预测结果进行修正,以适应实时电价对负荷的 影响。文献 2 9 】提出了一种粗糙集径向基函数神经网络模型,它运用粗糙集方法 和信息熵概念,简化了网络输入变量,并且优化了网络连接权值的学习算法 2 2 2 小波分析 小波分析具有伸缩、平移、放大的功能,它可以对信号进行多尺度分析, 有效的从信号中提取所需的特征信息,实现在时域和频域的高分辨局部定位。 在现行的预测方法中,都是将小波理论与其他预测方法相结合,尤其是神经网 络。在与神经网络的混合型方法中,基本分为两种类型:一是先用小波将原始 数据进行多尺度分析,再用n n 来处理;二是目前较新的小波神经网络( w a v e l e t n e u r a ln e t w o r k ,w n n ) ,它以小波基函数代替通常的神经元激励函数,结合了 小波变换的时频局部化性质与通常神经网络的自学习功能。 第二章电力系统负荷预测方法构摘要综述9 文献【3 1 】使用小波分析处理负荷序列,再针对电力系统本身具有的负荷以 天,周,年为周期发生波动的特点,使用周期自回归模型有选择的对分解序列进行 预测。文献【3 3 1 提出基于小波包分解和重构的预测算法,使用具有线性相位的 双正交小波对电力负荷数据进行小波包分解和重构,然后用神经网络直接对各 尺度上的电力负荷分量进行预测,最后将各尺度上的预测值相加。文献 3 4 1 概述 了小波神经网络在负荷预测中的使用,并分析了其优缺点,如所需网络节点少 和精度高,以及仍然存在收敛性差的缺点。文献【3 2 】提出了一种改进的电力负 荷短期预测小波网络模型,它采用最小二乘支持向量机( l s - s v m ) 实现了小波 分解系数的多尺度组合预测。文献】提出了一种免疫小波网络( i w n ) 来预测 电力系统短期负荷,在该i w n 中,根据共生进化和免疫规划原理,提出共生进 化免疫规划算法,用来自动确定小波网络隐层神经元的数量和参数。 2 2 3 数据挖掘技术 数据挖掘【3 5 ,3 6 】,是一个从大量数据中抽取挖掘出未知的、有价值的模式 或规律等知识的复杂过程。数据挖掘涉及的学科领域和方法很多,有多种分类 法。根据挖掘任务,可分为分类或预测模型发现、数据总结、聚类、关联规则发 现、序列模式发现、依赖关系或依赖模型发现、趋势和异常发现等。根据挖掘方 法,可分为机器学习方法、统计方法、神经网络方法和数据库方法。关于序列模 式的数据挖掘,便是本文方法中的一个重要环节,将在后面章节详细介绍。 应用数据挖掘技术来解决负荷预测也是目前的一个研究方向。除了上面单 独讲述的神经网络方法外,目前在负荷预测中使用的主要方法有分类分析、聚 类分析、决策树等。文献 3 7 】使用了确定性退火( d a ) 聚类算法,将原始数据在 用a n n 预测前进行聚类,显著减小了预测误差。文献【4 1 】提出了一种混合聚类 算法用于预处理负荷数据。文献 3 8 1 利用数据挖掘技术,寻找与预测日同等气象 类型的多个历史短期负荷,组成具有高度相似气象特征的数据序列,将此数据序 列作为支持向量机( s 讧) 的训练数据,从而克服了s v m 在训练数据时存在数 据处理量太大、处理速度慢等缺点。文献| 3 9 1 针对传统的c 均值模糊聚类存在的 一些缺点,利用遗传算法的全局寻优能力对传统的c 均值模糊聚类算法进行了改 进,同时将其运用到电力系统的中长期负荷预测中。文献【4 0 1 将天气相似日的相 关影响因素差异与相应负荷变化率之间的关联规则挖掘建模,挖掘模型算法采 用c 4 5 和c a r t 算法的基于b p 网络加权组合,算法还基于范例推理给出了节假 日调整因子校正节假日负荷。文献【4 2 l 将改进的决策树i d 3 算法用于日特征负荷 第二章电力系统负荷爱一方法的衡墨绿述 决策树预测模型,它在给出预测日气象及星期等信息后可对特征负荷进行预测, 并且若将每e 2 4 点或9 6 点负荷及影响因素数据用于模型训练,则可进行b 2 4 点 或9 6 点负荷预测。 第三章时间序列的数据挖掘技术 在i c d m 0 5 上公布的十个有挑战性的数据挖掘问题中有挖掘序列数据与时 间序列数据,而且在过去十年挖掘时间序列数据也是一个研究热点。由于本文 的方法是基于时间序列的统计分析和数据挖掘的混合型方法,我们将在本章把 将要用到的一些概念和算法尽量简要阐述。 时间序列数据是数据挖掘中一类复杂的数据对象,其复杂性表现在:一般 维数比较高,往往含有噪声;在幅度方面存在拉伸和平移,在时间轴上存在伸 缩;另外还有线性漂移和不连续点。时间序列数据挖掘中研究的问题大概分为 如下【4 3 】: ( 1 ) 相似性查找( s i m i l a r i t ys e a r c h ) :分为完整序列匹配与子序列匹配。前 者是指给定待查询序列q ,找出与q 相似的序列。而后者指给定待查询序列q , 在较长的序列s 中,找到与q 相似的子序列。 ( 2 ) 索引:由于时间序列数据库通常非常庞大,因此需要对这些数据进行 有结构化的组织,提高查询的效率,同时支持相似搜索。 ( 3 ) 聚类( c l u s t e r i n g ) :在某种相似性度量d ( q ,g ) 下,找出序列的分组, 即将某种程度上相似的序列放到一组。 ( 4 ) 分类( c l a s s i f i c a t i o n ) :给出一个未知类别的序列,将其分配到预先定 义好的类别当中。 ( 5 ) 分割( s e g m e n t a t i o n ) :对于给定的包含n 个数据点的时间序列q ,构造 一个模型国,它f l j k ( k n ) 个分段组成,使得囝能够尽量接近q 。 ( 6 ) 规则发现( r u l ed i s c o v e r y ) :找出时间序列随时间变化的规则。 在本文的方法中,涉及到了聚类,分类和相似性查找中的部分内容,暂时未 采用分割技术对原始序列预处理,尽管这样可能提高算法的效率,但会造成对 预测精度的影响。 3 1 相似性度量 相似性度量问题,是序列数据挖掘中的一个重要问题,它是聚类和序列匹 第- - t时i 剐簪列的羲据挖控术 配等的前提问题。我们将介绍几个重要度量,而在本文的方法中将要用到动态 时间弯曲距离,部分地方直接使用欧式距离。 3 1 1 欧式距离 欧式距离,是在时间序列数据挖掘中常用的一种相似性度量,如在文献f 4 4 , 4 6 ,4 7 ,4 8 】中。对于时间序列x = 知,2 :1 ,- t n 一1 和y = y o ,讥,一l ,x 和y 之 间的c p 距离为 n l d ( x , y ) = ( i 戤一弘i ) 1 p 面 p = l 时为“c i t y - b l o c k ”距离,p = 2 时即为欧式距离。对于给定阈值e ,若d ( x ,y ) ,则认为x 和y 是相似的。 但是这种相似性度量具有较差的强健性,即使一些序列的变化形态相似, 但是计算出的距离却是很大。这是因为时间序列由于受到多因素影响,形态相 似的序列会呈现多种变形,如平移、振幅伸缩、时间伸缩、双重伸缩、线性漂移 和跳跃不连续等【4 9 】,见图3 1 。 为克服图3 1 中的数种变形对相似性的影响,文献【5 0 】等对欧式距离进 行了改进。先对序列进行标准化变形,即采用序列的均值和方差进行规范 化,然后采用欧式距离。对于序列x = $ o ,z l ,z ,1 ) 可用标准化序列x = z ;,z :,一1 ) 替代之,其中 。:= 竽 p 是序列x 的均值,盯是标准差,标准化变换能够简单地解决平移和伸缩,但是 仍然对相似性要求太严格。 文献【5 1 贝l j 对序列不同部分赋予不同的权重,引入一种加权欧式距离。该 方法把待查找序列q 分为等长的数个部分m ,他,如分别对它们各自赋予权 值,屹,帆。此时0 与序列e 的距离为 r 一 d ( q ,c ) = 、:,咄( q ;- - c i ) 2 此方法也能对欧式距离进行一定改进,但不易操作,且仍不能克服一些变形,故 使用较少。 第三章时向序列的数据挖掘技术 ( c ) 振幅伸缩 图3 1 :相似序列的数种变形 t 氏纛一 图3 2 :欧式距离与d t w 的对比 3 1 2 动态时间弯曲距离 由于欧式距离对于序列在时问轴上的扭曲非常敏感,b e m d t 和c 蛐b r d 引入 了动态时间弯曲距离( d y n a m i ct i m ew a r p i n g ,d t w ) 5 2 ,5 3 ,5 4 ,5 5 ,5 6 】。 对于长度为n 的时间序列q = 口1 ,啦, ,和长度为m 的时间序列c = c l ,c 2 ,) 。为了用d t w 将两个序列对齐,首先构造一个n m 的矩阵a ,元 素a ( i ,j ) = d ( q i ,c j ) = iq i 一勺i ,d 慨,c j ) 也可以为一勺) 2 等。即矩阵中的每 个元素a ( i ,j ) 对应m 和。f 的距离,如图3 3 所示。一条弯曲路径就定义了序 列q 和c 之间的一种对齐方式。将w 的第个元素定义为蚺,它的值即对应矩阵 中的某个元素。于是,我们有; w = u l ,t , t ) 2 ,u ,瑚x ( m ,n ) s k m + i t , 1 图3 3 :a ) 原始序列q 和a 。b ) 根据所构造的矩阵, 得出最佳弯曲路径,实方块所示。c ) 最终对齐结果 此弯曲路径必须满足如下限制: ( 1 ) b o u n d a r yc o n d i t i o n s := a ( 1 ,1 ) ,0 ) k ;a ( m ,n ) 。即要求弯曲路 径从矩阵的最左下角起始,一直到最右上角结束。 ( 2 ) c o n t i n u i t y :对于u k ;a ( a ,和峨一1 = a ( a ,6 ,) ,则口一a r 1 , 且b f s l 。即限制了弯曲路径上的两个相邻点,只能对应矩阵中的相邻元 素( 对角也算相邻) 。 ( 3 ) m o n o t o n i c i t y :对于峨= a ( a ,6 ) ,和帆一l = a ( d ,6 j ) ,则a d o , 且b 一矿0 即路径上的点始终沿着对应矩阵向上和向右的方向前进。 第三章时问序列的数据挖l 技术 在满足上述条件的诸多弯曲路径中,选择具有最小弯曲代价的那条路径, 即: d t w ( q ,c ) = m i i l :。,啡) 现引入累积距离,y ( ,j ) ,它表示到吼和c j 为止的最小弯曲路径,用迭代式表示即 为: 7 ( 1 ,j ) = d ( 啦,勺) + i n i n ,y 0 1 ,j 一1 ) ,- r ( i 一1 ,j ) ,- r ( i ,j 一1 ) i i p t ( i ,j ) 是d ( 哦,勺) 与相邻的前一步最小累积距离之和。 根据如上表达式,可以通过采用“自底向上”的动态规划,构建一张累积距 离表,求出7 ( m ,n ) ,则硎( q ,c ) = 7 ( m ,礼) 。 两个序列之间的欧式距离可以看作是d t w 的特殊情况,此时u = a ( k ,k ) = d ( q k ,c k ) ,但是这仅在两个序列有相同长度情况下才是如此。因 此,不难发现,d t w 比欧式距离更能描述序列之间的相似性,它能支持序列长 度不相等的情况,即支持时间轴上的伸缩。 d t w 的主要缺点在于计算代价较高,基于动态规划的方法,它的时间和空 间复杂度都是d ( n m ) ,此处n 和m 是两个序列的长度。在子序列匹配时,时间复 杂度达到o ( n 2 f ) ,z 是子序列长度。 除了以上两种,还存在其余一些相似性度量,如文献 5 7 ,5 8 弓i a t 编辑距 离( e d i t i n gd i s t a n c e ) ,f 6 0 】引入了界标距离( l a n d ) ,( 6 2 】提出基于概率来度量 相似性,【4 5 1 则较早地提出若两个序列有足够多的,不相互重叠,按时间顺序且 相似地子序列,则为相似的标准。 3 2 聚类算法一p a m 聚类,就是将对象集划分为不同的类,在某种相似性度量下,使得类内的对 象尽量相似,而不同类内的对象差异性较大。聚类算法通常可以分为以下几大 类:分割法( p a r t i t i o n i n g ) ,代表算法有可k - m e a n s 、k - m e d o i d s 、c l a r a n s 算法 等:层次法( h i e r a r c h i c a l ) ,代表算法有b i r c h 、c u r e 、c h a m e l e o n 算法等; 基于密度的方法( d e n s i t y - b a s e d ) ,代表算法有d b s c a n 、0 p t i c s 、d e n c l u e 算 法等;基于网格的方法( g r i d - b a s e d ) ,代表算法有s t i n g 、c l i q u e 、w a v e - c l u s t e r 算法等;基于模型的方法( m o d e l - b a s e d ) ,通常有两种方向,统计的方案 和神经网络的方案。 第三章时闻序列的致据挖l 技术 聚类算法广泛地使用于时间序列数据挖掘中,它可以发现具有相似模式的 时间序列。层次聚类法中的是“自底向上”方案是一种较常用的方法:开始时每 个点做为一个类,寻找距离最近的两个类,将其合并,更新类中心,直至类的个 数等于某个值或者满足一定条件为止。 本文将应用一种基于分割聚类法k - m e d o i d s 的p a m 算法,在下面我们将简 述p a m 算法。 p a m ( p a r t i t i o n i n ga r o u n dm e d o i d s ) 算法 6 3 ,6 4 】,即围绕中心点的分割 聚类法,它将把n 个对象分为k 个部分,每部分成为一个聚类。为了发现k 个聚 类,p a m 方法为每个聚类确定了一个代表对象,称为中心点( m e d i o d ) ,它是聚 类的最中心位置的对象。选定k 个中心点后。每一个未被选中的对象与和其最相 似的中心点分在一组,即:若d f 是一个未被选中作为中心点的对象,而0 。是选中 的中心点,j l d ( o j ,o i ) = m i n d ( o j ,0 e ) 1 m ) ,则认为o j 属于由d 代表的聚类, 其中d ( d 4 ,o h ) 定义为o a 与o b 之问的相似性度量,m 为选出的所有的中心点集。 为寻找k 个中心点,p a m 算法起先任意选择k 个对象作为中心点。为了逐渐 改进聚类质量,此后每一步都把一个已选的中心点啦与非中心点0 做交换。为了 衡量交换o i 与o h 的效果,此算法为所有的非中心点o f 引入一个代价变量g 加根 据o ,属于如下哪种情况来计算f 3 5 ,3 6 】,如图3 4 c a s e1 :若o f 当前属于0 代表的聚类。若o l 被o h 替换,发现o ,此时最相似于 另外的一个中心点o t ,t i ,于是将o ,重新归属于吼代表的聚类。此时在涉及o j 的 交换代价就是:g h = d ( o j ,o t ) 一d ( o j ,仉) 上式的结果总是非负,表明用o h 替 换仉时出现非负的代价。 c a s e2 :o ,当前属于o i 代表的聚类。若o i 被o h 替换,发现o ,此时最相似的中 心点就是刚成为中心点的o h 。此时交换代价为:q 访= d ( o j ,o h ) 一d ( 吩,q ) 此代 价可正可负,依赖于o f 是更相似于d 还是o 。 c a s e3 :d f 当前属于d t 代表的聚类,t i 。即使o i 被o h 替换,o f 仍然属于d f 代 表的聚类。此时,涉及o f 的代价为:c = 0 。 c a s e4 :o f 当前属于o t 代表的聚类,t i 。若使o i 被o h 替换,引起o ,最相 似于中心点o h ,于是o f 被重新归属于o h 代表的聚类。此时,代价为:瓯 = d ( o j ,o h ) 一d ( o j ,仉) ,此式表示的代价总是负的。 i 一、i il 盂 。ii jp t i3il 擀蹿 ij 埘1 7 i l 7 壬斡 一r !h ij i j 、,了一p - li iliii 1 :铋。舷爹- 撇孝e e2 :c 叠。移黟卸瞬毋 t a l e4 :。粥缈蛳珍 图3 4 :p a m 算法代价计算 此时,用替换啦作为中心点的总代价为: t g h = j 最终将p a m 算法描述如下: s t e p1 :任意选择k 个对象作为中心点 s t e p2 :计算所有对象对慨,o h ) 的t g ,其中q 是当前聚类选择的中心 点,0 是非中心点。 s t e p 3 :选择对应m i nt g h 的对象对h ,) 。若最小的t g 为负,则用o h 替 换o i ,返回s t e p2 。 s t e p4 :对每一个非中心点,将其归属于最相似的中心点所代表的聚类。 第三章时同序列的教据挖l 技术 埔 上述算法的第二步和第三步中,共有k ( n 一女) 对他,o ) ,对每一对计算t q , 需考虑( n 一) 个非中心对象,累计时间复杂度为o ( 一k ) 2 ) ,且仅为执行一 次循环的代价。因此,在n 和k 的值非常大时,p a m 的开销非常大,针对大数据 量的需求,有c l a r a 算法【6 3 】和基于随机搜索的c l a r a n s 算法f 6 5 】。 由于p a m 算法将最中心位置的对象作为聚类的代表对象,因此它在存在孤 立点的情况下鲁棒性非常好。此外,p a m 算法对于小数据集合有着较好的聚类 效果( 如划分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论