(管理科学与工程专业论文)中长期负荷预测模型研究及系统实现.pdf_第1页
(管理科学与工程专业论文)中长期负荷预测模型研究及系统实现.pdf_第2页
(管理科学与工程专业论文)中长期负荷预测模型研究及系统实现.pdf_第3页
(管理科学与工程专业论文)中长期负荷预测模型研究及系统实现.pdf_第4页
(管理科学与工程专业论文)中长期负荷预测模型研究及系统实现.pdf_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华北电力大学硕士学位论文摘要 摘要 中长期负荷预测对电力系统规划和运行是非常重要的,本文的目的是探讨如何 准确的进行中长期负荷预测。 本文首次提出以联合数据挖掘技术对历史数据进行预处理,提取出规律强化的 数据序列,并在此基础上建立电力负荷优选组合预测模型。 月度负荷具有增长和波动二重趋势,本文提出以纵向历史数据为原始序列,用 g m ( 1 ,i ) 进行增长趋势预测,以横向历史数据为原始序列用a n n 进行波动趋势预 测,并引入最优可信度的概念,建立综合最优预测模型。 将多层递阶回归分析方法引入了中长期负荷预测领域,该方法较好的考虑了相 关因素影响,还对电力系统自身的时变特性具有较强的适用性。 实例验证了上述方法的先进性和适用性。 最后,针对辽宁电网进行了中长期负荷预测软件的开发。 关键词:串长期负荷预测,数据挖掘,优选组合,最优可信度,多层递阶回归分析 a b s t r a c t m i d l o n g t e r m p o w e r l o a df o r e c a s t i n gi sf u n d a m e n t a lt op o w e r s y s t e mp l a n n i n ga n d o p e r a t i o n t h ep u r p o s e i st od i s c u s sh o ww ec a nf o r e c a s te l e c t r i c a ld e m a n d a c c u r a t e l y t h eu n i t e dd a t am i n i n gt e c h n o l o g yf o rh i s t o r i c a ld a t ap r e p r o c e s s i n gi sp r o p o s e di n t h et h e s i s t h ed a t as e q u e n c ew h i c hc a nb o o s tu pr u l e si sc o m p o s e d t h r o u g h t h em e t h o d t h e o p t i m u m c o m b i n e dm o d e li sb u i l tb a s e do nt h a t f o rt h e m o n t h l y l o a dw i t hd o u b l et r e n d so f i n c r e a s i n g a n d f l u c t u a t i n g ,t h e i n t e g r a t e do p t i m u mg r a yn e u r a ln e t w o r km o d e lo fm o n t h l yl o a df o r e c a s t i n gi sp r o p o s e d i nt h et h e s i sf o rt h ef i r s tt i m e i nt h em o d e l ,w er e g a r dv e a i c a lh i s t o r i c a ld a t aa st h e p r i m i t i v ea r r a yt of o r e c a s ti n c r e a s i n gt r e n db yt h eg r a ym o d e l ,a n dr e g a r dh o r i z o n t a l h i s t o r i c a ld a t aa st h ep r i m i t i v ea r r a yt of o r e c a s tf l u c t u a t i n gt r e n db yt h ea n n b a s e do n t h a t ,t h ec o n c e p to f t h eo p t i m u m c r e d i b i l i t y i si n t r o d u c e d ,a n dt h ei n t e g r a t e do p t i m u m m o d e “sb u i l di nt h et h e s i s i nt h i st h e s i s ,m u l t i d e g r e er e c u r s i x er e g r e s s i o na n a l y s i si s a p p l i e dt of o r e c a s tt h e m i d - l o n g t e r ml o a df o rt h ef i r s tt i m e t h em e t h o dc a l l p e r f e c t l yr e f l e c t t h ei m p o r t f u n c t i o no ft h er e l a t e df a c t o r sa sw e l la sh a v es t r o n ga d a p t a b i l i t yt ot h ep o w e r s y s t e m w i t hs e q u e n t i a lv a r i a n c e t h ea d v a n t a g ea n da p p l i c a b i l i t yo ft h et h r e em e t h o d sm e n t i o n e di nt h ef r o n th a v e b e e nv e r i f i e db yi n s t a n c e s l a s t l y , m i d _ l o n gt e r ml o a df o r e c a s t i n gs o f t w a r ei sd e v e l o p e df o rl i a o n i n gp o u r e r g r i di nt h i st h e s i s l iy u a n y u a n ( m a n a g e m e n ts c i e n c ea n d e n g i n e e r i n g ) d i r e c t e db yp r o f n i ud o n g x i a o k e y w o r d s :m i d - l o n g t e r ml o a df o r e c a s t i n g ,d a t am i n i n g ,o p t i m u mc o m b i n e d , o p t i m u mc r e d i b i l i t y ,m u l t i d e g r e er e c u r s i v er e g r e s s i o na n a l y s i s 声明 本人郑重声明:此处所提交的硕士学位论文中长期负荷预测模型研究及系统实 现是本人在华北电力大学攻读硕士学位期间,在导师指导下进行的研究工作和取得 的研究成果。据本人所知,除了文中特别加以标注和致谢之处外,论文中不包含其他人 已经发表或撰写过的研究成果,也不包含为获得华北电力大学或其他教育机构的学位或 证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了 明确的说明并表示了谢意。 学位论文作者签名:期:兰旦丝竖_ 三工 关于学位论文使用授权的说明 本人完全了解华北电力大学有关保留、使用学位论文的规定,即:学校有权保管、 并向有关部门送交学位论文的原件与复印件;学校可以采用影印、缩印或其它复制手 段复制并保存学位论文:学校可允许学位论文被查阅或借阅;学校可以学术交流为 目的,复制赠送和交换学位论文;同意学校可以用不同方式在不同媒体上发表、传播学 位论文的全部或部分内容。 ( 涉密的学位论文在解密后遵守此规定) 作者签名:翅导师签名: 日期:o 争i 2 ) 趟 日 期:墨! ! 生至! 兰鲤) 日 华北电力人学硕士学位论文 第一章绪论 1 1 问题的提出 电力系统的作用是向各类用户提供经济、可靠、符合质量标准的电能,为社会 发展提供动力。由于电能不能大量储存,而且各类用户对电力的需求也一直变化, 所以电力负荷预测是电力系统中一项重要的工作,是电力系统运行、控制和规划不 可缺少的组成部分。 随着我国电力事业的迅速发展,电网的缺电局面在一定程度上有所缓解,特别 是电力系统逐步过渡到商业化运行的情况下,电力负荷预测工作更为重要。在保证 系统安全可靠运行、满足用户需求的前提下,电力企业必须更多的从经济效益方面 考虑系统的规划、运行。而通过准确的负荷预测,可以避免资源的浪费,从而提高 电力系统的经济效益。 按照预测的目的和时间期限不同,电力系统负荷预测一般可分为超短期、短期、 中长期几类,在不同场合,其含义并不完全一致。电力系统安全监视和自动发电控 制需要几分钟的负荷预测:事故预防控制和紧急状态处理需要几分钟到小时的负 荷预测,这些一般属于超短期负荷预测。安排日调度计划,包括确定机组的启停、 水火电协调、联络线交换功率和负荷经济分配等,需要用2 4 小时的负荷预测;安 排周调度计划,包括水库调度、设备检修等,需要7 天的周负荷预测,这些基本都 属于短期负荷预测,准确的短期负荷预测可以保持电网运行的安全稳定性,减少不 必要的旋转储备容量。对于电力系统规划则需要1 5 年的中期负荷预测,而作为 电力系统远期展望和规划,有时候甚至需要进行2 0 年的负荷预测,这些结果一般 用来决定未来新的发电机组的安装,决定装机容量的大小、地点和时间,决定电网 的增容和改建,决定电网的建设和发展。 本文中,主要考虑未来一个月到未来数年的负荷预测。对调度部门而言,这属 于长期负荷预测;对规划、计划部门来说,这属于中期负荷预测,本文中则称为中 长期负荷预测( 在不至于引起误解的场合,也简称负荷预测) 。 短期负荷预测的内容一般而言比较单一,主要是有功功率和无功功率( 目前实 际系统中前者更重要些) 。而中长期负荷预测的预测内容则要复杂得多,包括年 ( 季、月) 最大( 小) 负荷、年( 季、月) 最大峰谷差、年( 季、月) 用电量等等。为了加 强负荷特性的研究,国家专门出台了文件对这些指标统一定义并号召加以研究。 1 2 电力系统负荷预测的特点和难点 由于负荷预测是根据电力负荷的过去和现在推测它的未来数值,所以,负荷预 l 华北电力大学硕士学位论文 测研究的对象不是确定事件。只有不确定事件、随机事件,才需要人们采取适当的 预测技术,推知负荷的发展趋势和可能达到的状况。电力负荷未来的发展是不确定 的,它要受到多种多样复杂因素的影响,我们很难把握这些因素在未来时刻的状态, 只能在一定条件下,进行一定简化并作出了若干假设得到预测结果,通常我们需要 做出多种假设和简化,选用不同的预锄方法,所以负荷预i 9 1 1 l 具有不确定往、依赖外 部条件性和多方案性的特点。 虽然负荷预测有以上特点,但是负荷预测也是有一定规律,通过对历史数据的 分析,找出其内在规律,按照一定的科学原理,可以保证负荷预测工作尽可能的接 近实际情况。尤其中长期负荷预测存在如下的普遍规律:首先电力负荷的发展是一 个连续统一的过程,其未来发展是这个过程的连续:其次,各地区、各年段电力负 荷的发展具有定的可比性、相似性;最后,电力工业的发展与整个社会有着直接 的联系,通过分析国民经济发展水平和趋势,可以对电力负荷的发展做出相应的估 计。 作为预测问题,电力系统负荷预测的准确性是根本要求,但精确的负荷预测常 常是不容易做到的,主要有如下几个困难: 1 理论上讲,电力负荷的太小受到国民经济发展水平、产业结构、国家宏 观经济政策、气候、突发性事件等因索的影响,可以说,现代社会的绝大多数生产 活动都会对电力负荷产生影响。因此,我们不可能在预测的时候考虑到所有的相关 因素,而只能提取若干因素加以考虑。 2 某些因素,即使知道它们会对负荷产生影响,然而要定量的准确描述它 们的影响却非常困难:而且。这种影响往往是变化的,同样的外部作用在不同的时 间,对负荷的影响是不同的;更重要的是,并不能够事先确切的掌握这些因素在未 来时段的状态,有时候对这些因素的预测甚至比负荷预测更加复杂和困难。 3 实践证明,没有一种足够完善的理论方法能够适用于切的情况,同一 种方法应用在不同地区、不同时间,精度可能有着巨大的差异;因此,在对某地区 电力系统进行负荷预测中,熟悉该地区( 电力系统) 状况的专家的经验是不可忽视 的,而这种经验往往很难用精确的数学语言进行,因而也就缀难在数学模型中进行 考虑。 1 3 电力系统中长期负荷预测研究的现状 电力系统负荷预测技术是随着负荷预测的重要性而发展的,相对而言,目前短 期负荷预测技术发展更为充分些,考虑到短期负荷预测中数据丰富,而且未来时 刻的负荷主要依赖于历史负荷序列的发展,因此伴随着信号处理、人工智能等新兴 学科的发展,短期负荷预测无论是在科学研究还是在实际应用中,都得到了比较充 2 华北电力大学硕士学位论文 分的发展。与此同时,e b 于中长期负荷预测受到的影响因素多,可参考的历史数据 量小,各个地区的发展情况又不尽相同,进行准确的定量研究比较困难,因此这方 面科学研究力度相对较小;尤其是在我国,长期处于用电紧张的情况,使得中长期 负荷预测的重要性长期被淡化。本节简单介绍一下目前中长期负荷预测领域的研究 现状。 常用的负荷预测技术一般可分为定性预测技术和定量预测技术两类。 当同负荷预测相关的定量信息不存在或者很少或者可靠性值得怀疑、同时却有 足够的定性知识存在时,通常采用定性预测技术。常用的定性预测技术有:d e l p h i 法、用户调查法、形态研究法、类比法等。定性预测不是通过建立数学模型,而是 依赖于人的直观思考,判断和知识积累。这些方法的预测结果很大程度上是人们的 一种期望值,因此误差较大,但它可以利用人们的经验,从而可以计入许多非量化 的因素影响,所以在实际工作中,它仍然在潜移默化中发挥着重要的作用。当我们 对一个地区进行负荷预测,必须听取对当地负荷水平及经济状况有着深刻了解的电 力系统工作人员的意见,而不要迷信任何简单或复杂的数学模型。 随着负荷变化模式的复杂化,定量预测技术日益重要。定量预测技术首先有两 个基本假设:负荷及相关因索可以定量表达:负荷过去变化模式将来继续存在,这 两个假设显然有很大的局限性,但是在实际中也得到了大量的应用。定量预测技术 多种多样,按照使用的数据不同,其可分为:自身外推法和相关分析法。 自身外推法是根据负荷本身数据,通过寻找负荷历史数据中的变化规律与特 性,将其变化模式外推来进行未来负荷的预测。所需数据量少是该方法的优点,但 如果负荷序列规律性较差、波动较大时,预测结果可信度较低。自身外推预测较适 合用于预测周期较短的情况。目前国内中长期负荷预测领域,这类方法的应用比较 广泛。 相关分析法将负荷同各种社会以及经济因素相联系,通过寻找电力负荷与影响 其变化的相关因素的关系或数学模型来做出负荷预测。如果预测成功,它能清楚表 达电力负荷增长与其它可测量因素之间的关系。事实上,这颇难做到,因为相关因 素的获取可能比负荷预测更困难。该方法适合于负荷模式变化较大,预测周期较长 的情况。 目前比较成熟的定量预测技术基本上属于概率统计方法,可分为两大类:时间 序列分析法和回归分析法。 时间序列分析法属于自身外推法,即根据负荷自身历史数据进行未来负荷的预 测。按照处理方法的不同,其又有确定性时间序列分析方法和随机时间序列分析方 法之别。确定性的有指数平滑法、c e n s u s - 1 1 分解法、谱展开法等。指数平滑法假 定负荷由负荷模式和误差组成,通过对负荷历史数据的加权或平滑,去掉随机误差, 该方法简单、快速,可用于预测量大而预测周期短的情况。c e n s u s 1 1 分解法又假 3 华北电力大学硕士学位论文 定负荷变化由季节模式、趋势模式等多个子模式组成,通过对随机误差的平滑,分 别预测出各子模式分量,最后组合成一个最终预测。该方法可提供负荷各组成部分 对负荷大小的影响的信息。谱展开法利用f o u r i e r 技术将负荷模式分解为一系列不 同频率的正弦函数,从两可对负荷的周期性分量进行预测。也可将负荷用时间序列 自相关特征函数的时间函数表达,用于预测负荷的随机分量,该方法优点是结构简 单。常用的随机分析方法有:b o x j e n k i n s 法、状态空间法、m a r k o v 法等。8 0 x j e n k i d s 法将负荷序列当作一个随机过程进行处理,应用a r 姒、a r i m a 等模型进行预测。状 态空间法将负荷变化用系统状态方程表达,采用k a l m a n 滤波进行参数估计。m a r k o v 法也是将负荷时间序列看作一个随机过程,通过对不同状态的初始概率和状态之间 的转移概率的研究,确定状态的变化趋势,以预测未来负荷。以上三种随机分析方 法考虑了负荷行为及其相关因素的随机影响,主要缺点是模型识别主要依靠人的经 验,识别比较困难,另外在计算上使用矩阵形式,计算量大,而且对历史数据量要 求较多,不适合中长期负荷预测。 回归分析法假定负荷同一个或多个独立变量存在因果关系,寻找出因果关系的 数学模型,以此进行未来负荷的预测。回归分析分为线性模型和非线性模型两种, 线性模型的参数估计技术成熟,预测过程简单,但由于它假定变量间的关系为线性 关系,这可能成为系统误差,因为线性关系是种非常理想的状态,实际系统中很 少见:而非线性回归模型参数估计非常困难,应用中有很多不便。 以上所述定量预测方法在负荷预测中被广泛应用,但对于不确定性比较大,负 荷变化模式比较复杂的情形,也难于做出更高精度的负荷预测,于是新的不确定性 负荷预测方法被提出,他们有:灰色系统法、模糊预测法、专家系统法、人工神经 网络法等。 灰色系统预测技术将负荷数据当作灰数,通过数据的累加生成得到新的数据 列,从而减少数据的随机性,用此数据建立灰色模型进行预测,将预测值累减还原 即得到最终的负荷预测值。 模糊预测法应用模糊集理论,可直接根据不确定或不完整数据进行预测,常用 的方法有模糊回归分析、模糊指数平滑、模糊聚类分析等。 专家系统法通过将预测人员的经验用计算机可识别的产生式规则等形式表达, 建立知识库,从而可模拟专家进行负荷预测。该方法可以将人的经验与统计方法相 结合,在知识库比较完备的情况下,可得到准确的预测结果,特别是能对异常负荷 模式作有效预测。然而,将专家知识和经验要精确地转换成一系列规则往往难以做 到,甚至获取的专家的知识有时还可能是矛盾的,可见要建立完备的知识库十分困 难,这使该方法的应用大受局限。 人工神经网络法通过对人脑神经系统的模拟来实现负荷预测。人工神经网络具 有非线性、自组织、自适应、大规模并行处理等优点,它为负荷预测提供了一套薪 4 华北电力大学硕士学位论文 方法。 需要指出的是,所谓不确定性预测方法是指预测是在不确定因素很多的环境进 行,而对预测方法本身而言,其预测模型和预测结果一般都是确定的。在实际负荷 预测中,不确定性预测技术之间以及不确定性预测技术与确定性预测技术之间常常 结合起来运用以处理预测过程中的各种实际问题,因而又发展起来各种混合型负荷 预测方法。如灰色人工神经网络法、模糊神经网络法、模糊专家系统法、专家系统 神经网络法以及用不确定性预测技术进行时间序列模型、回归模型的辨识、参数估 计等各种方法。 可见,负荷预测方法多种多样,可以应用简单的定性方法,也可以采用复杂的 数学方法预测。但负荷预测是一个相当复杂的问题,目前尚无一个固定方法可以适 用于一切场合,并能保证优于其它一切方法。不同电力系统由于负荷特性不同可能 有不同的预测方法:即使同一个电力系统,根据预测时间的远近以及负荷特性的变 化,不同时期也可能采用不同的方法。随着社会的进步、电力事业的发展,负荷预 测的内容将不断丰富,负荷预测方法也应不断发展和完善,这要求负荷预测工作者 去更深入、更广泛的探索。 1 4 本论文的主要工作 本文的整个研究开发过程中,主要包括: 1 系统研究了中长期负荷预测理论体系,熟悉了解各种负荷预测方法以及适 用范围。 2 提出以联合数据挖掘技术进行负荷历史数据的预处理,并在此基础上建立 优选组合预测方法,实例验证了方法的适用性与先进性。 3 提出基于最优可信度的月度负荷综合晟优灰色神经网络预测模型,充分考 虑不同历史数据对不同趋势发展的贡献比重的不同,并实例验证了方法的适用性与 先进性。 4 将多层递阶回归分析方法引入了中长期负荷预测领域,并实例验证了方法 的适用性。 5 开发研制了一套“辽宁电网中长期负荷预测系统”,并已交付辽宁省电力公 司使用,现处于试运行。 5 华北电力大学硕士学位论文 2 1 引言 第二章负荷历史数据预处理 实际的电力系统负荷预测,是以对按某种时间序列排列的相关数据的获取和分 析为基础的。然而,这些数据由于受到多种随机干扰因素的影响,不可避免的会存 在一定的异常干扰值。异常值的产生使得许多良好的常规估计方法陷入困境,不能 很好的拟合数据序列,难以发挥应有的作用。因此,在利用历史数据进行负荷预测 之前,应对其进行预处理,以有效的提高负荷预测的精度。 由于目前常用的预处理技术存在定不足,所以本文在分析常用预处理技术的 基础上,结合负荷预测的实际特性,提出了一种以联合数据挖掘技术对负荷历史数 据进行预处理的方法。联合数据挖掘技术可以有效的考虑到相关因索的影响,经过 其处理提取后的数据序列变化规律有较大简化,在此基础上,只需要建立相对简单 的优选组合预测模型,就可以达到满意的预测精度,最后,通过实际比较检验,该 方法的预测精度确有较大改善。 2 2 常用预处理方法分析 负荷特性曲线变化受到许多相关因素的影响,这些因素的影响使得按时间排列 的负荷历史数据受到噪音污染,破坏了内在变化规律,如果不对历史数据进行建模 前的预处理,很容易导致预测失败,误差较大,影响电网的稳定运行。目前,一般 情况下都采用异常值处理技术或差分平稳化方法对负荷历史数据进行预处理。我们 知道,这类方法通常是强行将历史数据序列消减为振幅较小的新序列,用此建模进 行预测。分析可知上述常用预处理方法存在三个不足之处:第一,人为消减得到的 平稳化的新序列,一般情况下不能很好的反映因受到因素影响而具有某些特征的预 测日负荷的历史变化情况:第二,预测模型复杂化,由于平稳化后的新序列不含有 和预测日相似的特征,为了使预测结果能够反映预测目的特征,就要对模型考虑增 加各类特征输入项,则使得建模复杂化,但过于复杂的模型并不利于进一步提高预 测精度,还会增加预测工作的难度:第三,对预测结果的人工干预程度难以把握, 由于没有很好的考虑预测日负荷的特征,建模得到初步预测结果后,如何对预测结 果进行合适的修正也是困惑预测人员的一个难题。 针对这些问题,经过深入理论研究和应用分析,本文提出了一种以联合数据挖 掘技术对负荷历史数据进行预处理的新方法。由于目前考虑最多的影响因素是气象 因素,所以,本文针对气象因素介绍联合数据挖掘技术的设计。首先,通过天气预 报了饵到预j 9 | l | 日的气象特征,再通过模椒分类方法找出与预测目具有同等气象类型 6 华北电力大学硕士学位论文 的历史日负荷;然后,在关联分析技术的选择下,进一步提取数据,由此组成规律 强化、干扰弱化、具有高度相似气象特征的数据序列;最后,对此构建相应的预测 模型。由于规律强化且含气象特征,因此历史数据序列的变化规律有较大简化,从 而只需要建立相对简单的预测模型,预测结果就自然是含有预测日气象特征的结 果,而不需要再进行考虑气象的人工干预。这样,模型可以准确地反映变化规律, 相对简化后减少了计算误差,且预测结果也已具备天气预报的气象特征,因此,预 测精度必然会有较大提高。 2 3 数据挖掘 数据挖掘( d m ,d a t am i n i n g ) 的概念产生于2 0 世纪8 0 年代末,在9 0 年代获得 了长足的发展,今后仍将是研究的热点领域。 2 3 1 数据挖掘的概念 数据挖掘通常被视为以提取有用信息为目的的“数据簇聚”或“数据产生”的 过程,数据为信息处理者提取新的和有用的规则服务,并能够根据已有的信息对实 际未发生行为的结果做出预测。数据挖掘是从大量数据中挖掘出隐含的、先前未知 的、对决策有潜在价值的知识和规则,提取的知识表示为概念( c o n c e p t s ) 、规则 ( r u l e s ) 、规律( r e g u l a t i o n s ) 、模式( p a t t e r n s ) 等形式。这些知识蕴含了数据库中 一组对象之间的特定联系,揭示出有价值的知识、规则或高层次的信息。数据挖掘 的对象可以是数据库,也可以是文件系统,或其他任何组织在一起的数据集合。 2 3 2 数据挖掘的任务 数据挖掘从一个新的角度将数据库技术、机器学习、统计学等领域结台起来, 从更深层次中发掘存在于数据内部的有效的、新颖的、具有潜在效用的乃至最终可 理解的模式。它的六大类任务是: ( 1 ) 概念描述一特征描述与比较 特征描述是对数据的归属类别的一般特征的概括。特征比较是目标类数据对象 的一般特征同相对( c o n t r a s t i n g ) 类的数据对象特征的比较,目标类和相对类能够 被用户所分辨和指定,相关的数据对象能够通过数据查询得到。 概念描述是最简单的一种描述型数据挖掘任务,它不是对于数据的简单的枚 举,而是对于数据特征的提取和比较的描述,当要描述的概念指的是一类对象时, 也称为类别描述。概念描述的主要方法有归纳、概括、特征提取和比较,它们是完 成数据挖掘的两个主要功能模块一多水平特征提取和比较的基础。 ( 2 ) 关联度分析 关联度分析是指关联规则的发现,这些关联规则能够展示那些在个给定数据 7 一 坐! ! 塑垄查堂堡主兰垡堡奎 一 - - _ _ _ _ _ _ _ j _ _ _ _ - _ - _ _ - _ - 一一一 集中频繁的同时发生的属性值条件。 ( 3 ) 分类与规则 分类是在对训练数据集分析的基础上,分析一组对象的共同特征,寻求能够描 述数据概念、辨别数据类别的模型集合的过程。这种分类描述可进一步用于对数据 库中其它数据分类或上升为分类规则,目的是使用该模型来预测类别标志未知的 类。 预测可看成是建立和使用一个模型来评定一个无标志的样本的类别,或者评定 一个给定样本可能具有的属性值或其范围。从这个观点上说,分类和回归是预测问 题的两种主要形式,分类是用来预测类别量( 离散或标称值) ,回归则用来预测有序 量( 连续值或有序值) ,两者的基本思想是相同的。 ( 4 ) 聚类分析 聚类分析是基于类内部相似性最大化和类别问相似性最小化的原理对要处理 的数据进行聚类或分组,辨识其中感兴趣的数据分布和模式。聚类分析不需要已知 类别标志,但可以用来产生这些标志。聚类是无监督的学习过程。 ( 5 ) 离群点分析 数据库中可能会含有与数据的一般特征或行为不一致的数据对象,这些数据对 象就称为离群点。大多数数据挖掘方法将其作为噪声删除,然而在某些应用中,这 种偶尔出现的事件往往比有规律的事件更有价值。离群点分析的方法主要有统计方 法、距离度量、偏差分析等方法。 ( 6 ) 进化分析 数据进化分析对行为随时间变化的数据对象的规律和趋势给出描述。进化分析 可以包括对时间相关数据的概念描述、关联度分析、分类、聚类等过程,具有时间 序列分析、顺序或周期模式匹配、基于相似度的数据分析的明显特征。 2 4 联合数据挖掘技术的设计 根据数据挖掘的基本概念和基本任务,我们将模糊分类器和灰色关联技术结合 起来,设计了一种联合数据挖掘技术。前面已经说过,目前对负荷特性曲线最重要 的影响因素是气象因素,为了较大地提高负荷预测精度,必须考虑气象因素的影响, 本文也主要是针对气象因素影响进行设计,设计步骤如下: 2 4 1 首先建立负荷特性的影响因素模糊分类器 以日负荷为例,对负荷影响较大且天气预报可以给出的因素有日最高温度、日 最低温度、日平均温度和臼降雨量,如果条件具备还可以增加其它因素。现在对这 四类因素进行模糊赋值分类,分类情况用向量( z ,z :,z 3 ,z ) 表示,z 。,z :,z ,按模糊 8 华北电力大学硕士学位论文 化分别分类为低、中、高,分别取值1 ,2 ,3 ;z 。按模糊化分类为无雨、 雨、大雨,分别取值为0 ,l ,2 ,3 ,则可将每日的历史负荷分类如下; ( 2 1 ) 气温的低、中、高标准,可按本地区的实际情况确定,雨量的小、中、大标准, 也可按地区特点设定,或采用模糊聚类分析方法确定。每日将历史日负荷曲线9 6 点输入数据库时,同时输入每目的气象影响因素的模糊分类标记,例如:昨日最高 温度高,平均温度中,最低温度低,有小雨,则昨日的气象模糊分类类别是( 3 ,2 , l ,1 ) ,这样,每日都有一个气象模糊分类标记。 如果根据气象预报,知道预测日气象类别是( 3 ,2 ,1 ,1 ) ,则从历史负荷库中 反向抽取具有( 3 ,2 ,l ,1 ) 类别特征的历史负荷日,将具有这一气象特征的所有负 荷日抽出,形成一个气象模糊分类库,这个库中的所有负荷日都具有( 3 ,2 ,l ,1 ) 这一气象特征。 2 4 2 运用灰色关联分析选定预测所需负荷历史数据 第一步所建的同一类别气象模糊分类库中的负荷曰,只是挖掘出了粗糙相似的 气象特征,为了提高预测精度,再运用灰色关联分析理论,在分类库中进一步寻找 出与预测日具有高度关联的若干历史负荷日,以这些负荷日作为下一步预测建模的 历史数据。这些历史负荷目,通过联合数据挖掘技术中的分类和关联,达到了在气 象特征上与预测日气象特征的高度一致,用此来建模,无疑将较大地提高负荷预测 的精度。 24 2 1 灰色关联分析理论 关联分析是灰色系统理论提出的一种方法,是分析系统中各因素关联程度的方 法,其基本恩想是根据曲线间相似程度来判断关联程度。 具体计算步骤如下: 1 构造序列矩阵。在通过模糊分类器对历史负荷进行了初步分类挖掘,并形成 了与预测目具有相似气象特征的历史数据分类库后,进一步进行关联排序分析。参 考序列( 又称预测日气象特征) 用r o 表示,若预测曰气象预报为最高气温3 5 0 ,平均 气温2 5 。,最低气温1 5 。,雨量2 0 毫米,则r o = i f 0 0 ) ,瓦( 2 ) ,t o ( 3 ) ,磊( 4 ) ) = ( 3 5 ,2 5 ,1 s ,2 0 ) 。 同理,在已得分类库中的每日气象数据组成比较序列,用五,正,表示,这 + 1 个 序列构成序列矩阵: i 瓦( 1 ) 五( 1 ) ( 1 ) ( t o ,互,疋,) = j i ! j ;j 峨( m ) 正( m ) ,胁) jm 。、 9 嘲邺三 = = | i = 西易磊西 ,、,【 1 1 zz 乏 z 兰! ! 皇垄三! 三堂堡主兰堡垒壅 2 无量纲化:为消除量纲,用“初值化”方法进行数据处理。采用公式: 珊) 2 哿户o 1 ,2 川2 一 ( 2 _ 3 ) 得无量纲矩阵 i 巧( 1 ) 正1 ) 巧( 1 ) i ( 瓦,) = l i ; ;i l ( m ) 五聊) ( ) j ( 2 4 ) 3 计算关联系数 “炉苇篙篇幂拦斧 协j , i = 0 , 1 ,2 ,行;k = 1 , 2 ,一,m 其中,p 为分辨系数,p 0 ,1 】,通常取p = 0 5 ,得关联系数矩阵 阳) :岛一( _ 1 ) k 面:妊) j ( 2 6 ) 4 计算关联度 一当r 。妻k = l 驰) ,2 ,n ( 2 7 ) 2 4 2 2 预测建模所需历史负荷序列的确定 本文以预测日的气象因素指标向量为参考序列t o ,通过模糊分类器所得气象分 类库中所提供历史数据中每一日的气象因素指标向量为比较序列正,计算兀与z 之 间的关联度n 。设定一个阈值口,取关联度一t 2 的负荷日,或者给定一个值, 一般”取5 至7 即可够建模使用,按关联度从大到小的顺序取前九个负荷日,然后 将这些负荷日按时间先后排序作为新的历史数据序列,这样就完成了挖掘提取任 务。 2 5 电力负荷优选组合预测模型 理想的负荷预测模型是在保证预测精度的前提下,使用的计算模型却相对简 化。模型的简化本身也可以降低计算误差,减少编程实现的难度。本文所研方法也 是要达到这一目的。 经过联合数据挖掘提取预处理后的负荷历史数据序列,具有高度相似的气象特 征,变化规律大大强化,大致有平稳变化、平缓下降、快速上升、快速下降这几种 趋势。在此基础上,可以建立相对简单盲勺具有高度相似气象特征的历史负荷优选组 l o 华北电力大学硕士学位论文 合预测模型。 2 5 1 优选组合预测概念 优选组合预测有两类概念,一是将几种预测方法所得的预测结果,选取适当的 权重进行加权平均的一种预测方法:二是指在几种预测方法中进行比较,选择拟台 优度最佳或标准离差最小的预测模型作为最优模型进行预测。例如,设对某一预测 对象厂利用k 个预测方法得到k 个模型的预测值为:( f = 1 , 2 ,k ) ,利用k 个预测值 构成一个对厂的最终预测结果, 即厂= 妒( z , , ) ,特别可取 ik 伊( , ,) = q ,( 其中q = 1 ) ,这就是一种组合预测方式。组合预测方法 是建立在最大信息利用的基础上,它集结多种单一模型所包含的信息,进行最优组 合。因此,在大多数情况下,通过组合预测可以达到改善预测结果的目的。 2 5 2 四种预测模型的建立 为了考虑各变化趋势,分别建立几类预测模型: ( 1 ) 针对平稳变化,建立随机时间序列一阶自回归a r o ) 模型 _ y 。( r + 1 ) = a t + r p t y ( t )( 2 8 ) ( 2 ) 针对平稳上升、下降,建立线性回归模型 y o ) ( 七十1 ) = a + b x ( k + 1 )( 2 - 9 ) ( 3 ) 针对快速上升、下降,建立g m o ,1 ) 模型 y ( ( 七+ 1 ) = ( p 一:一1 ) fx ( 。1 ( 1 ) 一昙i e : l。j ( 2 10 ) ( 4 ) 针对个别可能出现的转折型趋势,建立二次多项式转折型非线性回归模型 y 4 ( i + 1 ) = a + b x ( k + 1 ) + c z 2 ( 七+ 1 )( 2 - 1 1 ) 2 5 3 优选组合预测模型 从以上四类预测模型y “、y ”、y ”、y ( 4 的模型值序列与历史负荷序列的比 较中自动选取标准离差最小、拟合优度最佳的预测模型,作为最后的优选组合预测 模型。 y = ir a i n ( s , ) ) ( 2 - 1 2 ) 华北电力大学硕士学位论文 s = 其中s ,为第i 个模型相对历史负荷序列的标准离差。 2 6 研究算例 ( 2 - 】3 ) 涉及到相关历史数据的可获取性,本文采用日负荷作为预测实例,在相关历史 数据满足的情况下,该方法也可以很好的适用于中长期负荷预测。分析某电网电力 负荷,其变化规律受气象影响十分显著,四季气温变化明显,农业负荷比例较大, 必须考虑气象因素。将本文模型( 简记为d m e c ) 与常用的线性回归模型( 工r ) 、人 工神经网络模型( a n n ) 进行预测精度分析比较,结果见表2 - 1 、表2 - 2 。 塞2 - 22 0 0 3 年7 月l 目一7 日预测相对误差绝对值小于3 的个数 日期7 17 27 37 4 7 57 67 7 三月5 24 3 3 94 44 8 a n6 75 0 5 46 26 q 5 l 4 8 4 7 6 l d m e c7 4 6 5 6 97 58 2 7 67 8 经过比较检验可见,在三种方法中,本文所提方法预测效果最好,精度最高,是一 种新的实用型方法,按此方法处理因素影响问题,能够有效地提高负荷预测的精度; 同时,又能相对简化负荷预测模型,减少对因素影响人工干预判断的困难。将来随 着电力市场的发展,本文方法中还可以考虑加入电价等影响因素。 2 7 本章小结 提高负荷特性预测精度的关键,在于如何对负荷特性历史数据进行挖掘预处 理。本章提出的以联合数据挖掘技术对负荷历史数据进行预处理的方法,可以充分 1 2 华北电力大学硕士学位论文 考虑到气象等相关因素对负荷特性的影响,有效的集中信息。在此基础上,可以在 相对简化预测模型的同时,有效的提高预测精度,还可以减少对预测结果做考虑因 素影响的人工干预方面的工作量,具有一定的实用性。经实际比较检验,可以看到 预测精度确有较大提高。当电力市场条件具备之后,我们还可以考虑提取有相似电 价类型的负荷。只要具有相关所需的数据库,此技术适用于中长期负荷预测以及日 负荷等短期负荷预测。 华北电力大学硕士学位论文 3 1 引言 第三章月度负荷预测模型 前面介绍了基于联合数据挖掘技术的负荷预测建模方法,但是,由于我国电力 企业实现信息化的时间还比较短,一些所需的相关历史数据并不完备,尤其是对于 中长期负荷预测来说,统计数据较少。所以,在目前条件下,上述方法实施起来还 存在一定的困难。针对这一现状,本文又对中长期负荷预测的重要组成部分一月度 负荷预测提出了一种预测模型。月度量是指以月度为尺度的预测对象,比如每月的 网供电量等。对于节约用电、机组维修、实行经济调度、保障社会生产和生活用电, 月度负荷预测都具有重要意义,是电力系统调度、用电和计划部门的重要日常工作。 通过对月度负荷特性数据序列的分析可知,随时间的推移,月度负荷相比于往 年同一月的历史负荷具有明显的增长趋势;同时,春耕秋收、气温升降、产销旺淡 又使月度负荷随季节变化与最近相邻几个月的历史负荷呈现出某种波动趋势。因 此,难以用单一固定式预测模型同时描述这两种不同的变化趋势。目前,专门预测 月度负荷特性的模型并不多,有些文献虽说考虑到了类似的季节型负荷的二重趋势 性,但是并没有充分认识到纵向历史数据和横向历史数据对不同趋势的贡献比重的 不同。 针对这一问题,本文提出一种综合最优灰色神经网络预测模型用于月度负荷预 测,该模型根据灰色g m ( 1 ,1 ) 模型具有较好的增长特性的特点,以往年同一月的历 史负荷,即纵向历史负荷为原始数据对月度负荷时间序列的增长趋势进行建模;根 据人工神经网络( a n n ) 具有较好的描述复杂非线性函数能力特点,以最近相邻若干 月的历史负荷,即横向历史负荷为原始数据对月度负荷的波动趋势进行建模:最后 又引入最优可信度的概念,建立兼有g m ( 1 ,1 ) 和a n n 优点的综合最优预测模型,简称 为o g a n n 。 3 2 综合最优预测模型 3 2 1 有关概念 定义l预测序列与拟合序列,推理序列 设已知某个物理量在历史时段1 t 月的取值依次为_ ,x :,x 。,对未来时段 + 1 ,n 作预测,得到的预测公式为 x t = f ( s ,f ) ,一1 ,2 ,n , 其中,s 为该预测模型的参数向量,例如,对于线性预测模型;_ f ( s ,) = 口+ 6 , 1 4 华北电力大学硕士学位论文 有s = d ,6 】7 。 设得到各时段预测值为x l ,x 2 ,x 一,x ,x na 称x 1 ,工2 ,x n 为原始序列, x ,- ,z ,为预测序列,其中与历史时段对应的子序列一,屯,x 。称为拟合序列, 与未来时段对应的子序列x “,x ”称为推理序列。称历史时段1 茎,r l 为拟合时 段,称未来时段n + l 蔓f 兰n 为推理时段。 定义2拟合残差、方差与协方差 用m 种方法对原始序列,x ,x 。作预测,设其中第i 种预测方法对原始序列 的拟合序列为x 。x 。,则拟合残差为 v = x i t x r ,i = 1 , 2 ,m ;t = 1 , 2 ,。一,h 拟合方差( 残差平方和) 为 h 。= v : i = 1 , 2 ,m ( 3 - 1 ) ( 3 2 ) 对于某两种预测方法f ,的预测结果,设其拟合方差分别为v 。,v ,则类似的定 义两种预测结果的拟合协方差为 = v 。v ,f ,= 1 ,2 ,m t - 1 定义3可信度及综合预测结果 若存在一组权重( f = 1 , 2 ,m ) ,满足 w ,= 1 a l w i 0 ,i = 1 ,2 ,m 并由此构成综合预测模型,其结果为 m m x o ,= h = w l z ( s m r = 1 ,2 ,n 一lf t l ( 3 3 ) ( 3 4 a ) ( 3 4 b ) ( 3 - 5 ) 其中,s ,为第f 种预测模型的参数向量。 称这组权重

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论