知识库在短期电力负荷预测中的应用研究_第1页
知识库在短期电力负荷预测中的应用研究_第2页
知识库在短期电力负荷预测中的应用研究_第3页
知识库在短期电力负荷预测中的应用研究_第4页
知识库在短期电力负荷预测中的应用研究_第5页
已阅读5页,还剩53页未读 继续免费阅读

知识库在短期电力负荷预测中的应用研究.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华北电力大学(保定)硕士学位论文知识库在短期电力负荷预测中的应用研究姓名:屈利申请学位级别:硕士专业:通信与信息系统指导教师:苑津莎;张卫华20071230华北电力大学硕士学位论文摘要摘 要电力负荷预测中非正常日的负荷预测是提高整体预测精度的关键。本文提出了一种基于知识库技术的新型短期负荷预测方法。首先,利用小波坏数据检测原理和软阈值细节消噪法对原始负荷中的坏数据进行预处理。其次,将处理后的负荷数据及其影响因素按照事例推理的表示方法组织成事例型知识库;利用卜最近邻法检索出与待测事例属性相近的相似事例,其中,采用基于粗糙集的权值确定法来确定负荷事例影响因素的属性权值;在事例精简过程中,利用信息熵与主成分分析法联合对相似事例的负荷数据冗余进行约简;利用得到的相似事例的负荷数据对基于动态数值优化算法的BP神经网络进行训练学习;针对非正常日,采用基于决策树的数据挖掘技术构造出修正模型以便进一步修正预测;最后,预测结果按照事例表示方法作为更新资源存储于知识库中;利用本文方法对实际的地区电网进行了测试,结果表明,该方法对于非正常日的负荷预测具有较高的预测精度和较强的适应能力。关键词:短期负荷预测,知识库,事例推理,决策树ABSTRACTThe key to inlproVe the whole load prediction accuracy is properly handling theprediction problem in abno珊al daysA noVel approach f0r Shorrt一7r色m Load Forecasting(STLF)based on knowledge base technology is put f0朋ard in the dissertationFirst ofall,through adjusting amplitude of waVelet modulus maxima and processing the waVeletdecomposed detail signal by soR threshold based on waVelet aIlalysis and singularit)rtheory,fault data in original loads are eliminatedThen,the knowledge base filled withcases is constituted with processed load data and innuential factors which 2ure organizedin according to case presentationThe肛nearest-ne追hbor is applied to find the mostsimilaLr cases whose cases attributes 2Lre nearest with the cases to be predicted,and thea仕ributes weights of innuential factors are calculated by wei曲ts computing based onrou曲setIn the process of extraction,infonIlation entropy and principal componentanalysis are integrated to reduce simil2ur cases s战The processed load sequence fromsimilar cases is used to train the BP neural network based on LeVenberg-Marquardtdynamic numerical optimization algorithm。 Aiming at abnormal days,data miningteclln0109y based on decision-tree is used to construct reVision model so that to make afunher revision on f0recastingFinally,the f0recasting results are preserVed in cases setin according to case presentation as refreshment resourcesThe testing results of STLFin actual power network show that the proposed methodaiming at abnomal day1华北电力大学硕士学位论文摘要摘 要电力负荷预测中非正常日的负荷预测是提高整体预测精度的关键。本文提出了一种基于知识库技术的新型短期负荷预测方法。首先,利用小波坏数据检测原理和软阈值细节消噪法对原始负荷中的坏数据进行预处理。其次,将处理后的负荷数据及其影响因素按照事例推理的表示方法组织成事例型知识库;利用卜最近邻法检索出与待测事例属性相近的相似事例,其中,采用基于粗糙集的权值确定法来确定负荷事例影响因素的属性权值;在事例精简过程中,利用信息熵与主成分分析法联合对相似事例的负荷数据冗余进行约简;利用得到的相似事例的负荷数据对基于动态数值优化算法的BP神经网络进行训练学习;针对非正常日,采用基于决策树的数据挖掘技术构造出修正模型以便进一步修正预测;最后,预测结果按照事例表示方法作为更新资源存储于知识库中;利用本文方法对实际的地区电网进行了测试,结果表明,该方法对于非正常日的负荷预测具有较高的预测精度和较强的适应能力。关键词:短期负荷预测,知识库,事例推理,决策树ABSTRACTThe key to inlproVe the whole load prediction accuracy is properly handling theprediction problem in abno珊al daysA noVel approach f0r Shorrt一7r色m Load Forecasting(STLF)based on knowledge base technology is put f0朋ard in the dissertationFirst ofall,through adjusting amplitude of waVelet modulus maxima and processing the waVeletdecomposed detail signal by soR threshold based on waVelet aIlalysis and singularit)rtheory,fault data in original loads are eliminatedThen,the knowledge base filled withcases is constituted with processed load data and innuential factors which 2ure organizedin according to case presentationThe肛nearest-ne追hbor is applied to find the mostsimilaLr cases whose cases attributes 2Lre nearest with the cases to be predicted,and thea仕ributes weights of innuential factors are calculated by wei曲ts computing based onrou曲setIn the process of extraction,infonIlation entropy and principal componentanalysis are integrated to reduce simil2ur cases s战The processed load sequence fromsimilar cases is used to train the BP neural network based on LeVenberg-Marquardtdynamic numerical optimization algorithm。 Aiming at abnormal days,data miningteclln0109y based on decision-tree is used to construct reVision model so that to make afunher revision on f0recastingFinally,the f0recasting results are preserVed in cases setin according to case presentation as refreshment resourcesThe testing results of STLFin actual power network show that the proposed methodaiming at abnomal day1华北电力大学硕士学位论文摘要possesses higher f0recasting accuracy and better adaptLbilityQu Li(Communication锄dInfomation System)Directed by pr6fYuan Jinsha&instructor Zhang WbihuaKEY WORDS:short-term load forecasting,lmowledge base,casebased reasoning,decisiOntree2声 明尸 明本人郑重声明:此处所提交的硕士学位论文知识库在短期电力负荷预测中的应用研究,是本人在华北电力大学攻读硕士学位期间,在导师指导下进行的研究工作和取得的研究成果。据本人所知,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得华北电力大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。学位论文作者签名: 日 期:关于学位论文使用授权的说明本人完全了解华北电力大学有关保留、使用学位论文的规定,即:学校有权保管、并向有关部门送交字位论文的原件与复印件:学校可以采用影印、缩印或其它复制手段复制并保存学位论文;学校可允许学位论文被查阅或借阅:学校可以学术交流为目的,复制赠送和交换学位论文;同意学校可以用不同方式在不同媒体上发表、传播学位论文的全部或部分内容。(涉密的学位论文在解密后遵守此规定)作者签名:日 期: 日 期:华北电力大学硕士学位论文11选题背景及其意义第一章 绪论电力系统是由电力网、电力用户组成,其作用就是对各类用卢尽可能经济的提供可靠而合乎标准的电能,以随时满足各类用户的需求。但是由于电力的生产与使用具有其特殊性,即电能是不能储存的。这样就要求系统发电出力必须随时紧跟系统负荷的变化,以保持发供的动态平衡,否则,轻则会影响供用电的质量,重则危及电力系统的安全稳定运行。因此,电力系统负荷预测成为工程科学中重要的研究领域,是电力系统自动化中一项重要的内容。另一方面,当前世界各国纷纷通过电力市场化来改革长年以来由于垄断经营而渐渐失去活力的电力企业。电力市场化在电力工业内部引入竞争机制的同时,也给电力系统各部门赋予了新的任务。负荷预测成为电力成交中重要的数据源,为电力公司制定发电计划、检修计划、报价计划及电网规划提供了依据,其预测精度的高低直接影响到电力企业的经济效益。电力负荷预测就是在正确的理论指导下,在调查研究掌握大量翔实资料的基础上,运用可靠的方法和手段对电力负荷的发展趋势做出科学合理的推断n1。根据预测时间跨度的不同,一般可以分为长期、中期、短期和超短期负荷预测【2】。中长期负荷预测一般指以年为单位的时间跨度较长的预测,它们的意义在于帮助决定新的发电机组的安装,包括装机容量大小、型式、地点和时间,以及电网的规划、增容和改建,是电力规划部门的重要工作之一。短期负荷预测是指一年之内,以月、周、日、小时为单位的负荷预测,通常预测未来一个月、一周、一天的负荷指标;超短期负荷预测是指提前1小时、半小时甚至10分钟对负荷进行预测。其意义在于帮助确定燃料供应计划;对运行中的电厂处理要求提出报告,使对发电机组出力变化事先得以估计;经济合理地安排本网内各机组的启停,降低旋转储备容量,在保证正常用电的情况下合理安排机组检修计划。因为负荷预测的周期不同,所采用的算法和考虑的因素也有所不同。对于短期负荷预测来讲,需要充分考虑电网负荷变化规律,分析对负荷有影响的相关因素,特别是气象因素、日类型、供电政策等。对于中长期负荷预测来讲,考虑较多的则是国民经济发展趋势、国家政策的影响等。预测工作的关键在于掌握大量真实的历史数据并对其进行研究,建立有效的负荷模型,并在预测中不断修正完善,使其能真正的反映负荷的变化规律。本文研究对象主要是短期负荷预测。1华北电力大学硕士学位论文能影响短期负荷预测精度的因素有很多,可归结为以下几个方面:(1)待测日的天气状况温度、湿度、风力、气压、降水等天气状况都会影响负荷的大小,但在这些因素当中,温度因素是最主要影响因素。例如:夏季连续的高温天气,使得空调负荷大幅度增长;而突如其来的暴雨带来的气温下降又会使城镇居民用电整体负荷水平下降。(2)节假日目前,十一、春节两个公共七天长假期可被归入节假日负荷,在节假日中,负荷水平比正常日水平明显偏低,特别是春节往往会出现全年的最低负荷。而像新定的元旦、清明、端午、中秋三天短假期的负荷可以参照双休日类型预测。(3)供电政策或特殊事件由电网故障或特殊政治事件、电视节目、体育比赛等特殊事件所引起的负荷变化。负荷预测一方面受负荷的历史表现影响,另一方面也受如上所述众多的非负荷因素的影响。在这些非负荷因素中,有一些因素是无法事先预知的,如电网故障、特殊事件等,但大部分因素如气象、节假日等信息均可以在预测之前得到。因此,如何全面的考虑这些非负荷因素对负荷预测的影响就成为提高负荷预测精度所必须要解决的问题。随着电力系统自动化水平的不断提高,每年积累了大量的负荷及相关数据,采用传统的统计分析方法难以对如此庞大的数据库进行分析。而数据挖掘的主要任务就是从大量数据中挖掘出隐含的、以前未知的、对决策具有潜在价值的知识和规则。这些规则和知识可反映数据集中的复杂关系,总结数据中某一面的特征。因此本文利用数据挖掘的方法,来得到能够反映非负荷因素和负荷之间关系的知识,并将这些知识按照一定的组织方式组织成能被推理系统方便调用的知识库,那么在负荷预测中便可利用这些知识有效提高负荷预测精度。12国内外负荷预测的研究现状近些年来,为了进一步提高预测精度,许多数据分析处理和人工智能等方面的技术已经被广泛地应用到负荷预测领域中。根据所应用的数学工具和负荷预测的发展历程,可分为经典预测方法和现代预测方法【31。下面对这两大类预测方法分别做简要介绍。121经典预测方法经典负荷预测方法是基于各种统计理论或相应的数学知识,对负荷及相应的数2华北电力大学硕士学位论文据进行统计分析,得出相应的函数表达式,并由此进行预测的方法。这类方法主要包括指数平滑法、随机时间序列、多元线性回归、卡尔曼滤波法等。经典预测方法有计算方法简单,运算速度快等优点,在20世纪80年代之前的短期负荷预测系统中应用较多。但其缺点预测精度不高,原因在于对影响负荷的诸多非负荷因素如气象等因素考虑不足。(1)指数平滑法(General Expone“al Smoothing)Hl指数平滑法是把负荷作为其过去相同时刻负荷的的拟和函数,并依据其相关性对其进行加权平均,最后得出待预测时段的负荷值。其表达式为y(f)=O)1厂(f)+s0) (1_1)其中以D为负荷拟和函数,由贝f)=耿f-1)确定,(,)为系数向量,s(f)为白噪声。系数的估计通常采用加权最小二乘法来确定。计算时应该加大新近数据的权系数,减小陈旧数据的权系数,以体现过程的时变性。(2)随机时间序列(Stochastic Time Seriej)【5】【61时间序列法把负荷数据看成是一个时间序列,采用时间序列的方法进行预测。也可理解为把负荷序列看成一个线性滤波器的输出,其输入是一个均值为零的随机序列,如图11所示。在短期负荷预测里这种方法是被应用的最广泛的方法之一。根据滤波器的特性不同,可将其划分为AR、MA、ARMA、A刚MA等。图卜1随机时间序列模型口AR(自回归)模型 在自回归模型中,当前负荷值y(f)被表达成以前时刻负荷值y(f一1),y(f一2)及随机噪声口(f)的线性函数,其表达式为矽(B)yO)=口O) (12)其中矽(B)=1一旃B一唬B2一一丸Bp,召的定义为砂O)=y0一1)。6MA(移动平均)模型在移动平均模型中,当前负荷值y(f)被表达成当前及以前时刻白噪声序列口(D,口(f1)的线性函数,噪声序列是当真实负荷值可以得知时计算出来的残差。其表达式为少0)=秒(召)口(f) (13)其中口(B)=1一鼠B一岛B2一一包B叮。cARMA(自回归移动平均)模型表达式为3华北电力大学硕士学位论文矽(B)少O)=乡(艿)口(r) (14)妒(B),p(B)的定义与式(12)式(1-3)的定义相同。覆ARIMA(季节性自回归移动平均)模型-表达式为(B)VdyO)=目(曰)口O) (15)其中VdyO)=(1一B)dy(r),矽(艿),秒(B)的定义与式(12)和式(1-3)的定义相同。时间序列方法的特点是计算速度快;反映负荷近期变化的连续。 存在的不足:主要是基于对平稳随机时间序列分析来建立模型,对天气等影响因素考虑不足:当原始时间序列不满足平稳性时,其平稳化后建模、辨识比较繁琐【71。(3)多元线性回归(Multiple Linear Regression)【8】多元线性回归是根据负荷过去的历史资料,建立可以进行数学分析的模型,对未来的负荷进行预测,其特点是将影响负荷的因素作为自变量,将负荷作为因变量,利用历史数据得到的经验回归方程,表示变量之间的定量关系,并通过所得方程,预测系统将来的负荷值。多元线性回归所采用的负荷模型如式(16)所示。、y(f)=qo+q五(,)+毛(f)+口O) (16)其中,y(,)为电力系统负荷,五(f)一(r)为影响负荷的因素变量,口(f)为随机向量,且均值为零,龟,qq为多元回归系数。回归分析法的特点是原理、结构简单,预测速度快,外推特性好,对于历史上未出现过的情况有较好的预测值。存在的不足是过度的依赖历史数据,采用线性方法描述比较复杂的情况过于简单,无法详细地考虑各种影响负荷的因素,模型初始化难度较大,需要丰富的经验和较高的技巧。(4)状态空间及卡尔曼滤波分析法【91【101卡尔曼滤波分析法把负荷作为状态变量建立状态空间模型,用卡尔曼滤波算法实现负荷预测。基本方程如下。状态方程X(七十1)=(七)x(七)+形(J|) (1-7)输出方程Z(后)=日(七)X(后)+y(后) 一 (18)其中,X(七)为气时刻下刀1阶状态向量,(尼)为X(后)到X(Jj+1)的刀刀阶状态变换矩阵,且不含强制函数,形(霓)为已知方差Q(妨的珂1阶白噪声,Z(岔)为t时刻下掰l负荷输出,日(后)为X(后)到Z(七)的m以阶状态变换矩阵,不含噪声,矿(后)为已知方差尺(七)的埘1阶负荷输出误差。状态空间法由于卡尔曼滤波算法的递归性质在在线负荷预测中得到了较多的应用。但这种方法是在假定噪声的统计特性已知的情况下得出,实际上估计噪声的统4华北电力大学硕士学位论文计特性也正是这种方法的难点之所在。122现代预测方法上个世纪80年代以来,随着计算机、模式识别、人工智能等领域的不断发展,一些在分类、聚类、优化、信号处理等领域中得到广泛应用并取得较好效果的方法,如模糊逻辑、进化算法、小波技术、人工神经网络、专家系统等,也被引入了短期负荷预测系统中。比起传统负荷预测方法,这些方法的主要优点是能够比较好的考虑各种非负荷因素对负荷的影响,能够较好的处理各种相关因素与负荷之间非线性关系。缺点则是需要对历史数据进行大量的运算,计算量一般较大。(1)模糊逻辑方法电力系统负荷预测问题可作为多输入多输出未知系统来处理,具有去模糊的模糊逻辑系统可以识别和以任意精度在一个简单设备上去逼近任意未知非线性动态系统【“】。具体过程是先将负荷预测的输入、输出空间划分成不等的模糊集合,如高、中、低等,然后用一组模糊规则来表示输入、输出关系。每一条模糊规则是一个模糊IFTHEN关系,关系的前件是对各输入变量不同模糊集合的组合,关系后件是输出变量表达式,输出变量表达式为各输入变量的线性组合,那么第f条规则可表示为:R,:伍五is A;AND恐is A:A巾is A:IT髓N Z=矗+爿五+E吃+Z其中,五,而,毛为输入变量;Ai,A:,A:I为输入变量,吃,的第j个模糊集合;彳是第f规则的输出部分:矗,科,一为输出部分中输入变量五,屯,的系数;“是常数项。对于一组输入变量五,恐,矗模糊逻辑最终输出为各规则输出的加权模糊值。模糊逻辑的优点是能够将日常的一些相对概念以数学的方式表达出来,增强了计算机处理相关知识的能力。缺点是进行模糊化时需要人工进行一定程度的干预,如隶属度的设定、隶属度函数的选择等,这些都会影响模糊逻辑的应用效果。(2)进化算法进化算法借用了生物遗传学的观点,通过自然选择、竞争、遗传、变异等用机制,以达到个体适应性的提高。在负荷预测中,进化算法通常被用做参数的选择。文献【12】提出了基于优进策略的差分进化算法,利用种群繁衍的有用信息改进子代分布,并引入确定性寻优操作,实现了高效全局搜优。文献【13】利用粒子群进化算法进行神经网络初始状态的优化。所以进化算法实质上是一种优化算法,必须和其它的预测方法结合起来使用,预测结果的好坏必然会受到所选择预测方法的影响。但是进化算法的计算量大,因而预测速度较慢。(3)小波分析方法5华北电力大学硕士学位论文小波是90年代初引入工程界的数学工具,被广泛的应用于信号处理的各个领域中。在负荷预测中,小波分析主要被用于负荷序列的分解与重构;负荷序列去噪等。文献【14】利用小波对负荷序列进行了分解,利用AR模型对小波细节分量进行了预测,利用神经网络法对小波的近似分量进行了预测,然后针对所预测的结果进行了重构,从而得出预测结果。文献【l 5】利用小波对负荷序列进行了去噪及趋势分析的工作。小波分析实质上是一个信号处理的工具,在负荷预测中主要被用来对负荷序列进行分解、去噪等工作,因此也必须与其它负荷预测方法结合使用。(4)人工神经网络人工神经网络以其强大的学习能力及对非线性函数的任意逼近能力,在近年来得到了广泛的应用。使用人工神经网络预测负荷,通常需要通过选取过去一段时间的负荷和气象数据作为训练样本,构造合适的网络结构,用某种训练算法对网络进行训练,得出能够满足预测精度要求的神经网络。神经网络总体上可以分为三层:输入层、输出层和中间层【l引。中间层不与实际的输入、输出链接,故又称为隐含层。输入层 隐含层 输出层图12神经网络结构示意图运用神经网络技术进行负荷预测的优点是它对大量非结构性、非精确性规律具有自适应功能,并且还具有信息记忆、良好的鲁棒性、自主学习、逻辑推理和优化计算的特点。其自学习和自适应功能是常规算法和专家系统技术所不具备的。但神经网络也存在需要大量数据进行训练、训练时间较长、解释不足、容易陷入最小极值点等缺点。(5)专家系统预测方法专家系统(expert systems)是人工智能应用的重要分支,它从负荷预测领域内专家的多年运行经验中,寻找影响负荷变化的因素,采用规则的形式形成专家知识库,并在此基础上进行负荷预测。这种基于规则的知识库采用IFTNEN或数学形式。有些规则并不随时间变化,另一些规则则需根据实际情况的变化不断的更新。专家系统是一个用基于知识的程序设计方法建立起来的计算机系统,它拥有某个领域内专家的知识和经验,并能像专家那样运用这些知识,通过推理,在那个领6华北电力大学硕士学位论文域内做出智能决策。一个完整的专家系统是由五个部分组成:知识库、数据库、推理机、知识获取部分和人机接口界面【171。专家系统最重要的部分是知识库,构建知识库不仅需要搜集足够的知识,而且需要将知识转化成能被程序执行的数学规则,即知识的获取。知识获取是构建知识库的难点,因此它也成为构建专家系统的瓶颈。13本论文的主要工作现有的预测方法对于正常日的负荷预测已经能够满足需要,但遇到一些突发的预测问题,诸如影响供用电的政策调整、节假日、天气的突变等,这些方法就显得力不从心。因此,在短期负荷预测过程中如何有效的考虑这些非正常因素对负荷的影响就成为短期负荷预测系统设计的重点和难点。本文提出一种基于混合事例推理技术的负荷预测框架,此时的知识库存放的是另外一种形式的知识,即实际的负荷值和它的影响因素(天气状况、节假日、供电政策等),那么,用知识库积累的针对这些常规因素影响下的实际负荷值去修正预测,或直接用数学模型去训练这些实际负荷值都能得到较其它方法更为满意效果:采用数据挖掘技术从大量的原始数据中找出非常规因素和负荷之间的关系知识,并按照一定的组织规则组织成知识库,用来修正负荷预测,可收到满意的效果。本论文的主要工作包括:(1)通过对负荷特性曲线的深入分析,比较全面准确地确定影响负荷的主要因素。(2)采用小波坏数据检测原理和软阈值细节消噪法对负荷历史数据进行预处理,从而为精确的预测做好数据上的准备。(3)针对事例检索过程中,事例属性权值难以确定的问题,本文引入一种基于粗糙集的权值确定方法,从而确定并给出事例属性的重要度排序,为进一步的事例约简做好准备。(4)本文提出一种将数据挖掘中的信息熵理论和统计学中的主成分分析法相结合解决事例的精简问题的方法。(5)在事例重用环节,考虑到神经网络的收敛性,本文采用收敛性能较好的基于动态数值优化算法的BP神经网络。(6)在修正环节中,本文提出一种基于决策树的数据挖掘方法来构造知识库,修正在非正常因素影响下的预测问题。(7)采用本文所提方法与BP神经网络、自回归动平均(ARMA)模型对实际电网一天的24小时的整点负荷进行预测,对其预测结果运用以下几个性能指标:均方根误差、平均绝对百分误差、最大相对误差、相对百分误差;并绘制出预测曲线。7华北电力大学硕士学位论文第三章_电力负荷的特性分析电力系统的负荷变化是一个非常复杂的问题,一方面它具有很大的随机性和不确定性,另一方面它也具有一定的客观规律,对其变化的特点和规律进行分析是做好短期负荷预测的基础和前提【1引。21负荷的自身特征析。本文以某地区电网2005年全年的历史负荷数据为例,对电力负荷特性进行分(1)全年负荷的总体特点L 蔼裂蕊高一L。一一i一一-叫:涮!图21某地区2005年全年负荷日平均曲线从图21某地区电网2005年全年负荷日平均曲线大致可以看出负荷的年变化规律。夏季负荷比春、秋、冬季负荷明显要高,特别是7、8月份负荷波动比较大,平均电量比其他月份高出了约123倍;冬季负荷比春、秋季负荷稍高,但增长不大。由此可以看出,该地区负荷受民用负荷影响显著,夏季由于气候炎热,降温负荷比较大;而冬季由于气温不是很低,所以取暖负荷较小,这说明负荷受气象因素影响较大。(2)周期性波动特点电力负荷时间序列具有一定的周期性,主要体现在周和日两种周期上。图22所示为该地区电网2005年6月13日至7月17日五周日平均负荷变化曲线。从图中可以看出,电力负荷每周的负荷变化具有很强的规律性,每周星期天的负荷基本上处于最小值,然后开始上升,到周末又下降,这是由于周末部分工业负荷的降低所致。8OOOOOOOOOOOOOOO8642O81,!芝、撂妪华北电力大学硕士学位论文=、棹斌图22华东某地区2005年6月13日至7月17日五周日平均负荷曲线图23所示为该地区电网2004年6月13日至6月19日一周内各日整点时刻的负荷曲线。从该图中可以看出,每天的负荷变化也存在很强的规律性:每天凌晨4点左右负荷达到最小值,然后开始持续上升,到了1l点半左右达到一个高峰值,然后下降,到了中午1点左右达到低谷,在中午1点至2点之间偶尔有一个小波动,然后又持续上升,到晚上7点半左右达到一天中负荷的最大值,接着又开始下降,直至第二天凌晨4点左右达到最小值。负荷每天的周期性非常明显,负荷曲线基本上呈现马鞍型,达到的日峰、日谷、晚峰、晚谷的时间基本上是固定的。但是各日的负荷值并不完全相同,仅具有相似性。18001600重o蓑姗1000800三菇三蘸;醪;趱热三碰一硝蔓:影_-,:罗一¥一:F:p:1 V-_0 24 48 72 96 120 144 168-时间m图23某地区2004年6月13日至6月19日一周日整点负荷曲线22负荷与非负荷因素之间的关系电力负荷不可避免的受到一些非负荷因素的影响,如气象情况、待测日类型等。在短期负荷预测当中,对预测精度影响最大的就是气象因素。因此,如何在负荷预测当中有效的考虑这些非负荷因素对负荷的影响就成为提高负荷预测精度的关键。在众多影响负荷的非负荷因素中,节假日和气象因素是对负荷影响较大的因素。下面分别对节假日和气象因素对负荷的影响加以讨论。 (1)节假日因素对负荷的影响9华北电力大学硕士学位论文1800兰瘫1400l 22 43 64 85 106 127 148 169 190 2ll 232时间H图24某地区十一期间的负荷曲线由图24可以看出,节假日、尤其是类似于五一、十一及春节的长假期对负荷的影响非常大。这是由于大多数单位都处于放假状态,同时也有大量的居民外出旅游,造成了节假日期间高峰、低谷负荷都显著降低,且峰谷差变小,也就是说,负荷峰值的减少量要比负荷低谷的数值减少更大一些。同时可以看出,在节假日的前一天的下午,负荷已经有所下降,然后在公共假期的第三天的低谷时段,负荷达到最低值,然后缓慢回升,直到节假日结束后两天才缓慢回升到正常水平。另外在节假日期间,负荷曲线的形状也与正常日有所不同,表现在早峰值下降较大,一天内的最高负荷通常会出现在晚峰时段。这是因为由于大部分工业部门由于职工放假停产,导致早峰值下降较大,而居民在晚上时的照明、日常生活用电相对来讲下降较小,因此每日最高负荷出现在晚峰时段。但由于受到居民外出旅游的影响,晚峰负荷比正常日负荷也有较大下降。(2)气象因素对负荷的影响气象因素是影响负荷的另一个重要因素。尤其随着人民生活水平的不断提高,电炊、空调负荷和冬季取暖负荷占总体负荷的比例也不断上升,如何考虑气象因素对负荷的影响已经成为影响负荷预测精度的最重要的因素。气象因素包括气温、湿度、气压、风向、风力、降雨量、云量等多种数据,经过研究发现,气温因素对负荷的影响最大,湿度对负荷的影响是通过影响人体对外界温度的感觉而实现的。气压、风力、风向对负荷的影响则相对不固定,云量对负荷的影响则主要表现为对照明负荷的影响。由于照明负荷在负荷总量中所占比例不断下降,因此本文暂不考虑其对负荷的影响。在下文将着重分析温度负荷的影响。10华北电力大学硕士学位论文, - 温度摄氏度图25温度负荷散点图40由图25可以看出,温度和负荷之间的关系是一个非线性的关系。大致来说,温度对负荷的影响可分为三个阶段。当温度低于15时(这种情况多出现在冬季),取暖负荷的存在是温度影响负荷的主要原因,此时温度和负荷之间的关系为负相关,当温度降低的时候,负荷增加。当温度高于15同时又低于25时(这种情况多出现于春秋两季),此时外界环境温度适中,在这个范围内的温度变动对负荷基本没有影响。当温度高于25时(这种情况多出现于夏季),此时温度对负荷的影响主要通过空调负荷来实现,温度与负荷的关系为正相关,温度上升的时候,负荷增加。另外从图中我们也可以看出,夏季最高负荷要比冬季最高负荷高,也就是说,一年内负荷的最高点出现在夏季。23本章小结本文从负荷的自身特性和负荷与非负荷因素之间的关系两方面分析了负荷变化的全年总体特性、周期波动性,以及节假日、气象因素对负荷的影响。从而为进一步的负荷预测做好准备。抛啪鲫姗咖,llll_蓬斌华北电力大学硕士学位论文第三章 电力负荷数据的预处理由于获取的原始负荷数据来自于电力系统的SCADA数据库,在数据采集、转换、传输的各个环节都有可能受到干扰或发生故障,导致数据异常。另外,当系统出现故障、系统失去负荷、短时的系统冲击负荷、瞬时故障跳闸、重合闸以及出现拉闸、限电等现象时,这些突发的负荷变动显然会对负荷的规律性造成破坏。由随机干扰和冲击负荷导致电力系统历史负荷反常态势的数据统称为异常数据,它们将以伪信息、伪变化规律的方式提供给负荷预测作为参考,必然影响负荷预测的精度和可靠性。因此,在建立负荷预测模型之前,对原始负荷数据进行预处理是必要的。31电力负荷中异常数据的处理对于电力系统负荷中异常数据的识别及处理,研究人员已经提出了一些方法,如:经验修正法、分时段设定阈值法、曲线置换法、数据对比法、插值法、概率统计法等。这些方法对于大段异常数据连续存在的情况,易产生误判和漏判。因此,近年来,人们又开始致力于数据挖掘方法对异常数据的处理。数据挖掘方法中,可先利用聚类算法从大量可能含有异常数据的负荷曲线中提取特征模式(把聚类中心矢量作为负荷特征模式),然后利用分类算法将含有异常数据的曲线模式同特征曲线模式分开来实现异常数据的辨识,再采用适当的调整方法进行异常数据修正。由于此法可以准确确定异常数据出现的位置,所以是负荷预测中数据预处理的常用方法,但这种方法不能对随机干扰导致的异常数据进行处理。随着小波理论的发展,根据小波分析和局部坏数据原理,通过模极大值的调整和细节信号的软阈值处理来检测并消除异常数据的方法得到了广泛的推广。本文采用了小波坏数据检测原理与软阈值细节消噪法,并通过具体的负荷预测实例与聚类分类法【19】进行对比,验证了所选方法的合理性和正确性。311利用小波坏数据检测消除冲击负荷由小波奇异点检测的基本原理可知,如果选择小波函数为平滑函数的一阶导数,对信号进行多尺度分析,在信号异常点处,其小波变换后的系数具有模极大值。由于小波变换每一尺度的局部模极大值浓缩了该尺度的主要信息,故由伪数据引起的异常信息将主要通过模极大值体现,因此,通过小波变换的模极大值点可以检测到信号中可能的异常点并进行处理20】【211。具体的检测与消除方法如下。设第f天,时刻的负荷经小波变换后第J尺度的小波变换值为巩(f,)。计算模极大值为。若l形(f,-,一1)ll形(j,)l n l彬(f,j+1)lo唬:羔畋(f,),E(f,_,)o 3-1则趣=髓:急ji力三臻 p2,式中,七l、娩可根据实际情况选择,二般取1315,045O5。(2)对只有正模极大值的分解结果,计算平均值旷=圭E(f,歹) (3-3)M一4、。,则形一cL-,=O (4-4)其中,C。表示事例索引,五,而,表示影响CI所代表的刀个属性,F表示Cl关于毛(1f,z)的函数。42事例的获取与表示事例在基于事例推理方法中占有比较重要的地位,整个的推理过程也是以此为基础而展开的。但要事例为计算机所用,还需要让计算机能够识别事例的内容,也就是说,要通过一定的方法将人类处理问题的知识和经验转换为在计算机中存储的能够被计算机使用的信息。这涉及到两个方面,一是事例的获取,一是如何对获取的事例进行知识表示【2引。421事例的获取事例的获取可以分两步进行,一是广泛搜集阶段,主要是搜集大量的、能够覆盖其应用领域的原始资料;二是对收集来的资料进行筛选,选取具有一定代表性的内容来进行使用。对于第一个阶段,主要是和该领域专家进行沟通,对该领域的知识和经验进行合理的划分,得到需用的信息。在这个过程中,难点是如果专家的知识没有明确的定义,就无法有效地进行知识获取、需要由软件设计人员和领域专家之间进行沟通。但一般来说,这个问题还是比较容易的,相比较规则的获取,其无疑能节省大量的时间。对于第一阶段收集到的资料还是比较粗糙的,还需要进一步的选取。可以用事例比较优选规则:时效性,相似性,预测相似性来对事例进一步细化。(1)时效性可供参考的事例中,近期的比早期的更有参考价值。对于负荷预测来讲,近期的负荷数据更能比较近似的描述当前的问题。(2)相似性。 也就是事例与当前规划的近似程度。事例的匹配比较灵活,对某个指标,其值在一定范围内,就可以认为事例的该指标与当前规划是匹配的。因此,对所有匹配指标可以综合处理,得出相似性指标,来判断事例近似当前规划的程度。18华北电力大学硕士学位论文(3)预测相似性用模型对事例和当前规则做各种预测,根据其结论的相似程度,可以判断事例与当前规划的近似程度。应用到负荷预测上,就是要搜集大量的历史负荷数据,及其对应的影响因素,如气温,降水,节假日等。当然,近期的负荷数据相对于早些的能更好的预测当前的负荷值,历史数据的影响因素与当前的的越相似,那么精确预测就越有利。422知识的表示所谓知识就是人通过实践认识到的客观世界中的规律性东西【291。它反映了客观世界中事物之间的联系。知识是信息经过加工整理、解释、挑选和改造而成的。知识表示是研究用什么形式将领域知识存入计算机以便进行处理的方法。它是将领域知识概念化、形式化与符号化的过程,其主要目的是寻找知识与表达之间的映射关系,并将知识转化为计算机内部的表示形式。在事例推理过程中,获取的事例只有存储于数据库中才能方便被计算机处理,这是就涉及到人类的自然语言到机器语言的转换,首要解决的问题就是如何表示这些事例。一般来说,事例的内容要包含事例的特征、事例的解决方案。事例作为一种特殊的知识其表示方法主要可从两个方面入手进行研究:一是对计算机可理解的知识表示形式进行研究;二是对不同类知识的表达方法、度量计算等的研究。知识表示主要包括两个过程:一是将现实世界的领域知识抽象为信息世界的概念化、形式化模型;二是将信息世界的概念化、形式化模型转化为机器世界的知识表示模型。人工智能中常用的几种知识表示方法有:谓词逻辑法、语义网络法、框架表示法、面向对象的表示等【301。(1)谓词逻辑法谓词逻辑法采用谓词合适公式和一阶谓词演算把要解决的问题变为一个有待证明韵问题,然后采用消解定理和消解反演来证明一个新语句是从已知的正确语句导出的,从而证明这个新语句也是正确的。谓词逻辑是一种形式语言,能够把数学中的逻辑论证符号化。谓词逻辑法常与其它表示方法混合使用,灵活方便,可以表示比较复杂的问题。(2)语义网络法语义网是Ouil 11and等人在1968年提出的,它是用一种采用有向图的知识表达方式。结点表示客体、客体性质、概念、事件和行为等,有向边则表示客体间的联系。(3)框架表示法框架表示法由美国著名的人工智能学者明斯基(MLMinsky)在1975年提出,称为框架理论,是一种理想的结构化知识表示法,是一种定型状态的数据结构。它的1 9华北电力大学硕士学位论文顶层是框架名,用以指定某个概念、对象或事件,其下层由若干个槽(s16ts)组成。每个槽由槽名和槽值组成。槽用来描述框架表示的实体的各个属性。对于比较复杂的框架,每个槽又可由多个侧面(facets)组成,各个侧面从不同的方面来描述槽的特性。每个侧面由侧面名和侧面值组成。无论是槽值还是侧面值,一般都事先规定了赋值的约束条件,只有满足条件的值才能填进去。槽值有四种填写方式:口靠上下文提供;6通过默认值隐含;c通过属性继承获取;矗通过附加过程推理得到。框架之间具有属性继承关系,即下层框架可以继承或修改上层父辈框架的属性值。还可以通过槽值为另一个框架名的嵌套连接成横向关系。整个框架系统由纵、横向联系成一个具有层次的网络结构。框架推理由上下文中的数据选择候选框架,通过上下文查询、默认、继承、附加等过程获得属性值,按照框架中各个槽的次序填入,使候选框架具体化,以生成一个能描述当前问题的实例。框架知识库是一种基于“抽象一一具体概念的层次型构造,上位框架为抽象度较高的信息,下位框架表达较具体的信息,最下位框架对象对应于各个具体的事例。由于知识库中框架之间的联系比较清晰,使一贯性的库管理得到有利的保证,加之推理完全接近人类的认识过程,因此框架知识表示非常适合于建立比较复杂问题的知识表示系统。(4)面向对象的表示法随着面向对象技术的应用和发展,面向对象的知识表示方法己被应用于人工智能和专家系统领域。一般地,用面向对象的类或对象表示知识的方法,都可以称为面向对象知识表示(Object Orineted Knowledge Representation,简称OOKR)。OOKR借助面向对象的抽象性、封装性、继承性和多态性,以抽象数据类型为基础,能方便地描述复杂知识对象的静态特征和动态行为。从本质上讲,00KR是将多种单一的知识表达方法按照面向对象技术的设计原则组成一种混合的知识表达形式。43事例推理的组织结构基于事例的推理系统主要由事例检索匹配、事例修正、事例重用、事例保存【29】等步骤组成,可以将CBR看成是一个闭合的自更新的循环过程(见图41)。20华北电力大学硕士学位论文图41事例推理流程图具体可以分为一下几步:(1)事例检索,就是根据问题描述,事例检索匹配机制从事例库中查找一个与当前问题相匹配的事例集即相似事例集。(2)事例的重用,把检索过程获得的事例(或事例集)中的信息和知识复用到新问题上。对于简单的分类问题,仅需要把旧事例的分类结果直接应用于新事例,它无需考虑新旧事例之间的差别。而对于问题求解类的问题,则需要对领域知识深入理解,根据事例之间的不同对问题进行调整,可以是对整个解的某一项作一些调整,也可以对整个解进行调整。复用的信息内容主要有两种类型:结果的复用和方法的复用。对于结果的复用,当旧事例的解答结果需要调整时,它依据一些转换操作知识,把旧事例中的种种可能解转换为新事例中相应的解。方法的复用则主要关心事例中问题的求解方法。(3)事例的修正,根据重用的结果进行评价,并修正为满足新事例的解决方法;当复用阶段产生的求解结果不好时,需要对其进行修正。修正的第一步是对复用结果进行评估,如果成功,则不必修正,否则需要对错误和不足进行修正。进行结果评估,可以依据它在实际环境中运行后的反馈,也可以通过向专家询问完成。等待反馈有时可能需要花一段时间。简单的修正只需要对过去解中的某些组成部分进行简单的替换,复杂的修正甚至需要修改过去解的整体结构。修正可以在新解的形成过程中完成,也可能是当新解在执行过程中出现了问题再来做。修正一般有这样几21华北电力大学硕士学位论文种形式:在旧解中增加新的内容,或从旧解中删去某些内容,或对旧解中的某些内容进行替换,或对旧解中的某些部分进行重新变换。修正有四类方法:替换法、转换法、特定目标驱动法、派生重演法。替换法把旧解中的相关值作相应替换而形成新解。包括重新例化、参数调整、局部搜索,查询、特定搜索、基于事例的替换6种。转换法包括常识转换法和模型指导修补法。前者使用明白易懂的常识性启发式从旧解中替换、删除或增加某些组成部分,典型的常识转换法是“删去次要组成部分。后者通过因果模型来指导如何转换。特定目标驱动法主要用于完成领域相关的修正,或结构修改。该法使用的各种启发式需要根据它们可用的情景进行索引。特定目标驱动的修正启发式知识一般通过评价近似解作用,并通过使用基于规则的产生式系统来控制。上述三种方法所做的修正是在旧解的基础上完成的。派生重演方法是使用过去推导旧解的方法来推导出新解,这种方法关心的是解是如何求出来的。(4)事例存储,就是将事例集修改的结果形成一个完全满足问题描述的答案,该结果同时作为一个新的事例经索引机制组织到事例库中以备将来使用。44事例检索事例检索是从事例库中找到一个或多个与当前问题最相似的事例。CBR系统中的知识库不是以前专家系统中的规则库,它是由领域专家以前解决过的一些问题组成。事例库中的每一个事例包括以前问题的一般描述即情景和解法。一个新事例入库,同时也建立了关于这个事例的主要特征的索引。当接受了一个求解新问题的要求后,CBR利用相似度知识和特征索引从事例库中找出与当前问题相关的最佳事例,由于检索所得到的事例的质量和数量直接影响着问题的解决效果,所以此项工作比较重要。它通过特征辨识、初步匹配、最佳选定三个子过程来实现【3l】。441检索过程检索的过程主要分为三步,首先是对事例特征进行辨识,其次是按照一定的算法进行事例的初步匹配,最后根据初步匹配的结果进行求精,得到最佳选定内容。(1)特征辨识特征辨识是指对问题进行分析,提取有关特征。特征提取方式可以从问题的描述中直接获得问题的特征。例如,以自然语言对问题进行描述,并输入系统,系统提取关键词获得问题的某些特征;也可以对问题经过分析理解后导出特征,如图像分析理解中涉及的特征提取;或者根据上下文或知识模型的需要从用户那里通过交互方式获取特征,由系统向用户提问,以缩小检索范围,使检索的事例更加准确。22华北电力大学硕士学位论文(2)初步匹配初步匹配是指从事例库中找到一组与当前问题相关的候选事例,这是通过使用辩识获取的特征作为事例库的索引来完成检索的。由于一般不存在完全的精确匹配,所以要对事例之间的特征关系进行相似度估计,它可以是基于上述特征的与领域知识关系不大的表面估计,也可以是通过对问题进行深入理解和分析后的深层估计。在具体做法上,则可以通过对特征赋予不同的权值体现不同的重要性。相似度评价方法有k一最近邻法、知识引导法和归纳索引法等。(3)最佳选定最佳选定是指从初步匹配过程中获得的一组候选事例中选取一个或几个与当前问题最相关的事例,这一步和领域知识关系密切。可以由领域知识模型或领域知识工程师对事例进行解释,然后对这些解释进行有效测试和评估,最后依据某种度量标准对候选事例进行排序,得分最高的就成为最佳事例,比如最相关的或解释最合理的事例可选定为最佳事例。442检索算法检索算法是检索过程中的一部分,但因为检索算法的优劣直接影响整个的检索过程,在事例的检索中占有比较重要的地位。很多关于事例推理的研究重点就放在了检索算法的探讨上。同时,数据结构和算法之间有着紧密相连的关系,因此探讨检索算法必须和事例库的组织结构联系在一起,不同的事例库组织自然要有相应的不同算法来检索。表结构或平面组织结构是一种简单的组织,而树和图结构则是复杂的组织。不同的事例组织有利有弊,依照具体情况而定。CBR中的研究人员已形成了一系列的事例组织和检索的策略和算法,这些策略和算法有串行的、有并行的;有平面型的、有层次型的;有在细粒度级上建立索引以区别不同事例的,也有在粗粒度级上建立索引的。用的最多的则是倒排索引之类的方法,既可以采用串行也可用并行策略来检索。最常用的检索方法有如下三种【3I】:k一最近邻法、归纳索引法以及知识引导法。最近邻法是普遍采用的一种方法,它通过计算事例属性之间的距离来判断事例的相似度,但该种方法会随着事例的个数增多而线性增长。因此,当事例库较小时k一最近邻法是较合适的。而事例较多时,需要对该种方法进行适当的改进。采用归纳索引法可以确定哪个特征在区分事例时最好,此方法能生成一棵决策树,它可以有效地组织事例。知识引导法与SQL查询类似,能返回在一定参数值范围内的所有事例。知识引导法一般用于使用其他技术之前,如在使用k一最近邻法之前,可先用知识引导法减小近邻法的搜索空间。23华北电力大学硕士学位论文45基于事例推理的特点和意义基于事例推理方法由于涉及到认知学和人工智能两个学科方面的内答,具有非常鲜明的特点,这些特点在下节同其他求解方法比较时进行讨论。451与其它问题求解方法的比较首先基于事例推理方法与基于统计方法的比较,它们都是问题求解时常用的方法,基于统计方法在利用大量标准化数据验证己知假设时,效果良好。但在进行探索性的分析、结果未知的情况下效果较差,在应用时很难增添常识或背景知识;CBR由于集成了数字方法和符号方法,因此可以有效的应用背景知识。与信息检索方法的比较,CBR和信息检索(Infomation Retrieval,IR)都是从数据源中检索信息,都为用户提供了灵活的数据查询手段,最终的结果都是相关数据的集合,而不需要精确的匹配。但两者还是不同的,首先,IR方法主要处理文本数据j而CBR方法通常运用在复杂的数据表示之上,如由实数、整数、符号、字符串构成的多维数据;其次,IR方法可以处理大量的数据,可以搜索大量的文档,CRB这方面的能力相对有限;第三,IR系统的运行独立在用户求解任务之外,它提供的是可用于多种任务的通用的索引和检索机制,但是对于特定的查询,精确度较低;CBR系统利用问题求解过程中的相关知识建立有效的索引,提高索引的精确度;第四,CBR系统通常有明确的知识系统,而IR系统没有。在与数据库技术进行比较时,数据库系统在查询和输入信息时,必须精确匹配,而CBR系统的目标是找出最相似的事例,事例的某些属性可能与查询不同甚至矛盾,在CBR系统中,某一事例是否被选中,除与自身内容相关之外,还取决于同其竞争的其它事例。而且,CBR系统中的查询和检索比数据库系统中的查询和检索更为积极,问题输入与事例的结构往往不同,事例本身的结构也不完全相同,因此在查询和检索过程中需要动态地调整问题描述的结构。再同传统的基于规则系统(RuleBased Reasoning:RBR)进行比较,开发基于规则的专家系统用以解决复杂的实际问题是一项十分困难的工作。主要困难之处在于规则必须由相关的人类专家提供,而专家虽然能够较好地解决实际问题,但是往往不擅长于解释解决问题时应用的因果关系,尤其困难的是用语言描述严格的逻辑规则来表达知识。CBR系统提供了系统构建和维护的方法,专家通过给出实例而不是规则来描述知识。基于事例的方法是增量的,即系统可以学习在实践中获取的新知识,这一维护任务在基于规则的系统中更加困难,因为新增的一小部分必须由规则完全覆盖,这就降低了效率,增加了维护难度,最重要的是可能导致不完整的问题覆盖,影响问题求解。24华北电力大学硕士学位论文同经典机器学习方法比较,机器学习中学习和问题求解明显是分离的,学习是对培训样本分析以提取函数和规则,问题求解是应用这些函数解决新的问题,在CBR系统中两者不是分离的。机器学习的算法更侧重于学习而不是问题求解,CBR更强调利用记忆解决实际问题;基于事例的方法与符号分类算法的一项主要区别在于学习知识的表示,符号分类方法将知识彻底规范化、抽象化,如果说这一过程类似程序编译执行的话,CBR的过程更类似是解释执行。同神经网络比较,在弱知识环境下,当数据无法用符号表示时,神经网络比CBR的性能更好,如雷达信号的识别,同时它可以很好地应用于原始数据较繁杂的模式识别问题,能够有效地排除小的干扰。但是神经网络不适合应用于需要考虑背景知识的领域,它无法处理复杂的结构,为了获得好的性能,在学习阶段必须尽可能地穷举,它以黑盒子的方式工作,缺少透明度,系统决策的有效性无法判别。系统的输出是权矢量的函数,这一函数依赖网络结构的选择和学习模式的应用。452基于事例推理的特点从基于事例推理的基本构成和推理过程和以上进行的比较可以看出,一个CRB系统具有如下特点【33】:(1)学习是CBR的基本功能。这种学习就是基于事例的学习。在一个CRB系统中,问题求解的结果总是作为新的事例存放到事例库中作为积累,这无疑为今后系统求解相同或类似问题带来了极大的方便;(2)检索系统是CBR的核心,检索系统一般包括检索机制和索引机制,索引机制关系到把当前已经推理出的结果如何保存到事例库中; (3)CBR求解问题的方式是直截了当的,它跳过了依赖问题求解知识进行规则化抽象这一间接层次。如果说从解决复杂问题的数学模型法到专家系统的以规则或知识为中心的方法是问题求解模型认识上的一大飞跃,那么从以规则或知识为中心的方法转变到从事例到事例的问题求解思想又是一个新的进步。当然,在CBR中并不排斥领域规则知识的使用,就如专家系统也不排斥定量的数学模型使用一样,规则知识的引入在CBR中往往是为了进一步提高问题求解的效率,同时如何结合基于规则推理和基于事例推理目前也是一个研究的方向;(4)CBR系统容易建立和维护。由于它把知识获取的任务简化为建立事例描述方法和从专家那里搜集事例,因此可以杜绝知识获取中知识畸变的一些环节,从而有利于克服专家系统构造中的瓶颈问题。453应用基于事例推理的意义基于事例推理在知识获取、知识维护等方面都具有先天的优点,在专家系统中的应用具有很好的前景。在知识获取上,这个问题一直是基于知识的系统的瓶颈问25华北电力大学硕士学位论文题。开发基于规则的知识系统时,获取规则或模型非常繁琐,需要领域专家和知识工程师的反复密切合作,在某些领域,还有许多知识不能很好地为人类理解,因而无法用规则、逻辑、数学模型、甚至一般的数据形式表达。而基于事例推理存储的是事例,事例的表示可以是数据、表格甚至图形等任何目标解形式,获取非常方便。在知识维护方面,随着系统的运行,知识系统由于初始的知识不完善常常需要更新。因为领域规则之间、领域规则与控制规则之间仍有许多依赖关系,这使得系统添加或修改知识的调试工作量很大。此外,新的知识可能会与原有知识产生冲突,导致非常大的系统变动。基于事例推理则有效地解决了知识表达困难或无法表达的领域问题。对于改进问题求解效率和质量上,CBR可以将与当前目标事例相似的源事例展现在人们面前,供参考修改。CBR系统还可以提供对旧事例的调整手段,尽管专家们在设计分析能力上极强,但由于工程众多且庞杂,他们不可能牢记所有的调整细节,而CBR系统却能相对容易地达到目的。而且,由于CI通系统记录了过去求解问题时的失败或成功信息,使得求解新问题时可避开错误的途径,改进了求解质量。并且由于基于事例推理的根据是历史事实,对用户有说服力,用户会更愿意选择基于事例推理的方法。46本章小结用于电力负荷预测的模型内核事例推理,融合了人工智能和认知科学的一些思想,本章分别从基本概念、组织结构、优点意义等方面入手介绍这一人工智能领域的新方法。在第五章中,将通过具体创建过程和实例更为详细的探讨这些方法的应用及效果。26华北电力大学硕士学位论文第五章 基于知识库的短期负荷预测方法本章研究一种新的基于混合事例推理的负荷预测系统,讨论知识库中事例的表示、检索、约简、推理等方法。文申引入一种基于粗糙集的权值确定方法,研究确定事例属性的重要度排序。文中还提出一种将数据挖掘中的信息熵理论和统计学中的主成分分析法相结合解决事例的精简问题的方法。对于非正常因素影响的负荷预测,本文给出一种基于决策树的数据挖掘方法,确定影响因素与负荷的关系,以修正预测负荷。由于自然因素及人为因素的影响,短期负荷预测具有明显的周期相似性【34】,包括不同日之间24小时整体变化规律的相似性;不同星期、同一星期类型日的相似性;工作日和休息日各自的相似性:不同年度的重大节假日负荷曲线的相似性。事例推理的主要思想是运用已存在的对问题求解的成功事例去预测相似的问题【351。所以考虑到电力负荷曲线的周期相似性特征,将事例推理应用到负荷预测中是合理的。基于这一想法,本文提出一种基于混合事例推理的负荷预测系统,其中,知识库承载的是各种因素影响下的历史负荷,为了消除影响因素和负荷序列自身的冗余,粗糙集用来确定负荷事例属性权重,并消除重要性低的属性;信息熵和主成份分析结合消除负荷序列自身的冗余。另外,对于非正常因素影响下的预测,本文提出一种基于决策树的数据挖掘方法,挖掘出负荷与影响因素的潜在关系知识以修正预测。51基于事例推理预测模型的构建511混合事例推理的过程从系统结构上看,混合事例推理是一个闭合的自更新的循环过程,这个过程一般由以下几个步骤【36】(见图51)组成;(1)事例表示:按照一定的数据结构将待测新问题表示成便于检索的结构型事例。 (2)事例检索:依据待测事例属性的相关信息,从事例库中检索出与待测事例属性相似的事例集;(3)事例精简:就是运用信息熵和主成分分析的方法处理负荷数据,得到精简事例集;(4)事例重用:就是将精简后的负荷数据输入到神经网络中去训练;(5)修正事例:进一步对负荷进行修正,以减小预测误差: (6)事例存储:将新生成的解事例按照一定的组织方式作为事例库的更新资源保存到事例库中。 27华北电力大学硕士学位论文512负荷事例的表示方法图5一l混合事例推理流程事例表示是CBR中一个重要的问题,是用一定的数据结构来描述事例的特征,并以此组建事例库作为事例推理的检索知识资源。在事例库中,事例可用对象来表示,对象是属性和方法的封装。在事例的对象表示中,属性表示问题的特征,方法则表示事例推理过程3 71,包括事例检索匹配、调整、重用和保存。一个负荷事例可定义为如下结构的对象:Class CaseCaseID: 事例编号WeekType;星期类型(工作日、星期六或星期天)SeaSonType; 季节类型L0adCondition;负荷条件TempCondition;温度条件DayType;预测日日期类型(正常日或节日)Restore(); 事例存储函数Match(); 事例相似性匹配函数Similarity; 相似度)其中Restore()表示事例存储方法,通过向事例对象发送消息,可以调用该函数将对应的事例信息存入事例库中;Match()是相似性匹配函数,用于计算该事例与目标事例的相似度,并用计算结果修改Similarity属性的值;Similari锣表示该事例与目标28华北电力大学硕士学位论文事例之间的相似程度,其初始值为O,实际值由相似性匹配函数在系统推理过程中填写。5。13事例检索事例检索就是通过相似性匹配从事例库中检索出与预测事例条件属性相似的事例集。检索过程首先要做到检索出来的事例尽可能与预测事例相似,其次还要做到检索出的事例尽可能少。所以为了便于在事例库中快速寻找相匹配的事例,事例库中的历史事例应该按照各种使用方式建立索引。如将预测点当天的星期类型、负荷条件、温度条件作为事例的索引。系统则先根据当前预测问题的实际情况从事例库中选取具有相同星期类型;接着需定义合适的相似度指标以衡量目标事例与历史事例间的相似程度,进而依据相似程度的大小选出与目标事例条件最接近的最佳历史事例。5131基于粗糙集的事例属性匹配权重的确定为了消除影响因素,本文提出一种基于粗糙集的权值确定方法,从而确定并给出事例属性的重要度排序,消除重要性低的属性,为进一步的事例约简做好准备。对于一个四元组S=,彳,y,厂),U为对象的非空有限集合,称为论域;么为属性的非空有限集合。彳=C UD,Cn D=g,C称为条件属性集,D称为决策属性集;矿= U y口,圪是属性口的值域;厂:u厂_y是一个信息函数,它为每个对象的每个属性磺予一个信息值,即v口4工u,厂(x,口)y。给定一个知识表达系统s=(u,么),等价关系R把集合涮分为多个互不相交的子集,每一子集称为一个等价类,用uR来表示。于是有R x=Uy【,JRlyx)凡z=Ul,uRlj,n xa),分别称它们为z的上近似和下近似38m916(X)=尺一足称为x的尺边界域,即论域的不确定域,如果边界区砌R为空,的,反之是粗糙的。令P和Q为U中的等价关系,Q的P正域记为pD如(Q)鼍U只(5-1)(5-2)(5-3)则称X关于R是清晰(5-4)Q的P正域是U中所有根据分类卯的信息可以准确地划分到关系Q的等价类中去的对象的集合。知识的依赖度定义为七=柞(Q)=lpD雌(Q)|Jul (5-5)属性约简是粗糙集理论的核心内容之一。知识库中的属性并不同等重要,即在保持知识库分类能力不变的条件下删除其中不相关或不重要的属性,提取出最能反29华北电力大学硕士学位论文映系统特征和变化规律的属性与规则,使系统达到最简化0m帅幻。射怯糯黼鲠性c功:嘲 侉6,(功:艄 (56客观权重计算方法综合权重吃(D)一七。(D)吼2=(57)【七(D)一一,(D)】r叫锡=级+(1一)A (5-8)其中p是主观权重,提客观权重;是经验因子,反映了决策过程中决策者对主观权重和客观权重的偏好程度,越小,表明决策者越重视专家的经验知识:越大,表明决策者越重视客观权重。粗糙集是针对离散条件域进行属性的约简,要将它用于连续数据上必须将它离散化,将连续数据离散化的方法有多种,这里选用模糊理论汹“儿453,因为它充分考虑了类内元素的可分辨性,尽可能的降低因离散化带来的信息损失。模糊理论下的粗糙集其上下近似分别定义为纷|:r(巧)=nlin盹(力,以(x) Vf (5-9)心x(巧)=磁x(1一如(x),以(x) Vf (510)论域U中元素腺属于模糊正域的定义为(x)=心(x)(曲 (5-11)对应的知识依赖度为 艇洲,砟(Q)=l心唧。口,(x)IIuI=,彰以嘶。口,(石)|ul (5-12)这里引用某一电业局历史负荷的相关数据,以日最大负荷为例,引用粗糙集理论来选择、约简与待预测日相关的属性集。过程如下:预测日前七日内与负荷相关的属性,即每日最高温度(k)、最低温度()、平均温度(乙)、湿度(日)、风速(形)、降水(P)、时间段(,)、日期类型(D)、季节类型(S)、最大负荷(乙),列出作为条件属性,将待预测日的最大负荷作为决策属性构建初始决策表,30华北电力大学硕士学位论文表51初始属性集接着用上面介绍的粗糙集属性约简算法约简初始属性集,得到原表的最小约简和相关属性的重要度,表52列出的是约简后的属性表,从中可以看出,各属性之和是0998,说明约简后的属性几乎可以代表初始属性。将约简后的条件属性集作为事例的特征属性,再经事例检索、匹配得到于预测日前七日内相似的事例,不仅仅与预测日当日相似,因而比只运用预测当日相似事例更合理。本文采用基于粗糙集的属性权值确定方法分析除事例属性的重要度排序j约简掉重要度低于某一阈值的事例,使得检索时间缩短,表52约简后的属性集5132扣最近邻法目前,采用的检索方法主

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论