




已阅读5页,还剩61页未读, 继续免费阅读
(计算机应用技术专业论文)基于支持向量机的电力系统短期负荷预测模型研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大连理工大学硕士学位论文 摘要 短期负荷预测是电力系统调度和计划部门安排购电计划和制定运行方式的基础,是 保障电力系统安全和经济运行的一项重要手段。准确的负荷预测不仅可以帮助电力企业 经济地安排电网发电机组的起停,合理制订机组检修计划,减少不必要的旋转储备容量, 保证电网运行的安全稳定性,同时是建设电力市场,实现促进电网和供电企业参与市场 竞争、提高电力行业经济效益和社会效益的基本工作内容之一。 电力负荷预测工作的核心是预测的技术方法,即如何分析电网的实际负荷特性,结 合实时运行情况,建立合理和准确的预测数学模型,设计高效的计算方法,得出精确的 预测结果。本文在云南电网机组检修、运行优化项目的基础上,以云南电网总网的平均 负荷为研究对象,研究了基于支持向量机预测方法( s v m ) 的短期负荷预测模型。 短期负荷预测指的是对未来一天到几个月的负荷预测,而最为典型的是对未来天 的日负荷曲线预测,这也是本文研究的对象。文中首先介绍了研究课题的理论基础,包 括电力系统负荷预测的基础理论和支持向量机基础理论。接着,针对云南电网总网的短 期负荷特性,着重分析了了其主要影响因素,建立了云南电网的s v m 短期负荷预测模 型。针对s v m 方法,通过对不同的核函数、参数的预测结果的对比,确立了最优的核 函数和相关参数。然后,利用改进的s m o 训练算法进行网络训练,最终确定了s v m 网 络结构,并将其应用于云南电网总网提前一天的负荷预测中。最后,对预测结果进行误 差分析,并与传统的b p 神经网络的预测结果进行比较,证明s v m 预测方法具有更高 的预测精度,本文建立的s v m 短期负荷预测模型符合项目要求的预测精度,完全适用 于云南电网。 关键词:短期负荷预测:负荷分析;支持向量机;贯序最小优化;径向基函数 贺嫒嫒:基于支持向量机的电力系统短期负荷预测模型研究 i n v e s t i g a t i o no nas h o r t - t e r ml o a df o r e c a s t i n go f e l e c t r i cp o w e r s y s t e mb a s e do ns u p p o r tv e c t o rm a c h i n e a b s t r a c t t h es h o a t t e r ml o a df o r e c a s t i n g ( s t l f ) i sad a i l yr o u t i n ei nt h eo p e r a t i o n so fe l e c t r i c p o w e rs y s t e m a c c u r a t es t l fp l a y s a ni m p o r t a n tr o l eb o t hi np r o d u c t i o np l a n n i n g ,u n i t m a i n t e n a n c es c h e d u l i n g ,e c o n o m i c a la n ds a f er u n n i n g ,w h i c hd i r e c t l yi n f l u e n c e st h ep r o f i to f t h ee l e c t r i cu t i l i t ye n t e r p r i s e s ,a n di nt h ec o n s t r u c t i o no fe l e c t r i cp o w e rm a r k e t ,w h i c hn e e d c o m p e t i t i o nm a de c o n o m i ce n s u r eb e t w e e nt h ee l e c t r i cp o w e rc o r p o r a t i o n s t h ec o r eo ft h es t l fi st h ef o r e c a s t i n gt e c h n o l o g y ,w h i c hn e e d sc o n s t r u c tt h e m a t h e m a t i cm o d e lo f t h er e a ll o a da tt h eb a s i so f t h ea n a l y s i so f i t ss p e c i a l i t y ,a n dt h e nd e s i g n t h ee f f e c t i v ea l g o r i t h mt oo b t a i na c c u r a t er e s u l t s b a s e d0 1 3t h ep r o j e c to fu n i tm a i n t e n a n c e s c h e d u l i n go fy u r m a ne l e c t r i cp o w e rn e t w o r k ,t h i sp a p e rr e s e a r c ho nt h ed a i l ya v e r a g el o a do f m a i np o w e rn e t w o r k ,a n das t l fm o d e lb a s e do nt h es u p p o r tv e c t o rm a c h i n e ( s v m ) i s p r o p o s e d t h ec o n t e n to fs t l fi st of o r e c a s tt h el o a do f n e x td a y se v e nt on e x ts e v e r a lm o n t h s a n dt h em o s tt y p i c a lo n ei st of o r e c a s tt h ec u r v eo fd a i l yl o a do fn e x td a y s ,w h i c hi sa l s ot h e r e s e a r c ho b j e c to f t h i sp a l : e r i nt h i sp a p e r f i r s t l yt h et h e o r e t i c a lb a s i sa r ei m r o d u c e d w h i c hi n c l u d et h eb a s i ct h e o r i e s o fs t l fa n dt h eb a s i ct h e o r i e so fs v m s e c o n d l y c h a r a c t e r i s t i c so fs h o r t - t e r ml o a do fm a i n p o w e rn e t w o r ki sa n a l y z e d ,b a s e do fw h i c ht h em a i ni n f l u e n c ef a c t o r sa r ec h o o s e d a n dt h e s v m f o r e c a s t i n gm o d e li se s t a b l i s h e d t ot h es v mn e t w o r k s e v e r a lk e r n e lf u n c t i o n sa n d p a r a m e t e r sa r et r i e d ,a n db yt h ew a yo fs t a t i s t i c ,t h em o s ts u i t a b l ek e r n e la n dr e l a t e d p a r a m e t e r sa r ec h o o s e d t h e nt h es v mm o d e ii s t r a i n e da n df i n a l l ye s t a b l i s h e db ya i m p r o v e dt r a i n i n ga l g o r i t h mn a m e ds e q u e n t i a lm i n i m a lo p t i m i z a t i o n ( s m o ) a tl a s tt h e m o d e li su s e di ns t l fo fy u m l a np o w e rn e t w o r k b yt h ee r r o ra n a l y s i so ft h er e s u l ta n d c o m p a r ew i t hb pn e t w o r k ,t h es v mm o d e li sp r o v e dt ob em o r ee x c e l l e n c e a n df i tf o r y u n n a np o w e rs y s t e m ss t l f k e yw o r d s :s h o r t - t e r ml o a df o r e c a s t i n g ;l o a da n a l y s i s ;s u p p o r tv e c t o rm a c h i n e s e q u e n t i a lm i n i m a lo p t i m i z a t i o n :r a d i a lb a s i cf u n c t i o n 独创性说明 作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理 工大学或者其他单位的学位或证书所使用过的材料。与我一同工作的同志 对本研究所做的贡献均己在论文中做了明确的说明并表示了谢意。 作者签名:堡煎选日期: 大连理工大学硕士研究生学位论文 大连理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位论文版权使用 规定”,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子 版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内 容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论 文。 作者签名:斑麟 导师签名 盈红 刎年j 月上曰 大连理工大学硕士学位论文 1 绪论 1 1 电力系统负荷预测的基本理论 1 1 1 电力系统负荷预测的概念和特点 电力负荷是指各用电单位或用电设备使用电力和电量的具体数量。也可以说,负荷是 指发电厂、供电地区或电网在某一瞬间所承担的供电量。对用户来说,用电负荷是指连接 在电网的用户所有用电设备在某一瞬间所消耗的功率之和。电力系统负荷预测中的负荷概 念,是指国民经济整体或部门或地区对电力和电量消费的历史情况及未来的变化发展趋势 。电力负荷预测就是在正确的理论指导下,在调查研究掌握大量资料的基础上,运用可靠 的方法和手段对电力负荷的未来发展趋势做出科学合理的推断口j 。这里,既可以是对电量的 预测,也可以对功率进行预测,但一般是以预测功率为主。 由于负荷预测是根据电力负荷的过去和现在推测它的未来数值,所以负荷预测研究 的对象不是确定事件。电力负荷未来的发展受到多种多样复杂因素的影响,很难把握这 些因素在未来某一时刻的状态,只能在一定的条件下,进行一定简化并做出若干假设得 到预测结果。通常我们需要做出多种假设和简化,选用不同的预测方法,所以负荷预测 具有不确定性、多条件性和多方案性的特点。 1 1 2 电力系统负荷预测的原理和步骤 虽然负荷预测有以上特点,但是负荷预测也是有一定的规律【引。首先,电力负荷的 发展是有一定规律的,这是进行预测的基础:其次,电力负荷的发展是一个连续统一的 过程,其未来发展是这个过程的连续;再次,各地区、各年段电力负荷的发展具有一定 的可比性、相似性。因此,通过对历史数据的分析,找出其内在的规律,按照一定的科 学原理,可以对电力负荷的发展做出相应的估计,并使其尽可能地接近实际情况。 总的来说,负荷预测有以下几个基本步骤 4 : ( 1 ) 明确负荷预测的内容和要求,确定要作的预测属于哪种类型,应满足哪些标准, 根据具体情况制定预测计划; ( 2 ) 资料的搜集和整理: ( 3 ) 选择预测模型,进行预测。 l1 3 电力系统负荷预测的分类 目前,从不同角度来说,电力负荷预测分为以下几类: ( 1 ) 按时间分类 贺媛媛:基于支持向量机的电力系统短期负荷预测模型研究 电力负荷预测按时间期限分类,通常可分为长期、中期、短期和超短期负荷预测【5 】。 长期负荷预测一般指1 0 年以上并以年为单位的预测,主要用于电源和网络的发展 及电力系统的远景规划,一般需要数年至数十年的负荷值,并受国家政策、地区的社会 经济、人口、气候等因素的影响,涉及许多不确定问题。 中期负荷预测指5 年左右并以年为单位的预测,主要用于水库调度、机组检修、交 换计划和燃料计划,帮助决定新的发电机组的安装( 包括装机容量大小、型号、地点和 时间) 与电网的规划、增容和改建。 短期负荷预测是指一年以内,以月为单位的负荷预测,还指以周、天、小时为单位的 负荷预测。通常预测未来个月、一周、一天,甚至一天中各时段的负荷值。短期负荷预 测主要用于火电分配、水火电协调、机组经济组合、交换功率计划、确定燃料供应计划、 合理安排机组的检修计划、对运行中的电厂处理要求提出预告,使对发电机组出力变化事 先得以估计。 超短期负荷预测是指对未来1 小时、0 5 小时甚至几分钟的预测,主要反映负荷在 短时间内的变化规律,即反映负荷的上升、下降或水平趋势及变化值,用于质量控制和 自动发电控制( a g c ) 、安全监视和紧急状态处理。 ( 2 ) 按行业分类 一般来说,按行业可以分为城市民用负荷预测、农村负荷预测、商业负荷预测、工 业负荷预测等,不同类型的负荷有不同的变化规律【6 j 。 民用负荷主要是城市人口的用电负荷,它与人们的日常工作、生活的规律密切相关, 具有明显的随季节转变而变化的特点,将直接影响电力系统峰值负荷的季节性变化。而 且,随着人们生活水平的逐渐增高,各种电器设备的广泛使用,民用负荷具有逐年增高 的趋势,使得它占整个电力系统负荷的比例越来越大,其季节性变动特别是在夏季和冬 季,对峰值负荷季节性变动的影响都会越来越大。以上民用负荷的特点,尤其在我国大 中城市的用电负荷调查中表现得特别明显。 工业负荷则是指各厂矿用于工业生产的用电负荷。工业负荷有其自身的特点,一般 不受季节或气候变化的影响,通常组成电力系统负荷的基本负荷。 商业负荷主要是为从事商业经营或围绕商业的其它的些服务行业,如:餐饮、娱 乐部门等提供照明、动力、通风和空调等用电负荷。其特点是具有季节性和易受天气变 化的影响。随着人们物质生活的日益丰富,生活质量地大大提高,加快了商业、餐饮和 娱乐等部门的发展,其用电负荷也随之加大。当然,商业负荷在电力系统负荷中所占的 比例是远远不及民用负荷和工业负荷,但是必须注意在电力系统每天晚高峰负荷中商业 大连理工大学硕士学位论文 负荷的影响也是相当大的。另外,在节假日时,其他用电负荷基本上处于较低水平,而 商业负荷却正是处于最高用电阶段,所以商业负荷在节假日必须引起充分重视。 农村负荷主要是广大农村所有的用电负荷,包括居民生活用电和从事农业生产相关 的用电。由于农业生产的特点决定了农业负荷易受地理、季节、气候等自然环境的显著 影响,且与排灌等情况密切相关。 ( 3 ) 按负荷特性分类 根据负荷表示的不同特性,负荷预测可分为对最高负荷、最低负荷、平均负荷、负 荷峰谷差、高峰负荷平均、低谷负荷平均、平峰负荷平均、全网负荷、母线负荷、负荷 率等类型的负荷预测,以满足供电、用电部门的管理工作的需要。 1 1 4 电力系统负荷预测的意义 电力负荷预测是电力系统规划、调度等管理部门非常重要的工作之一。在电力系统安 排生产计划和实际运行的过程中,负荷预测起着非常重要的作用,从大的方面说主要有以 下几点: ( 1 ) 电力部门进行市场运营的的需要 电能无法储存的特点决定了电力生产“即产即销”的特点,即整个生产与消费必须 同一瞬间完成。所以,在电力市场环境下,电力负荷预测同电力市场的发、供电公司都 有密切联系。 首先,对于各发电公司来说,发电量不足或发电量过剩,都给影响发电公司的经 济效益;另外,为提高发电机组运行可靠性、延长机组寿命,电力公司每年必须定期 对发电机组进行检修。这些都需要对电网负荷进行准确的预测,以便于各电力公司对 所属的各电厂制定相应的生产计划和检修计划口】。而发电公司在出售电能前制定实时电 价的时候由于需要既保证赢利,又要保证电价的竞争力,必须制定出合理的实时电价, 这也需要对短期负荷预测的结果进行参考。 另一方面,各供电公司由于需要自负盈亏,也需要根据负荷预测的数据制定购电计 划。以免由于购电量不足,使整个电网的可靠性无法得到保障;或购电量过剩,造成浪 费,带来经济上的损失【8 。 ( 2 ) 电力系统安全分析的基础 电力事故所造成的经济损失和社会影响是巨大的,必须尽量避免。负荷预测为基础 是进行电力系统安全、发现系统临界状态的重要依据,这些信息将帮助和提醒调度员进 行必要的操作以确保电力系统的安全性。 ( 3 ) 实时调度和负荷管理的参考 贺媛媛:基于支持向量机的电力系统短期负荷预测模型研究 对于实时调度来说,负荷预测的信息给了调度员一个实时信息,以保证调度员经济、 可靠的在线工作。 负苟管理,主要是通过调整用户的用电负荷和用电时间,削峰填谷,提高负荷率,搞 好均衡发供电和用电,以充分发挥现有电力设备的潜力【9 】。它对于缓解电力供应的紧张状况, 发挥了积极的作用。而准确的负荷预测能够为负荷管理提供重要参考,便于电力企业在负 荷高峰期采取有效的负荷管理措施来保证电力供应。 ( 4 ) 电源建设、发展规划的依据 全国性的电力规划从宏观上规定了全国电力工业的发展水平、发展速度、能源动力 资源的需求量,电力工业发展的资金需求量,以及电力工业发展对人力资源的需求量。 而全国性的电力负荷预测,为编制全国电力规划提供了一个依据。 而地区或电网范围内的电力负荷预测成果,则是地区或电网范围内的电力规划的基 础,它为地区或电网的发展速度、电力建设规模、电力工业布局、能源资源平衡,地区 或电网间的电力余缺调剂,以及地区或电网资金和人力资源的需求与平衡提供可靠的依 据 “。 综上所述,负荷预测是电网运行计划、实时控制和长期发展规划的前提。准确的系 统负荷预测,对编制发、供电计划,经济合理地安排电网内部发电机组的起停,合理安 排机组检修计划,保持电网运行的安全稳定性,减少不必要的储备容量,有效地降低发 电成本等都有很重要的意义。 可以说电力负荷的预测,直接关系到电力系统的安全经济运行和国民经济的发展。 因此,做好电力负荷预测的研究工作,是一项重要而迫切的工作。 1 2 电力系统负荷预测的国内外发展现状 电力系统负荷预测问题的核心是预测技术。已有的负荷预测方法可分为传统的经典 数学方法和智能技术两大类。 1 2 i 传统预测方法 传统的负荷预测方法主要是基于各种统计理论的时间序列分析方法,如卡尔曼滤波 法、b o x - j e n k i n s 法、回归分析法、灰色预测法和分解模型法等。其主要思想是是基于负 荷形状及函数形式对负荷进行研究,把负荷预测的不确定性归结为随机性,运用概率论 和数理统计的方法进行处理。 ( 1 ) 回归分析法 大连理工大学硕士学位论文 回归预测是根据历史数据建立数学模型,用数理统计中的回归分析方法对数据进行 统计分析,从历史数据的变化规律寻找自变量( 影响预测目标的因素) 和因变量( 预测目标) 之间的回归方程,确定模型的参数,据此作出预测。它分为一元线性回归、多元线性回 归、一元非线性回归和多元非线性回归 1 0 】,它的预测精度比较高,适用于中、短期负荷 预测。但缺点是需要样本量大,且要求样本有较好的分布规律,当预测的长度大于原始 数据长度时,其预测结果的精度不能保证。 ( 2 ) 时间序列分析法 时间序列分析法是将历史数据中的因变量( 预测目标) 和自变量( 影响预测目标的因 素) 均看成随机变量,电力负荷的历史资料就是一个时间序列,用这个序列对电力负荷 变化的规律和特性进行分析,以此来建立和估计产生实际序列的随机过程的模型,其中 用这个数学模型一方面描述电力负荷这个随机变量变化过程的统计规律性,另一方面在 该模型的基础上再建立负荷预测的数学表达式,从而实现对未来负荷的预测。时间序列 分析法主要有自回归模型( a r ( p ) ) 、滑动平均模型( m a ( q ) ) 和自回归滑动平均混和模型 ( a r m a ( p ,q ) ) 等【 。由于时间序列方法是假定负荷曲线是平稳的时间序列,但实际电力 系统的负荷并非平稳时间序列,所以利用它来预测周末、节假日或季节变化周期时,预 测精度就比较差,同时复杂的模型技术和巨大的计算量也是它的不足【”。 ( 3 ) 趋势外推法 电力负荷一方面有其随机性、不确定性,同时在一定的条件下也有明显的变化趋势。 趋势外推法通常用描散点图的方法定性的确定变化趋势类型,再按照该变化趋势对未来 负荷情况做出预测【。其优点是只需要历史数据、所需的数据量较少,缺点是如果负荷 出现变动,会引起较大的误差。 ( 4 ) 卡尔曼滤波法 卡尔曼滤波法是建立状态空间模型,把负荷作为状态变量,用状态方程和量测方法 来描述。卡尔曼滤波法递推地进行计算,适用于在线负荷预测。这是在假定噪声的统计 特征己知的情况下得出的,而估计噪声的统计特征是个难题。 ( 5 ) 灰色预测法 灰色预测法是- , e e 对含有不确定因素的系统进行预测的方法,它将一切随机变化量 看作是在一定范围内变化的灰色量,常用累加生成( a g o ) 和累减生成( i a g o ) 的方法将杂 乱无章的原始数据整理成规律性较强的生成数据列。用灰色模型( g m ) 的微分方程作为电 力系统单一指标( 如负荷) 的预测时,求解微分方程的时间响应函数表达式即为所求的灰 色预测模型,对模型精度和可信度进行校验并修正后即可据此模型预测未来的负荷 1 4 】。 贺嫒媛:基于支持向量机的电力系统短期负荷预测模型研究 灰色系统预测法可分为普通灰色系统模型和最优化灰色模型两种。普通灰色系统模 型是一种指数增长模型,当电力负荷严格按指数规律持续增长时,此法有预测精度高、 所需样本数据少、计算简单等优点,但对具有波动性变化的电力负荷,其预测误差较大。 而最优化灰色模型可以把有起伏的原始数据序列变换成规律性增强的指数递增变化的 序列,大大提高了预测精度和灰色模型法的适用范围 1 ”。灰色预测法适用于短期负荷预 测。 传统预测方法考虑的影响因素较少,具有建模简单、易于实现的优点。缺点是:模 型的定阶求解识别困难;模型的适应性不强,模型与数据不分离,且建模所需数据量大, 运算速度不理想,精度不尽如人意等。 1 ,2 2 负荷预测技术的新进展 近年来,随着科学技术的迅速发展,新的预测方法不断出现,为电力负荷预测问题 的研究提供了有力的工具。新发展起来的负荷预测方法主要有:人工神经网络预测法、 模糊预测法、专家系统预测法、优选组合预测法、小波分析等。这些负荷预测方法除了 考虑负荷形状等因素外,还涉及影响负荷的许多外在因素,如天气状况、日期特征等, 因而预测精度有进一步提高,具有较好的发展前景。 ( 1 ) 模糊预测法 模糊预测法是建立在模糊数学理论上的一种新技术。模糊理论是解决不确定、不完 全信息日题的一种有效方法。在电力负荷预测中,存在着大量的不确定因素,很难进行 精确的描述和表达。九十年代以来,模糊理论在电力负荷预测中的应用逐渐展开【1 6 1 。 目前,模糊理论在电力负荷预测的应用研究主要集中于两个方向:一是基于模糊理 论的电力负荷预测方法,其主要基于模式匹配的思想,利用模糊集理论在处理从大量数 据中抽取出具有相似性的代表量和非线性问题的强大功能,通过对历史数据的模糊化处 理和分析,将大量看似杂乱无章的原始数据整理成规律性很强的数据排列,提炼出负荷 相关环境及负荷变化的若干种典型模式,通过判定未来待预测环境属于哪种模式,最终 建立负荷预测模型,实现负荷预测;二是将模糊逻辑与传统数学模型预测方法、神经网 络及专家系统预测方法相结合的电力负荷预测方法研究【” 。 模糊理论方法的优势在于处理负荷预测中的不确定因素的有效性,但是在自学习、 自适应能力等方面还需要进一步的深入研究。 ( 2 ) 小波分析 小波分析是上个世纪数学研究成果中最杰出的代表,它作为数学学科的个分支, 吸取了现代分析学中诸如泛函分析、数值分析、f o u r i e r 分析、样条分析、调和分析等众 大连理工大学硕士学位论文 多分支的精华,并包罗了它们的特色。小波分析是一种时域一频域分析方法,它在时域 和频域上同时具有良好的局部变化性质,并且能根据信号频率的高低自动调节采样的疏 密,它容易捕捉和分析微弱信号以及信号、图像的任意细小部分【l 引。 电力系统中日负荷曲线具有特殊的周期性,负荷以天、周、年为周期发生波动,大 周期中嵌套小周期。根据样本数据的实际情况,短期负荷预测将涉及一个较宽的频带 可以负荷序列进行小波变换,将负荷序列分别投影到不同的尺度上,使用正交二进 制小波变换,将各个尺度近似地看作各个不同的“频带”,这样各个尺度上的子序列分 别代表了原序列中不同“频域”的分量,他们更加清楚地表现了负荷序列的周期性。在 此基础上,对不同的子负荷序列分别进行预测。由于各个子序列的周期性更为明显,显 然采用周期自回归模型( p a r ) 的预测结果也就更为精确。最后通过序列重组,得到完整 的小时负荷预测结果,其精确性比直接用原负荷序列进行预测有一定的改进1 1 。 ( 3 ) 人工神经网络预测法 人工神经网络是由多个神经元连接而成,用以模拟人脑行为的网络系统。它通过学 习获得合适的参数,用来映射任意复杂的非线性关系。 目前在负荷预测问题上应用最广泛、最成熟的人工神经网络是b p 神经网络。由于 它出色的学习能力和处理输入输出变量间非线性关系的能力,避免了建模过程的复杂 性、困难性,也提高了计算时f 司:另外,由于它的自适应性,每一时刻都可以选择新的 训练样本来估计和调整系统参数,提高了预测精度。但是它本身存在着固有缺陷,如隐 层神经元的选择不易把握、收敛速度慢、无法实现所有网络权值及结构参数同时优化、 易陷于局部收敛等问题。同时,作为传统的神经网络算法,由于其只追求训练误差最小, 而可能导致推广能力下降,从而不总能达到好的预测效果。另外,在小样本学习方面也 存在缺阿2 0 之2 1 。 ( 4 ) 专家系统 专家系统是一个基于知识的知识处理系统,它拥有某个特殊领域内专家的知识和经 验,并能象专家那样运用知识,通过推理在某个领域内作出智能决策 2 3 1 。九十年代初, h ok l ,h s uyy 2 4 j 等提出基于专家系统通过推理进行预测的短期电力负荷预测方法, 并在台湾电力系统中投入应用,其预测精度基本令人满意,但其自学习和自适应能力有 待提高。专家系统方法的优势在于它可以避开复杂的数值计算而使问题得到解决,系统 结构简单、清晰,对于预测过程和预测结果具有良好的透明性。 然而,知识库的构建是专家系统方法的难点。目前知识库往往是通过访问有关领域 专家来获取相关知识,再将其表示成能够采用计算机程序表达的形式来实现。这一过程 存在着许多不足,如专家知识存在着主观性、不确定性,不完全性,往往造成知识冗余、 贺嫒媛:基于支持向量机的电力系统短期负荷预测模型研究 蕴涵、矛盾、遗漏:计算机程序不一定能够准确、完全地表达专家的知识等f 2 ”。如何实 现预测知识的自动获取是专家系统方法进一步发展的关键所在。 ( 5 ) 数据挖掘技术 数据挖掘f d a t am i n i n g ) 是2 0 世纪末刚刚兴起的数据智能分析技术,它又称为数据库 中知识发现( k n o w l e d g ed i s c o v e r yf r o md a t a b a s e ,简称k d d ) ,是一个从大量数据中抽取 挖掘出未知的、有价值的模式或规律等知识的复杂过程【26 | 。数据挖掘的显著特点就是它 强大的数据处理能力,能从大量的数据中发现有用的规律、规则、联系、模式等知识。 电力系统的数据类型多样,数据量巨大,特别是电力市场化后,历史负荷数据十分 惊人。在这种情况下,仅靠传统的分析处理方法已捉襟见肘,而数据挖掘可以从海量数 据中发现许多有用的信息,正是解决这个难题的有力工具。 决策树技术是数据挖掘中的一个重要分支,可用于解决高维数据的分类问题,具有分 类速度快、精度高、生成的模式简单等优点。文献 2 7 提出一种决策树和时间序列相结 合的负荷预测模型,可以有效地计及气象等相关因素对负荷的影响。并将这种影响直观 地以“知识树”的形式显示出来,同时预测人员也可根据自己的专家知识和实践经验对 “知识树”进行修正。, 数据挖掘作为一门新兴的技术,目前在电力系统负荷预测方面的应用尚处于探讨阶 段,其在负荷预测方面将有广泛的应用前景。 ( 6 ) 优选组合预测 优选组合预测技术有两层含义 2 8 :一是从几种预测方法得到的结果中选取适当的权 重加权平均:另一层含义是,可在几种方法中比较,选择标准偏差最小或拟合度最佳的 种方法。 组合预测方法是建立在最大信息利用的基础上,它集结多种单一模型所包含的信 息,进行最优组合。因此,在大多数情况下,通过组合预测可以达到改善预测结果的目 的 2 9 - 3 0 1 。 ( 7 ) 支持向量机 支持向量机是由v a p n i k 在统计学习理论基础上提出的一种新的通用学习算法,它 基于经验风险最小并不能保证期望风险最小的理论,提出了结构风险最小化原理,相对 于基于经验风险最小化原理的传统机器学习算法,它具有更出色的学习性能和推广能 力,能收敛于全局最优解,且在样本有限的情况下性能优越,被认为是神经网络的替代 方法,已成为机器学习界研究热点之一 3 l - 3 3 1 。目前,已应用于解决非线性分类、模式识 别、函数拟合等问题口。然而,作为一种新兴技术,它在许多方面其中还有很多尚未解 决或尚未充分解决的问题【3 5 l 。 大连理工大学硕士学位论文 本文主要是通过对这一理论技术的研究,提出了对云南电网短期负荷预测算法的改 进,后文将详细介绍这一预测理论技术。 1 3 本论文的主要研究内容 电力系统负荷,尤其是短期负荷,对于电力系统的优化运行是极为重要的因素。电 力系统机短期经济运行计划的制定,需要以精确的负荷预测数据为基础,来合理地安排 系统内各发电机组的启动和停止,以保证发电容量的合理调度,满足给定的运行要求, 同时使发电成本最小,维护电力系统的安全性、稳定性和经济性。目前,云南电网负荷 预测数据主要依靠取历史相似日数据,再由人工调整获得,其准确度与预测人员的经验 有很大的关系,预测精度也远远不能满足项目需求。在这种情况下,寻找一种科学有效 的预测手段成为迫在眉睫的事情。本文就是在这种背景下,将目前一种较新的支持向量 机算法引入云南电网短期负荷中,以云南电网的历史负荷数据为基础,在总结现有理论 成果的基础上主要对支持向量机的训练算法、参数选取以及核函数的构造、短期负荷特 性以及预测模型进行研究。预测结果与传统的b p 神经网络进行对比,证明其预测精度 优于b p 神经网络算法。 本文所作的工作如下: ( 1 ) 以云南电网的负荷为例,进行短期负荷特性分析,从而为后面提出预测模型提 供依据; ( 2 ) 针对传统b p 神经网络易陷于局部最优点、需要大量训练样本的缺点,本文建 立了在有限样本情况下学习和推广能力更强、具有全局最优解的s v m 短期负荷预测模 型: ( 3 ) 对负荷数据的处理,首先对历史负荷数据进行平滑处理,去除伪数据( 即那些不 符合概率统计的随机干扰,如人为或设备原因的停电等原因造成的数据) ;然后,将负 荷数据归一化处理,建立样本集; ( 4 ) 研究了s v m 的网络结构。根据s v m 的算法特点,通过对选取不同核函数和参 数的预测结果进行比较,从而确定了最优核函数和参数: ( 5 ) 以云南电网的负荷为例进行预测,并与b p 神经网络的预测结果进行比较,结 果证明,s v m 短期负荷预测方法具有更高的预测精度。该模型己成功运用于云南电网 机组检修、运行优化项目中,实践证明,其精度完全满足实际系统的需要。 贺媛嫒:基于支持向量机的电力系统短期负荷预测模型研究 2 支持向量机的基本理论 2 1 机器学习和统计学基本理论 基于数据的机器学习是现代智能技术中的重要方面,其本质就是从观测数据出发寻 找统计规律,并对未来进行预测。现有机器学习方法某同的重要理论基础之一就是统计 学。 传统的统计学研究的是样本数目趋于无穷大时的渐进理论,但实际问题中,样本的 数目往往是有限的。v v a p n i k 3 6 】从6 0 年代开始致力于有限样本统计理论的研究,称之 为统计学习理论( s l t1 ,到9 0 年代中期,随着其理论的不断发展和成熟,也由于神经 网络等学习方法在理论上缺乏实质性进展,该理论开始受到广泛的重视。统计学习理论 指出经验风险最小并不能保证期望风险最小;提出了结构风险最小化原理;给出了核心 概念v c 维,指出为了最小化期望风险必须同时最小化经验风险和v c 维;支持向量机 就是基于这个理论的一种模式识别的方法,支持向量机是统计学习理论总最新的内容, 也是最实用的部分。 21 1 经验风险最小化 机器学习的目的就是根据给定的训练样本求系统输入输出之间的依赖关系。学习问 题可以一般地表示为:变量y 与石之间存在的未知依赖关系,即遵循某一未知的联合概 率f ( x ,y ) 。机器学习问题就是根据z 个独立同分布观测样本( 一,y ) ,( 而,y 2 ) ,( x l ,y 1 ) , 在一组函数 f ( x ,w ) ) 中求一个最优的函数f ( x ,w ) 对依赖关系进行估计,使式( 2 1 ) 的期 望风险尺( w ) 最小。 r ( w ) = il ( y ,f ( x ,w ) ) d f ( x ,y )( 2 1 ) 其中, f ( x ,w ) 称为预测函数集,w 为函数的广义参数。 f ( x ,w ) 可以表示为任何的参 数集。l ( y ,f ( x ,w ) ) 为由于用f ( x ,w ) 对y 进行预测而造成的损失。预测函数也称作学习 函数、学习模型或学习机器。 联合概率f ( x ,y ) 通常未知,唯一能够获得的信息被包含在训练样本中,所以在传统 的学习方法中通常用经验风险的最小化来代替期望风险最小化,这就是所谓的经验风险 最小化原贝l j ( e s t i m a t i o nr i s km i n i m i z a t i o n ,简称e r m ) 。也就是说,用样本定义经验风险 r 。( h ,) 如下: 大连理: 大学硕士学位论文 u w ) = 吉喜地,( 墨 w ) ) ( 2 2 ) 机器学习的目的就是要设计学习算法,使上述风险最小,作为对r ( w ) 的评估。实 际上,如图2 1 所示,经验风险只有在样本趋于无穷时才依概率收敛于期望风险。 概率 样本数 图2 1 期望风险与经验风险的概率分布 f i g 2 1p r o b a b i l i t yd i s t r i b u t i o no f t h e e s t i m a t i o nr i s ka n dt h ee m p i r i c a lr i s k 2 1 2 模型复杂度和推广能力 以神经网络为例,早期的神经网络研究中,人们总是把注意力集中在如何使经验风 险更小,但很快发现一味追求训练误差最小( 即经验风险最小) 并不总能达到好的预测效 果。实际情况是,只要学习机器足够复杂,训练时间足够长,则训练误差可以任意减小。 最极端的情况是,学习机器记住了所有的训练样本,则训练误差为零,但是实际上这种 学习机器机器不具有推广能力。也就是说训练误差过小反而可能会导致推广能力下降。 关于机器复杂度与机器性能的关系,有如下一些结论: ( 1 ) 经验风险( 或者说训练误差) 对学习机器的性能有一定的影响,但不起决定作用。 执行经验风险最小化原则( 即最小化训练误差) ,并不总能提高学习机器的推广能力; ( 2 ) 复杂度高的学习机器,往往具有较低的经验风险。因此,经验风险最小化原则 的结果,将使学习机器变得越来越复杂: ( 3 ) 学习机器的复杂度对其性能有较大影响,推广性能好的学习机器应该具有与实 际面对的问题相对应的复杂度。 因此,如何根据实际问题,在学习机器的经验风险和模式复杂度之间取得合理的折 中,从而使学习机器具有更高的推广能力,是一个非常重要的问题。 贺嫒媛:基于支持向量机的电力系统短期负荷预测模型研究 2 1 3v c 维 模式识别方法中v c 维的直观定义是:对一个指示函数集,如果存在h 个样本能够 被函数集里的函数按照所有可能的2 “种形式分开,则称函数集能够把h 个样本打散。函 数集的v c 维就是它能打散的最大样本数目h 。若对任何数目的样本都有函数能将它们 打散,则函数集的v c 维称为无穷大。有界实函数的v c 维可以通过用一定的阈值将它 转化成指示函数来定义。 v c 维反映了函数集的学习能力。一般而言,v c 维越大则学习机器越复杂,学习 内容量就越大。目前没有通用的关于任意函数集v c 维计算的理论,只对一些特殊的函 数集知道其函数维。例如在一维实数空间中线性分类器和线性实函数的v c 维是n + l , 而f ( x ,口) = s i n ( a x ) 的v c 维则为无穷大。如何用理论和试验的方法计算其v c 维是当前 统计学习理论中一个待研究的问题 3 。 21 4 结构风险最小化原理 统计学习理论系统的研究了对于各种类型的函数集、经验风险和实际风险之间的关 系,即泛化的界限。统计理论指出:经验风险r 。( w ) 和实际风险r ( w ) 之间至少以卜一印 的概率满足如下关系【4 1 1 : 月( w ) s8 。( w ) + f h ( 1 n ( 2 l h ) 7 1 ) - i n ( r 4 ) - ( 2 3 ) 其中,z 是样本数,h 是函数集的v c 维。 这一结论表明,统计学习的实际风险由两部分组成:一个是经验风险,另外一个是 置信界限( v cc o n f i d e n c e ) 。置信界限反映了真实风险和经验风险差值的上确界,反映了 结构复杂所带来的风险,它和学习机器的v c 维h 及训练样本数,有关。在有限的训练 样本下,学习机器的复杂性越高,v c 维h 越高,则置信界限越大,就会导致真实风险 和经验风险之间可能的差别越大( 这里,如果v c 维无穷大时,该界限就不再成立) 。 这样,学习机器能力过强( v c 维很大) ,虽能取得小的经验风险,但置信范围会很 大;v c 维太小又导致大的经验风险。个好的归纳原则必须在二者之间作出权衡。结 构风险最小化原贝, f j ( s t r u c t u r a lr i s km i n i m i z a t i o n ,简称s r m ) 就是基于以上结论提出的一 项新策略,和e r m 最小化训练错误率( 即经验风险) 不同的是,s r m 通过最小化期望风 险的上界,定义了在对给定数据的逼近精度和逼近函数的复杂性之间的一种折衷,不但 使经验风险最小化,还要使v c 维尽量小,即缩小置信范围,以此来使期望风险最小。 大连理工大学硕士学位论文 2 2 支持向量机基本原理 支持向量机( s u p p o r tv e c t o rm a c h i n e ,简称s v m ) 是由v a p n i k 在统计学习理论基础 上提出的一类新的机器学习算法,它基于结构风险最小化原理,与传统机器学习方法相 比,s v m 具有小样本学习能力强、模型推广性能好、高维输入数据处理能力等特性。 s v m 的基本原理如下: 假设存在训练样本 ( t ,m ) ) ,i = l ,z ,可以被某个超平面( w ,z ) + 6 = 0 没有错误地 分开,其中置r ”,m ( 一1 ,1 ) ,为样本个数,r 一为,2 维实数空间。( ,) 为向量的点 积,则与两类样本点距离最大( 称边缘最大) 的分类超平面称为最优超平面,如图2 2 所 示,h 即为最优超平面。其中距离超平面最近的异类向量( 凰、2 上的点) 被称为支持向 量( s u p p o r tv e c t o r ) 。最优超平面将由离它最近的少数样本点( 称为支持向量) 决定,而与 其他样本无关。 最优超平面会获得最佳的推广能力。 图2 2 最优超平面的概念 f i g 2 2o p t i m a ls e p a r a t i n gh y p e r p l a n e 我们用如下形式描述与样本间隔为的分类超平面 ( w - x ) + 6 ,f l w l l = 1 y = 1 ,若( w - x ) + b a y = - 1 ,若( 1 4 - x ) + b 一a 贺媛媛:基于支持向量机的电力系统短期负荷预测模型研究 v a p n i k 给出了一个关于一间隔分类超平面v c 维上界的定理p 7 1 :如果向量z 属于 一个半径为r 的超球范围中,那么一间隔分类超平面集合的v c 维h 满足下面的界: n 蝌1 + - ( 2 4 ) 这样,s v m 首先保证了一个小的经验风险( 在训练样本可分时就是零) ,并通过选择 边缘最大的超平面的方式控制了函数集的v c 维。也就是说,使分类间隔最大实际上就 是对推广能力的控制,这就是s v m 的核心思想之一。 2 3 支持向量机的数学模型 s v m 目前主要应用于分类和回归两大领域。支持向量分类器s v c ( s u p p o r
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 自动化办公文档备份创新创业项目商业计划书
- 智能制造超算调度创新创业项目商业计划书
- 2025年恩施州来凤县第四实验小学招聘考试笔试试题(含答案)
- 现场急救知识培训通知课件
- 2025年环保产业园区产业集聚与绿色产业发展协同报告
- 2025年工业互联网平台同态加密技术在工业设备设备性能优化中的可行性研究
- 2026届江西省抚州市临川第一中学化学高三上期末达标测试试题含解析
- 现代武器装备常识课件
- 2025年教师资格证考试(中学)教育知识与能力冲刺模拟试题及答案解析版
- 2025年一级建造师考试建筑工程管理与实务押题冲刺模拟试卷
- 六年级家长会课件
- 2025年安徽省淮南市【辅警协警】笔试模拟考试题(含答案)
- 废气处理活性炭吸附操作规范
- 2025年教科版新教材科学二年级上册教学计划(含进度表)
- 创伤急救基本知识培训课件
- 2025年农业农村科技基础知识考试题库(附含答案)
- 合同第三方见证人范本
- 学生心理健康教育干预措施
- DB32∕T 4652-2024 基于区块链技术的多中心药物临床试验管理系统开发指南
- 实验室生物安全知识培训考试试题(含答案)
- 2025年成人高考英语试题及答案
评论
0/150
提交评论