




已阅读5页,还剩61页未读, 继续免费阅读
(计算机软件与理论专业论文)基于粗糙集与支持向量机的电力短期负荷预测研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 电力负荷预测是保障电力生产系统安全、节约能源及使生产效益最大化的 重要管理手段,而对于短期负荷的预测则是电力负荷预测中的关键。 目前电力短期负荷预测中常用的神经网络方法,预测精度虽然较高,但存 在经验最小化、网络结构参数难以确定、局部最优及泛化能力不强的缺点。本 课题综合分析国内外研究现状,在探讨负荷预测常用手段的基础上,提出结合 粗糙集和支持向量机两种技术的方法,它具有支持向量机的小样本学习能力强、 全局最优、泛化能力好的优点,又由粗糙集简化了支持向量机输入向量的维数, 能够解决神经网络中存在的问题。该方法采取对异常数据进行完备化、平滑化 和归一化等预处理手段,通过研究基于改进的二进制分辨矩阵属性约简算法和 支持向量回归训练模型,对短期负荷进行预测,同时还采用南昌市2 0 0 5 - - - 2 0 0 7 年历史负荷数据进行仿真实验,分析实验结果表明: 1 采用软件滤波方法对历史数据进行预处理,可以保证数据的完备性和平滑 性; 2 基于改进的二进制分辨矩阵粗糙集结合支持向量回归模型的预测方法,不 但可以简化样本数量和维数,而且能缩短训练时间,同时能进一步提高预 测准确度。 基于粗糙集与支持向量机相结合对短期负荷进行预测的技术,不仅为指导 电力生产调度及营销等工作提供了理论依据,而且具有良好的社会经济效益与 应用前景。 关键词:粗糙集;支持向量机;短期负荷预测 a b s t r a c t a b s t r a c t p o w e rl o a df o r e c a s ti sv e r yi m p o r t a n tm a n a g e m e n tt h a tc a ng u a r a n t e et h es a f e t yo ft h e s y s t e m ,s a v ee n e r g ya n dr a i s ep r o d u c t i o ne f f i c i e n c yt ot h em a x i m a ld e g r e e s h o r t - t e r ml o a d f o r e c a s ti st h em o s ti m p o r t a n tl o a df o r e c a s ti np o w e rs y s t e m a r t i f i c i a ln e u r a ln e t w o r k ( a n n ) i sac o m m o nm e t h o d b a s e do nt h ee x p e r i e n t i a lr i s k m i n i m i z a t i o np r i n c i p l e ,a n nh a st h ea d v a n t a g eo fh i g h e rf o r e c a s ta c c u r a c y , a n db u ti th a ss o m e d i s a d v a n t a g e s ,s u c ha sd i f f i c u l tn e t - s t r u c t u r e - p a r a m e t e r - c o n f h m a t i o n , a n dw e a kg e n e r a l i z a t i o n a b i l i t y am e t h o dc o m b i n e ds u p p o r tv e c t o rm a c h i n e ( s v m ) w i t hr o u g hs e tt h e o r y ( r s ) i s p r e s e n t e d i tc a ns o l v et h es m a l ls a m p l e ,s i m p l i f yt h ed i m e n s i o n so ft h es a m p l ed a t a , a n dh a st h e a d v a n t a g e so ft h eg l o b a lo p t i m i z a t i o na n dt h eb e t t e rg e n e r a l i z a t i o na b i l i t y t h em e t h o dm a k e st h e a b n o r m a ld a t ac o m p l e t e d ,s m o o t ha n du n i f o r m ,a n dc o m b i n e st h ei m p r o v e da t t r i b u t er e d u c t i o n a l g o r i t h m b a s e do nb i n a r yd i s c e r n i b i l i t ym a t r i xa n dt r a i n i n gm o d e lo fs u p p o r tv e c t o r r e g r e s s i o n ( s v r ) t of o r e c a s tt h es h o r t - t e r ml o a d u s i n gt h ed a t ao fn a n c h a n gb e t w e e n2 0 0 5a n d 2 0 0 7 ,s i m u l a t i o ne x p e r i m e n t ss h o w : 1 t h eh i s t o r i c a ld a t ap r e - p r o c e s s e db yf i l t e rm e t h o dc a ng u a r a n t e et h ed a t ac o m p l e t e n e s sa n d s m o o t h n e s s ; 2 t h el o a df o r e c a s to ft h ei m p r o v e da t t r i b u t er e d u c t i o na l g o r i t h m , b a s e do nb i n a r y d i s c e r n i b i l i t ym a t r i xa n dt r a i n i n gm o d e lo fs v r , c a nr e d u c et h et e s ts a m p l e sa n dt h ed i m e n s i o n s o f t h es a m p l ed a t a , s h o r t e nt h et r a i n i n gt i m e ,a n df u r t h e ri m p r o v et h ef o r e c a s ta c c u r a c y t h em e t h o dm e n t i o n e di nt h ep a p e rp r o v i d e sat h e o r e t i c a lg u i d ef o rp o w e rp r o d u c t i o na n d m a r k e t i n g , a n dh a sag o o ds o c i a la n de c o n o m i cb e n e f ra n dan i c ep r o s p e c t k e yw o r d s :r o u g hs e t ;s u p p o r tv e c t o rm a c h i n e ;s h o r t - t e r ml o a df o r e c a s t i n g n 学位论文独创性声明 学位论文独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得直昌太堂或其他教学机构的学位或证书而使用过的材料。与 我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确 的说明并表示谢意。 学位论文作者签名( 手写) :铆壤曩 签字日期:州瞄年,碉;1 日 学位论文版权使用授权书 本学位论文作者完全了解直昌太堂有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权直昌太堂可以将学位论文的全 部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存、汇编本学位论文。同时授权中国科学技术信息研究 所将本学位论文收录到中国学位论文全文数据库,并通过网络向 社会公众提供信息服务。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:钾镞 导师签名: 签字日期:0 年f 月弓、) e l 签字日期:砂多年,力月;o e l 第1 章绪论 第1 章绪论 电力负荷预测则是对未来电力需求量( 功率) 或用电量的估计和推测。本 课题着重研究电力系统领域的短期负荷预测,第一章简要阐述了什么是电力系 统负荷预测,电力负荷预测的分类,以及为什么要做负荷预测;短期负荷预测 有哪些常用方法,课题采用什么方法来进行短期负荷预测,并与其它方法比较 预测效果和性能;最后介绍论文的组织结构。 1 1 负荷预测的研究背景和研究意义 负荷预测是电力行业能量管理系统( e m s ) 的重要组成部分,是电力系统 领域的一个传统研究问题,主要是指从历史的电力负荷、经济、社会、气象等 情况出发,通过对历史数据的分析研究,探索各相关因素变化对未来负荷的影 响及与未来负荷发展之间的内在联系,从而对未来负荷做出科学的估计和推测。 1 1 1 负荷预测的研究背景 负荷预测实质上是对电力市场需求的预测,是实现电网安全、经济运行的 前提。从2 0 世纪7 0 年代开始,国际上对电力负荷预测的研究逐步增多;2 0 世 纪8 0 年代后,由于能源紧张造成的对负荷科学管理的迫切要求以及对准确和适 应性强的负荷模型的期望,使得对负荷预测的重视程度越来越高;2 0 世纪9 0 年 代,随着世界各国电力市场的发展,负荷预测受到人们更加广泛的重视,越来 越多的专家学者投入到负荷预测理论和方法的研究中来【l 】。 国内的研究发展也经历了一个较长的过程。在计划经济体制下,电力市场 基本上是卖方市场,以发定用,从而导致电力部门对市场缺乏充分的了解,对 先进的预测理论和方法研究不够。 然而改革开放以后,我国电力行业得到充分发展,9 0 年代末期基本上消除 了电力行业与国民经济不相适应的局面,使得电力市场转化为买方市场,电力 设备出现了部分的闲置,降低了电力行业的经济效益。进入2 1 世纪,由于电力 需求极度旺盛、电煤供应不足等种种原因,某些省份的电力供应又趋于紧张, 甚至出现了拉闸限电的情况。此时,负荷预测的难度又大大增加。总之,随着 电力企业逐步走向市场,市场经济对电力负荷预测提出了新的更高要求。 1 第l 章绪论 电力系统负荷预测值作为电能交易中的重要依据,为电力公司定制电能报 价、运行方案以及电网规划提供了必要的导向,其预测精度将直接影响到电力 企业的经济效益,因此更高的预测精度和科学性将成为电力负荷预测技术发展 的主线 2 1 1 3 。 1 1 2 短期负荷预测研究的意义 1 负荷预测的分类1 4 i 按照预测时间的长短和应用场合的不同,电力系统负荷预测可以分为长期、 中期、短期及超短期负荷预测。 ( 1 ) 长期负荷预测 长期负荷预测是指未来3 - - 5 年甚至更长时间段内的负荷预测,主要是电网 规划部门根据国民经济的发展和对电力负荷的需求,所作的电网改造和扩建工 作的远景规划。对中、长期负荷预测,要特别研究国民经济发展、国家政策等 的影响。 ( 2 ) 中期负荷预测 中期预测是指未来一年( 1 2 个月) 之内的用电负荷预测,用于安排大修计划以 及水库的经济运行。 ( 3 ) 短期负荷预测 短期负荷预澳, u ( s t l f ,s h o r t t e r ml o a df o r e c a s t i n g ) 通常是指未来2 4 小时的 日负荷预测和未来1 6 8 小时的周负荷预测,目的是给各个电厂安排日、周发电 计划,包括确定机组起停、火水电协调、燃料采供、联络线交换功率、负荷经 济分配、水库调度和设备检修等。 ( 4 ) 超短期负荷预测 超短期预测是指未来1 小时、未来o 5 小时甚至未来1 0 分钟的预测,主要 用于安全监视、预防性控制和紧急状态处理。 2 短期负荷预测的研究意义 传统的负荷预测是电力系统中规划、计划、用电、调度等部门的基础工作, 在电力工作市场化的过程中,负荷预测又成为市场交易、市场营销等部门的核 心业务之一。负荷预测因此成为电力系统管理现代化的重要内容之一,是对发 电、输电和电能分配等合理安排的必要前提。对电力系统的安全经济运行与国 民经济的发展具有非常重要的意义。 2 第l 章绪论 短期负荷预测主要用于预报未来几分钟、几小时或几星期的电力负荷,对 于调度安排开停机计划,对于电力应用如机组最优组合、经济调度、最优潮流, 尤其是对电力市场有着重要的意义。若负荷预测存在较大误差,可能造成电力 系统经济上的浪费:如果预测的负荷偏大,而实际负荷较小,将造成某些机组 的购电计划不能完成;如果预测的负荷偏小,而实际负荷较大,将导致系统缺 电而降低经营的利润;如果各供电公司的预测误差都较大,但由于误差正负的 互相抵消,系统总的误差较小,在这种情况下,电网运行的网损较大。 由于对安全和经济发、配电有重大意义,短期负荷预测是对电力系统最为 重要的负荷预测。短期负荷预测是电力系统调度运营部门的一项重要日常工作, 是制定发电计划和输电方案的主要依据。精度较高的短期负荷预测在制订发电 计划时可以合理安排旋转备用和冷备用容量,减少机组启停次数,降低即日交 易电量,在满足用户用电的同时减少电能成本和电价,另外日负荷预测数据是 校核电网安全的重要依据。因此,不论从经济角度还是从安全角度讲,短期负 荷预测工作都是十分重要的。 因此,为了准确地预测市场对电力这一商品的需求,必须认真分析各种信 息与相关数据,采用先进的理论进一步提高预测精度,并采用先进的计算机技 术增强预测软件的实用性与方便性。 1 2 国内外研究现状及发展趋势 负荷预测方法大体可以分成两类:传统的数学统计方法和现代的人工智能 方法。理论上讲,负荷预测的数学理论的核心是如何获得预测对象的历史变化 规律。无论是传统的预测方法还是现代的方法,它们都是在获得预测对象的历 史变化规律后,将这种规律延伸以预测未来。预测模型实际上是表述这种变化 规律的数学函数。不同地区不同时段负荷的变化规律都不一样,因此,这就要 求提供尽可能多的预测模型,以适合不同地区不同时段的预测需要。另一方面, 数学模型是理想的抽象,负荷发展的自然规律很难用单一数学模型加以描述, 必须用许多预测模型进行有机的组合,即实现综合预测模型,才能形成对负荷 发展自然规律的更贴切、完备的描述。 负荷预测研究历史较早,有很多较为成熟的传统技术,如回归分析、时间 序列、趋势外推等统计方法;近年来发展起来一些新型预测方法,如2 0 世纪8 0 3 第1 章绪论 年代中后期的专家系统、2 0 世纪9 0 年代以后的人工神经网络,还有一些如模糊 逻辑、小波变换预测法等。 1 2 1 数学统计的短期负荷预测方法 1 回归分析法 利用数理统计中的回归分析方法,通过对历史负荷数据的统计分析,建立 可以进行数学分析的数学模型,对未来负荷进行预测,一般包括线性回归预测 和非线性回归预测两种。回归分析方法计算速度快,程序容易实现,对于正常 工作日,天气变化不大的情况有非常好的预测效果。但该方法由于自适应学习 能力较弱,而且对数据精度的要求很高,因此该方法多用于电力系统的中、长 期负荷预测,而不太适合于短期负荷预测。 2 趋势外推法 电力负荷一方面有其随机性、不确定性,同时在一定的条件下也有明显的 变化趋势。外推法就是根据已知的历史负荷资料来拟合一条曲线,使得这条曲 线能反映负荷本身的变化趋势,然后根据变化趋势,从曲线上估计出未来某时 刻点的负荷值。常用的曲线主要是直线、指数曲线、幂函数曲线、s 型曲线等, 可根据实际电力负荷曲线情况来选用。 拟合的方法主要是最小二乘法,使估计值与预测值之间的偏差的平方和最 小。外推法在本质上是利用回归分析,得到描述负荷增长趋势最好的模型参数 估计,从而使模型可以用来预测负荷增长趋势【5 】,并进行超短期负荷预测,其优 点是只需要历史数据,所需的数据量较少,缺点是未考虑天气情况,如果负荷 出现变动,会引起较大的误差。 3 时间序列法【6 j 时间序列分析法是将历史数据中的因变量( 预测目标) 和自变量( 影响预测目 标的因素) 均看成随机变量,电力负荷的历史资料就是一个时间序列,用这个序 列对电力负荷变化的规律和特性进行分析,以此来建立和估计产生实际序列的 随机过程的模型,其中用这个数学模型一方面描述电力负荷这个随机变量变化 过程的统计规律性,另一方面在该模型的基础上再建立负荷预测的数学表达式, 从而实现对未来负荷的预测。 时间序列分析法主要有自回归模型( a r ) 、动平均模型( m a ) 、自回归动平均 混和模型( a r m a ) 和累积式自回归动平均模型( a r i m a ) ,比回归分析法更适用于 4 第1 章绪论 短期负荷预测。由于时间序列方法是假定负荷曲线是平稳的时间序列,所以该 方法在温度和天气变化不大时可以取得令人较满意的结果;但实际电力系统的 负荷并非平稳时间序列,所以周末、节假日或季节变化时,利用它来预测负荷 的精度就比较差,同时复杂的模型技术和巨大的计算量也是它的不足。 4 灰色理论预测法【7 】【8 】 灰色系统理论是介于白色、黑色系统而言的,即部分信息己知,部分信息 未知的系统。对负荷预测来说,对其影响的供电机组,电网容量、生产能力、 大用户情况、某些产品的耗电情况等信息是已知的,但是影响负荷的其他因素, 如天气、管理政策的变化、地区经济活动情况等等是难以确切知道的,故可将 电力负荷看成是灰色系统。灰色预测具有要求负荷数据少、不考虑分布规律、 不考虑变化趋势、运算方便、易于检验等优点。但是,它和其他预测方法对比, 也存在一定局限性。由于其微分方程指数解比较适合于具有指数增长趋势的负 荷指标,对于具有其它趋势的指标则有时拟合灰度较大,因此,当数据离散程 度越大,即数据灰度越大,则预测精度越差。这种方法对休息日、节假日这种 变化过程呈增长或下降趋势的数据预测精度较高,而对预测气候温度剧烈变化 的过程效果一般。 1 2 2 人工智能的短期负荷预测方法 人工智能方法中主要有专家系统法、小波变换法、模糊逻辑法及人工神经 网络法等。 1 专家系统l l 】 专家系统是一种人工智能的计算机程序系统,这些程序具有相当于某个专 门领域的专家的知识和经验水平,以及解决专门问题的能力,但负荷预测离不 开预测人员的丰富经验与判断能力,尤其是在节假口、有重大社会活动和突发 事件等情况下,专家知识起着至关重要的作用。但是,专家系统在具体的应用 时还面临着知识获取与知识更新的瓶颈,一方面专家知识存在着主观性、不确 定性及不完全性,另一方面,如何采用计算机程序完整而准确地表达专家的知 识也是制约专家系统发展的难题。 2 小波变换【9 】【1 0 】 小波变换是数学学科的一个分支,吸取了现代分析学中诸如泛函分析、数 值分析、f o u r i e r 分析、样条分析、调和分析等众多分支的精华,是一种时域一 5 第1 章绪论 频域分析方法。它在时域和频域上同时具有良好的局部化性质,并且能根据信 号频率高低自动调节采样的疏密,其目标是将一个信号的信息转化成小波系数, 可以方便地处理、存储、传递、分析或被用于重建原始信号。 电力负荷曲线具有特殊的周期性,负荷以天、周、月、年为周期变化,大 周期中嵌套小周期。根据样本数据的实际情况,短期负荷预测将涉及一个较宽 的频带,可以将负荷序列进行小波变换,把负荷序列分别投影到不同的尺度上, 使用正交二进n d , 波变换,将各个尺度近似地看作各个不同的“频带”,这样各个 尺度上的子序列分别代表了原序列中不同“频域”的分量,更加清楚地表现了负荷 序列的周期性。小波变换的优点结合电力负荷曲线的特点,决定了小波变换可 以有效地应用于负荷预测问题的研究。 3 模糊逻辑【l j 模糊逻辑预测法是建立在模糊数学理论上的一种新技术。模糊理论是解决 不确定、不完全信息问题的一种有效方法。在电力负荷预测中,存在着大量的 不确定因素,很难进行精确的描述和表达。 目前,模糊理论在电力负荷预测的应用研究主要集中于两个方向:一是基 于模糊理论的电力负荷预测方法,其主要基于模式匹配的思想,模糊集理论能 从大量数据中抽取出具有相似性的代表量和非线性问题,利用这个强大的处理功 能,通过对历史数据的模糊化处理和分析,将大量看似杂乱无章的原始数据整 理成规律性很强的数据排列,提炼出负荷相关环境及负荷变化的若干种典型模 式,通过判定未来待预测环境属于哪种模式,最终建立负荷预测模型,实现负 荷预测;二是将模糊逻辑与传统数学模型预测方法、神经网络及专家系统预测 方法相结合的电力负荷预测方法研究。 模糊理论方法的优势在于处理负荷预测中的不确定因素的有效性,但是在 自学习、自适应能力等方面还需要进一步的深入研究。 4 人工神经网络( a n n ) 二十世纪九十年代初期开始,人工智能技术( 如人工神经网络、专家系统、 模糊推理等、小波分析法) 逐步被用到短期负荷预测中。在各种人工智能方法中, 人工神经网络法无疑是最引人关注的方法,也是近十年来研究和使用最多的一 种方法。人工神经网络是一个高度非线性的超大规模连续时间动力系统,可以 映射任意复杂的非线性关系,且能够识别有噪声或变形的样本,通过学习能把 样本隐含的特征和规律分布于神经网络的连接权上。 6 第1 章绪论 利用人工神经网络,选取过去一段时间的负荷作为训练样本,然后构造适 宜的网络结构,用某种训练算法对网络进行训练,使其满足精度要求以后,用 人工神经网络做负荷预测。人工智能技术主要用来解决非线性问题和不确定性 问题,和数学统计方法相比,人工智能预测方法在预测过程中考虑了各种不确 定因素( 如天气因素、季节因素、人工经验等) ,在实际的负荷预测过程中确实能 够提高预测精度。而电力系统的负荷预测从根本上讲就是非线性系统的辨识问 题,因此采用神经网络进行预测有着传统方法所没有的优点。但是神经网络也 存在一些问题,首先是需要合理地选择网络结构与参数,神经网络隐含层的层 数和单元数的选择尚无理论上指导,网络往往存在很大的冗余性,一般需根据 经验或通过反复实验确定。其次神经网络方法本质上是一种基于经验风险最小 化的方法,而不是使期望风险最小化,它的泛化能力受到制约i l 。 1 3 课题研究内容与组织结构 1 3 1 课题研究内容 课题根据电力系统短期负荷预测的特点,提出将粗糙集( r o u g hs e t ,r s ) 理 论与支持向量回归( s u p p o r tv e c t o rr e g r e s s i o n ,s v r ) 方法相结合溶入电力短期负 荷预测中,实现历史数据分析处理、数据特征选取、预测模型构建,最终达到 较好负荷预测精度的目的。 基于统计学习理论的支持向量机是一种结构风险最小化的新型学习方法, 支持向量机算法是一个凸二次优化问题,它找到的极值解就是全局最优解,从 而在统计样本量较少的情况下获得良好的统计规律和更好的泛化能力,为解决 小样本、非线性、高维数等学习问题提供了一个途径,解决了许多其他学习方 法难以解决的问题。与神经网络方法相比,支持向量机有着显著的优越性,被 认为是人工神经网络方法的替代方法。 粗糙集理论是一种研究不完整、不确定知识和数据的表达、学习、归纳的 理论方法。在不需额外的先验知识的情况下,通过描绘知识表达中不同属性的 重要性,进行知识表达空间约简,去掉冗余信息,简化信息的表达空间维数。 课题以某电网2 0 0 5 年2 0 0 7 年负荷情况为样例进行系统研究:首先全面分 析影响短期负荷预测的因素,对历史数据进行完备性和平滑性处理,并根据历 史数据建立属性决策表,在不影响信息完备性和平滑性的前提下,通过属性约 7 第1 章绪论 简算法对数据进行挖掘,基于粗糙集找到影响负荷的核心因素,提取最小特征 集,通过对训练数据进行s v r 训练,构建预测模型,并利用该模型对测试数据 进行预测,同时进行分析处理,预测结果表明,应用粗糙集与支持向量机相结 合的模型,对本研究对象进行短期负荷预测,预测精度和训练时间都得到进一 步提高,能够满足实际生产的需要。 具体从以下三个方面进行研究: 1 数据处理: 要提高短期电力负荷预测的精度,历史数据处理是重要的环节之一。数据处 理可分为三个步骤: ( 1 ) 针对历史数据可能会出现数据缺损及数据异常的特点,在利用这些数 据之前,使用软件滤波方法,自动补齐缺损数据,平滑异常负荷数据,消除异 常数据的不良影响。 ( 2 ) 为防止样本集中各输入向量的数据差异过大,对支持向量机训练输入 样本数据进行归一化处理,使所有输入样本数据在一定数据范围之内展开。 ( 3 ) 对输入样本进行聚类分析,将训练样本分为若干个子类,并针对不同 子类构建不同的s v r 模型。 2 数据特征选取 对影响负荷变化的众多因素进行分析,如历史负荷、温度、气象、星期、 节假日等信息,在不影响信息完备性的前提下,采用粗糙集方法,对影响负荷 预测的因素进行约简,求得最小特征集,以此确定输入样本的维数,在此基础 上,利用已知历史负荷数据构造训练样本集,作为支持向量回归模型的输入进 行训练,采用训练完毕后的模型进行负荷预测。 3 分析预测 研究神经网络、支持向量机等智能预测技术,使用现场信息( 包括实时数 据和历史数据,及现场人员对负荷预测的知识经验) 和温度、气象、星期、节 假日等信息,采用合适的支持向量回归模型来进行预测。 同时,由于天气、日期和电力负荷曲线之间的关系常常是复杂的,不能仅 仅用一种方法来比较准确地进行预测,而各种情况下的电力负荷有其特定的规 律,因此研究将众多不同的方法进行综合、集成,在信息融合的基础上进行负 荷预测。 总之,要综合历史负荷数据、实时负荷数据和相关信息,引入人工智能技 8 第1 章绪论 术,在数据融合的基础上对负荷进行预测,以增强负荷预测的准确性和及时性, 优化电网发电机组的启停及制订机组检修计划,同时促进建设电力市场。该层 最终将分析数据以图表的形式反映出来。 1 3 2 论文组织结构 论文主体部分主要分为六个章节,各章的内容安排如下: 第一章主要介绍了课题的发展、研究内容和研究意义,国内外现有各种研 究方法现状,并介绍了课题的主要研究内容和组织结构。 第二章介绍了与负荷预测相关的粗糙集理论的基本概念,并介绍了属性约 简和属性值约简的算法过程。 第三章介绍了统计学习理论、支持向量机基本理论,支持向量机的训练算 法及模型选择。 第四章对负荷的构成和原理进行了分析,介绍了进行负荷预测的步骤,及 进行数据处理的方法。 第五章根据样例,对历史负荷进行了分析,再采用粗糙集方法,对影响负 荷预测的因素进行预测模型输入特征项提取,然后利用已知历史负荷数据构造 训练样本集,进行支持向量机模型训练,并采用训练完毕后的模型进行负荷预 测,最后与神经网络的预测结果进行分析比较。 第六章对现有预测研究方法进行总结,并对未来研究方向提出了展望。 9 第2 章粗糙集基本理论与知识约简 第2 章粗糙集基本理论与知识约简 2 1r o u g h 集理论 粗糙集( r o u g hs e t s ,r s ) 理论是波兰科学家z p a w l a k 在1 9 8 2 年提出的一种 数据分析理论,是经典集合论的重要发展。r s 是一种处理不精确、不确定知识 的新型数学工具,其优势是不需要提供问题所需处理的数据集合之外的任何额 外的先验信息,能从数据本身提供的信息中发现有效的、潜在的知识,通过知 识的约简与知识依赖性分析,导出决策规则。 粗糙集理论的研究对象是一个由多值属性集合描述的对象集合信息系 统。在粗糙集理论中用等价类形成的上近似和下近似来描述集合的粗糙性。上 近似和下近似的差是一个边界集合,它包含了所有不能确切地判定是否属于给 定类的对象。 粗糙集方法可以解决重要的分类问题,去除冗余属性,进行属性的约简, 还可以用决策规则集合的形式表示最重要属性和特定分类之间的所有重要关 系。本文将这一理论应用到s v m 训练的前阶段,用粗糙集的属性约简算法实现 属性约简,然后结合s v m 训练方法对负荷数据进行预测。下面将简单陈述粗糙 集的相关概念和定义。 2 1 1 集合论的等价关系和等价类 粗糙集理论是经典集合论的重要发展,而集合是一些不能确定对象的全体, 所有对象的集合被统称为全域或论域( u m v e r s e ) ,而这些对象称为集合的元素, 从集合彳到b 的关系r 是彳召的一个子集【1 2 】。 定义1 设r 为集合x 上的一个二元关系,即r c x x x , 则r 有五种性质: 称尺为自反的,如果对于x 的任意元素x ,有x r x 。 称r 为反自反的,如果对于x 的任一个元素x ,有_ 1f j c 删,即良矽萑r 。 称r 为对称的,如果对于x 的任意元素x 、y ,都有x r y _ y r x 。 称r 为反对称性的,如果对于x 的任意元素x 、y ,都有x r y y r x 川可。 称尺为传递的,如果对于x 的任意元素x 、y 、z ,都有x r y y r z x r z 。 定义2 等价关系定义满足x 上自反、对称、传递的关系r 称等价关系 1 0 第2 章粗糙集基本理论与知识约简 ( e q u i v a l e n c er e l a t i o n ) 。 等价类一足是x 上等价关系,对x 酣可构造一个x 的子集x j r ,称为x 对 r 的等价类。 划分一的子集4 j ,么2 ,以满足:么f 均分离,即4 f n 4 ,- p ,j = l , 2 ,彬彳,u 彳2u 洲一- - s ,则a = 以j ,彳2 ,彳一) 称为s 的划分,而 a ,称为划分的块( ,f = j ,z 刀) 。 黼弧:x = q b c ,r = : ( q b ) ( b a ) ( a 。c ) ( c 。口) 。( 口。口) ( b b ) ( c 。c ) 可以看出,x 在犬上有向砂一p ,矽,向砂一+ 以矽,向矽_ 向圳,p ,矽_ p ,砂, 则r 在x 上是自反的,对称的,但非传递的,所以尺不是x 上的等价关系。 2 1 2 信息系统和不分明关系 粗糙集理论是建立在分类机制的基础上的,它将分类理解为在特定空间上的 等价关系,而等价关系构成了对该空间的划分。粗糙集理论将知识( k n o w l e d g e ) 理 解为对数据的划分,每一被划分的集合称为概念。粗糙集理论的主要思想是利用 已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来( 近似) 刻 画。设r 是u 上的一个等价关系,u r 表示根据关系r ,u 中对象所构成的所有等 价类族( 或u 上的划分) 构成的集合, x l r 表示包含元素i eu 的足等价类。 定义3 信息系统( i n f o r m a t i o ns y s t e m ,s ) 定义如下: s = ( u ,a ,v ,门 ( 2 1 ) 式中,u 为论域( 是一个非空、有穷的集合,且u = 扛。,x :,工。 ) ;其中属性 集彳是一个非空、有限的,个数为r l 的属性集合,a = c u d ,c = c l ,c 2 ,c 。1 ) , d = d l ,d 2 ,以2 ) ,甩= + ,1 2 ,c 为条件属性,d 为决策属性;对任一属性口彳, 都存在信息函数无:u xa 寸圪,其中圪是属性a 的所有值集合,称为属性a 的值域。 由这种“属性专值”的关系就构成了一张二维表,可称之为信息表,若属性 中包含决策属性,则称其为决策表。 定义4 若非空关系p 是关系集r 的一个子集,则将尸所产生的所有等价关 系的交称为不可分辨关系( i n d i s c e m i b i l i t yr e l a t i o n ) i n d 伊) ,对任意置u ,x 在 不分明关系n d ( p ) 上的等价类记为m ,d 尸) = n i x p 。若关系集似y ) i n d ( p ) , 称对象石和y 是不可分辨的。 肘 u i n d 俐( 即等价关系n d ( p ) 的所有等价类) 表示等价关系族p 相关的知识, 称为k 中关于u 的尸基本知识( 基本集) 。为简单起见,也可用岍代替u n d 俐, 第2 章粗糙集基本理论与知识约简 l n d 倒的等价类也称为知识p 的基本概念或基本范畴。如果d 且,则称0 为k 中关于u 的q 初等知识,q 的等价类为知识r 的q 初等概念或q 的初等范畴。 假设u 是全域,潞d ,r 是u 上的一个等价关系( e q m v 甜e n c e r e l a t i o n ) , 则u r 构成了u 上的一个划分,称a - 似剧为u 中关于胄的近似空间 ( a p p r o x i m a t es p a c e ) 。划分在某种程度上体现了知识分类( g r a n u l e s ) 的存在,它 表明在己知的有限信息条件下,某些对象具有相似性,它们之间是不可分辨的。 2 l 3 上近似、下近似和边界 定义5 设r 是u 上的等价关系,对任意的x c u , r 0 0 一扛na 坤s 哿或小( x ) = t j y e u r :瑶日( 22 ) 称为卫关于胄的下近似集( l o w c r a p p r o x i m a t i o n ) ; 胄。= 扛e 盯:脚r r 诳,或r + 0 0 = 叫y e u r :y 九脬,( 2 3 ) 称为置关于r 的上近似集( u p p e r a p p r o x i m a t i o n l 。 r + 代表那些根据现有知识能够判断肯定属于x 的元素所组成的最大集 合,r + 0 0 代表那些根据现有知识能够判断可能属于x 的元素所组成的最小集合, 显然r p 9 r + p 印,由此可见r 所表示的是精确部分,而r t ( ) 。所表示的则 包含不确定部分,这就引出了边界区域的概念: 定义6 p o s r ( x ) = 胄被称做x 的胄一正区域in e g r ( x ) = ur t 被称做x 的县- 负区域;b n r ( x ) - r r 弼r - 例被称做x 的r _ 一边界区域。 边界区域所包含的是那些不能确定是否属于x 的元素。边界区域是判断精 确与否的根据。当跚忙对,则称z 关于r 是清晰的,分明的,可以定义 的;当b n r ( :o c k 中时,则称j 关于r 是不清晰的,即互是关于r 的粗糙集。 在粗糙集理论中,集合的不精确性是由于边界区域的存在而引起的。集合 的边界区域越大,其精确性越低。 图2 1 粗糙集概念示意图 1 2 第2 章粗糙集基本理论与知识约简 命题l 若r 驴且r 内阢磁称为粗糙可定义; 若r 仞咖且r = 阢确吏称为在u 外部不可定义; 若r 。= 毋且疋+ 仞队x 皱称为在u 内部不可定义; 若r = 且r 仞= 阢x 陂称为完全可定义; 2 1 4 连续属性离散化 在实际的数据挖掘应用中,数据类型各式各样,绝大多数情况是既包含连 续属性又包含离散属性,由于粗糙集方法处理的对象是离散数据,它不能直接 处理连续属性。当用粗糙集方法处理这此数据时,必须首先对数据进行离散化 顶处理。 连续属性值离散化的方法有很多,但都遵循共同的原则:就是在特定的连续 属性的值域范围内,设定若干的离散化划分点,将属性的值域范围划分为一些 离散化区间,最后用不同的符号或整数值代表落在每个子区间中的属性值。 离散化问题用数学方法可描述为:决策表的离散化过程中么= 似么u a 1 1 ) ,其 中= 以,w o ) 是实值区间,对于v 口鲋,寻找的一个离散化划分匕,的任 意划分是有来自的所谓割集v i v 2 班序列所定义。因此,离散化分族可由 一系列割集确定。在离散化过程中,寻找满足某些条件的割集序列。 目前文献【1 3 】【1 4 】【1 5 】已有的处理连续属性的离散化方法很多,大致可分为非监 督离散方法和监督离散方法。但是,各种离散化方法或多或少都会损失部分信 息,因此,对具有丰富样本的信息系统而言,人们只能试图获得一个次最优的 离散化算法,在保证离散化结果达到性能要求的前提下,用尽可能少的断点将 属性空间划分成尽可能少的子空间,达到完备性、一致性的要求。 2 1 5 属性和属性值约简 知识约简是粗糙集的核心内容之一,包括属性约简和属性值约简。知识约简 研究的是在保持规则库描述能力不变的前提下,信息系统中每个等价关系是否 都必要,并如何删除冗余的知识。知识约简在人工智能与数据挖掘等领域都具 有重要的应用价值。 定义7 设髟是一个论域,条件属性集为c ,它与c 为定义在u 上的两个等 价关系族,且c 互c ,如果满足:i n d 矧= i n df ,c 夕且c 是独立的,则称c 是c 的一个约简( r e d u e t ) 。 1 3 第2 章粗糙集基本理论与知识约简 一个信息系统中可能存在多种属性约简,每种约简可能会得出不同的分类。 所谓属性约简,就是从决策表中删除一些冗余的属性。每当删除一个属性时, 检查决策表中的不可分辨关系是否发生变化,若无,则此属性可以删去,否则 不能删除。而属性值约简也就等价于从决策表中消去一些重复的属性值。 定义8 由属性集c 所有必要元素组成的集合称为c 的核c o r e ( ,c ) ,它是c 的所有约简集的交,即c o r e ( c ) = n r e d u c t ( c ) 。 所有的约简中都包含属性核,即在属性约简过程中没有丢掉的描述事物特 征属性的集合,当知识简化时它是不能消除的规则特征部分的集合,可以直接 进行计算,因此找出属性核是属性约简的基础。 2 2 属性约简算法 属性约简是粗糙集的重要部分,从2 0 世纪8 0 年代初z p a w l a k 提出r o u g h 集以来,国内外许多的学者开始研究信息系统的属性约简问题【1 6 】【1 7 】【1 引,相继提 出了一系列的属性约简的方法。2 1 5 节已经了解了属性约简的概念,本节根据 基于分辨矩阵( d i s c e r n i b i l i t ym a t r i x ) 的属性约简算法提出一种改进的二进制分辨 矩阵算法。 2 2 1 基于分辨矩阵约简算法 1 概念及算法 使用基于不可分辨关系的属性约简算法具有一定的局限性:当进行约简的 信息系统的条件属性很多,或含有大量的记录时,该方法的时间复杂度和空间 复杂度都很高,而且该方法对求最佳约简属性不是完备的。基于分辨矩阵的约 简算法是一种较好的研究结果,它是由华沙大学的著名数学家s k o w r o n 提出来 的,基于分辨矩阵的属性约简算法是目前常用的一种属性约简方法,是在r o u g h 集约简上出现的一个有力的工具。利用分辨矩阵可以将存在于复杂的信息系统 中的全部不可区分关系表达出来【l 】。 定义8 设s = ( ,u ,a ) 为一个决策表,泸缸厶x 2 , 列为论域,而0 = 1 ,2 ,砂 为所讨论的记录;么= 陋,c 1 2 , 划是条件属性集合,田= ,z ,州为记录所具有的 属性;口例是记录在属性a ( a 上的值;d = 形伍彬是决策属性。若用m o o , j ) 表 示可分辨矩阵中第i 行i 列的元素,则可分辨矩阵m o 可如下定义: 1 4 第2 章粗糙集基本理论与知识约简 l a aa k ( x i ) a k ( x j ) a n dd k ( x i ) 或( x ) m d ( j ,) = 0d 。( x i ) = 矾o ,) ( 2 4 ) l 一1a k ( x i ) = a k ( x i ) a n dd k ( x i ) a k ( x j ) 从上式可以看出,分辨矩阵m d ( i , j ) 包含了s 中所有记录之间的区分信息, 分辨矩阵是否包含空集元素可以作为判定s 是否包含矛盾信息的依据。根据分 辨矩阵的定义可知: 1 当d 。( x ;) 反( x ,) 时,即两个记录的预测决策属性取值不同,可以通过某 些条件属性特征的取值不同即a k ( x ;) a k ( x i ) 来区分开,它们所对应的分辨矩阵 元素取值为这两个记录中条件属性不同的特征属性集合,这样可以区分这两个 记录的特征属性集合。 2 当d k ( x 。) = 以( x j ) 时,两个记录的预测决策属性取值相同时,它们所对应 的分辨矩阵的取值为o 。 3 当两个记录发生矛盾时,所有的条件属性取值相同时,决策属性取值不 同时,对应的分辨矩阵中的元素取值为1 。 利用分辨矩阵求取最小约简的一个前提是:在数据表的预处理阶段要先对 不相容的记录进行处理,即分辨矩阵不处理不相容记录。预处理的方法如将冲 突的记录数除以记录总数,得到一个粗糙度的量度,该量度可以作为数据表的 一个特征【1 9 j 。 基于分辨矩阵的约简算法描述为: 输入:决策表s = “c u n 以今,其中u 为论域,c 为条件属性集,d 为 决策属性集。 输出:该决策表的一个相对约简。 步骤1 :计算决策表的分辨矩阵m 并将矩阵中属性组合数为- 的属性列为 最终的属性约简集合,即为核集c o r e ; 步骤2 :从分辨矩阵中找出不包含核属性且c i j # o 的属性组合q , q = c u i c 0 nc o r e = c 季o ,i , y = j 2 磁; 步骤3 :将所有不包含核属性的条件属性组合表示为合取范式,即: p = a ( v e r y
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司设计人员安全培训课件
- 肺晚期的护理查房
- 骨折术后康复护理查房
- 饲料公司会计汇报
- 施工现场管理办法
- 老年患者护理风险与安全管理
- 《装在套子里的人》课
- 新课程标准解读物理
- 事故案例安全培训感想课件
- 事故安全培训报道课件
- 2024年罗非鱼行业分析报告及未来发展趋势
- 钢丝绳吊装时最大允许吊装重物对应表
- XX医院DRG绩效分配方案
- GB 14866-2023眼面防护具通用技术规范
- 专题四“挺膺担当”主题团课
- 小学生品德发展与道德教育PPT完整全套教学课件
- 部编人教版五年级上册语文 第三单元单元分析
- 护理综述论文的撰写
- 医院院内急会诊制度
- TSDPIA 05-2022 宠物猫砂通用技术规范
- GB/T 11446.9-2013电子级水中微粒的仪器测试方法
评论
0/150
提交评论