毕业设计(论文)-基于粒子群优化最小二乘支持向量机的短期风速预测.doc_第1页
毕业设计(论文)-基于粒子群优化最小二乘支持向量机的短期风速预测.doc_第2页
毕业设计(论文)-基于粒子群优化最小二乘支持向量机的短期风速预测.doc_第3页
毕业设计(论文)-基于粒子群优化最小二乘支持向量机的短期风速预测.doc_第4页
毕业设计(论文)-基于粒子群优化最小二乘支持向量机的短期风速预测.doc_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于粒子群优化最小二乘支持向量机的短期风速预测摘 要为了能够减少或消除风电开发并网带来的对电网的稳定性的不良影响,风电场风速的短期预测已经成为各个国家共同关注的问题。风电场风速的准确预测,对风电场的规划计划设计、大型风场中风电机组开停机计划的安排、保持电网的安全稳定性、提高经济效益和社会效益都有很重要的意义。本文的历史风速数据来自我校校史馆处的风速采集器,模拟风电场风速进行短期的风速预测。本文采用粒子群优化最小二乘支持向量机(pso-lssvm)方法对风电场进行短期风速预测。并与支持向量机(svm)、最小二乘支持向量机(ls-svm)进行分析对比,体现经过粒子群优化后预测准确度的优势。粒子群优化算法(pso)分别对ls-svm的超参数和核函数进行优化,从而使最小二乘支持向量机(ls-svm)对短期风速预测的结果更加准确。本文的三种模型支持向量机(svm)、最小二乘支持向量机(ls-svm)、基于粒子群优化最小二乘支持向量机(pso-lssvm),利用实际数据对模型进行训练和测试,提前一步(即一个小时)对风速进行预测,并把三种模型的预测值与下一时刻的实际风速值进行比较,体现粒子群优化最小二乘支持向量机(pso-lssvm)模型的准确度高、收敛性好。为pso-lssvm模型实际运用提供理论支持。关键词:风力发电、风速预测、粒子群优化算法、支持向量机、最小二乘支持向量机、pso-lssvmparticle swarm optimization based on ls-svm prediction of short-term wind speedabstractin order to reduce or eliminate the development of wind power grid stability of the grid caused by the adverse effects of short-term forecast wind speed has become a common concern of all countries. accurate forecasts of wind speed, wind farm planning program on the design of large-scale wind turbine open stroke down to planned arrangements and to maintain security and stability of the grid and improve the economic and social benefits are very important significance. this historical wind speed data from the wind speed at my school history museum collection, short-term simulated wind speed wind speed forecast. in this paper, particle swarm optimization support vector machine (pso-lssvm) method of short-term wind speed prediction. and with the support vector machine (svm), least squares support vector machines (ls-svm) for analysis and comparison of expression through particle swarm optimization after prediction accuracy advantage. particle swarm optimization (pso) on the ls-svm, respectively, the hyper parameters and to optimize the kernel function, so that the least squares support vector machines (ls-svm) the results of short-term wind speed forecasting more accurate. three models of this paper support vector machine (svm), least squares support vector machines (ls-svm), based on particle swarm optimization support vector machine (pso-lssvm), the model using actual data for training and testing, early step (that is one hour) to predict wind speed and the three models predicted the actual wind speed and the next moment the value is verified by comparing pso support vector machine (pso-lssvm) the accuracy of model and convergence is good. the practical application of pso-lssvm models provide theoretical support.key words: wind power generation、wind speed forecasting、pso、svm、ls-svm、pso-lssvmi目 录摘要iabstractii第一章 绪论11.1研究背景11.2风电的发展概况21.3国内外风速短期预报研究现状31.3.1风速预测的基本方法31.3.2国外风速短期预报研究现状41.3.3国内风速短期预报研究现状51.3.4支持向量机在风速预测中的发展5第二章 支持向量机概述72.1机器学习的基本理论72.2小样本统计学习的基本理论82.2.1vc维概述92.2.2支持向量机(svm)算法102.2.3支持向量机用于回归112.2.4svm实现风速预测与预测结果122.3最小二乘支持向量机172.3.1ls-svm与svm的区别172.3.2ls-svm原理18第三章 最小二乘支持向量机的短期风速预测203.1最小二乘支持向量机进行短期风速预测的步骤203.2最小二乘支持向量机参数的确定213.2.1网格搜索法213.3ls-svm实现风速预测与预测结果243.3.1基于ls-svm短期风速预测matlab程序243.3.2基于ls-svm预测值与实际值的比较253.4粒子群优化算法283.4.1粒子群优化算法的定义283.4.2粒子群优化算法的初始化283.4.3pso算法介绍283.4.4pso的参数设置29第四章 基于粒子群优化最小二乘支持向量机的短期风速预测314.1基于粒子群优化最小二乘支持向量机的短期风速预测的步骤314.2参数优化314.2.1粒子群优化算法的思想314.2.2粒子群优化最小二乘支持向量机的构建334.2.3粒子群优化最小二乘支持向量机预测模型344.3基于pso-lssvm实现风速预测与预测结果344.3.1基于pso-lssvm短期风速预测matlab程序344.3.2基于pso-lssvm短期风速预测值与实际值的比较36第五章 对比与分析38结论41参考文献42致谢45南京工业大学本科生毕业设计(论文)第一章 绪论1.1 研究背景风速的准确预测是风电项目可行性研究现阶段的主要工作,风的功率和具有的能量是风力发电系统设计的主要依据,是选择风力发电机功率、确定风力发电机的启动风速和停止风速以及保证电网安全稳定的主要依据,所以只有在对一个区域的风能资源进行准确考察和计算以后,才能确定适当的风电参数。进而确定风电系统的工作范围和设计状态,使风电场发电量和稳定性达到期望目标,获得最佳的经济效益和社会效益。我国地域宽广,各地气候及地理条件大相径庭。各地风电资源的分布也不相同,因此一种固定短期风速预测模型很难实现各地的风速预测。因此,如何选择相应的模型对不同地域进行短期风预测与评估,是目前一项十分有价值和难度的研究工作。现在随着风电行业的快速发展,机组容量倍增,据文献1由于风能存在着随机性、间歇性和不可控性,风电大规模并入电网,必然会给电力系统稳定性带来严峻的挑战,所以风速预测已成为风电行业面临的主要的问题。如果能对风电场的短期风速有一个比较准确的预测,便可以依据提前预测的风速对风电场的发电量的进行短期的估算进而增强系统的安全性、可靠性和可控性。根据风电场估算的发电量曲线适当开关发电机组,达到降低运行成本,提高电网的稳定性的目的,最终实现低投入高回报,实现经济利益的最大化,进而促进风电行业的发展,使得风电这一绿色的能源得到最大的发展。即充分利用的资源,又保护了环境。如果对风电场风速有个比较准确的预测结果,则有利于提前调整计划,从而有效减少风力发电对整个电网带来的不利影响,减少电力系统运行造成的开支,提高电网的风电穿透功率极限(风电穿透功率指的是风电功率占系统总发电功率的比),并有助于制定合适的发电计划。中国电力科学研究院对此做了大量的研究付出了巨大的努力,一般情况下,在风电穿透功率不超过8%时我国电网不会出现较大的不稳定现象。但是,当风电穿透功率超过阙值以后,就有可能对整个电力系统产生巨大的影响,并且会危及常规发电方式。因此,为了减小风电对整个电网的不利影响,想要扩大风电在电网中的占有比,必须提高风电的可控性和可预测性。提前一步对风速做出准确的预测就显得至关重要,成为风电能不能继续安全稳定发展的关键问题。地球上的化石燃料如石油、煤炭、天然气等,经过人类的不断开发利用现在已经处于枯竭的边缘,至少就中国而言现在石油已经是所剩无几了,现在还在大力开发使用天然气,所以化石能源枯竭是早晚的事。穷则思变这是老话,面临的资源枯竭的压力我们就必须寻找新型的可再生资源来替代,逐步优化能源结构、提高利用效率。风力发电是一种可再生,而且基本无污染的资源,不光如此风电还有投入少、占地面积少等优点,目前风电已经受到各个国家的关注。发展可再生能源己经是大势所趋。所以解决风速预测是风电发展面临的主要问题。1.2 风电的发展概况风能是一种清洁能源并且储量无限,与传统的能源相比,风电有其自身独特的优越性,据文献2主要表现在:(1) 风力发电不用燃烧煤和油所以也没有燃烧产生的污染,不会引起温室效应、酸雨等环境问题;(2) 与核电相比,发电量虽然比不上,但是不存在核电放射性废料对人类的威胁;(3) 风力发电场建设周期短,投资少,装机灵活,可根据当地实际情况进行安装,可单装也可群组;(4) 现在风力发电的经济效益日益提高,比火电、水电、核电更加安全环保,没有火电的环境污染问题,水电的修筑大坝的开支,没有核电废料的放射危害,风电一次投资终生受益,在设备安装好后除了人员的开支外其它的基本不需要再花费金钱,主要还是风电对环境基本无污染,竞争力强;(5) 在新兴的能源发电中目前风电发展是最迅速也是最成熟的,目前风电机组单台发电功率高,不易出现故障,随着短期风速预测技术的成熟,以后大功率的风力发电机必将出现;(6) 由于风力发电机独特的分散安装方式,占用空间少,变电所占地面积只有总占地面积百分之一,剩下的空间仍然可以利用。全球范围内风力资源分布广泛,资源量大,所以发展势头也来越好。正是由于具有这些独特的资源优势,风力发电正逐渐成为许多可持续发展国家的主要发展方向。 同样风电在中国同样具有广阔的发展前景,主要原因有两个:(一)我国风力资源丰富分布广泛,有潜力大量开发使用风电;(二)一个技术的发展离不开国家的支持,现在我国正大力支持风电发展。风能发电在技术上日趋成熟,现在已经在部分适合地区装机发电商用。随着技术的进步,风力发电的成本必将能够进一步减少,发电效率也会进一步提高。因此,在各种可再生能源中,风能具有很强的竞争力,成为电力系统增长速度最快的新能源。1.3 国内外风速短期预报研究现状1.3.1 风速预测的基本方法国内外对于风力发电的研究越来越深入,但是关于短期风速预测的研究结果勉强令人满意。目前的一些风速预测方法,据文献3-4大致可分为以下两种:(一) 物理模型法:物理模型法中不仅用到了历史的风速数据,而且加入了气象和地表情况,以及风力发电机的性能,但主要依据是来自气象模型,所以物理模型要想获得比较准确的预测结果,需要经过长时间的训练与校正,因此不适用于短期风速预测。(二) 基于时间序列模型法:时间序列法利用收集的历史风速数据进行建模,它是以最小均方差和统计理论为基础,利用历史风速数据简历预测风速的模型,此种模型虽然建立简单但是对风速预测的精度不高。目前关于风电场风速预测的研究,大多采用第二种时间序列模型,时间序列模型据文献8又有以下的集中方法: 1)随机时间序列法(time series):随机时间序列法利用大量历史数据来建立预测模型,经过模型识别、参数估计、模型检验来推导确定一个能够进行短期风速预测的数学模型,进而达到预报的目的。该方法只要收集风电场的单一风速时间序列即可建立模型预测; 2)卡尔曼滤波法(kalman filters):把风速作为状态变量建立状态空间模型,但是卡尔曼滤波法难点在于估计噪声的统计特性,主要能准确的估计噪声的统计特性,就能比较准确的进行短期风速预测; 3) 持续法:这个是风速预测领域最简单的方法,可表示为:,式中表示预测值,p表示模型的阶数,t表示预测周期,t表示当前时刻,预测值就是离p最近的历史值的滑动平均值。一般情况下,可以简单地把离p最近一点的风速观测值作为下一点的预测值。该模型的预测误差较大,且预测结果不稳定。 4)模糊逻辑算法(fuzzy logic ):应用模糊逻辑算法再加上预报人员的专业知识,将数据和语言形成模糊规则库,然后选用一个线性模型逼近非线性动态变化的风速。可惜的是,仅仅利用模糊逻辑来预测风速,效果往往不佳,这是由于模糊预测的学习能力差,在预测系统假如要使用模糊逻辑算法还有待进一步的研究。1.3.2 国外风速短期预报研究现状国外对于风电场风速及发电功率的预测研究开始的比国内早。据文献10美国太平洋西北实验室(pacific northwest laboratory)率先提出短期风速预测对于风电场稳定发电的重要性。landberg建立了一种基于推导的短期预测模式,该模式与欧洲风力分布地图建立的方法类似,其主要思想是利用天气预报(nwp)测得的风速数值和方向数据,通过一定的方法转换成该处风速和风向,然后根据功率曲线预测成风电机组的发电量,最后曲线通过风电场的发电效率来矫正。welgley分别采用持续法、马尔可夫模型和自回归模型,且采用不同的步长来对风速进行预测,结果证明马尔可夫模型和持续法分别对于最短步长和最长步长的预测效果好。predictor是丹麦的里索国家实验室开发的一个风电场功率预测系统,它尽量的使用物理模型,数值天气系统的hirlam为其提供空气流动数据,根据地心引力定律和风速的对数分布图,可以把高空的风速转换为地面的风速。对于一个特定的地域,需要更详尽的数据,因此可以用wasp(wind atlas analysis application program)程序来进行分析,wasp可以考虑粗糙度和障碍物的影响。2001年,shuhui li应用神经网络模型对风速进行预测,进而预测发电功率,便于安排机组的保养与维修。近年来,人们越来越注重风速和功率的在线预测,开发了很多种用于在线预测的系统。1.3.3 国内风速短期预测研究现状目前我国对风速短期预测还在理论探索,风速短期预测的方法主要有时间序列法和神经网络法。文献14中,作者采用持续法、bp模型和arima三种方法提前1小时进行风速预测,并对预测结果进行了研究和比较,结果表明绝大多数情况下bp网络的预测效果好于持续法和arima;文献15采用径向基(rbf)网络对风电场的风速提前3小时进行了短期预测;文献16基于用模式识别的技术来选取风速样本,然后利用自适应模糊神经网络进行短期风速预测;文献17采用时间序列法对风电场风速预测模型进行了深入的研究;文献18将广义回归神经网络(generalized regression neural network,grnn)和时间序列相结合,提前10分钟对预测风速。就目前国内尽管对于风速和发电量的预测方法很多,但只限于理论摸索,还没有开发出独立的风速预测系统。1.3.4 支持向量机在风速预测中的发展支持向量机对解决小样本、非线性及高维模式识别问题具有特定的优势,具有较好的函数拟合和预测能力。文献19-20中把支持向量机应用到混沌时间序列的预测中,然后和神经网络预测的结果进行比较,得出支持向量机的性能比神经网络要好的结论。文献21将支持向量机应用到时间序列的预测,并和径向基函数的神经网络比较,发现支持向量机采用的是不敏感损失函数,神经网络采用的是huber s鲁棒损失函数,两种模型的损失函数不同,另外对正则参数的选择也和阙值b如何计算的问题做了相关研究。结果表明svm对神经网络有着极大的优势。文献22中提出ls-svm和pso算法的电厂中烟气含氧量软测量,利用pso优化算法优化的支持向量机参数能比传统方法更加迅速的逼近最优值,模型的校正即可以在线也可以离线进行,模型的灵活性更好。文献23利用递归结构在小样本的训练集上进行非线性辨识的研究,研究表明递归结构有着很好的泛化能力,和相同功能的神经网络相比,其结构简单性能更优。文献22-25还研究了其与线性回归法和人工神经网络软测量法的比较,表明软测量模型具有精度高、速度快、泛化能力强等特点。svm在风力发电中主要应用风速短期预测及在故障诊断方面,对于发电量的预测比较少。由于风力发电具有波动性、间歇性和不可控性的特点,假如大容量的风力发电并入电网,电力系统运行的安全和稳定比将面临着严峻的挑战。掌握对风电场风速进行短期预测,风电场发电功率的短期预报问题,是解决这一问题的最有效的途径。风速的短期预测主要有两种方法,一种是时间序列方法,根据历史风速数据进行下一时间段的风速预测,因为预测时间较短,所以对外界因素的响应慢;另一种是利用统计方法进行建模,如bp神经网络等,进行短期风速预测,根据训练因素不同,风速短期预测的精度也随因素的不同而变化,历史数据的范围比较宽泛。文献26是对基于支持向量机风速的研究。该文对风速预测的方法进行了研究,从物理和统计方法对支持向量机预测方法作了分析,得出结论svm在风速预测中有非常大的应用前景,并进行了预测实验验证。但由于风速受多种因素影响,例如大气压,空气密度,湿度,地形,地况等等,因此次预测模型存在一定的缺陷。45第二章 支持向量机概述支持向量机(support vector machine, svm)是由vapnik及其领导的at和tbell实验室研究小组在统计学习结构风险最小化原理论和vc维理的基础上提出的一种新的有发展前景的机器学习的方法。svm近似于结构风险最小化归纳原则(structural risk minimization inductive principle)。svm方法是根据有限的样本信息在模型的复杂度(即对特定训练样本的学习精度)和学习能力(即无错误的识别任意样本的能力)之间寻求最佳折衷,以期望获得最好的推广能力。svm具有直观的几何解释、完美的数学形式和良好的泛化能力,解决了模型选择的欠学习、过学习问题以及出现非线性问题;避免了局部最优解;克服了“维数灾难”,且需要设定的参数少,使用方便。svm是用于预测的新的方法之一。与神经网络预测相比,svm有明显的优越性,被当做是可以替代人工神经网络方法的方法,并已经成功地应用于许多预测和识别问题中,支持向量机模型速度快,精度高,结果稳定,模型选择更容易。另一方面,由于支持向量机完成的任务与bp神经网络非常类似,所以神经网络中的经验可以直接用到svm模型中。文献28提出的支持向量机的电力负荷预测模型,在2001年在欧洲智能技术网举行的世界电力负荷预测比赛中取得第一名。由此可以看出,svm预测方法表现优秀,应用前景宽广。现在svm电力预测模型已经受到各国的广泛关注,多篇文献29-31对svm电力负荷预测模型进行了研究。本章简洁明了地介绍了svm、ls-svm、pso-lssvm的理论,并用三种模型,采用学校收集的风速数据进行风速预测,对三种模型的预测结果进行比较分析。1.2.2.1 机器学习的基本理论机器学习的目的是根据给定的数据集合来寻找某个系统输入输出之间的关系,从而尽量能够对未来的事件做出准确的预测。根据训练样本机器学习的一般模型由产生器g、学习机器lm、训练器s三个部分组成。如图2-1 机器学习模型示意图所示:训练器s产生器gxyy学习机器lm- y- y图2-1 机器学习模型示意图g是样本产生器,可以从分布函数(一定概率但是未知)f(x)中独立产生出随机向量。s是训练器,对每个输入向量x返回一个确定的输出值y,产生的输出是条件分布函数。lm是学习机器,能在一组函数集(其中是参数集合)中选择输出,使其更好的逼近训练响应y的函数。训练以后的lm必须对任意输入都能给出输出,使期望风险最小; (2-1)其中,称为学习函数集或预测函数集,为函数的广义参数。为在给定输入x下训练器输出y与学习器给出的之间损失的期望值。2.2 小样本统计学习理论概述学习是所有智能系统都具有的基本特征,人工智能的表现形式就是学习,样本的机器学习问题是最前沿的研究领域现代智能计算技术的一个重要分支,机器学习模仿了人类学习概括归纳的能力,通过累积经验对事件进行判断,主要研究的是通过学习已经有的历史数据,通过学习归纳,对尚未发生的事件或者现象进行提前预测。 2.2.1 vc维概述定义一个指示函数集,能够被集合中的函数以任意可能的2h种方式分成两类的向量zl,k,zh的最大数目h称作的vc维。若对任意的样本数目n,总是存在一个n个向量集合可以被函数集打散,那么函数集的vc维是无穷大。若是一个以常数a和b为界集合,则主要考虑它的指示集合,其中,是阶跃函数。所以实函数集的vc维就是对应的指示集合的vc维。vc维表现了函数集的学习归纳能力的强弱,直接决定学习机器能不能达到推广的标准。vc维变大就会导致学习机器的复杂度和容量也随之变大。目前的遗憾的是现在尚没有能通用vc理论,仅仅只能对一些特殊的函数集起作用。例如平面中直线的vc维就是3。据文献34如图2-2 平面中vc维是3的例子所示,n维坐标空间中的线性函数集合的vc维是n+1。对于一些复杂的学习机器如神经网络,其vc维除了与神经网络结构有关外,还受学习算法等因素的影响,其vc维的确定就更加困难,目前急需要解决的问题是如何计算已经给定的学习函数集的vc维的维数。 z2z2z2z3z4z1 z1z1图2-2 平面中vc维举例2.2.2 支持向量机(svm)算法支持向量机(support vector machines)简称svm,是vapnik等人根据统计学习理论中的结构风险最小化原理而提出的。svm能够尽可能提高学习机的推广应用能力,即使训练样本有限但得到的决策规则对独立的测试集仍能够够得到较小的误差。svm算法是一个凸二次优化问题,可以保证找到的极值解就是全局最优解。这些特点使支持向量机成为一种优秀的学习算法。svm是统计学习理论中出现最晚的内容,但却是最实用的部分。其核心内容是1992年到1995年间提出的,目前仍处在不断拓展研究阶段。支持向量机的基本思想是通过一种非线性映射将输入向量x映射到一个高维空间z(特征向量),在映射到高维空间中构造一个最优分类超平面;实际上并不用知道上述非线性映射的具体形式,而是可以通过核函数计算高维空间中的内积。这样可克服高维数而引起的计算困难,有效的避免维数灾难。svm根据样本的选择结构。有间隔时细分的维数(称为fat shattering维数)要比vc维数的维数低,大间隔可能对应良性分布,所以svm有较好的推广能力。vc维数只对g取符号,而不考虑g本身的值,对大间隔分类器和用于回归的不太合适,因此定义为fat-shattering:设f为实值函数集合,假如存在实数rx,使得存在,满足: ,或 (2-2)则称点集x被细分,简称fat-shattering(可以假设为用宽度为2的直线来细分)。svm分类函数形式上相似于神经网络,输出是中间节点的线性组合,每个中间节点对应一个svm,据文献37如图图 2-3 支持向量机示意图所示: yk(x1,x) k(x2,x) k(xn,x)输入向量 x1 x2x3 xn x=(x1,x2)图 2-3 支持向量机示意图2.2.3 支持向量机用于回归设某待回归的输入、输出样本数据集为,为n维系统输入向量,为系统输出,回归的目的就是经过数据的训练学习确定一个函数的解析式,使得在相同的输入情况下,解析式的输出能够在一定精度范围内与时间值相似。svm函数回归方法的基本思想方法是:通过非线性交换日将n维输入样本从原空间映射到高维特征空间f,并在该高维空间构造一个最优线性回归函数: (2-3)svm在算法用原空间核函数代替了高维特征空间的点积运算,避免了复杂的计算。此时,输出y取实数值,用相似于间隔的概念定义-不敏感损失函数,可得到: (2-4)优化的目标函数为: (2-5)为了更好的描述将不敏感函数用于回归的概念,假设我们要以精度逼近未知的,即用另一函数描述,并使处于的管道内。为此取一个弹性的总趋于平坦的管道,并把放入此管道中,这样它会碰到的一些点。根据这些点将管道的管道壁固定,那么管道的中心线就可以定义的逼近,管道碰到处的点的坐标就是支持向量的坐标。核函数准确的描述了管道的变化,使趋于管道平坦处。为了转换最优化问题,本文引入了两个松弛变量和,则可得: (2-6)约束条件: (2-7) 其中, 经过转化后可以用支持向量机的核方法表示,其解为: (2-8)2.2.4 svm实现风速预测与预测结果1.2.2.12.22.2.12.2.22.2.32.2.42.2.4.1 基于svm短期风速预测的matlab程序取200历史风速数据作为训练数据,50作为预测数据,经过测试7步预测1步的效果比较好,即利用前7个小时的风速预测后一个小时的。具体程序如下:%t1.是目标向量,p是输入向量(10维)clear;close;%数据载入load 1.mat;%提取样本p,tk=7; for i=1:length(a)-k m(1:k,i)=a(i:k-1+i,:); endp=m;t=a(k+1:length(a),:);q=250;%样本总数p0=p(1:q,:);%取q个样本,前j个做训练集,后q-j个做测试集t0=t(1:q,:);j=200;%训练样本个数p1=p(1:j,:);%训练集j个t1=t(1:j,:);p2=p(j+1:q,:);%测试集q-j个t2=t(j+1:q,:); % %2归一化 x=max(a)*0.5;p1n=p1/x;t1n=t1/x;p2n=p2/x;t2n=t2/x;% bestmse,bestc,bestg = svmcgforregress(t1,p1,-10,10,-5,5,3,0.1,0.1,0.001); %c,g寻优bestg=0.1;bestc=2;model1 = svmtrain(t1n, p1n, -s 3,-t 2,-g bestg,-c bestc,-p 0.001);%用训练集训练 t1nn,y3=svmpredict(t1n,p1n,model1);%用所有样本测试t1m = t1nn*x; figure(1); time1=1:j; plot(time1,t1,-,time1,t1m,-); t2nn,y3=svmpredict(t2n,p2n,model1);%用测试样本测试t2m=t2nn*x; %反归一化 figure(2); time2=j+1:q; plot(time2,t2,-,time2,t2m,-); figure(3); e=(t2-t2m)./t2; plot(time2,e); err=abs(e); ee=0; for i=1:length(p0)-j ee=ee+err(i); end % 3.模型预测误差x=t2;p=t2m;figure(4);plot(x);hold onplot(p,-.r) ;hold off title(风速序列预测和实测对比图);xlabel(t/1h);ylabel(风速值 / m/s);legend(实际值,预测值)e = abs(x-p); %误差disp(平均绝对误差为:);disp(mean(e) %平均绝对误差disp(平均相对误差为:);disp(mean(abs(e./x) % 相对误差disp(相对误差为:);disp(x-p)./x); % 平均相对误差figure(5)bar(e./x);title(相对误差);xlabel(t/1h);ylabel(误差);2.2.4.2 svm模型的预测值与实际值的比较上一节的程序中有一段是将数据分组的,如下k =7;for i=1:length(a)-km(1:k,i)=a(i:k-1+i,:);end该段程序可以通过设定k的值将数据进行分组,本程序将训练值与测试值分成7个一组构成200*7和50*7的矩阵,前200组用来对模型的训练,后50组用来测试。训练曲线如下图 2-4 svm训练值与预测值比较所示: 图 2-4 svm训练值与预测值比较在经过上面的200组数据的训练学习以后,模型就具有一定的预测能力,然后用剩下的50组数据输入进行预测,得到预测结果,把实际值和预测值绘制在一张图里进行比较,如图2-5 svm 测试值与预测值比较所示:图2-5 svm 测试值与预测值比较上图清晰的表示出预测值是如何伴随着着输入值的变化而变化的,可以说还是比较准确的,但是还有有误差,如图 2-9 svm 预测结果误差图所示:图 2-9 svm 预测结果误差图由程序计算出的误差为0.1181,由误差图可以看出svm模型预测的风速有时也是比较准确的,但是有时误差比较大,还有待改进。2.3 最小二乘支持向量机2.3.1 ls-svm与svm的区别2.32.3.12.3.1.1 如何在规模过大时求解suykens等人提出的最小二乘支持向量机(least squares support vector machines, ls-svm)从机器学习的损失函数着手,ls-svm利用等式约束条件替代了svm中的不等式约束,使用二范数对准备优化的目标函数进行处理,使得最小二乘支持向量机方法的优化问题变为通过kuhn-tucker条件转化为求一组线性方程组解,大大降低的计算量,加快了速度。2.3.1.2 构造优化问题从样本分类与回归估计的分析中可知支持向量机与最小二乘支持向量机在优化问题的构造上,二者的目标函数分别采用了误差因子的一次项与二次项,而且约束条件也分别采用了不等式约束与等式约束形式。这两方面的不同必然导致svm与ls-svm求解过程的不相同。2.3.1.3 优化问题求解方法svm求解qp问题中,训练样本的个数决定了变量的维数,然而矩阵元素的个数却是训练样本个数的平方。当训练样本个数很多时,传统办法就难以用来对支持向量机算法进行求解。针对svm的求解困难的问题,也产生了一些相应的解决办法,如选块算法和smo算法等。这些算法对简化了求解svm优化问题有一定作用,促进了支持向量机的发展。而最小二乘支持向量机方法通过求解线性方程组来寻找最终的决策函数,适当的降低了求解难度,减少了求解所需要的时间,据文献38-39计算速度快了,就可以适用于解决一些大规模问题,更能适应于一般的实际应用。即使不能解得全局最优解,也可以得到较高精度识别率。2.3.1.4 解的稀疏性支持向量机标准算法中,解复杂的qp的问题需要求,理论上的能够寻找到全局最优解,并且,大部分的lagrange乘子均为零,使得最终的决策函数只依赖于少部分样本数据,就是支持向量。使其中的解表现出稀疏性。在最小二乘支持向量机方法中采用了 误差平方项以及等式约束条件来优化问题的目标函数,将svm的qp问题转化为求解一组线性方程组,使得lagrange乘子与误差项存在比例关系,最终的目的是使得最终决策函数和所有样本都存在一定的关系,也就失去了svm方法中解的稀疏性的特点。但是ls-svm方法对最终求解得到的lagrange乘子进行排序,并使用“修剪”算法,仍然可以在一定程度上实现解的稀疏性的。2.3.2 ls-svm原理最小二乘支持向量机是一种标准支持向量机的扩展形式。它的损失函数直接定义为误差平方和,将优化的不等式约束转化为等式约束,应此将二次规划问题转化为线性方程组求解,降低了计算复杂程度,加快了求解速度。ls-svm是在标准支持向量机的目标函数中增加了误差平方和项。建立优化目标: (2-9) (2-10) 这里,调节量是正实数,它可以在模型复杂度和训练误差之间取一个折中值以便使函数具有较好的泛化能力。ls-svm通过定义与svm不同的损失函数,将不等式约束改为等式约束: (2-11)上式中,是lagrangian乘子。最优的和b可以通过kkt条件获得:进一步可得: (2-12)由上式消去和优化问题转化为求解下面的方程: (2-13)其中y=y1,ynt ,=1,1t, =所以ls-svm函数的回归结果为: (2-14)小结:、章主要介绍了支持向量机模型是如何来进行短期风速预测,并初步的介绍了最小二乘支持向量机。第三章 最小二乘支持向量机的短期风速预测3.3.1 最小二乘支持向量机进行短期风速预测的步骤基于最小二乘支持向量机的短期风速预测,主要目的是试图寻找确定一个函数来发现未来值与过去值之间的关系,也就是说预测就是利用过去和现在的观测值去估计未来值,这实际上是基于一个假设,即未来值与过去值存在某种函数关系。预测步骤如下: 1)风速样本的选择 最小二乘支持向量机预测的前提条件就是要有足够多且精度高的样本集。为使训练过程得到最好的效果,建立的模型有良好的性能和泛化能力,收集整理预测对象的历史数据,并将收集到的数据分为训练样本和测试样本。 2)选择合适的最小二乘支持向量机的核函数和相应参数,建立回归函数,寻找决策函数式,确定预测模型,利用训练样本对模型进行训练并对未来风速进行预测。 3)预测误差分析 通过分析误差可以对预测结果进行评估,并根据误差可以对模型进行改进。目前计算和分析预测误差的方法和指标主要有如下几种:(1)绝对百分比误差(ape-absolute percentage error) (3-1)式中v表示预测值,表示实际值,这是一种直观的误差表示方法。在电力统中作为一种考核指标而经常使用。 (2)平均相对误差(mremean relative error) (3-2)式中,n为预测值的个数;v为预测值;v为实测值。由于预测误差有正有负,为了避免正负相抵消,故取误差的绝对值进行综合计算其平均数,这是误差分析的综合指标法之一。(3)均方误差(mse-mean square error) (3-3)均方误差是预测误差平方之和的平均数,它避免了正负误差不能相加的问题,是误差分析综合指标之一。(4)均方根误差(rmse-root mean square error) (3-4)由于对误差e进行了平方,加强了数值的误差在指标中的作用,从而提高了这个指标的灵敏性,是一大优点,这也是误差分析的综合指标之一。本文主要采用绝对百分比误差及平均相对误差作为评价标准。3.2 最小二乘支持向量机参数的确定用于回归预测的最小二乘支持向量机模型中,惩罚因子c用于控制模型复杂度和逼近误差的折中,c越大则对数据的拟合程度越高,但训练时间增加。比如c到时,表示没有一个错分的样本,但泛化能力将相应降低。这些参数在一定程度上对模型的预测精度具有很大影响,且目前尚无统一选择的标准。但是核函数参数的值对模型的预测速度、预测精度均有重要的影响,从而对值进行优化研究。目前常用的方法为网格搜索法,但这类方法只作用于求空间中的单个解,随着迭代的进行,这个解沿着速度下降方向不断改进,可能陷入局部最优解。而遗传算法综合了随机搜索与定向搜索的优点,可以取得较好的区域搜索和平衡的空间扩展。3.2.1 网格搜索法3.3.13.23.2.13.2.1.1 网格搜索法简介(1) 特征概述首先,网格能够提供资源共享,据文献40它能消除信息孤岛,实现应用程序的互连互通。网格与计算机网络并不同,计算机网络实现的是一种硬连通,而网格能实现应用层面的连通;其次,网格还有第二个特点是协同工作,很多网格结点可以共同处理一个项目;第三,网格是基于国际开放技术标准,这跟以前很多行业、部门或者公司推出的软件产品不一样;最后,网格可以提供动态的服务,可以适应变化。(2) 网格核心技术为解决不同领域复杂科学计算与海量数据服务的问题,人们基于网络互连构造了不同的网格,有代表性的如计算网格、数据网格、拾遗网格等,它们在体系结构和解决问题的类型等方面大同小异,但都需要共同的关键技术,主要有如下几种: 高性能调度技术。网格的调度需要建立随时间变化的性能预测模型,充分利用网格的动态信息来显示网格性能的波动。 资源管理技术。资源管理的关键问题是为用户有效地分配资源。从而实现系统最优化,运行速度最大化。 网格安全技术。网格计算环境中的用户数量、资源数量都有很大变化余地,一个计算过程中的多个子进程间存在不同的通信机制,资源支持不同的认证和授权机制且可以属于多个组织。(3) 网格分布式计算网格分布式计算是近几年提出的一种新的计算方法。据文献42可知所谓网格分布式计算就是在两个或多个软件之间互相共享信息,这些软件既可在同一台计算机上运行,也可以在网络互联的多台计算机上运行。分布式计算比起其它算法具有以下几个优点: 稀有资源可以共享; 通过分布式计算可以在多台计算机上平衡计算负载; 可以把程序放在最适合运行它的计算机上,其中,共享稀有资源和平衡负载是计算机分布式计算的核心思想之一。 据文献41实际上,网格计算就是分布式计算的一种。如果我们说某项工作是分布式的,那么,参与这项工作的一定不仅仅只有一台计算机,而是一个计算机网

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论