基于OS-ELM和Bootstrap方法的超短期风电功率预测附录.doc_第1页
基于OS-ELM和Bootstrap方法的超短期风电功率预测附录.doc_第2页
基于OS-ELM和Bootstrap方法的超短期风电功率预测附录.doc_第3页
基于OS-ELM和Bootstrap方法的超短期风电功率预测附录.doc_第4页
基于OS-ELM和Bootstrap方法的超短期风电功率预测附录.doc_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

附录A 对于N个不同的训练样本,是维输入向量,是维输出向量,具有D个隐层节点和无限可微激活函数的SLFN结构可以以零误差逼近这N组样本,即存在,和,使,也可写成如下形式: (A1)式中:为维向量,表示输入层与隐含层的神经元的连接权值;为维向量,表示隐含层与输出层神经元的连接权值;为隐含层神经元的阀值;为网络的输出;为激活函数,可以是“sig”,“rbf”,“sin”等多种形式。这N个方程可写成矩阵形式: (A2)(A3)and ELM全局最优输出权值可写为: (A4)OS-ELM主要包括2个步骤。1)初始化阶段给定网络初始的隐含层节点数,初始训练样本,激活函数,随机产生输入层和隐含层之间连接权值和阀值初始化网络,求得初始隐含层输出矩阵H0和输出权值向量。2)在线序贯学习阶段当第t+1批次样本数据到来,t+1次隐含层输出矩阵和输出权值向量可根据下式更新:(A5) (A6)式中:;; 表示第t+1批次样本的个数;=,., ,表示第t+1批次样本的输入向量。整个流程详见图A1,首先通过标准ELM建立初始网络,随后根据最新批次的样本数据不断更新参数H和,更新网络,直到所有数据学习完毕。图A1 OS-ELM流程图Fig.A1 Flowchart of OS-ELM附录BB1 误差评估概念1) 残差样本对于个误差评估训练样本,假定预测残差是一个随机变量,其中表示原始网络隐函数,为对应的实测值,方差为,其总体分布F未知。为了消除模型系统误差的影响,将预测残差中心化:, (B1)上述即构成误差总体分布F的一个观测。2) Bootstrap训练样本从中有放回地进行次随机抽样,记第j次抽到样本为(),由此构造一组Bootstrap训练样本,其中定义为: (B2)理论上可以近似逼近,神经网络隐函数可以近似逼近,即Bootstrap输出可以有效模拟实际的网络输出。进一步,为考虑输入对残差的影响采取如下方式:产生一组N(0,1)随机变量来模拟输入向量对残差的影响,最终的Bootstrap训练样本输出可以写成: (B3)3) Bootstrap置信区间给定任意测试样本输入,如图5(b)所示得到组预测输出()。记为Bootstrap伪输出由小到大的排序,在给定的置信水平下Bootstrap置信区间为,。本文对比研究中使用的两种Bootstrap置信区间计算法如下。1) PB法:=,=,。2)BCPB法:记,计算Bootstrap伪输出分布中不大于的概率,即;计算(其中,为标准正态分布的累积函数);最终的BCPB置信区间的上下限。基于Bootstrap法的多ELM误差评估步骤总结如下。步骤1:生成残差样本。对个训练样本,执行以下计算:给定第j个输入,通过原始预测网络OS-ELM计算;计算误差;计算残差。步骤2:生成Bootstrap训练样本。在进行NB次有放回随机抽样,根据式(12)生成新的Bootstrap伪样本输出, 。步骤3:根据步骤2中新产生的训练样本训练得到新的ELM结构,重复步骤2直到完成M个ELM误差评估网络。步骤4:评估Bootstrap置信区间。对测试样本输入,根据步骤3结果计算 ();将生成的个输出按升序排序,计算置信区间,。在实际使用过程中,对于算法有如下说明:取值不宜过大或过小,为兼顾评估计算时间及足够伪样本数量,本文选取M=5000;在应用Bootstrap进行ANN预测误差评估过程中,多个ANN学习过程独立并占用主要的CPU计算时间,ELM的快速学习特性以及独立ANN的天然并行性,有助于使上述评估方法实用化。附录C表C1给出了一个批次(24个预测点)的平均置信区间宽度比较,其中正态分布估计法是将风电预测误差近似看作正态分布并评估其置信区间。从表中可以看到,2种Bootstrap置信区间宽度比正态分布法要短,说明其估计精度相对较高。除此之外,BCPB法与普通百分位数Bootstrap法相比也能得到较短的置信区间宽度。表C1 不同置信度下PIW比较Table C1 PIW comparison under different confidence levelsPIW(MW)80%90%95%春夏秋冬春夏秋冬春夏秋冬正态分布估计法18.1615.4616.7116.0220.1816.2718.5517.7221.3117.0919.6618.74百分位数Bootstrap法17.1713.7016.5315.4818.1214.1417.4616.2418.8915.1318.5816.83BCPB法17.0513.1215.9815.7418.0413.2516.3216.5619.2715.0118.2617.12附录D将一天144点按9种不同的更新周期平均分成不同的批次:1点(10 min)、3点(30 min)、6点(1 h)、12点(2 h)、24点(4 h)、36点(6 h)、48点(8 h)、72点(12 h)和144点(1 d)每批次。选取2010年5月全月的数据来测试不同更新周期长度对模型预测精度的影响。总体RMSE如图D1所示。图D1 不同滚动周期下的误差比较Fig.D1 Error comparison among different time scale由图可见,滚动周期在14 h时模型的预测效果较好,随着每一批次数据量增大(滚动周期增大),预测精度呈下降趋势,这也意味着对于相同的数据量,OS-ELM网络更新的频率也越低,网络无法实时跟踪最新的样本特性;但是每一批次数据量也不是越小越好,考虑到SCADA系统的可靠性以及天气波动剧烈的情况,可能会造成神经网络结构稳定性下降,对精度产生负面影响。在本文中,综合考虑超短期预测未来04 h功率的需求以及维持神经元结构稳定性,选择每4 h更新一次网络,即每24点为一个批次。附录E为了测试隐层节点数对模型精度的影响,本文选取了不同月份的6组数据进行测试,每组数据由连续7 d的数据组成,数据每4 h更新一次,为了尽量消除随机因素

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论