电工杯A题国家二等奖电力系统短期负荷预测之欧阳德创编_第1页
电工杯A题国家二等奖电力系统短期负荷预测之欧阳德创编_第2页
电工杯A题国家二等奖电力系统短期负荷预测之欧阳德创编_第3页
电工杯A题国家二等奖电力系统短期负荷预测之欧阳德创编_第4页
电工杯A题国家二等奖电力系统短期负荷预测之欧阳德创编_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、欧阳德创编2021.03.07欧阳德创编2021.03.07欧阳德创编2021.03.07报名序号:1254时间:2021.03.07创作:欧阳德论文题目:电力系统短期负荷预测姓名班级有效联系电话参赛队员1参赛队员2参赛队员3指导教师:参赛学校:证书邮寄地址、邮编、收件人:报名序号:阅卷专家1阅卷专家2阅卷专家3论文等级电力系统短期负荷预测摘要提高负荷预测进度是保障电力系统优化决策科 学性的重要手段。根据已有电力负荷数据及气象因 素数据,文章主要建立了 4个模型来解决关于短期 负荷预测方面的问题。针对问题一,建立日最高负荷量模型、日最低负荷 量模型、日峰谷差模型、日平均负荷量模型以及日 负荷率

2、模型。利用Excel软件可将两地区014年各 个负荷量的统计值求出(详见附件1),其中地区 二2014年1月1日的日最高负荷量、日最低负荷 量、日峰谷差、日平均负荷量以及日负荷率分别为 6765.5、3748.48、3017.05、5138.23 和 0.76。通 过观察两地2014年负荷数据变化曲线图,考虑数 据的波动性等因素可得岀地区二更准确的预测结果 的结论。针对问题二,构建多元线性回归模型,利用SPSS 软件对日最高负荷、日最低负荷、日平均负荷与各 气象因素进行回归分析。通过观察标准化残差图 (详见图4),认为没有趋势性,回归模型有效。用同样的方法可得岀两地区各个因变量的回归方程(详见

3、表5) o对多元线性方程做回归误差分析, 认为将不重要的气象因素剔除可减小误差。利用逐 步回归法可进行更合理的回归分析,得出优先推荐 平均温度来提高负荷预测精度。针对问题三,构建ARIMA预测模型,对数据 进行预处理,取每年春季的负荷量作为参照数据, 消除了季节成分的影响。通过自相关方面的分析, 确定模型为ARIMA (1,1,1),利用SPSS软件可得 出所需的预测结果。例如地区一在时间点T0000的 负荷量预测模型为必"92弘J+£-0.999。模型拟合 可决系数都在08以上,说明预测结果精度比较 咼O针对问题四,构建基于BP神经网络算法的多 元非线性系统模型,确定模型

4、为 )=ANN(X"2,W,“,X5),利用Matlab编程可训练出相 应的神经网络结构,得岀预测结果。通过参照数 据、模型原理这两个方面,论证了计及气象因素影 响的负荷预测结果的精度得到了改善这一结论。针对问题五,提取两地区日负荷率作为待处理 数据,分别对两地区日负荷率进行正态拟合、T分 布拟合、Logistic拟合,做岀拟合曲线并对各个拟 合进行拟合曲线广义似然比检验。得岀地区二的数 据比地区一的数据更有规律的结论。关键词:短期负荷预测;多元线性回归;ARIMA 预测模型;BF神经网络;拟合短期负荷预测是电力系统运行与分析的基础, 对机组组合、经济调度、安全校核等具有重要意 义。

5、提高负荷预测精度,是保障电力系统优化决策 科学性的重要手段。现代电力系统中,构成电力负 荷的用电器种类繁多,空调等受气象条件影响的负 荷占比持续增高,气象因素(温度、湿度、降雨量 等)对电力系统负荷的影响愈显突岀。考虑气象因 素成为调度中心进一步改进负荷预测精度的主要手 段之O已知地区1、地区2从2009年1月1日至 2015年1月10日的电力负荷数据(每15 min 个采样点,每日96点,量纲为MW)以及2012 年1月1日至2015年1月17日的气象因素数据 (日最高温度、日最低温度、日平均温度、日相对 湿度以及日降雨量)。具体要求如下:1 请分析两个地区2014年1月1日一2014 年1

6、2月31日的负荷数据,统计各地区全年的日最 高负荷、日最低负荷、日峰谷差、日负荷率指标的 分布情况,并绘制两地区2014年全年的负荷持续 曲线;结合上述结果,分析两地区负荷变化的主要差 异;初步预判哪个地区的负荷可以获得更准确的预 测结果,说明你的理由。2. 根据2012年1月1日至2014年12月31 日的数据,分别对日最高负荷、日最低负荷、日平 均负荷与各气象因素的关系进行回归分析,分析回 归误差;如果要用气象因素来提高负荷预测精度, 在诸气象因素中,你优先推荐哪个(或哪几个)? 简要说明理由。3. 请根据已知负荷数据,构建预测方法,对两 个地区2015年1月11日至17日共7天的电力负

7、荷进行预测(间隔15min),给出负荷预测结;在 不知道实际负荷数据的条件下,你对预测结果的准 确度有何推断,请说明理由。4. 如果已获得2015年1月11日至17日的气 象因素数据,你能否构建计及气象因素的负荷预测 方法,对两个地区2015年1月11日至17日共7 天的电力负荷再次进行预测(间隔15min),给出 预测结果;与原有的预测结果相比,你认为计及气象 因素影响的负荷预测结果精度得到改善了吗?有何 证据?请说明理由。5. 综合上述计算结果,你如何评价两地区负荷 规律性的优劣?你还有什么证据可以佐证两地区负 荷整体规律性优劣的判断?2问题的分析2. 1对于问题一的分析问题一要求分析两个

8、地区二014年的负荷量数 据的一些统计量,全年的日最高负荷、日最低负 荷、日峰谷差、日负荷率指标的分布情况。可以直 接建立最大量最小量模型以及一些简单算数模型来 解决,利用Excel软件可以很快求出答案。题目还 要求绘制出两地区二014年全年的负荷数据变化曲 线,可以利用Matlab的绘图工具来绘制岀想要的 结果。最后对所得统计量以及两地区二014年全年 的负荷数据变化曲线进行分析,可以初步预判哪个 地区的负荷可以获得更准确的预测结果。2. 2对于问题二的分析问题二要求对日最高负荷、日最低负荷与各气 象因素的关系进行回归分析,分析回归误差,还要 求用推荐哪个(或哪几个)气象因素,来提高负荷 预

9、测精度。可利用统计学知识分别对日最高负荷、 日最低负荷与各气象因素的关系进行回归分析,并 通过回归分析所得的一些统计学数据来进行回归误 差分析以及选出推荐的气象因素。2- 3对于问题三的分析该问题要求根据一致负荷数据,构建预测方 法,对两个地区二015年1月11日至17日共7 天的电力负荷进行预测。此问题没有提及气象因素 对负荷的影响,说明要求我们通过负荷数据本身进 行预测,这是个时间序列预测问题,可建立 ARIMA模型就可预测岀指定7日的负荷量。2. 4对于问题四的分析该问题要求构建计及气象因素的负荷预测方 法,并给出预测结果。气象因素对负荷影响是很大 的,我们可以尝试构建人工建神经网络的模

10、型,通 过训练网络可以比较准确地找到各气象因素与负荷 之间的关系,进而预测岀指定7日的负荷量。该问 题还要求将通过气象因素预测岀的结果与问题3的 预测结果进行比较,可以从多个方面比较预测结果 的精度。2. 5对于问题五的分析该问题要求对两地区负荷规律性的优劣进行评 价,既然是考虑规律性,我们可以将两地区的负荷 数据进行正态拟合、Logistic拟合以及T分布拟 合,比较两个地区负荷的拟合效果,就可以得出哪 个地区的规律性更好。3. 模型的假设与符号说明3. 1模型的假设(1) 假设2009年1月1日至2015年1月10日的电力负荷数据均为真实有效数据;(2) 神经网络训练期间,“坏数据”带来的

11、 训练误差;不会使网络不能收敛到理想误差。3. 2符号说明MFX承5隐层节点数权值输入端连接的神经节点数第f个地区第丿天笫R个时刻所测量的负荷数 据第i个地区第丿天的日最高负荷量%第个地区第J天的日最低负荷量 第i个地区第丿天的日峰谷差 第:个地区第丿天的日平均负荷, 第i个地区第丿天的日负荷率Y日最高负荷、日最低负荷、日平均负荷中的种变量ANNX、X,X,非线性函数最咼温度最低温度平均温度相对湿度降雨量4.模型的准备4. 1回归分析法基本原理回归分析法是根据历史数据的变化规律和影响 负荷变化的因素,寻找自变量与因变量之间的相关 关系及回归方程式,确定模型参数,据此推断将来 时刻的负荷值。回归

12、分析法的优点是计算原理和结构形式简 单,预测速度快,外推性能好,对于历史上没有岀 现的情况有较好的预测。4. 2针对问题三对原始数据进行预处理在解决问题三的过程中,利用ARIMA预测模 型,首先运用SPSS软件将地区一的原始负荷数据 导入,对时间点T0000构建如下的序列图。图1数据处理前地区一 T0000时间点序列图图中有明显的季节成分,因此需要做季节分 解。题目要求预测两个地区二015年1月11日至 17日共7天的电力负荷,都属于春季。因此只需 提取每年的前三个月的负荷数据作为输入的数据。 分解后,序列图如下。图2数据处理后地区一 T0000时间点序列图从上图可知,排除了季节成分。所做的预

13、测将 会更精准,同时计算的复杂程度将会降低。4. 3 BP神经网络基本原理概述4. 3. 1 BF神经网络基本原理BP网络模型处理信息的基本原理是:学习过 程由信号的正向传播和误差的反向传播两个过程组 成。正向传播时,输入信号通过中间层作用于输岀 层,经过非线形变换,产生输出信号;若输岀层的实 际输岀与期望输岀不符,则转向误差的反向传播阶 段。误差的反向传播是将输出误差以某种形式通过 中间层向输入层逐层反转,并将误差分摊给各层的 所有单元,从而获得各层的误差信号作为修正各单 元权值的依据。此过程周而复始,直到输出的误差 降到可以接受的程度。此时经过训练的神经网络即 能对类似样本的输入信息自行处

14、理,进而输岀误差 最小的经过非线形转换的信息,然后可通过检验神经网络的有效性。运用BP神经网络处理实际问题时分为两个步 骤即网络训练和网络应用。第一步网络训练采用有 监督的学习,有监督的学习是指每一个训练样本都 对应一个代表环境信息的教师信号作为期望输出, 训练时计算实际输岀与期望输岀之间的误差,根据 误差的大小和方向反复调整网络连接权值,直到误 差达到预订的精度为止。欧阳德创编2021.03.07欧阳德创编2021.03.07欧阳德创编2021.03.07欧阳德创编2021.03.074 3. 2BF神经网络的结构欧阳德创编2021.03.07欧阳德创编2021.03.07BP神经网络是一种

15、多层前馈网络,其神经元 连接权值的调整规则采用误差反传算法即BP算 法。BP神经网络又是一个多层感知器,多层次感 知器强调神经网络在结构上由输入层、隐含层、输 出层等多层构成,BP网络则强调层间连接权值通 过误差反传算法进行调整。BP神经网络的特点是:网络由多层次构成,包 括输入层、隐含层(单层或多层)和输岀层;层与层 之间全连接,同层神经元之间无连接;传递函数必须 可微,常用的有Sifmoid型的对数、正切函数或线 性函数;采用误差反传算法进行学习,逐层向前修正 网络连接权值。BP神经网络结构在设计时主要包括以下方 面:(1)网络层数BP神经网络至少包括一个输入层和一个输岀 层,可以包含一个

16、或多个隐含层,所以网络层数的 决定问题即是隐含层层数的决定问题。理论上己经 证明,单个隐层可以通过适当增加神经元节点数达 到任意的非线性映射,因此大多数情况单隐层结构 的神经网络足以满足需求。在样本较多的情况下, 增加一个隐层可以有效减小网络规模。(2) 输入层节点数输入层节点数取决于输入向量维数,具体可根 据实际问题和数据类型确定。如果输入数据为模型 信号波形,则可根据波形的采样点数目决定输入向 量维数;如果输入数据为时间序列数据,则输入节点 为时间点数;如果输入为图像,则输入单元可以为图 像像素或经处理的图像特征。(3) 隐含层节点数隐含层节点数在很大程度上影响着BP神经网 络的性能。对此

17、一个非常重要的定理表述为对任何 个在闭区间内的连续函数都可以用三层即单隐层 BP神经网络逼近,因而单隐层BP网络可以完成任 意的n维到m维的映射。一般而言,隐含层较多 节点可使网络达到更好的性能,但可能导致较长的 收敛时间。实践中,通常采用以下经验公式选 择最佳节点数:f c,3第一种:幺 ,其中为样本数,M为隐层 节点数。如果,M,规定V=0。第二种:后右,其中"为输入节点数, ,为输出节点数。"是之间的常数。第三种:,"为输入节点数。(4) 输出层节点数输出层节点数需要根据实际问题的扌由象模型进 行确定。例如在利用神经网络解决模式 分类问题中,如果共有个类别,

18、则输出节点数为或吨2,卜表述不小于X的最小整数。(5) 传递函数根据研究经验,一般情况下输入层和隐层的传 递函数选用S型函数或正切S型函数输出层选用线性函数作为传递函数,用purelin表7J o(6) 训练方法BP神经网络采用迭代调整的方式进行权值确 定,因此在训练之前需要确定初始值作为迭代调整 的起点。初始值的大小会影响网络的性能,通常情况将初始值定为较小的非零随机值,经验值为端连接的神经节点数。之间,其中F为权值输入5模型的建立与求解5. 1问题一的模型建立与求解对于第一问,设®为第,个地区第丿天第个时 刻所测量的负荷数据,可建立日最高负荷量的数学 模型:该模型中九表示第j个地

19、区第丿天的日最高负荷量。同样可建立最日低负荷量的数学模型:该模型中®表示第,个地区第丿天的日最低负荷量。对于日峰谷差,可建立如下模型:该模型中©表示第,个地区第丿天的日峰谷差。日负荷率为日平均负荷与日最大负荷的比值, 可建立如下模型:其中为第,个地区第丿天的日平均负荷,表 示第个地区第丿天的日负荷率。依据上述模型可利用Excel软件求岀部分下列 结果如下(详见附件1):表12014年地区二负荷量的统计量结果日期最髙负荷最低负荷日峰谷差日平均负荷日负荷率201401016765.535513748.4817513017.0537595138.2252990.759470598

20、201401028464.7008063278.474755186.2260566232.4204770.736283611201401038642.1199174141.4382574500.681666703.7413430.775705661201401048350.4596384269.5947544080.8648846550.9297090.784499296201412288480.1667774356.9454123.2217776557.4511550.773269126201412299010.5247534238.8371214771.6876326936.8804180

21、.769864199201412308780.4737334455295644325.3441696898.4699630.785660338201412318059.2465294297.7196133761.5269166494.8010360.805881916利用Matlab软件,将数据导入后利用输入相 应代码(详见附录1),可得出如下负荷持续曲线 图:图3两地2014年负荷持续曲线欧阳德创编2021.03.07欧阳德创编2021.03.07通过结合上述结果,分析两地区负荷变化的主 要差异,初步预判地区二的负荷可获得更准确的预 测结果。原因是通过对附件1的统计量结果的分 析,地区二的日

22、峰谷差更小,通过图1也可以明显 看出负荷持续波动更小,因此地区二可获得更准确 的预测结果。5. 2问题二的模型建立与求521多元线性回归模型的建立变量丫和变量XxXuXyXyXs的关系:其中xpx2,x3,x4,x5分别代表最高温度、最低温度、平均温度、相对湿度以及降雨量,丫代表日最高负 荷、日最低负荷、日平均负荷中的一种变量。$为 均值为0的随机变量。/的函数为线性的,即整个 线性模型为:丫 =炖+砒+ 心 +咏+牡+际+£。为了得到回归参数的估计值,就要对变量进行 观测,对变量的"T旳6次独立观测数据为: (以皿,,轧),上1,7,则这些观测数据应满足式, 即有,其中

23、E(®) = o,Cog,£j) = 8-cy-,(/,; =,j己 丫 =( Vl 9 )2 9 ,儿),0 =(bo、b,,Z?加),£ =(£, &2 9 6) 则多元线性回归的数学模型式(4-6)可以写捉矩 阵形式 貞由 E(£)= 0yVar(£)=(jn。为了获得参0的估存,我们采用最小二乘法,即 选择0,使0(0)=養2 =几=(丫 _ xpY Y - XP)j(4 - 8)达到最少、。猜0%)对0求导数并令其为零,得即X'X0 = x"y°记皿X,则上述方程称为正规方程,其中X为沁(

24、卄1)阶矩 阵,般假定如丛(X) = ? + l,由线性代数理论可知, L =为满秩矩阵,它的秩如3加+1,则正规方程有唯一解,记作A我们来证明上式中Q为参数向量0的最小二乘法 估计量,现用矩阵形式来叙述其证明步骤。对任意 的0有° =(JX莎(Y_X0)贝|j肴上述程中应用了如下结果:A至此,郃H叼寸,证明了正规方程中的0是0的最 小二乘法估计量。A A AA在实际工作中,常称yf+g+ +/,”为经验线 性回归方程。多元线性回归模型的求1首先本文利用问题一中所给模型,求出2012 年1月1日至2014年12月31日的日最高负荷、 日最低负荷、日平均负荷,部分结果如下表(详见 附件

25、2):表22012年到2014年地区一统计量结果日期最高负荷最低负荷日平均负荷201201013967.2599682674.31075231933274882102.914724518.020952201201037362.3221443413.13251256887471683972.141286055.78345201201057772.6227844126.71251261580901124130.579261037301124

26、114.81465659284302723930.44617653846073283658.45609657162263683895.229925743.61441201412249041.5027844830.50406470950094084861.55545671226556164805.51785670733290884826.8937926912.

271860484616.67107260789556164224.259846707.0431201412308479.017856457& 10604866277698884313.0172165880.430551根据多元线性回归模型,利用SPSS软件,可 对日最高负荷、日最低负荷、日平均负荷与各气象 因素的关系进行回归分析。将数据导入软件后,设 置回归分析方法为进入法,分别将日最高负荷、日 最低负荷、日平均负荷作为因变量,进行回归分 析。例如,对地区一日最高负荷与各

28、气象因素的关 系进行回归分析,可得以下分析结果:表3地区一最高负荷与各气象因素回归分析的模型模型RR方调整R方标准估计的误差R方改更改统计量Sig.F改F更改dfldf21.623a.388.3851517.28958.388137.69351088.000从上表看出可决系数为0.388,其模型的拟合 程度最好,但还是很一般。表4地区一最高负荷与各气象因素回归分析的系数模型非标准化系数标 系tSig.相关性共线性统计 量B标误试 用 版零 阶偏部 分容 差VIF(常5604140402.91313.909.000最高温 度-33.50030.15513111.267.573.034.026.0

29、5518.306最低温 度130.05960.378.4122.154.031.614.065.051.01564.995平均温 度105.83479.770.3341.32785.615.040.031.009112.876相对湿 度-12.9064.419.091-2.921.004.112.088.069.5821.718降雨量5.8563.235.0461.810.071.074.055.043.8581.165上表给出了各个自变量的回归系数,但在这得 出结论之前,必须要观察以下标准化残差图:图4地区一最高负荷与各气象因素回归分析标准化残差从图中可以看岀,残差图中的分布是随机的, 可以

30、看作没有岀现趋势性,所以回归模型是有效 的。最终的回归模型为:y = 5604.140 - 335X| +130.059X2 +105.834X? 一 12.906X4 + 5.856X5用同样的分析过程可得两个地区各个因变量的 回归分析,结果如下表:表5各个回归方程汇总表地 区日最 高y = 5604.140-33目 +130.059X. +105.834X. -12.906X4 +II最 低y = 2886.322 一 16.266X】+ 90.362X, + 53.659X,-8.75X4 + 3.<日平均y = 4401 141 一 24.384X, +109.575/ +78.

31、188X3-1 1.018X4 -地 区II最 高y = 6300.062 19.918X+1&774X2+219.213X3 - 21.968X4 + 1II最 低y = 2891.563-8.736X, +19.088X, +149.577X3 -17.684X4 +丨丨T:y = 4808.043-16.877 X, +18.501 兀 + 195.402X? 20.913X4 +5.856X,4.37X52.607 &1.364X,9.279X5总的来说回归方程的有效性还是可以的,气候 因素确实对负荷有影响。5- 2. 3多元线性回归误差的分析本文将地区二的日平均负荷作

32、为实例进行误差 分析。我们知道两个因素之间的相关性可作为两个 因素的相互影响程度的衡量标准,因此可以通过下 表来得出一些结论:表6地区二的日平均负荷与各因素的相关系数表日均负 荷最髙温 度最低温 度平均温 度相对湿 度降雨量日均负荷1.000.715.656.740.123.119最髙温度.7151.000.795.962.138.032Pearson 最低温度656.7951.000.878.398.177相关性平均温度.740.962.8781.000.278.115相对湿度.123 138.398.2781.000.411降雨量.119.032.177.115.4111.000从上表可以

33、看出,相对湿度与日平均负荷的相 关性为0.123,降雨量与日平均负荷的相关性为 0.119o这两个相关系数都比较低,说明相对湿度 和降雨量对日平均负荷的影响很少。如果将相对湿度与降雨量强行作为自变量的话,就会加大误差。 因此如果将相对湿度度与降雨量这两个因素从自变 量中排除,可减小回归误差。可以对回归分析模型 的汇总进行比较。表7地区二日平均负荷与各气象因素回归分析的模型汇总模 型RR方调整R2标准估讣误 差更改统计量R2改F更改dfldf2Sig.F 改1.750a.563.5611054.322281.563280.63451089-000表8地区二日平均负荷与部分象因素回归分析的模 型汇

34、总模 型RR方调整R2标准估计误 差更改统计量R2改F更改dfldf2Sig.F 改1.7413.549.5471070.475794.549442.27631092.000虽然最高的用即可决系数在去掉两个自变量后减小了一点为0.549,但因为原始数据的减小,我 们任然可以认为降雨量与相对湿度是造成误差加大 的一个比较重要的原因。52. 4为提高负荷预测精度对气象因素的选择在SPSS软件中,有多种回归方法可供选择, 现将回归方法改为逐步回归法。以地区二日最高负 荷与各气象因素的回归分析为例,结果如下:表9地区二日最高负荷与部分象因素回归分析的模 型汇总模 型RR 方调整R2标准估 计误差更改统

35、计量DurbinWatsonR2更 改F更改dfldf2Sig.F 改1.706.498.4981315.65.4981086.3511093.0002.709.503.5021309.989.00510.48211092.0013.715.511.5101300.499.00816.99911091.000.459由上表知模型3的可决系数为0.511,但相互差别不大。模型模型拟合程度最高,DW值为0.459,通过检验,说明残差项不存在一阶自相 关。表9地区二日最高负荷与部分象因素回归分析的方差分析表模型平方和df均方FSig.1回归1.880E911.880E91086.358.0001残差

36、1.892E910931730958.153总计3.772E910942回归1.898E929.492E8553.132.000b残差1.874E910921716071.308总计3.772E910943回归1.927E936.424E8379.824.000残差1.845E910911691292.379总计3.772E91094上表中可明显看出模型1的F值最大,说明模型 1的回归效果最显著。表10地区二的日最高负荷与各因素的相关系数表模型非标准化系数系 数tSig.相关性共线性统计量B标误试 用零 阶偏部分容差VIF(常4670.4601441932.407.000平均温 度209.53

37、16.357.70632.960.000.706.706.7061.0001.000(常5486.218289.96418.920.000平均温 度215.4636.590.72632.697.000.706.703.697.9231.084相对湿 度-11.9953.705.072-3.238.00130.098.069.9231.084(常5932.160307.51319.291.000平均温 度215.4536.542.72632.935.000.706.706.697.9231.084相对湿 度-18.5644.00811-4.631.000.130.139.098.7771.287

38、降雨量13.0533.166.0964.123.0003324.087.8311.203因为模型1的回归效果最显著,因此可以认为 最好的回归方程为4670.460+ 209.53 IX30同理,可得出其他经过筛选后的回归方程,结 果如下表:表11对气象因素筛选后各个回归方程汇总表地 区日最髙 负荷y = 4361.94 + 194.674/日最低 负荷y = 3008.140 + 90.362X, -9.85X4 + 4.129X,日平均 负荷y = 3357.264+ 156.729X(地 区日最髙 负荷y = 4670.460 +209.531X3日最低 负荷y = 282.286 + 2

39、0.228X, +139.249X3-17.13X4 + 9.484X5日平均 负荷y = 3263.269 + 188.247X综上,可认为在诸气象因素中,优先推荐平均温度。5. 3问题三的模型建立与求解5. 3. 1 ARIMA预测模型的建立个时间序列通常存在长期趋势变动、季节变 动、周期变动和不规则变动因素。时间序列的目的就是逐一分解和测定时间序列中各项因素的变动程 度和变动规律,然后将其重新综合起来,预测统计 指标今后综合的变化的发展情况。采用ARIMA模型对现有的数据进行建模,首 要问题是确定模型的阶数,即相应的Z值,对于 ARIMA模型的识别主要是通过序列的自相关函数 和偏自相关函

40、数进行的。序列儿的自相关函数度量了儿与)匚之间的线性 相关程度,用几表示,定义如下: 式中:心儿)比之叫和)表示序列的方差。自相关函数刻画的是儿与人分别与它们的中间 部分之间存在关系,如果在给定 加,儿2, j之间的前提下,对儿与杠之间的条件相 关关系进行刻画,则要通过偏自相关函数进行, 偏自相关函数可由下面的递推公式得到:AIC准则既考虑拟合模型对数据底接近程度, 也考虑模型中所含待定参数的个数。 关于ARIM(/“),对其定义AIC函数如下: 其中戸是拟合ARIMSO)模型时残差的方差,它是 ("的函数。如果模型中含有常数项,则 + 9被 +。+ 1代替。AIC定阶的方法就是选择

41、ARIMSQ最 小的(“作为相应的模型阶数。模型阶数确定后,就可以估计模型。主要方法 有三种估计方法:据估计,极大似然估计和最小二乘 估计。最小二乘估计和极大似然估计的精度比较 高,因而一般称为模型参数的精估计。5. 3. 2 ARIMA预测模型的求解在数据处理的基础上,同样以地区一在时间点 T0000的数据为例,做自相关分析,结果如下:图5地区一T0000的ACF图图6地区一 T0000的PACF图从图中可以看出,序列的自相关图(ACF)和 偏自相关图(FACF)都是拖尾的,说明序列是非 平稳的。数据序列通常不是平稳序列,但一般一阶 差分都是平稳的,因此可以通过差分做进一步分 析。将差分设为

42、1,绘制差分序列的序列图如下:图7地区一 T0000的差分序列图由图可以知道,差分序列基本均匀分布在0刻 度线上下两侧,因此可以认为差分序列是平稳的。图8调整后地区一T0000的ACF图图9调整后地区一 T0000的PACF图由图可知,差分序列的ACF和PACF都是拖 尾的,因此,可对序列建立ARIMA模 型。经过反复试验,确定模型为ARIMA (LL1),模型运行如下:依次点击“分析”, “预测”,“创建模型”,弹岀时间序列建模器。可求岀最后所需的结果,下表给出了地区一预测模 型的部分统计量(详见附件3、附件4):表12地区一预测模型统计量模型预测变量数模型拟合统计量Ljung-Box Q

43、(18)离群值 数平稳R 方R方统计量DFSig.T0000模型 11.035.859216.16016.0000TOO 15 模型 21.035.861208.96416.0000T0030-模型 31.017.858186.09916.0000T0045-模型 41.035.861200.88116.0000TO 100-模型 51.014.858179.67716.0000T2245-模型921.044.840218.54616.0000T23OO-模型931.048.842211.68616.0000T2315-模型941.049.843201.50216.0000T233O-模型95

44、1.050.844193.48916.0000T2345-模型961.051.845186.13016.0000从上表可看岀茁都在0.8以上,可证明拟合的结果比较科学。结果中给岀了各个的值,如下 表所不:表13地区一 ARIMA预测模型参数估计SEtSig.T0000模型_1T0000无转 换常数4.1134480.697.001.999AR滞后1.928.02340350.000差分1MA滞后1.999.09110.969.000YMD无转 换分 子滞后0-7.771E-8.000.0001.000TOO 15-模型_2T0015无转 换常数3.4323987.218.001.999AR滞后

45、1.923.02241.114.000差分1MA滞后11.000.1277.845.000YMD无转 换分 子滞后0-4.978E-8.000.0001.000T2330-模型T2330无转常数1401.96416126.571.087.931_95换AR滞后1.092.179.515.607差分1MA滞后1.323.1701.900.058YMD无转换分 子滞后0-6.940E-5.001-.087.931T2345-模型96T2345无转 换常数1655.12715410.761.107.915AR滞后1.067.179.376.707差分1MA滞后1.3021711.767.078同样拿

46、地区一的T0000时间点举例,可得其预 测模型如下:用同样的方法可预测岀地区二的指定七天的负 荷量,部分结果如下(详见附件Q3-Areal- Loadx 附件 Q3-Areo2-Lood):表13地区二ARIMA预测结果YMD T0000 TOO 15 T0030 T0045 T23OO T2315 T2330 T2345201501116198.5576007.202 5863.55 5700.1 7091.34 6820.8 6546.5 6245.16 20150112 6205.14 6010.508 5871.95 5704.867088.19 6821.1 6548.83 6246

47、.7 20150113 6209.693 6015.623 5876.24 5709.49 7096.02 6828.13 6554.84 6252.43 201501146214.6166020.3775881.055714.137101.936834 6560.526257.86201501156219.4716025.203 5885.8 5718.767108.176840.066566.236263.3120150116 6224.338 6030.015 5890.55 5723.39 7114.36 6846.1 6571.93 6268.76 20150117 6229.203

48、 6034.829 5895.3 5728.02 7120.56 6852.14 6577.64 6274.21 变量的n组随机独立抽样的观察值矩阵,X: nxp 是对应于厂的自变量的已知的观察值矩阵£: pxq 是未知的回归系数矩阵0: nxq是未知的随机误 差矩阵,一般称为残差阵。与一元的线性模型一样,多元方差分析及多元协方 差分析。般,在线性模型中多假设有下分布:与上假设等价的是5. 4. 2基于BP神经网络算法的多元非线性系统模型的建立在科学研究和生产实践中,对具有表现系统特 征或运行状态的离散数据进行建模,用于系统预 测、评价等,是科学决策和决策系统建立的重要基 础。由于大

49、多数研究对象普遍具有多变量且依从高 度非线性关系等特征,因此多元非线性系统建模极 其重要。人工神经网络是由大量简单的处理单元(神经 元)广泛地互相连接形成的复杂非线性系统。它不 需要任何先验公式,可直接从训练样本(离散数 据)中自动归纳规则,提取离散数据之问复杂的依 从关系(可以是高度非线性关系),储存于网络权 重之中,从而建立研究问题的神经网络模型。其中 由Rumelhart提出的多层前馈神经网络,由于采 用误差反传的学习算法,被称为BP网络,其应用 非常广泛。在理论上已经证明具有三层结构(一个隐含层)的BP网络能够逼近仟何有理函数。题目中给出了 5个自变量、1个因变量。有三 层BP神经网络

50、模型逼近存在于样本数据间的函数 关系,其模型为y = WxPx2,x3,x4,x5)这是个非线 性函数。此模型为隐含表达式,即不能用通常数学 公式表示,故称为“知识库”。5. 4. 3基于BP神经网络算法的多元非线性系统模型的求1根据这个多元非线性系统模型,利用Matlab 编程可训练岀相应的神经网络结构。首先还是考虑 负荷的季节性很明显,为排除季节因素对负荷的影 响,将数据预处理。只留下两地区每年春季的负荷 量数据,以及两地区每年春季的各气候因素的数据 作为预测的原始数据。利用Matlab编程(详见附录二、附录三), 可预测出指定七天的负荷量,地区一的负荷量预测 结果如下(详见附件Q4-Ar

51、eal-Loads附件Q4- Area2-Load):表14地区一负荷量预测结果YMD T0000 TOO 15 T0030 T0045 T23OO T2315 T2330 T2345201501114455.224332.894313.604319.68 -20150112 4692.49 4202.82 4318.704399.88 - -201501134692.494202.82431&704399.88 -201501144455.22 4332.894318.703862.89 201501154455.22 4332.894318.704149.47 2015011644

52、55.22 4332.894318.704298.76 -201501174399.204332.894306.454218.56 5182.734969.394766.264609.26-5659.89 548& 154961.615189.43 5659.89 5393.79 4961.615189.435035.62 4969.394766.264373.575182.734969.394766.264373.575182.73 4969.39 4766.26 4609.265288.234969.394766.264609.265. 4. 4预测结果与原有的预测结果进行对比本模型得岀的预测结果与原有预测结果进

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论