Hopfield 网络在年用电量预测中的应用研究.doc_第1页
Hopfield 网络在年用电量预测中的应用研究.doc_第2页
Hopfield 网络在年用电量预测中的应用研究.doc_第3页
Hopfield 网络在年用电量预测中的应用研究.doc_第4页
Hopfield 网络在年用电量预测中的应用研究.doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

精品论文推荐hopfield 网络在年用电量预测中的应用研究刘武寅 辽宁工程技术大学理学院,辽宁阜新 (123000) e-mail: 摘要:该文将偏最小二乘回归模型(partial least square regression,pls)应用于年用电量预测,并与基于最小二乘的多元线性回归模型预测成果进行对比,探讨了偏最小二乘法在电 力负荷预测中的可行性和优势。通过四川省电网年用电量预测表明:偏最小二乘回归法比一般最小二乘法优,具有较强的实用性。关键词:电力系统;多元线性回归;偏最小二乘;最小二乘1. 引言西电东送,必须预测西部本身的用电量。准确的负荷预测, 可经济合理地安排电网内 部发电机组的生产计划, 保持电网运行的安全可靠, 降低发电成本,提高经济和社会效益。 但年用电量受人口、 国民生产总值、第一生产值、第二生产值及第三生产值影响。这些影 响因素之间存在严重的多重相关性。为了提高负荷预报精度,电力工作者作了大量的研究工作,尝试了各种预测方法13。 回归分析法在电力负荷预测中有着广泛的用途。 在建立自变量集合与因变量间的回归方程 中,一般常用最小二乘法,但若自变量间存在多重相关性时, 该法估计结果误差较大且不 稳定。 在这种情况下,应用新的估计方法是十分必要的。瑞典化学家 s.wold 教授提出的被称为第二代回归分析的偏最小二乘回归是一种新的 多元统计数据分析方法。它是多元线性回归、 典型相关分析和主成分分析的有机结合4, 较传统的回归分析、主成分回归具有更大的优势,从而使模型精度、稳健性、实用性都得到 提高。2. 偏最小二乘回归模型42.1 概述在一般多元线性回归模型中,有一组因变量y = y1 , y2 ,l, y p ( p 为因变量个数)- 8 -和自变量 x= x1 , x2 ,l, xn ( n 为自变量个数),当数据总体满足高斯马尔科夫定理时,由最小二乘法有 b = x ( x t x ) 1 x t y ,式中 b 为估计的回归系数。当 x 中的变量存在严重的多重相关性(变量本身物理意义决定了它们之间的相关性,或 由样本点数量不足造成),行列式( x t x )几乎接近于零,求解 ( x t x ) 1 时会含有严重的舍 入误差,使回归系数估计值的抽样变异性显著增加。更有甚者,当中的变量 x 完全相关时,( x t x ) 是不可逆矩阵,无法求解回归系数。此时,若仍沿用最小二乘法拟合回归模型, 回归结果将会出现许多反常现象,致使其精度、可靠性得不到保证。在实际工作中,变量的 多重相关性是普遍存在的。偏最小二乘法就能较好地解决这类问题。2.2 偏最小二乘回归模型的思路偏最小二乘回归是多元线性回归、典型相关分析和主成分分析的集成和发展。其思路是: 首先,从自变量集合 x 中提取成分 t h ( h = 1,2,l ),各成分相互独立;然后,建立这些成分与自变量 x 的回归方程,其关键在于成分的提取。与主成分回归不同的是,偏最小二乘回归所提取的成分既能很好地概括自变量系统中的信息,又能最好地解释因变量,并排除系 统中的噪声干扰。因而有效地解决了自变量间多重相关性情况下的回归建模问题。2.3 偏最小二乘回归模型的建模步骤2.3.1 原始数据标准化将原始自变量数据表 x = ( xij )n p 和因变量数据表y = ( yij )nq 进行标准化处理,得到标 准化矩阵 e0 = (eij ) n p , f0 = ( f ij ) nq ,其中xij x jeij =sx j, i = 1,2,l, n; j = 1,2,l, p ,(2-1)fijy y= ijj , i = 1, 2,l, n; j = 1, 2,l, q ,(2-2)sy jx j 、 y j 分别为矩阵 x 与 y 的第 j 列数据的平均值,sx j 、sy j 为矩阵 x 与 y 的第 j 列数 据的标准差。2.3.2 主成分提取 第一轮主成分提取tt求矩阵 e0 f0 f0 e0 的最大特征值所对应单位特征向量 w1 ,得自变量的第 1 个主成分t1 = e0 w1 .tt求矩阵 f0 e0 e0 f0 的最大特征值所对应单位特征向量 c1 ,得因变量的第 1 个主成分u1 = f0 c1 .求残差矩阵e1 = e0p t1t1 ,(2-3)1 1f1 = f0 t r t ,(2-4)式(2-3)中 pe t t=0 1 ,式(2-4)中 r2f t t=0 1 .121t1t1在 pls 方法中称 w1 为模型效应权重, c1 为因变量权重, p1 为模型效应载荷量。 新一轮主成分提取令 e0 = e1 ,f0 = f1 ,回到第 a 步,对残差矩阵进行新一轮的主成分提取和回归分析。 设第 h 步的计算结果为th = eh 1 wh ,(2-5)u h = fh 1 ch ,(2-6)hh 1h he = e t p t ,(2-7)f = f t rthh 1h h,(2-8)e t tf t t式(2-5)至(2-8)中, h = 1,2, l , m, m ranke0 , ph =h 1 h2t h, rh =h 1 h .2t h 主成分提取终止准则判断的准则常用的有交叉有效性准则和复测定系数准则。本文将采用交叉有效性准则5,6。复测定系数准则可参考文献5。把所有 n 个样本点分成两个部分:第一部分是除去某个点 i 的所有样本点集合(共 n 1个样本点),用这个部分样本点并使用 h 个成分拟合一个回归方程;第二部分是把刚才被排除的样本点 i 代入前面拟合的回归方程,得到 y j 在样本点 i 上的拟合值,记为 y hj ( i ) 对于每一个 i = 1,2,l, n ,重复上述测试,即可以定义 y j 的预测误差平方和为 press hj ,有press hjn= ( yiji =1 y2hj ( i ) ),(2-9)定义 y 的预测误差平方和为 pressh ,有ppress h = press hj .(2-10)i =1另外,再采用所有的样本点,拟合含 h 个成分的回归方程这时,记第 i 个样本点的预测值为 y hji ,则可定义 y j 的误差平方和为 ss hj ,有ss hj= ( yijyhji) 2 ,(2-11)定义y 的误差平方和为 ssh ,有对每个因变量 yk ,定义pss h = ss hj .(2-12)i =1q 2 = 1 press hk hkss,(2-13)( h 1) k对于全部因变量y ,成分 th 的交叉有效性定义为q press hkpressq 2 = 1 k =1 = 1 h .(2-14)hq ss ( h 1)k =1ss ( h 1)当 q 2 (1 0.952 ) = 0.0975 时,认为 t 的成分的边际贡献是显著的hh2.3.3 建立回归方程 建立数据标准化后的 pls 回归方程将 t = ew = e w * (i = 1,2,l, m) 代入方程ii 1 i0 i1 1rr0ttf = t r t+ t 2 2+ l + t m m+ fm,(2-15)得 f0 关于 e0 的 pls 回归方程f = ew* r t+ e w* r t+ l + ew* r t + f,(2-16)i 100 1 10 2 20 m mm其中 w* = (i wp )w , i = 1,2, l , m ,为单位矩阵。ik =1kki 关于原始变量的 pls 还原方程将方程还原成 (2-21)关于原始变量的 pls 回归方程y k= ( y kp kisy kxi )p+ kisy kxi , k= 1,2, l , q ,(2-17)i =1sxii =1sxi其中 k 是矩阵 pqm*= w j r j 的第 k 个列向量, 是 的第 i 个分量。j =1kik3偏最小二乘回归模型在年用电量预测中的应用3.1 基本资料本文收集了四川省 19781998 年年用电量及其影响因素的资料7, 见表 1。 表中电量 单位为亿 kwh,人口单位为万人, 产业值单位为亿元。影响年用电量(自变量)的因子有国 民生产总值 x1,第一产业生产值 x2, 第二产业生产值 x3, 第三产业生产值 x4 和总人口 x5。 用 19781993 年资料建模,19941998 年资料进行检验。表 1 四川省年用电量及其影响因子的基本资料年份x1x2x3x4x5年用电量1978185.7682.2065.5538.017071.980.131979205.7691.9572.3141.507120.590.781980229.31101.6881.0546.587154.893.951981242.32108.0283.3650.947215.694.251982275.23125.3692.8457.037300.4100.291983311.00138.17105.6967.147336.9108.151984358.05156.11121.6880.277364.0116.371985421.15172.90148.11100.147419.3124.921986458.23181.20160.62116.417511.9129.831987530.86202.25187.88140.737613.2151.121988659.69241.95238.32179.427716.4159.921989744.98263.15266.16215.677803.2172.671990890.95321.41313.64255.907892.5177.1119911016.31339.00378.48298.837947.8188.1519921177.27372.04441.57363.667992.2194.3719931486.08449.38580.38456.328037.4218.9119942001.41597.37802.77601.278098.7247.5519952504.95725.461020.91758.588161.2273.5019962985.15860.021229.01896.128215.4292.1019973320.11919.281385.381015.458264.7299.1719983580.26941.241527.071111.958315.7304.083.2 多重相关性检验计算自变量、因变量间的相关系数,见表 2。从表 2 中可以得出各自变量之间的相关系 数最高达 0.999,最低达 0.932。而因变量与自变量之间的相关系数最高大 0.990,最低达 0.960。 由此可知用电量与其影响因素之间存在着明显的相关关系,同时自变量之间存在严重的自相 关性,这种自相关性有着严重的危害性。表 2 自变量、因变量间的相关系数r()x1x2x3x4x5yx11.0000.9950.9990.9990.9400.970x21.0000.9890.9910.9710.984x31.0000.9990.9320.960x41.0000.9410.965x51.0000.990y1.0003.3 第一主成分相关性检验分别提取自变量集合与因变量集合的第一主成分,绘制第一主成分相关图。绘制二者之 间的 t1 / u1 平面图见图 1,我们可以发现,所有样本点在图中的排列近似于一条直线,则说 明 x 和 y 之间存在着较强的线性关系,并且计算得到二者之间的相关系数高达 0.990由此可知,用电量与其影响因素之间存在着明显的相关关系。因此可以用偏最小二乘回归模型进行建模。图 1 t1 / u1 平面图3.4 对年用电量建立偏最小二乘回归模型根据前面偏最小二乘建模步骤, 得到如下成果:3.4.1 第一成分 t11w = (0.4456,0.4519,0.4407,0.4429,0.4540)t1p = (0.4456,0.4510,0.4484,0.4494,0.4371)t*t1 = 0.4456x1 + 0.4519x2 + 0.4407 x3 + 0.4429x4 + 0.4540 x5y* 与 t1 的回归方程为y * = r t= 0.4441t= 0.1979x* + 0.2007 x * + 0.1957 x* + 0.1967 x* + 0.2016x*1 11123451 1r = 0.964,f = 371.2 (r 为 y * = r t 回归方程,f为计算的 f 检验值)1q 2 = 0.907 0.0975 ,继续计算:3.4.2 第二成分 t22w = (0.2326,0.0419,0.3657,0.3122,0.8444)tp = (0.2324,0.0644,0.3880,0.3049,0.8363)t2*t2 = 0.2232 x1 + 0.0514 x2 0.3564 x3 0.3028x4 + 0.8539 x5y* 与 t1,t2 的回归方程为 *y = r t+ r t= 0.4441t+ 0.5117t= 0.0836x* + 0.2270x* + 0.0133x* + 0.0417 x* + 0.6390x *1 1r = 0.970,2 21212345f = 212.02q 2 = 0.565 0.0975 ,继续计算:3.4.3 第三成分 t33w = (0.0047,0.6721,0.6657,0.2180,0.2398)t3p = (0.0261,1.003,0.4530,0.2563,0.3336)t*t3 = 0.0122 x1 0.6704 x2 + 0.6538x3 0.2282 x4 + 0.2683x5y* 与 t1,t2,t3 的回归方程为 *y = r t+ r t+ r t= 0.0713x * 0.4510x * + 0.6745x * 0.1891x * + 0.9104 x *1 1 2 2 3 312 3 4 5r = 0.970,f = 177.73q 2 = 0.028 0.0975 ,计算结束。3.4.4 偏最小二乘回归方程上面计算表明,提取 2 个主成分就足够了。 偏最小二乘回归方程如下: 标准化变量回归方程 : *y = 0.0836 x * + 0.2270 x * + 0.0133x * + 0.0417 x * + 0.6390x *1 2 3 4 5原始变量回归方程 :y = 518.7 + 0.0093x1 + 0.0881x2 + 0.0038x3 + 0.0141x4 + 0.0836 x5(3-1)3.5 模型评价3.5.1 累计解释能力分析t1,t2 的累计解释能力数值见表 3。 从表 3 可看出,t1,t2 对自变量和因变量的累计解释能 力均达到 99%以上。可见,t1,t2 能很好地解释自变量和因变量。累计解释能力的计算公式如 下:di 1hh i jr ( x ; t ,l, t) =j =1r 2 ( x , t )表 3 累计解释能力rdx1x2x3x4x5xyt10.9950.9980.9860.9910.9370.9810.967t21.0000.9990.9990.9990.9990.9990.9903.5.2 拟合、检验分析为了对比,对相同资料建立一般最小二乘回归模型,方程如下:y = 773.6 0.7277 x1 + 0.5914 x2 + 1.0722 x3 + 0.4704 x4 + 0.1206 x5(3-2)对式(3-1)、(3-2)进行比较,可看出明显的区别:式(3-1)中各回归系数都为正值,表明年 用电量与各因变量正相关,与实际情况吻合;而且回归系数大小能客观反映各自变量对年用 电量的影响程度, 如第一产值 x2 和人口 x5 的回归系数分别为 0.0881 和 0.0836,较其它大, 真实地刻划了它们对 y 的影响权重。式(3-2)中,y 与国民生产总值 x1 的回归系数为-0.7277, 表明国民生产总值增加, 年用电量反而减小, 与实际矛盾;另外,人口对年用电量的影响 应较大,而式(3-2)中 x5 的回归系数仅为 0.1206,出入较大。从实际拟合和检验进一步比较分析。表 4 列出了两种模型预测的结果,表 5 给出了两种模型在拟合和检验阶段的合格率(小于给定相对误差的年数与总年数的百分比)及确定性系 数 dy。由表 4、表 5 可知,偏最小二乘回归模型较最小二乘回归模型优。 可见,偏最小二 乘回归模型更具有先进性, 其计算结果更为可靠,它在实际系统中的可解释性也更强。表 4 年用电量拟合和检验结果阶段实际值偏最小二乘回归最小二乘回归预测值相对误差%预测值相对误差%拟 合 阶 段80.1382.17-2.5480.76-0.790.7887.353.7886.724.493.9591.402.7291.242.894.2597.23-3.1697.38-3.3100.29106.27-5.96106.94-6.6108.15110.97-2.61111.42-3.0116.37115.500.75114.381.7124.92122.571.88122.751.7129.83131.66-1.41132.91-2.3151.12143.105.31145.393.7159.92157.151.73159.850.0172.67167.682.89167.692.8177.11182.38-2.98176.530.3188.15190.56-1.28192.09-2.0194.37199.83-2.81198.00-1.8218.91215.121.73216.890.9检 测 阶 段247.55240.942.67243.441.66273.50265.163.05268.201.94292.10288.721.16292.71-0.21299.17303.44-1.43313.75-4.87304.08313.95-3.24340.89-12.11表 5 偏最小二乘回归模型和最小二乘回归模型 拟合和检验结果标准偏最小二乘回归模型最小二乘回归模型拟合检验拟合检验e10%10010010080.0e20%100100100100dy0.9910.8870.9930.2454结论年用电量受人口、国民生产总值、第一生产值、第二生产值及第三生产值影响。 这些 影响因素之间存在严重的多重相关性。 用一般最小二乘回归法建模存在着很大的误差且物 理意义明显不足。偏最小二乘回归方法实现了多元线性回归、 主成分分析和典型相关分析 的综合,克服了自变量之间的多重相关性的问题,因而更具有先进性,其计算结果更为可靠, 它在实际系统中的可解释性也更强。 该法简单, 计算快捷,可较好地运用于电力系统年用 电量的预测中。参考文献1 牛东晓,曹树华,赵磊等. 电力负荷预测技术及其应用m. 北京:中国电力出版社, 19982 谢开贵,李春燕,周家启.基于神经网络的负荷组合预测模型研究j. 中国电机工程学报, 2002, 22(7):85-893 冉启文,单永正,王琪等. 电力系统短期负荷预报的小波神经网络-parima 方法j. 中国电机工程学 报, 2003, 23(3):38-424 包研科,李娜.数理统计与 matlab 数据处理m.沈阳:东北大学出版社,20085 王惠文.偏最小二乘回归方法及其应用 m. 北京:国防工业出版

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论