(农业电气化与自动化专业论文)配电网中长期负荷预测方法研究.pdf_第1页
(农业电气化与自动化专业论文)配电网中长期负荷预测方法研究.pdf_第2页
(农业电气化与自动化专业论文)配电网中长期负荷预测方法研究.pdf_第3页
(农业电气化与自动化专业论文)配电网中长期负荷预测方法研究.pdf_第4页
(农业电气化与自动化专业论文)配电网中长期负荷预测方法研究.pdf_第5页
已阅读5页,还剩56页未读 继续免费阅读

(农业电气化与自动化专业论文)配电网中长期负荷预测方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-it, i、rk c 声明尸明 本人郑重声明:此处所提交的硕士学位论文配电网中长期负荷预测方法研究, 是本人在华北电力大学攻读硕士学位期间,在导师指导下进行的研究工作和取得的研究 成果。据本人所知,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发 表或撰写过的研究成果,也不包含为获得华北电力大学或其他教育机构的学位或证书而 使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的 说明并表示了谢意。 学位论文作者签名: 垂】垂j 幽 日 期:垒盟:垡:垒! 关于学位论文使用授权的说明 本人完全了解华北电力大学有关保留、使用学位论文的规定,即:学校有权保管、 并向有关部门送交学位论文的原件与复印件;学校可以采用影印、缩印或其它复制手 段复制并保存学位论文;学校可允许学位论文被查阅或借阅;学校可以学术交流为 目的,复制赠送和交换学位论文;同意学校可以用不同方式在不同媒体上发表、传播学 位论文的全部或部分内容。 ( 涉密的学位论文在解密后遵守此规定) 作者签名: 麴壁捌 导师签名: 日期: 、 串,l, 华北电力人学硕+ 学位论文摘要 摘要 电力系统负荷预测是电网规划的重要组成部分,也是电网规划的基础。配电网 中长期负荷预测是电力系统负荷预测的重要组成部分。本文详细讨论了适用于配电 网中长期负荷预测的各种模型,重点研究了基于多相关因素的预测方法,通过分析 组合预测方法的现状及优缺点,探索出一种新的基于偏最小二乘回归的配电网中长 期负荷组合预测算法,经算例验证,该方法能够显著提高电力负荷预测精度。本文 采用面向对象程序设计方法开发出一套配电网中长期负荷预测软件,该软件具有丰 富的预测模型库、较好的人机交互界面,操作简便、实用性强,为配电网规划人员 提供了一个实用的负荷预测管理平台。 关键词:配电网,中长期负荷预测,偏最d - 乘回归 a b s t r a c t p o w e r s y s t e ml o a df o r e c a s t i n gi sa ni m p o r t a n tp a r to fa n dt h ef o u n d a t i o no fp o w e r 鲥d p l a n n i n g , a n dm e d i u ma n dl o n gt e r ml o a df o r e c a s t i n go fd i s t r i b u t i o nn e t w o r ki st h ei m p o r t a n t c o m p o n e n to fp o w e rs y s t e ml o a df o r e c a s t i n g t h i sp a p e rd i s c u s s e sv a r i o u sm o d e l ss u i t a b l ef o r m e d i u ma n dl o n gt e r ml o a df o r e c a s t i n go fd i s t r i b u t i o nn e t w o r ki nd e t a i l ,m a i n l ys t u d i e st h e f o r e c a s t i n gm e t h o db a s e do nm u l t ir e l a t e df a c t o r s t h e nt h ep a p e rp r o p o s e san e wc o m b i n a t i o n f o r e c a s t i n gm e t h o df o rm i d - l o n gt e r ml o a do ft h ed i s t r i b u t i o nn e t w o r kb a s e do nt h et h e o r yo f p a r t i a ll e a s ts q u a r er e g r e s s i o nt h r o u g ht h ea n a l y s i so ft h ep r e s e n ts i t u a t i o no fc o m b i n a t i o n f o r e c a s tm e t h o d ,a n dac a l c u l a t i n ge x a m p l es h o w e st h a tt h em e t h o dc a ni m p r o v et h ea c c u r a c y o ft h ep o w e rl o a df o r e c a s t i n ge v i d e n t l y f i n a l l y , t h i sp a p e rd e v e l o p sam i d l o n gt e r ml o a d f o r e c a s t i n g s o f t w a r ef o r t h ed i s t r i b u t i o nn e t w o r k b yo b j e c t - o r i e n t e dp r o g r a m m i n g m e t h o d ,w h i c hh a sr i c hp r e d i c t i o nm o d e l s ,g o o dm a n - m a c h i n ei n t e r f a c e ,e a s yo p e r a t i o na n d p o w e r f u lp r a c t i c a b i l i t y t h es o f t w a r ep r o v i d e sap r a c t i c a ll o a df o r e c a s t i n gm a n a g e m e n t p l a t f o r mf o rd i s t r i b u t i o nn e t w o r kp l a n n i n gp e r s o n n e l l i uy a z h o u ( a g r i c u l t u r a le l e c t r i f i c a t i o na n da u t o m a t i o n ) d i r e c t e db yp r o f l i a n gz h i r u i k e yw or ds :d i s t r i b u t i o nn e t w o r k , m e d i u ma n dl o n gt e r ml o a df o r e c a s t i n g , p a r t i a ll e a s ts q u a r er e g r e s s i o n 一 , 鼍 i 0 华北电力人学硕+ 学位论文目录 目录 中文摘要 英文摘要 第一章引言1 1 1 预测的概念1 1 2 电力系统负荷预测的概念及意义。l 1 3 国内外研究动态1 1 4 本论文的主要工作4 第二章基于时序趋势外推的基本预测方法2 5 2 1 概述5 2 2 动平均法5 2 2 1 一次动平均法5 2 2 2 二次动平均法5 2 3 指数平滑法6 2 3 1 简单指数平滑法一6 2 3 2 二次指数平滑法7 2 4 增长速度法7 2 5 灰色预测8 2 6 生长曲线法9 2 6 1 简单s 型曲线法1o 2 6 2 其它具有s 型特征的曲线l o 2 7 马尔可夫预测法11 2 8 灰色马尔可夫预测法:l1 第三章中长期负荷相关分析与预测1 3 3 1 概述13 3 2 考虑单相关因素的预测方法1 3 3 2 1 弹性系数法1 3 3 2 2g d p 综合电耗法1 4 3 2 3 人均用电法1 4 3 2 4 产业产值单耗及人均生活用电法l5 3 2 :5 最大负荷利用小时数法j :15 3 3 考虑多相关因素的预测方法1 5 3 3 1 多元线性回归分析1 5 3 3 2 主成分分析1 9 华北电力人学硕十学位论文目录 3 3 3 偏最小二乘回归分析2 l 中长期预测中多模型的筛选与综合2 6 概述2 6 组合预测的概念2 6 4 2 1 组合预测的有关定义2 6 4 2 2 实现组合预测的途径2 7 组合最优拟合模型2 8 4 3 1 组合最优拟合模型的建立2 8 4 3 2 组合最优拟合模型的求解2 9 组合次优拟合模型3l 组合最优预测模型3 2 组合预测模型与单一预测模型的比较3 3 基于偏最小二乘回归拟合的组合预测一3 3 4 7 1 问题的提出3 3 4 7 2 建模步骤3 4 4 7 3 实例验证及分析3 7 配电网中长期负荷预测软件开发一3 8 引+ 占3 8 软件开发环境3 8 软件总体结构和功能3 8 系统简介。j 4 0 5 4 1 登录界面4 0 5 4 2 预测软件主界面4 0 5 4 3 总体预测4 l 5 4 4 分行业预测4 5 5 4 5 分区预测4 6 第六章结论4 8 参考文献4 9 致 射。5 2 在学期间发表的学术论文和参加科研情况5 3 i i 华北电力人学硕十学位论文 1 1 预测的概念 第一章引言 预测,是一类科学问题的总称,是对尚未发生或目前还不明确的事物进行预先 的估计和推测。科学的预测是正确决策的依据和保证。关于预测的定义有多种表达, 一般可以认为,预测是在一定的理论指导下,以事物发展的历史和现状为出发点, 以调查研究所得的资料和统计数据为依据,在对事物发展过程进行深刻的定性分析 和严密的定量计算的基础上,研究并认识事物的发展变化规律,进而对事物发展的 未来变化预先做出科学的推测【i 】。 1 2 电力系统负荷预测的概念及意义 电力系统负荷预测是根据电力负荷、经济、社会、气象等的历史数据,探索电 力负荷历史数据变化规律对未来的影响,寻求电力负荷与各种相关因素之间的内在 联系,从而对未来的电力负荷进行科学的预测【l l 。 负荷预测对电力系统许多部门都起着重要的作用。例如,一年以上的中长期负 荷预测是制定电力系统发展规划的前提,以日负荷曲线为预测对象的短期负荷预测 是制定日前发电计划的基础。负荷预测问题涉及电力系统规划和设计,电力系统运 行的经济性、可靠性和安全性、电力市场交易等多个方面,它已成为现代化电力系 统运行和管理中的一个重要研究领域。 电力系统的主要任务是为各类用户提供经济、可靠和高质量的电能,应随时满 足用户的负荷需求量与负荷特性的要求。为此,在电力系统规划设计、运行管理和 电力市场交易中,必须对负荷需求量的变化与负荷特性有一个准确的预测。这就是 人们不断研究并发展电力系统负荷预测理论的重要原因。 电力负荷预测,在电力进入市场化运行后,其实质上是对电力市场需求的预测。 电力供需瞬时平衡的特点决定了电力行业的预测比其他行业更加紧迫,人们越来越 认识到,做好电力负荷预测工作是实现电网安全、经济运行的重要保障。传统的负 荷预测是电力系统中规划、计划、用电、调度等部门的基础工作,其重要性早已被 人们所认识【2 l 。在电力工业市场化的过程中,负荷预测又成为市场交易、市场营销 等部门的核心业务之一。 一 1 3 国内外研究动态 负荷预测的核心问题是预测的技术方法,或者说是数学模型。随着现代科学技 l 华北电力人学硕十学位论文 术的不断进步,负荷预测理论技术得到了很大的发展,理论研究逐步深入。国内外 关于负荷预测的研究己出现许多种方法,可以归结为两类:基于参数模型的方法和 基于非参数模型的方法。 基于参数模型的方法就是通过分析负荷和影响负荷因素之间定性的关系,可以 建立负荷的数学模型或统计模型,如:多元线性回归模型、自回归平滑移动模型等。 通过对历史数据的估计可得到这些模型的参数,并且通过模型的残差( 如预估误差) 来评价模型。 基于非参数模型的方法不需要事先知道过程中模型的结构和参数的有关先验 知识,也不必通过复杂的系统辨识来建立过程的数学模型,非常适合于存在非线性、 多变量、时变、不确定性的电力系统预测。基于非参数模型的方法主要有专家系统、 灰色系统、模糊逻辑和神经网络理论建立的方法,这些方法优于传统预测方法的地 方在于它们考虑了负荷预测系统的鲁棒性,并且在非线性关系下具有分类能力。 中长期负荷预测是电力系统负荷预测的重要组成部分,为了找到使用方便、计 算精度高、计算速度快的预测方法,8 0 年代后人们对此展开了广泛的研究。用于中 长期负荷预测的方法很多,有经典预测方法、传统预测方法和智能预测方法 从严格意义上说经典预测方法并不是真正的预测方法,它仅仅是依靠专家的经 验或一些简单变量之间的相互关系对未来负荷值做出一个方向性的结论,所以预测 的精度较差。主要有分产业产值单耗法、电力消费弹性系数法、分区负荷密度法和 人均电量指标换算法等等【3 1 传统预测方法包括增长曲线方法、回归分析法及时间序列分析法 增长曲线又称为生长曲线,是对事物的生长、发展过程的定量描述模型按照 地区负荷变化的不同,可以选择不同的增长曲线。如指数增长曲线、修正指数增长 曲线、逻辑增长曲线、龚珀兹增长曲线等等【3 1 回归分析法和时间序列法基本上都是属于概率统计的方法。回归分析法【l 通 过对观察数据的统计分析和处理,寻找负荷与影响因素之间的因果关系,建立回归 模型进行预测。回归分析法分为线性模型和非线性模型两种,线性模型参数估计技 术成熟,但预测过于简单,误差较大:非线性模型参数估计较难,不能方便的使用。 时间序列分析法【4 , 1 0 , 1 1 l 依据负荷过去的统计数据,找到其随时间变化的规律, 建立时序模型,以推断未来的负荷数值按照处理方法不同,时间序列法分为确定 性时间序列分析法和随机时间序列分析法f 1 2 】确定性时间序列分析法有指数平滑法 和c e n s u s h 分解法。常用的随机时间序列分析法有b o x j e n k i n s 法、状态空间法、 m a r k o v 法等。 时间序列法可以代替回归分析法用于在影响负荷的因素错综复杂,相关因素数 2 华北电力人学硕十学位论文 据资料无法得到的情况下。但是随着社会经济的快速发展,统计方法对于不确定因 素考虑不够的缺陷日益显著。同时,由于中长期电力负荷具有非线性和时变性,要 通过清晰的数学方程来表达输入( 历史年负荷值、负荷影响因素值) 与输出( 规划 年负荷值) 之间的关系存在着种种困难。因此,在这种情况下,更能体现历史负荷 及影响负荷变化相关环境的智能预测方法逐渐发展起来。 智能预测方法主要包括专家系统法、人工神经网络法、模糊预测法和灰色理论 预测法。 专家系统是一个应用基于知识的程序设计方案建立起来的计算机系统,它拥有 某个特殊领域专家的知识和经验,并能像专家那样运用这些知识,通过推理,在该 领域内做出智能决策。将专家系统技术用于中长期负荷预测时,能对所收集整理的 常规的预测模型逐一进行评估决策,快速地做出最佳预测结果,避免了人工推理的 繁琐和人为差错的出现,克服以往用单一模型进行预测的片面性缺陷【i o l 。 人工神经网络是源于人脑神经系统的一种模型,具有模拟人的部分形象思维能 力,它是由大量的人工神经元密集连接而成的网络。人工神经网络法是一种不依赖 于模型的方法,它比较适合那些具有不确定性或高度非线性的对象,并具有较强的 适应和学习功能。用于负荷预测时,人工神经网络法利用神经网络可以任意逼近非 线性系统的特性,对历史的负荷曲线进行拟合。负荷预测中常用的人工神经网络模 型有k o h o n e n 模型、b p 模型、改进的b p 模型等 1 3 , 1 4 】。 电力负荷预测的实质就是利用以往的数据资料找出负荷变化的规律,从而对未 来负荷的变化及状态做出预测。在实际负荷预测中收集和统计的历史数据往往不尽 全面和准确,即是模糊的;而且,如果仅以某种简单的函数关系去描述电力负荷和 其影响因素如气象、环境、经济等的关系,会使得到的预测结果和实际情况有较大 的偏离。因此用模糊理论去研究和处理这种具有“模糊特性的对象,其效果将是 显而易见的。模糊理论【1 5 l6 】最早由美国教授查德( l a z a n d e h ) 首先提出,文献 1 7 】 比较全面地论述了模糊数学在电力系统中的应用,如用于网架规划、电厂选址、运 行最优化等等。用于电力系统负荷预测的模糊方法有模糊线性回归、模糊指数平滑、 模糊聚类、模糊相似优先比法、最大贴近度法等【7 捌】。 灰色系统理论自8 0 年代由我国学者邓聚龙教授提出来后,已经在各个方面得到 广泛的应用【3 l 。用于预测时首先把负荷数据当作灰数,通过数据的累加生成得到新 的数据列,从而减少数据的随机性,用此数据建立灰色模型进行预测,最后预测值 累减还原得到最终的负荷预测值。应用灰色理论进行负荷预测,具有样本少、计算 简单、精度高和实用性好的优点 1 0 , 1 2 , 2 2 之6 1 。 可见电力系统负荷预测的模型是多样的,可以根据不同地区及不同时段选择不 同的预测模型。可以采用简单的定性方法,也可以采用复杂的数学模型,或者对不 3 硕十学位论文 得更加准确的预测结果。 测软件。文献【2 7 】提出了一种基于w i n d o w s 软件采用面向对象程序设计方法,使系统 预测软件所具有的计算快速、模型库丰富 、模型库扩充简易、具备饱和负荷预测以 地方。 电量看作单一变量进行预测,而没有考虑 素对负荷和电量的影响。因此,考虑配电 运用配电网负荷的技术经济规律,综合考虑 配电网中长期负荷预测软件将是新的研究 本论文以配电网中长期负荷预测方法研究和软件实现为主要内容,主要的工作 可分为以下几个方面: ( 1 ) 研究基于时序外推的各种中长期负荷预测方法,分析比较各种方法的优 缺点,以及适应对象; ( 2 ) 重点研究中长期负荷相关分析与预测,特别是基于多相关因素的预测方 法,如:主成分分析方法、偏最t | , - - 乘回归分析方法等; ( 3 ) 分析组合预测方法的现状及优缺点,将偏最小二乘回归分析理论应用在 组合预测方法中,探索新的配电网中长期负荷组合预测算法; ( 4 ) 在w i n d o w s 系统下,以d d p h i 7 0 语言与a c c e s s2 0 0 3 数据库为工具,开 发一套实用性的配电网中长期负荷预测软件,该软件具有丰富的预测模型,既能够 实现负荷及电量的总量预测,又可以实现分区及分行业预测 4 华北电力人学硕+ 学位论文 2 1 概述 第二章基于时序趋势外推的基本预测方法 中长期负荷预测中,时序趋势外推预测是最为常见的一类问题,一般根据时间 序列的历史值来预测其未来值。时序趋势外推预测有多种不同的方法。如果预测以 对象的历史数据构成了基本的单调序列,那么本章介绍的这些预测模型一般都可以 适用。 2 2 动平均法 动平均法是对一组时间序列数据进行某种意义上的算数平均值计算,并以此为 依据进行预测,包括一次动平均法、加权平均法和二次动平均法等。 2 2 1 一次动平均法 所谓一次动平均法,就是取时间序列的个观测值予以平均,并依次滑动,直 至将数据处理完毕,得到一个平均值序列。 对于时间序列y i ,此,h ,一次动平均计算公式为: 肘j t ) :丛生红土监盟( f )( 2 1 ) n 式中,m p 为第t 期的一次动平均值;为动平均的项数( 或称为步长) 。 一般情况下,如果时间序列没有明显的周期变化和趋势变化,可用第t 期的一 次动平均值作为第t + l 期的预测值,即 夕川- - m , 1 ( 2 2 ) 2 2 2 二次动平均法 一次动平均法只适用于一步的预测,而不适用于以后若干步的预测,因此,一 般采用二次动平均法进行预测。所谓二次动平均法,就是将一次动平均序列再进行 一次动平均。其计算公式为: m j :) :丝型丛监( 2 - 3 )i n 当时间序列具有线性增加或线性减少的发展趋势时,如果用动平均法进行预 测,就会出现滞后现象,表现为:对于线性增加的时间序列,预测值偏低,而对于 5 离预测期越来越远而逐渐减小即应有如下关系: n - i p y m + i 。乙q i y p i 扣0 口o 口i 口2 口p l 在有些情况下,最后一个条件可以不满足。 2 3 1 简单指数平滑法 简单指数平滑法中,选定参数o a 0 , 0 刀) 为基础, 按下式预测未来的全社会用电量: e = g d p , 磊,( f 驯噜 ( 3 - 6 ) 此方法要求首先对国民经济的发展作出预测。 3 2 3 人均用电法 人均用电法适用于全社会用电量的预测 与g d p 综合电耗相似,人均用电量也是一个综合的能耗指标当已知历史上各 年的人均用电量g l ,9 2 ,铂时,可以按其发展变化的规律性,运用回归技术、动平 均法、指数平滑法、灰色系统法等手段,预测未来年份的人均用电量毒,o n ) 。然后, 以总人1 :1 的预测值矗,( f 刀) 为基础,按下式预测未来的全社会用电量: e = 乞专,t n ( 3 - 7 ) 1 4 华北电力人学硕十学位论文 此方法要求首先对总人口作出预测。 3 2 4 产业产值单耗及人均生活用电法 产业产值单耗及人均生活用电法适用于三产业电量及城乡居民尘活用电的预 测。经对历史数据的统计分析,历史上各产业的产值单耗及人均生活用电量为已知, 记第t 年第产业的产值单耗为g ,u ,第t 年的人均生活用电量为。可以分别分析 这些数据的变化规律;采用外推手段预测未来年份的值:g t u ,。 当已知第产业( 产1 ,2 ,3 ) 在未来第t 年的产值为b t ( j ) 时,该产业在第t 年的用 电量由下式计算: 宣= e 7 售d ,i = 1 ,2 ,3 ( 3 8 ) 同理,当已知未来第t 年总人口的预测值磊,时,城乡居民生活用电可由下式计 算: 宣4 = 乞只 ( 3 9 ) 此方法要求首先对三产业的产值及城乡总人口数做出预测。 3 2 5 最大负荷利用小时数法 最大负荷利用小时数法适用于最大负荷的预测。 年最大负荷利用小时数的定义是: t i = = e o pc ( 3 1 0 、) 式中,丘、只、乃分别为第t 年的年电量、年最大负荷和年最大负荷利用小时数。 年最大负荷利用小时数的变化一般比较有规律,可以按历史数据采用外推方法 得出未来年份的值,在已知未来年份电量预测值的情况下,采用下式计算该年度的 年最大负荷预测值丘: = e z ( 3 一1 1 ) 3 3 考虑多相关因素的预测方法 3 3 1 多元线性回归分析【3 4 】 3 3 1 1 模型分析 假设随机变量叩与m ( 肌2 ) 个自变量工i ,x 2 ,x m 之间存在相关关系,且满 足 j t l = b o + b , ,x i + 也而扣一+ b m 托( 3 - 1 2 ) l e - n ( o ,盯2 夕 华北电力人学硕十学位论文 即叩n ( b o + b n x l + b 2 x 2 + + k ,o r 2 ) ,其中bn ,6 2 ,b m ,o r 2 是与x i ,x 2 , 无关的未知参数,是不可观测的随机变量,称式( 3 1 2 ) 为m 元线性回归模型, 由式( 3 1 2 ) 可知: e , p = b 0 + 岛而+ + 6 一 ( 3 - 1 3 ) 此式称为叩对工i ,娩,的回归函数,或称为m 元线性回归方程。 当x l ,x 2 ,x m 取n 个不同值( x i i ,砌,魂朋) ,i = 1 ,2 ,i o t a9n 时,可知,叩的样本 、* n 叩i ,珂2 ,叩行狎眄疋 p + 擘l + 如2 扣+ 6 _ 托,( 3 - 1 4 ) h ( o ,盯2 夕 记 珂= ,7 l ,7 2 : 玑 ,x =, p = a 6 2 : 6 _ q 9 2 : s _ 式( 3 1 4 ) 可表述为 妒即+ ( 3 - 1 5 ) b n 固,a zi 。、 其中x 是已知的n x ( 朋+ 1 ) 的常数矩阵,夕为未知参数向量,厶是n x n 阶单 位矩阵,矿是未知参数 由式( 3 1 4 ) 或式( 3 1 5 ) 所确定的关系式也称为m 元线性回归模型,这时也 称可= ( 巧l 叩2 ,) r 服从线性模型,简记为( a t ,即,以) 由式( 3 1 5 ) 易知 e , l - - x d ( 3 1 6 ) 在后面的讨论中,都假定x 是列满秩( 即i l l ( x ) = 小+ 1 ) 矩阵 对于m 元线性回归模型所考虑的统计推断问题主要有:对未知参数 b l ,b 2 ,o e o9b 肘及仃2 进行估计g 对与参数有关的某些统计假设进行检验;对吁进 行预测与控制。 设反,毛,丘分别是6 0 ,b i ,”,6 崩的估计就可以得到一个m 元线性方程 夕= t , 0 + b n x l + + 6 _ ( 3 1 7 ) 有了回归方程,当自变量x i ,娩,在未来时刻f 分别取值x 1 i ,x i 2 ,x i r a 时, 可求得 1 6 崩 研; 一 一 虫即 3 3 1 2 对于 的估计, 。1 ( 3 1 9 ) = m i n 荟( y ;一6 0 一一6 2 耵吮) 2 为了方便计算,在求夕时,常常采用中心化方法,即按公式夕= ( x r y ) 一1x r l ,求 夕时,先写矩阵又及矿: 且记 x = i 而l 一墨 i 屯l 一墨 x l m x m x 2 m x m i l 一墨一瓦 y - 一歹 l ,= l 少2 一歹i 【y 。一歹j 矗矗 乇= ( 一墨) ( 一刁) = h h 一惦弓,f ,j = l ,2 ,m t z l k = l 矗一 勺= ( 一孑) ( y 。一歹) = 靠儿一嵋歹,l j - - 1 ,2 ,m k = lk = i 则可以验证 l = 。: 厶i 2 2 ,。l乙2 b l 6 2 : : k = f 1 1 7 。 ,2 。 乙。 ( 3 2 0 ) 华北电力人学硕+ 学位论文 6 0 = 歹一b , 2 j ( 3 - 2 1 ) p l 且b o ,6 l ,6 辨就是6 0 ,b l ,b 历的最小二乘估计。 3 3 1 3 回归效果的显著性检验 在m 元线性模型中,经常要考虑如下的假设检验问题。 叩与x l ,x 2 ,x m 之间的线性相关关系只是一种假设,它们是否具有线性相 关关系,需要进行检验。如果它们之自j 没有线性相关关系,就意味着一切b , ( i = l ,2 ,朋) 都应为零,这相当于检验假设t t o :bn = 6 2 = = b m = o 是否成立。 如果叩与j l ,x 2 ,之间确有线性相关关系,但并不意味着每个变量 x i ,x 2 ,x m 对随机变量叩都有显著影响,若而对叩的影响不显著,就应该有b j = 0 。 因此要检验而对叩是否有显著影响,就相当于检验假设4 0 :b :o ( 户l ,2 ,历) 是 否成立。 3 3 1 4 非线性回归线性化 前面所讲的线性回归分析问题,先假定它是线性模型,然后求参数估计,得线 性回归模型,并对其进行假设检验,以及求叩的预测等问题。但是在许多实际问题 中,随机变量与自变量之间并不都具有线性相关关系。这时如果假定它服从线性模 型,则关于线性模型的假设检验,将会被做出否定的判断。因此通常的作法是先做 出散点图,根据它所呈现的形状,粗略地看看是否像一条直线,如果很不像一条直 线,就应该用非线性回归,这时常与常见的已知函数图形进行比较,配置一条较适 合的曲线。这样要比粗糙地硬配置一条直线更为精确。 下面给出一些常见的非线性回归模型。 双曲线模型 1 宰口+ 一b + 占,g ( 0 0 2 ) ,7 x 令孝:! ,f = 一1 ,上模型就成为一元线性回归模型孝= 口+ b t + g ,占。( 0 , 7 2 ) 。 7 7 工 对数曲线模型 ,7 = a + b l n x + 占,占一( 0 ,仃2 ) 令t = l n x ,上模型就成为一元线性回归模型,7 = d + b t + s ,p n ( o ,仃2 ) 。 ,一 s 曲线模型 巧= 七,占( o ,盯2 ) 1 8 华北 令f :! ,f :e ,上模型就成为 r l 多项式回归模型 刁= b o + b l x + b 2 x 2 + + b x “+ s ,g n ( o ,盯2 ) 令妒,j = l ,2 ,m 。上模型就成为m 元线性回归模型 ,7 = b o + b l x l + 6 2 x 2 + + 6 埘+ g ,占n ( o ,盯2 ) 幂函数回归模型 刁= a x 6 + g ,n ( o , a 2 ) 指数曲线回归模型 b ,7 = a e k + 占或r l = a e 一+ 占,s n ( o ,盯2 ) 生长曲线回归模型 r l = 而l 鬲+ g ( 6 8 5 ( 或8 5 ) 的准则,确定k ,从 ,z if f i tj - t 而建立前k 个主成分: z = f i e = i n p i + + ,p ,2 l ,2 ,k ( 3 - 2 6 ) 从而可得新指标( 主成分) 样本值( 乃) 棚以之代替原样本值( ) 唧作统计分析, 便可将问题简化。 ( 6 ) 建立回归方程 通过多元线性回归分析方法,建立因变量y 与k 个主成分z l ,z 2 ,z 历之间的回 归方程,如式( 3 2 7 ) 所示: y = b o + 岛z i + b 2 2 2 + + b k z t ( 3 - 2 7 ) 将式( 3 - 2 6 ) 代入上式,可得y 关于标准化自变量留的回归方程 y = + 耳p l + 巧p 2 + + b k e k ( 3 2 8 ) 最后,通过标准化的逆过程,可得到y 关于而的回归方程为 y = 6 i 工l + 6 2 屯+ + b k x t ( 3 2 9 ) 3 3 3 偏最小二乘回归分析【3 似0 1 3 3 3 1 基本概念 偏最小二乘回归( p a r t i a ll e a s t s q u a r e sr e g r e s s i o n ) 是一种新型的多元统计数据 分析方法,它于1 9 8 3 年由伍德( s w 0 l d ) 和阿巴诺( c a l b a n o ) 等人首次提出。许 多统计学家开始致力于其理论研究,而它在应用方面的巨大发展前景j 下受到越来越 多人员的关注。 偏最, j , - - 乘回归方法在统计应用中的重要性主要有以下几个方面。 ( 1 ) 偏最小二乘回归是一种多因变量对多自变量的回归建模方法。 2 1 应对所 乃 为群 p 乞 _ = , 、j 乇;0 j,j-。_-_。_-。_-一 = j u歹各的qi u啊赆o 。 五 量 向 征 。 设 特 值 妨 化 征 不 规 特 正 个 的 华北电力人学硕十学位论文 偏最小二乘回归主要的研究焦点是多因变量对多自变量的回归建模。特别当各 变量集合内部存在较高的相关性时,用偏最d , - 乘回归进行回归建模分析,比对逐 个因变量做多元回归更加有效,其结论更加可靠,整体性更强。 ( 2 ) 偏最小二乘回归可以较好地解决许多以往用普通多元回归无法解决的问 题。 偏最小二乘回归主要用于建立多因变量与多自变量的统计关系。在回归分析 中,当自变量与因变量的个数都很多,并且在自变量之间以及因变量之问都存在较 严重的多重共线性时,如果采用一般的多元回归方法,其分析结果的可靠性极低, 而采用偏最小二乘回归分析的建模方法,可以较好地解决这个问题。 另一个在使用普通多元回归时经常受到的限制,是样本点数量不宜太少。一般 统计书上介绍该数目应是变量个数的两倍以上然而,在一些试验性的科学研究中, 常常会有许多必须考虑的重要变量,但由于费用、时间等条件的限制,所能得到的 样本点个数却远小于变量的个数。普通多元回归在对样本点数量小于变量个数时的 建模分析是完全无能为力的。而这个问题的数学本质与变量多重相关性十分类似。 因此,采用偏最小二乘回归方法,也可较好地得到解决。 ( 3 ) 偏最小二乘回归之所以被称为第二代回归方法,还由于它可以实现多种 数据分析方法的综合应用。 偏最小二乘回归可以集多元线性回归分析、典型相关分析和主成分分析的基本 功能为一体,将建模预测类型的数据分析方法与非模型式的数据认识性分析方法有 机地结合起来,即: 偏最小二乘回归多元线性回归分析+ 典型相关分析+ 主成分分析 3 3 3 2 偏最小二乘回归分析方法的算法推导 ( 1 ) 基本原理 为了研究因变量r = l v , ,强,肋1 与自变量骼h i ,x 2 ,】之间的统计关系,偏 最d - - 乘回归分析借用了主成分分析的工作手段。它首先在自变量系统x 中,提取 一个主成分t l ( t i 是x i 娩,的线性组合) ,同时,在因变量系统l ,中,提取一 个主成分u i ( i 是j ,i ,y 2 ,即的线性组合) 偏最小二乘回归分析在提取这两个主 成分时,有下列两个要求。 t i 和“l 应尽可能大地提取它们各自原变量系统中的变异信息 t l 与”l 的相关程度能够达到最大。 这两个要求表明,t l 和i 应尽可能好地综合它们各自的原变量系统,同时,自 变量主成分t i 对因变量主成分甜l 的解释性又能达到最大。 华北电力人学硕士学位论文 在第一主成分t i 被提取出来后,偏最d , - 乘回归分别实施x 对t i 的回归以及l r 对t l 的回归。如果回归方程已经达到满意的精度,则算法终止;否则,将利用x 被 t l 解释后的残余信息以及l ,被t l 解释后的残余信息进行第二轮的主成分提取。如此 往复,直到能达到一个较为满意的精度为止。若最终对x 共提取了彳个主成分 t i ,t 2 ,t a ,偏最小二乘回归将通过施行肌对t l ,t 2 ,t a 的回归,最后再表达成款 关于原变量x 的回归方程。 偏最小二乘回归分析是主成分分析、典型相关分析及多元线性回归分析的有机 结合。在主成分分析理论中,从自变量x 和因变量l ,中提取的第l 主成分t l 和“l 应尽可能多地携带原数据的变异信息,使所提取的成分方差最大。 在典型相关分析中,为保证自变量与因变量之间的相关性,在典型成分t i 和“i 的提取过程中,应使典型成分之间的相关系数最大。 偏最小二乘回归在普通多元回归中的应用,主要可以用来消除自变量之间多重 相关性的不良作用。 ( 2 ) 建模步骤 设已知因变量j ,和k 个自变量工i ,j r 2 ,歇,样本数为刀,形成自变量矩阵 x = 【一x 2 吒】舭和因变量矩阵l ,= 【y 】删。将x 与l r 进行标准化处理,得到标准 化后的自变量岛和因变量矩阵风。标准化处理是为了公式表达的方便和减少运算 误差。 2 半 y ;:丛2( 3 3 0 ) s y e o = ( x :) 腓 r = ( y ? ) 蒯 其中,i = l ,2 ,玎;户1 ,2 ,k ,勘表示自变量矩阵x 中第_ ,个变量暂的第i 个样本值;弓表示自变量矩阵x 中第_ ,个变量咛的均值;毋表示习的标准差;弘表 示因变量j ,的第i 个样本值;歹表示j ,的均值;s y 表示j ,的标准差;表示和标准 化后的数值:y ;表示弦标准化后的数值。 提取第一个主成分 w :呈: 嵋2 丽2 ( 3 _ 3 1 ) 力 力而;坼 “ 几 华北电力人学硕+ 学位论文 【r ( x l ,y ) e o i + r ( x 2 ,j ,) 点k + + r ( x k ,y ) e 眦】 ( 3 - 3 2 ) 旷静 e i2e o - t i p t r ( 3 3 3 ) ( 3 3 4 ) 其中,e o j ( 户l ,2 ,七) 表示e o 的第,列;,( x j ,j ,) ( 户l ,2 ,七) 表示而与y 的相关系数。p i 表示面对t i 的回归系数;e l 表示回归方程的残差矩阵。 重复建模步骤,以e l 取代凰,以f i 取代f o ,用同样的方法得到 肾晶舶讹厕脚龇觯硝蝻 肾晶2肾雨2 厶誊e 1 ( 3 - 3 6 ) 一 仍2 静 悖3 7 ) 易= 最一乞z ( 3 - 3 8 ) 式中,c o y ( e l i , j ,) 表示曰v 与y 的协方差 依此类推,从第步开始,可用交叉有效性确定偏最小二乘回归中成分的提取 个数,并停止迭代 在得到成分t i ,f 2 ,k ( 朋 o k = - l ,2 ,q 这是一个以w 七为决策变量的优化模型,属于非线性规划中的二次规划问题。我 们首先分析此问题的特征,用矩阵形式表示。 按照组合预测模型的定义,目标函数可转化为: z = ( 丸一只) 2 = 【( 九) 一( 艺w t ) 只】2 f it - ii - ik - i = 【 矗一只) 】2 = 【艺】2 1 。1 扣。1 ( 4 1 0 ) # ( m ) 2 + 2 ( w i ) 】 l t ii l k , q = 【以吒】+ 2 【( m ) ( ) 】 根据拟合方差和拟合协方差的定义,记: w l w 2 : 华北电力人学硕十学位论文 y = y 虬p : 一i v 钾j 则: z = w t w r w = w r h w( 4 1 1 ) 式中,h = w r 为非负定对称矩阵。 于是问题的矩阵表述形式为: m i n z = w th w s 丘e t w = i ( 4 1 2 ) m 0 4 3 2 组合最优拟合模型的求解 上式描述的是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论