




已阅读5页,还剩57页未读, 继续免费阅读
(电力系统及其自动化专业论文)次日无约束市场清算价格(umcp)预测技术的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
华北电力大学( 北京) 硕士学位论文 ab s t r a c t r e c e n t l y , t h e r e g i o n a l p o w e r m a r k e t o f o u r c o u n t r y h a s g e t i n t o t h e s t a g e o f s i m u l a t i o n , t h e e a r l y t i m e o f t h e d a y a h e a d p o w e r m a r k e t o f t h e n o r t h e a s t c h i n a w i l l t a k e t h e c o m p e t i t i o n m o d e o f s i n g l e b u y e r , t h e r e b y , t h e p r e d i c t i o n o f u n c o n s t r a i n e d ma r k e t c l e a r p r i c e ( u mc p ) i s o f g r e a t i m p o r ta n c e f o r t h e g e n e r a t o r s . a t f i r s t , o r d i n a l c l u s t e r i n g a n a l y s i s , d a y ty p e a n a l y s i s , f a c t o r a n a l y s i s , d y n a m i c c l u s t e r i n g a n a l y s i s a r e u s e d i n t h e p a p e r t o c l a s s i f y t h e s a m p l e o f d a y o f a w h o l e y e a r s t e p b y s t e p , s o t h e s i m i l a r s a m p l e a r e c l u s t e r e d i n t o a g e n u s . t h i s p a rt s o l v e t h e p r o b l e m o f t h e c l a s s i f i c a t i o n o f p r i c e m o d e a n d t h e s e l e c t i o n o f s a m p l e . t h e n , o n t h e b a s i s o f t h e r e s u lt o f a b o v e c l u s t e r i n g a n a l y s i s , b y t h e c o mp a r e o f s o me f o r e c a s t m e t h o d s a n d t h e o p t i mi z a t i o n o f f o r e c a s t m o d e l s , a b e tt e r f o r e c a s t m e t h o d f o r u mc p i s b r o u g h t f o r w a r d . a ft e r t h e a b o v e s t u d y o f o 西ma l c l u s t e r i n g a n d o p t i m a l f o r e c a s t m o d e l s w i t h h i s t o r i c a l . d a t a , t h e d i s c r i m i n a n t a n a l y s i s i s u s e d t o s o l v e t h e p r o b l e m o f t h e c o n f i r ma t i o n o f t h e u n - f o r e c a s t e d d a y , a n d s i m u lt a n e o u s l y , t h e b e s t f o r e c as t m o d e l a n d s a m p l e f o r t h e m o d e l a r e f o u n d . i n t h e s t u d y , a l o t o f i m p o r t a n t p r o b l e m s a re s t u d i e d d e t a i l e d l y : t h e p r o b l e m o f o p t i m a l c l u s t e r i n g , t h e a n a l y s i s a n d d i s p o s a l o f d i ff e r e n t r e s u l t t h a t c o m e f r o m d i ff e r e n t m e t h o d s o f f a c t o r a n a l y s i s , t h e a n a l y s i s a n d d i s p o s a l o f t h e d i ff e r e n t c l u s t e r i n g r e s u l t w h i c h c o m e fr o m t h e c l u s t e r in g a n a l y s i s w h e n d i f f e r e n t m e t h o d f o r c a l c u l a t i n g d i s t a n c e b e t w e e n s a m p l e , t h e o p t i m i z a t i o n o f f o r e c as t m e t h o d s , e t c t h e e x a mp l e c o n f i r m t h a t t h e t h e m e t h o d s t h e p a p e r b r i n g f o r w a r d a r e p r a c t i c a l a n d g o o d , t h e y a r e g o o d f o r g e n e r a t o r s t o f o r m b i d d i n g s t r a t e g i e s a n d i m p r o v e b e n e f i t b y f o r e c a s t i n g d a i l y u mc p . k e y w o r d s : u n c o n s t r a i n e d m a r k e t c l e a r p r i c e ( u mc p ) , c l u s t e r i n g o r d i n a l c l u s t e r i n g a n a l y s i s , d y n a m i c c l u s t e r i n g a n a l y s i s , f a c t o r for e c a s t a n a l y s i s , a n a l y s i s , 华北电力大学( 北京) 硕士学位论 文 第一章绪论 电力市场下 u m cp预测的重要性 目 前, 我国的区域电力市场已经进入模拟运行阶段, 东北区域的 日 前市场初 期将采用单一购买者的竞争方式,因此, 对于单一购买者来说,电力无约束市场 价格 ( u m c p )的预测将具有相当 重要的 意义。 对于发电商来说,准确的短期电价预测是发电商进行 “ 竞价上网” 最有力的 “ 武 器,。 如 果 能 够较 准 确地 预测 次日 的 市 场 清 算电 价, 将有 助 于 其构 造 最 优 报 价策略,以获取最大利润。 1 . 2 本文所作研究的市场模式背景描述 本文的研究针对单一购买者模式的日 前市 场: 发电商将报价提交 p x , 在有 效性检查之后,p x先在不计电网约束的 情况下以 购电费用最小为原则安排交易 计 一 划, 报价较低的电 厂上网发电, 直到满足负荷需求为止, 最后一台被安 排发电 的机组所报电价为无约束系统边际清算电价 u mc p 。 然后再做系统安全校核, 必 要时适当调整无约束发电计划形成有约束发电计划。 1 .3 研究现状 文献 1 采用 1 5 + 1 5 + 1 结构的b p网 络预测短期市场的清算价格 ( s m p ) . 输 入 层 变 量 ( 以 预测 时 段t 的 市 场 清 算 价 格s m p 为 例) 为 : t , t- 1 , t -2 时 段 的 系 统 潜在负 荷需求 ( s p d ( t ) , s p d ( t - 1 ) , s p d ( t - 2 ) ) 、系统能量备用 ( s p r ( t ) , s p r ( t - 1 ) , s p r ( t - 2 ) ) 预测和系统边际电价 ( s mp ( t ) , s mp ( t - 1 ) , s mp ( t - 2 ) ) ; 日 期型输入变量 ( 包括日 类型、假期编码、月、夏令/ 东部时区差别、圣诞节代 码、 年) 。为了证明所选的 输入变量对预测的重要性, 作者使用了 敏感度指标来 衡量, 输入变量对预测结果的敏感度越大, 说明该 变量越重要。 该文的敏感度选 择变量的方法非常新颖。 但是文献本身 也提到, 该预测方法只适合于预测某一时 段的价格, 不能预测全天的价格; 另外, 该文献把s m p ( t )用作输入变量, 有 华北电力大学( 北京) 硕士学位论文 些令人难以理解。 文献 2 也同 样采用b p 网络作为预测模型。 文献【 2 用了 较大的篇幅研究原始 数据的处理: 包括增长趋势的去除和星期性变化趋势的去除。 该文采用相关预测 系数来选择输入变量,并且引入了星期性变化趋势变量。 此外, 作者还对b p 网 络的误差函数加以修改,从而体现出了 “ 重近轻远”的样本使用原则。 文 献 3 用时间序列的a r i m a模型 和前馈神经网 络模型分别建模预测, 并对 两种模型的预测结果加以比较, 特别的是,除了负荷需求和可用发电容量外, 文 献还引入了 供求指数变量作为前馈神经网络的 输入变量。 文献 4 采用b p 神经网络的 方法对浙江发电市场的m c p 进行了预测,并 且 对不同时段选用了不同的预测模型。 文献还在变量中引入了竞价空间的概念。 该 文不同时段分别建模的方法非常值得称道。 文 献 5 1 采 用 了 多 元 线 性 回 归 、 多 元 非 线 性 回 归 和b p 神 经 网 络 的 方 法 进 行 预 测。 文 献6 同 样采 用b p 网 络 进 行预 测 , 选 用 相关 信 息( 星 期 几 编 号、 时 段、 预 测负 荷、供需形式选项a / b ( a表示电力供给超过需求并达到了 一定的比 例) 和 历史价格数据 ( s m p ( i - 2 1 , t ) , s m p ( i - 1 4 , t ) , s m p ( i - 7 , t - 1 ) , s m p ( i - 7 , t ) 表示上周同 一日 相 同 时 段的 系 统 边际 价 格、 s m p (i -7 ,t+ 1 ) , s m p ( i- l ,t- 1 ) , s m p (i - l ,t ) , s m p ( i- l ,t + l ) ) 作为模型的 输入变量, 输出 为预 测日 时段t 的 预测值。 文献 6 1 在输入输出 变量基 本确定之后, 还通过大量的预测模型和预测结 果找到了最优模型, 特别的是, 它 没有象其它文献一样将网络结构仅仅局限在三层网络上, 并且文献的预测值表明 1 2 - 8 - 5 - 1 的网 络结构是最优的。 文献 7 采用b p网络预测市场清算价格 ( mc p ) 和市场清算数量 ( m c q ) , 该文也采用三层结 构, 输出 层为m c p 和mc q , 输入层除了历史m c p , mc q和 预测负 荷外,还有燃料价格、 与其它系统的功率交换、天气、 时间指数 ( 小时、 星期、季节) 。该文还对网 络可能出 现的 过度训练问 题进行了讨论,认为当训练 误差 在一定训练周期内 连续增长时便可以 停止训练了。 作者还认为, 应该对工作 日 、 周末和节假日 分别建 模。由 于发电 商的搏奕行为, 价格可能出 现突增, 这样 会对预测产生很大的影响,该文使用了切断突增价格的办法来改善预测效果。 文献 8 使用了 数据挖掘技术进行 s m p 的预测: 利用未来2 4 小时的负 荷预测 华北电 力大学( 北京) 硕士学位论文 值, 在一定范围内的历史负荷序列中进行相似性查 询, 找出 和该预测负 荷序列最 相似的几个大力加强序列, 将这几个负荷序列所对应的电价序列加权平均后就得 到预测日的预测电价。 日前市场电价预测的研究是随着近十年来电力市场的发展而逐渐发展, 目前 这一领域的 研究成果尚不成熟。 大部分 研究都是用人工神经网络的b p 模型进行 电 价预测1 1 , 2 , 4 , 5 , 6 ,7 1 至于输入变量的选择, 有些文献提出了选择的 依据, 如相关 系数法 2 1 , 但大部分文献没有说明变量选择的 依据, 而且都 采用了 历史价格和负 荷预测作为输入变量。 有的文献 3 1 采用累计式自 回归滑动平均模型和人工 神经网 络对我国某省电力市场系统边际电价进行了预测, 在其模型中考虑了市场供需关 系对电 价的影响, 但没有考虑对不同的交易时段分别建模。 有些文献还采用了多 元线性回归的方法 5 1 , 有的 对不同的交易时段分别建模3 ,4 1 。 有的使用了 数据挖掘 的 方法预测电价 8 l假设各发电 商按成本报价且策略不变, 从历史数据中找出 与 预测日负荷曲 线最相似的几日的负 荷序列, 这几日 的实际价格算术平均值即为预 测结果, 数据挖掘方法的前提假设比较苛刻, 只有较成熟的电力市场才有可能适 用。 总体来说, 大部分研究都以预测方法本身为中心进行研究, 缺乏对模式分类、 样本选择、变量选择、预测方法选择等重要问题展开综合详细地讨论,也没有对 各种预测方法进行详细比较。 4 本论文所做的主要工作 1 分析整理历史数据,找到日 价格样本的最佳聚类方法和小类的最优预测模型。 1 ) 运用聚类分析方 法解决样本选择问 题,即 利用历史数据对全年的日 前 市场价 格模式进行聚类: ( 1 ) 一级聚类: 采用有序样本聚类分析将全年的日 价格模式分成几类, 并且选 择最优聚类数目 和最优聚类结果,从而消除价格模式的年周期 性。 ( 2 ) 二级聚类: 在有序样本聚类分 析的基础上, 利用工作日、 周末和节假日 价 格分 布特征的不同, 将一级类进一步分成三个二级类。 ( 3 ) 利用相关性分析、 关联度分析、 主成分分析等因素分析方法, 求出 预测负 荷、预测可用发电容量、昨日同时段价格、前日同时段价格、上周同时段 华北电 力大学 ( 北京) 硕士学位论文 价格等变量中,与价格关系最密 切的变量。 ( 4 ) 三级聚类:以因素分析得到的与价格关系较密切的变量为依据, 在二级类 的基础上, 采用动态聚类分析方法继续 ( 如果二级聚类得到的类内样本数 目 比较大且足以满足预测方法对样本数目 的要求, 并且类内 样本之间差别 还比较大, 则有必要采用此步分析) 对各小类进行聚类分析, 并且通过最 优聚类数 目的研究确定最优分类结果, 从而最终得到类内样本相似程度最 高、类内样本数量适当的分类结果。 2 ) 在聚类分析的 最终分类结果上 ,参考因 素分析 得到的变量关系,以 各小 类的 样本为己知数据, 用多种预测方法分别建模、 预测、比 较, 找到每一小 类的最 优预测模型。 ( 1 ) 利用经验将全天 2 4 个时段分成连续的几段,以 便后面 对每一段分别建模 预测。 ( 2 ) 多元线性回归法:利用各小类的样本,参考因素分析的结果得到的变量, 采用多元线性回归方法对全天2 4 个时 段分成的几个时间段分别建模、预 测,得到各时间段的最优多元线性回归预测模型。 ( 3 ) 人工神经网络法:利用各小类的 样本,参考因 素分析的结果得到的变量, 采用人工神经网络方法对全天2 4 个时 段分成的几个时间段分别建模、预 测,得到各时间段的最优人工神经网络预测模型。 ( 4 ) 时间序列法: 利用各小类的 样本, 采用时间序列法建模预测, 得到该小类 的最优模型。 ( 5 ) 简单方法:以同类内上一日的实际价格和该价格的调整值作预测值。 ( 6 ) 比 较各预测方法,选择最优预测方法。 ( 7 ) 比 较选择样本与不选择样本的 预测结果, 证明聚类分析 法样本选择的重要 性。 2 预测方法的实际应用:采用判别分析确定预测日的模式类别,从而确定最优样 本及最佳预测模型,进行实际预测。 华北电力大学( 北京) 硕士学位论文 第二章相关预测理论与技术 本章主要解决各种预测方法的样本如何选择的问题,以聚类分析为主,因素 分析为辅助手段。目的是将相似的日价格样本归类在一起, 然后才能对这一类的 样本单独建模和预测。 2 . 1 有序样本聚类分析 ( 一级聚类) 2 . 1 . 1有序样本聚类分析的必要性 众所周知,由于供暖、使用空调等原因,电力负荷有较强的季节性特征,不 同时期的日 负荷曲线会呈现出较大的差异。 我们对加州 1 9 9 9 年和2 0 0 0 年全年的 现货价 格曲 线和负荷曲 线 ( 图2 . 1 . 1 ,图2 . 1 . 2 ) 加以比 较,发现正常情况下 ( 因 为发生了电 力危机导致电 供不应求【 如图2 . 1 . 3 , 2 0 0 0 年后期价格出 现了异常) , 负荷波动较大的时期价格波动也较大, 所以价格一定程度上也会随着负荷一起波 动,表现出 不同的季节性特征,而且年年如此 ( 如图 2 . 1 . 1 和图2 . 1 . 2 ) 。因 此, 我们认为由于负荷对价格的影响, 价格也会象负荷一样呈现相对固定的时期性特 征。 为了找到一个客观的分类依据和科学的分类方法, 便采用了有序样本聚类分 析, 因为该方法不仅能够保持样本的时间顺序, 而且能够保证分成的类内部样本 差别最小, 类间样本差别最大。在实际预测时, 便可首先根据待预测 日的日期进 行一级聚类, 然后再进行二级聚类 ( 见2 . 2 ) . 华北电 力大学( 北京) 硕士学位论 文 价 格 负 荷 图2 . 1 . 1 : 加州1 9 9 9 全年价格、负荷曲 线 价 格 !(! 一 也 l _ _ _ _ _ _ _ _ _ _ _ _ _ 上_ 一 -,.- -一1 -一- - 一- -一 r- - - -. !:1_ _ _ _ _ _ _ ii i - - - 一 一 1隆 一葬 _一 _一 _ 拼 _ _ . _蚤 _- - - - - - - - - 一 !- - - - - - - - 一 ; - - - - - - - - 一 ! - - - - 一1 盗 i - 一1 l 奋 公 二 以辜 屯 蕊扁 : - - - -品 以 抽 负 荷 图2 . 1 . 2 :加州2 0 0 0 全年价格、负荷曲线 华北电 力大学 ( 北京) 硕士学位论文 .二 ;是1 止一、一六 “ 一、,、一 酝 日 . . !. ;. 以成 . ; 为 通二 峰 一 y 卿卿卿 图 2 . 1 , 3 :加州200 0 全年剩余可用发电容量 ( = 预测负荷一 可用发电容量+ 系统功 率输出一 系统功率输入) 2 . 1 2 基本思想和分析过程 聚类分析的基本思想是19 :从一批样本的多 个观测指标中,找出能度量样本 之间或指标之间相似程度 ( 亲疏关系)的统计量,构成一个对称的相似性矩阵。 在此基础上进一步找寻各样本 ( 或变量) 之间或样本组合之间的 相似程度, 按相 似程度的大小,把样本 ( 或变量)逐一归类。 而有序样本聚类 最优分割) 在聚类分析时, 保持了样本排列的先后顺序, 在样本之间找出一些分点,将他们划分成几个分段, 每个分段为一类 , 分类的依 据是离差平方和, 同时使各类内部样本间的 差异最小, 而各类之间 样本的差异最 大。 大 概的 求解 步骤 如图 2 . 1 .4 , 详 细 步 骤可以 参 见 有关 文 献19,1 0,1 , 本 文使 用 m atlab6 . 5 进行分析,由 于m atlab对矩阵维数有所限 制, 本文便通过矩阵分解对 其具体分析过程加以改进,详细过程请参考本文第四章的综合算例。 华北电力大学 北京 ) 硕士学位论文 构造原始数据矩 求解类直径矩 根据类直径矩阵 求解最小误差矩 根据以上两步的 结果求解最优分 结 束 一 图2 . 1 .4有序样本聚类分析步骤 2 . 1 . 3 最优聚类 选择不同的分类数目, 会得到不同的分类结果。 每个分类结果都会满足各类 内部样本间的 差异最小, 各类之间样本的 差异 最大。 随着分类数目 的增加, 分 类 会越 来 越 细, 因 此, 我 们 必 须合 理 的 分 类 数目 当 中 , 找 到 一 个 最优 分 类 数目 和分 类结果。可以 采用以下几种方法: 1 、根据常识确定最优聚类数 目 我们所作的分类,目的是将相似的样本放在同一大类中之后,再对该类单独 进行分 析和预测, 这样可有效缩小研究对象和误差的范围。 因此为了满足预测方 法对样本数量的要求,一般要保持每一类都要具备一定的样本数量规模;但是, 我们也不能随便的排除出现小数量样本的分类结果, 对数目较小的类型, 要单独 进行研究, 尽可能找到它们呈现特殊特征的原因, 如果是特殊节日 造成的, 就说 明它是一种客观规律, 就不能排除这种分 类结果; 如果这几天都非特殊节日, 也 不是其它的年周期性原因造成的, 而是一种偶然现象, 就应当排除这种分类结果。 2 、段内离差平方和曲线图确定最优分割数目 根据文献 1 2 中的论述: “ 怎样确定最优分割数 k呢?一般在开始计 算时, 将分割数设得比实际的 段数大一些, 然后做分割数g 与段内离差平方和s pi n 的曲 线图,当s 段 内 几乎不变时,所对应的9 值即为最优的分割数k ” 。这里的s 段 内 实 际就是最小误差函数,s段 内 几乎不变时,也就是最小误差函数几乎不变的时候, 华北电力大学( 北京) 硕士学位论文 这时分成更多的类 已经起不到太大的作用了,也得到了最优分类数目。 o ( p o ( m , n ) ) (p ( p o ( m + 1 , n ) ) 方法确定最优聚类数目 根据参考文献 1 3 中的论述:“ 从数学上的最小误差函数来判断 m,当 gp ( p o ( m , n ) ) p ( p o ( m + 1 , n ) ) 较大时,说明分成 m 十 1 类型比m类型好” 。 这句话可以这么理解, 些业燮 1较 大 时 , 说 明 分 成 m 类 时 的 类 内 差 别 比 m + l 类 时 的 要 明 显 , 这 ,p ( p n ( m + 1 , n ) ) 时这。 + 1 类内部更接近于 恒定方差。 所以找到最大的比 值就可以 找到最 优聚类 数目了。 4 、阀值确定最优分类数目 可以 事 先 给 定 一 个阀 值 。 , 当 某 个分 类数 对 应 的 所 有 类的 直 径 都小 于 该 阀 值 的时候, 该分类数目即为最优的分类数。 但是, 该阀值的大小只能视具体的需要, 并根据经验和统计数据才能给出, 而且阀 值取的 大小不同, 得到的 最优分类数目 也 不同。 2 .2 运用日 类型的模式划分 ( 二级聚类) 对工作日 和周 末的价格曲 线加以 对比 ( 如图2 . 2 . 1 ) , 可以发现: 工作日 和周 末的 价格曲 线形状有很大的差异。 而且, 对周末和工作日 分别进行因素分析 ( 见 本文 的 综 合 算 例) , 也 可以 发 现 周 末 和工 作日 具 有 较 大的 差 异。 因 此, 很 有 必 要 在有序样本聚类分析 ( 一级聚类) 的基 础上, 再对一级类进行二级聚类,即 将各 大类中的周末和工作日单独归类 。 华北电 力大学 北京) 硕士学位论文 工作 日 周末 图2 .2 . 1 :工作日和周末的价格曲线对比 2 . 3 因素分析 2 .3 . 1因素分析的必要性 在经过有序样本聚类分析和日 类型模式划分两级聚类之后, 有的类样本数量 比较小了, 不适于再细分; 有的类样本数量还比较大,而且样本之间差别仍比较 大, 这时 应 对 其 作 进一 步的 聚类 分 析 。 聚 类的 结 果很 可 能 打 破时 1f f lip 序( 郎 类内 的样本并非相邻 日) ,如果还用 “ 价格”作为分类依据的话,虽然能够保证聚类 结果的合理性, 但是确丧失了实用性。 因为我们在实际预测时只能根据日期做前 两级的分类, 而无法知道它应属于哪个三级类,因为分类依据是价格, 所以就无 法使用这个依据来 确定该日的 三级类别归属。 因此, 不得不使用其它的聚类依据, 本文使用导致价格 “ 结果” 的“ 原因” 作为分类依据, 即与价格关系较密切的“ 变 量” ,至于使用哪个 “ 变量” , 这时就需要做因素分析了。 供 求关 系 很 大 程度 上 能 够决 定 价 格 1,3 ,4,81 , 但 是 价 格也 受 许多 其它 的 变 量( 详 情请 参见本文的算例分析)的影响 3 , 6 1 ,因此许多文献也把其它的与 价格关系很 密切 变量 用 于 预测 i ,5, 6,7 。 通过 因 素 分 析, 便 可 找出 与 价 格 关系 较 密切 的 变 量, 华北电力大学 ( 北京) 硕士学位论文 作为预测时变量选择的参考。 2 .3 .2相关性分析 相关系数的可以衡量两个变量之间的线性相关程度的大小。 相关系数的绝对 值越大, 这两个变量的线性关系就越紧 密, 相关系数的绝对值等于 1 时, 两个变 量完全线性相关,它们存在着确定的线性函数关系。 相关系数只表示两个变量的“ 线性” 关系的 紧密程度, 当r 很小甚至于0 时, 并不一定表示它们不存在其他关系, 它们可能存在明显的其它关系, 只不过不是 线性的而已 2 9 1 。 相关系数的计 算公式为: 习 _ . cov(x ,y)d (x) d (y ) - y- ( x , 一 x ) ( y i 一 y ) j y- ( 、 一 x ) 2 v e ( : 一 y ) 2 ( 2 . 3. 1 ) 2 . 3 . 3关联度分析 用来描述两个曲 线形状的相似程度, 并 联度越大, 曲 线形状越接近, 曲线的 变化趋势越接近。 在进行关联分析时, 必须先确定参考数列, 然后比 较其它数列同参考数列的 接近程度, 这样才能 对其它数列进行比较, 进而做出 判断。 具体求解步骤可参考 有关文献d 9 1 , 其大概步骤为: 1 确定比较数列和参考数列 2 求关联系数 3 求关联度 4 关联度按大小排序 2 . 3 . 4主成分分析 研究变量 ( 价格)的 观测变量个数很多时, 该方法可以用个数较少的变量代 替原来为 数众多的 变量, 同时又基本上包含原来变量的信息。 当 变量之间存在一 定的相关关系时, 可以通过原始变量的线性组合, 构成为数较少的不相关的新变 量代替原始变量, 而每个原始新变量都含有尽量多的原始变量的信息。 它有以下 几点功能 1 4 1 . 华北电力大学( 北京) 硕士学位论文 i 能降低所研究的数据空间维数。 2可通过因子负荷结构,弄清变量间的关系。 3 多维数据的 一种表示方法。 4由 主成分分析法构造回归 模型。 5 用主成分分析筛选回归变量。 主成分分析的基本过程如下: 1 变量数据标准化 2 计 算变量的相关系数矩阵 3计算相关系数矩阵的 特征根、 相应的 单位化的特征向量及特征根的累积百分 l 匕 。 4 根据累积百分比 求得主成分 5 计算主成分与各变量的相关系数及每个变 量与主成分的 复相关系数。 6 做经济学解释 2 . 3 . 5三种变量分析方法的比较 三种方法分别从不同 侧面反映了自 变量与因 变量的关系的紧密程度: 1 相关性: 反映了 两个变量的线性相关 程度的大小,虽然两个变量之间的关系不 一定是线性的。 2 关联 度:用来描述两个曲 线形 状的相似程度,并 联度越大,曲 线形状越接近, 曲线的变化趋势越接近。 3 这种方法将原来的自 变量进行线性组合之后来重新描述因变量, 使新的自 变量 能够与因变量具有更强的相关性,同时又去掉了旧自变量之间的相关性, 虽然旧 自变量通过新自变量也能描述它与因变量关系的紧密程度, 但是它只是间接地来 说明,分析结果更多地应用于重新构造回归模型的变量。 所以三种方法的分析结果必然会有所不同, 得到的 自 变量与因变量紧密程度 的顺序肯定 会有所不同, 对于这种问题, 我们可以分别在这三种结果的 基础上进 行下一步聚类和预测工作, 用预测结果的优劣来说明这三种分析方法对预测工作 的适用性强弱。 华北电 力大学( 北京) 硕士学位论文 2 . 4动态样本聚类分析 ( 三级聚类) 2 . 4 . 1动态样本聚类分析的必要性 运用有序样本聚类分析和日类型模式划分得到的只是比较粗糙的分类结果, 要想进 一 步 研究电 价的规律, 只 有在以上两步模式划分和因素分析的基础上进行 进一步的分类 。 比较常见的聚类方法是系统聚类法,它是一种比较聚类方法,样品一旦划到 某个类以后就不变了, 这要求分类的方法比较准确。 而且它是通过标度谱系图由 粗到细地分 类, 然而,当 样本点 数量十分庞大时, 要求绘制谱系图, 则是 件很繁 重的工作,且计算速度也很慢。这时, 采用系统聚类法就很困难,而动态聚类法 则避免了系统聚类法不便处理大量样本的缺点, 它更方便、实用。 如果有序样本聚类分析得到的类中样本数量己经足够小了或者样本之间的 差别已经很小了,也可以不进行这一步分析,直接进入预测工作阶段。 2 . 4 . 2基本思想和分析过程 动态聚类法要解决的问题是,如果有 n 个样本点, 要把它们分成 k类,使得 每一类内的元素都是聚合的, 并且类与类之间还能很好地区别开来。 动态聚类法 主要适用于大型数据表, 这时它的 计算速度要比系统聚类法快许多 i 5 。动态聚 类法大体可用如下框图来表示: 图2 . 3 . 1动态聚类基本过程 框图的每一部分均有多种方法, 这些方法按框图进行组合就会得到各种动态聚类 华北电力大学( 北京) 硕士学 位论文 法 1 6 。具体步骤请参见本文的综合算例和相 关文献p s ) 2 .4 .3最优聚类 同样, 动态聚类分析也面对一个最优分类数目的问题, 分类的目的是将相似 的样本放在一起, 或者将少数的特殊样本单独归类, 以便在分类的基础上进行预 测,因此样本数 目要具有一定的规模。另外,还要对每类的样本进行分析, 如果 已 经将特殊日、 周末划分出去, 并且满足了 样本数量的要求, 我们就可以 接受这 样的结果了。 2 .5 判别分析 2 .5 . 1目的 通过聚类分析和因素分析的方法, 可以将相 似的样本归为一类, 然后再分别 研究有同的类, 找到每个类的最佳预测方法, 这样可以有效地缩小预测误差可能 出现的范围。 但是,实际应用当中,我们无法知道下一 日应属于哪一类,更不知 那些样本是预测它的最佳样本, 叨 ; 种方法是预 测它的最佳方法。 而 模式识别正好 解决了这个问题, 通过识别影响下一 日 价格的主要因素与哪一类更接近, 便可知 道它应属于哪一类,这样便解决了下一日最佳预测样本和预测方法的选择问题。 2 . 5 .2方法 2 . 5 . 2 . 1距离识别 距离判别法的思想方法十分简单、直观。假设有两个总体 g ; 和 g 2 , x是一 个 新 样 本点 , 如果 能 够 定 义x 到g , 和g 2 的 距 离d ( x , g ) 和d ( x , g z ) , 则 可 用 如 下 规则进行判别 x g 1 若 d ( x , g l ) d ( x , g 2 ) 待判若 d ( x , g l ) = d ( x , g 2 ) ( 4 . 1 ) 在判别分析中 常采用马氏 距离。具体方法题可以 参考有关文献 1 0 , 1 5 华北电 力大学 北京) 硕士学位论文 2 . 5 .2 .2 贝叶斯判别 如果己 知共有k 个类g , , q, 二 , , q, 每个类都是一个p 维总体, 分别具有分 布密 度f l ( x ) , f2 (x ) . . . . . f k (x ) , 设 想它 们 把p 维 空间 分成k 块d i , d 2 ,. . . . , d k o 若 样本y 落入d j , 则 判 定 它 属于 总 体q 。 具 体 方法 题 可以 参 考有 关 文 献 p o7 2 . 5 . 2 . 3费歇判别 我 们 找 到 线性 判 别函 数: = a , y , 向 量a 表 示p 维 空 间中 的 一 个 方向 , 如 果按 这 个 方向 做 一条 直 线 ( 建 立 一 个 一 维 坐 标系 ) , 那 么a , y 表 示向 量 y 在 这 条直 线 _ l 投影的坐 标。 同样将各类平均 值投影到这条直线上, 得到各类平均值在这条直 线上的坐标, 通过判断样本投影与各类平均值投影的距离, 可以判断出它应该属 于哪个类。具体方法题可以 参考有关文献p o i 2 . 5 . 2 .4判别分析的改进和应用说明 前面三种方法都是先有样本, 后判别。 而我们面对的难题则是没有样本 ( 预 测 日的价格) , 只有影响样本的因素值 ( 下一日负荷预测、下一日可用发电容量、 昨日 价格等) , 我们可以 把 3 种方 法中的样本改成影响预测结果的主要因素, 总 体改成总体中各样本对应的主要因素。 本文采用距离判别法, 并用欧式距离进行判别, 主要出于以下几点 考虑: 距 离判别法简便易行; 距离判别法与本文运用的动态样本聚类分析中的归类过程用 的方法一致, 可以避免由 于聚类和判别时判别方法的不同而导致的归类不合理的 现象出现; 欧式距离与有序样本聚类分析和动态样本聚类分析中的样本距离 度量 方法一致, 同 样可以 避免由于聚类和判别时 距离 度量方法的 不同导致的 归类不 合 理 。 本文的 判别分析实际上分三步, 因为在分类时使 用了两种聚类方法, 有序样 本聚类方法和动态聚类方法。 有序样本聚类方 法出于对日 前价格季节性规律的考 虑, 在保证各类内部样本时间连续的前提下, 将历史数据中全年的日价格样本分 成几个大类, 因为 各年的日 价格都 近似符合同样的 规律( 见 有序样本聚类分析章 节的相关内 容) , 所以第一步判别是判断预测日的日 期, 然后将它归入相对应的 华北电力大学( 北京) 硕士学位论文 季节模式大类别中。 第二步判别是判断预测 日的日期类型:工作 日、 周末还是特殊节 日,再将它 归入对应的类别。 第三步判别才是通过计算影响预测 日价格的主因素与各动态聚类成的小类 样本集对应主因素的集合重心的欧氏距离来判别预测日的类别归属。 图2 . 3 . 3 : 本文聚类方法的综合流程图 华北电力大学( 北京) 硕士学位论文 第三章预测方法 在完成了上一章的聚类分析和样本选择理论研究之后,本章要在聚类结果的 基础上,对小类进行建模和预测。 3 . 1 多元线性回归 3 . 1 . 1 数学模型 多元线性回归用矩阵表示的模型为: 茸= 几+ 八 x 、 + 热x 2 +.二 + 几瓜 十 e , 式中y t因变量的 观察值 x , 自变量的观察值 戏回归系数 e t 一 一随机误差 二自 变量个数 以下各矩阵的定义为: ( 3 . 1 . 1 ) y ) ! 苏 1 y =xi: 一 x = 卜 l y n j l l 戈 l x , , x 2 1 x 2 . x n , x_ 几 ) “。 ) 肖 e , 一 “ 一 卜 l /t . j l e n t 因 此可以用下面矩阵代表y t 线性方程: y= x刀+ e 式中y 因变量 y的观察值向 量 p 回归系数向量 x 自 变量 x的矩阵 e -随机误差向量 ( 3 . 1 . 2) 华北电力大学 ( 北京) 硕士学位论文 3 . 1 . 2 步骤 1 、 选择自 变量 2 、利用历史 数据中提供的自 变量和因 变量求出回归系数矩阵9 、运用公式y = x 刀 求出预测值 基本假设和违背时的解决办法 线性回归当中使用到了最小二乘法进行参数估计,但是普通最小二乘法进行 参数估计时必须满足四 个古典基本假定的前提11 7 : 1 , 角 军 释变量是确定性变量, 不是随 机变量, 且解释变量之间不相关。 2 ,随机误差项具有 0均值和同方差。 3 ,回归余项 ( 残差、剩余差)线性独立 4 、随机 误差项与解释变量之间是 有相关的 满足以上四点,变可以 运用普通最小二乘 法来进行参数估计, 得出的参数估 计满足线性性、无偏性、最小方差性三个性质。 违背古典基本假定一般有四种形式: 1 、多重共线性:它是对基本假定 1 的违背,即 解释变量之间 存在相关关系。 存 在严重的共线性时, 这时 会导致普通最小 二乘法失效, 甚至无法进行参数 估计; 存在近似的多重共线性时,则会造成估计值的方差过大, 精度降低, 不能正确判 断解释变量对被解释变量的影响程度,从而导致参数估计量的经济意义不合理。 回归方程中 用于检验有无相关的方法是: 首先计算两个自 变量的 共相关系数, 而 后再计算每个自 变量与因变量之间的 相关系数。 如果共相关系数大于两个自 变量 的相关系数之和, 则肯定存在共相关现象 i s 。解决该问 题可以使用 3种方法: 主成分回归、岭回归和偏最小二乘法, 本文使用了主成分回归的办法,即先用主 成分分析的结果来生成几组新变量,然后用这几个新变量来形成回归预测方程, 然后再预测。 2 、 异方差性:它是对基本假定2 的违背。如果存在异方差时仍用普通最小二乘 法估计会造成不满足参数最小方差性及参数不显著为非零的后果, 异方差性的 检 验有很多种方法,常用的有:图示法、等级相关系数法、戈德菲乐特一 夸特检验 华北电力大学 北京) 硕士学位论文 等, 克 服 异方 差的 方 法的 基本 思 路是 变 换原 来的 模 型 11 7 , 使 经过 变 换后 的 模型 具有同方差的随机项, 然后再应用普通最小二乘法进行估计。 本文解决该问题的 办法是: 通过有序样本聚类分析和动 态样本聚类分析使 模式相近的样本尽量规在 一个类中,这样可以使方差尽量相同。 3 、自 相关性:它是对基本假定 3 的 违背。如果存在自 相关时仍用普通最小二乘 法估计也会造成不满足参数最小方差性及参数不显著为非零, 自 相关性的检验主 要是杜宾 华生检验,但杜宾 华生检验也有其局限,存在无法判断随机误差项是 否 有自 相关的区间。造成自 相关的原因是 1 8 : 回归公式中遗漏了一些关键因 素。 本文使用尽量多建模型, 然后进 行比 较的方法来避免该问 题。 4 .随机解释变量问题:它是对基本假定 4的违背。随机变量问题最常见是由滞 后变量、 观测误差或变量本身的取值就带有很大的随机性, 但不是所有的随机解 释变量都会使最小二乘法失效,只有在随机解释变量与随机误差 项高度相关时, 才会有严重后果。 通常用工具变量法来解决随机解释变量问题,即找出一个新变 量不相关且与随机误差项不相关。本文没有对该问题作深入研究。 3 . 1 .4 评价 线性回归方法计算简单。 但是只能建立线性化的模型, 存在一定的 局限 性。 通过选择不同的 变量, 可以 建立不同的回归模型。 样本的选择对回归预测的结果 好坏至关重要,好的方法,没有好的样本,一样得不到好的结果。 3 . 2时间序列 3 .2 . 1 概念 一 个随 着 变 量t 变 化的 量y ( t) , 在t 1 , t2 . .tn 处 的 观 测 值 y ( t i ) , y ( t 2 ) , . . . , y ( t n ) , , 二 形成的离散有序集合, 称为一个时间 序列。 用这个序列对电 价变化的规律和特征 进行分析并对未来价格做出预报,这正是电价预报的主要内容。 华北电 力大学 ( 北京) 硕士学位论文 3 . 2 . 2 模型 时间序列模型的一般形式为: y , 一 v , ( b y ,) -一v , ( b p y , ) = a , 一 0 ,( b a , ) -一6 y ( b v a , ) (1 一 (p ,b - 一 (p p b p ) y , = ( 1 一 b ib - 一 氏 b i ) a , ( 3 . 2. 1 ) 或 式中 rp ( b ) y , = b ( b ) a , b 延 迟 算 子, 它 使 得b y ,= y ,-t 9, . . p , b , , . .b , 模 型的 系 数 a , 一 一 白噪声序列,他们满足 ( 3 . 2 . 2) e (a ,)= 0 , e (a 、 、 ) 二 ( q a , 一 “, e (a,+。 一 。 (k
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 跨文化谈判心理效应-洞察阐释
- 医疗美容促销活动与消费者心理预期匹配度分析-洞察阐释
- 小学五年级科学下册教案
- 电子商务平台成立公司投资入股协议
- 智能化采购合同管理与谈判策略定制合同
- 冲击锤施工安全事故应急预案与责任认定合同
- 2025全面商业办公租赁合同范本
- 2025建筑工程安装合同范本
- 2025标准车辆租赁合同范本
- 基于RTMaps的多传感器融合与场景建模研究
- 《通信原理》期末考试复习题库(含答案)
- 2024年火电电力职业技能鉴定考试-600MW超临界机组运行笔试参考题库含答案
- 2024年中储粮集团招聘笔试参考题库附带答案详解
- 20-樊登读书会第20本书-《高绩效教练》省公开课一等奖全国示范课微课金奖课件
- 关于深圳的英语作文
- 安全生产十大法则
- 电力系统安装服务市场分析及竞争策略分析报告
- 大学语文(第三版)教案 孔子论孝
- 《美术教育学》课件
- 大盛公路工程造价管理系统V2010操作手册
- 户外运动基地设施建设技术可行性分析
评论
0/150
提交评论