(应用数学专业论文)一些预测算法的研究与应用.pdf_第1页
(应用数学专业论文)一些预测算法的研究与应用.pdf_第2页
(应用数学专业论文)一些预测算法的研究与应用.pdf_第3页
(应用数学专业论文)一些预测算法的研究与应用.pdf_第4页
(应用数学专业论文)一些预测算法的研究与应用.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(应用数学专业论文)一些预测算法的研究与应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浙江大学硕士学位论文 中文摘要 本文主要讨论了几种预测方法以及在浙江电力市场和中国股票市场的应用 实例。预测方法主要介绍了统计学方法和b p 神经网络算法。对统计算法中回归 模型中的假设条件、平滑指数的自适应调整、a r m a 模型的参数估计作了一些分 析。指出可以通过b p 算法进行a r m a 模型的参数估计,并比较了b p 作为预测算 法与统计模型的异同。文中提出了数据清理的一些方法,给出了通过灵敏度分析 来进行因子筛选的一种算法。 电力工业的市场化改革突出了市场清算价格( m c p ) 预测的重要性。本文给出 了一种浙江电力市场m c p 的预测方案,对浙江电力市场下一交易日市场清算价格 进行了预测,得到的预测精度达到9 0 左右。在此基础上,研究了发电商报价决 策问题,并开发出相应的软件,解决该问题时,提出了一种基于图的邻接矩阵的 聚类算法,取得了满意的效果。 预测并非对所有的问题都是有效的,本文第四部分就是这样的一个实例。用 线性和非线性两种方式对中国股票市场指数收益率的预测分析表明,根据历史数 据得不到有关未来收益率的有效信息,验证了中国股票市场具有弱有效性。 关键话l :时间序列,市场清算价格,聚类,竞价策略,弱有效性 塑垩茎堂璺主兰些堡三一 a b s t r a c t i nt h i sp a p e r ,w em a i n l yd i s c u s ss e v e r a lf o r e c a s t i n gm e t h o d s ,a sw e l l a st h e i ra p p l i c a t i o n si nz h e j i a n ge l e c t r i c i t ym a r k e t sa n dc h i n e s es t o c k m a r k e t s h e r ew eb r i e f l yi n t r o d u c es t a t i s t i cm e t h o d sa n db pa l g o r i t h m w e m a k ea n a l y s e so ft h et h r e eh y p o t h e s e so fr e g r e s s i o n 、a d a p t i v e a d j u s t m e n to fs m o o t h i n gi n d e xp a r a m e t e r sa n dp a r a m e t e re s t i m a t i o no fa r m a m o d e ls a f t e rt h a t ,w ed i s c u s sr e l a t i o n sa n dd i f f e r e n c e sb e t w e e nb pa n d s t a t i s t i ca l g o r i t h m t h e n ,s o m em e t h o d o l o g i e s o nd a t ac l e a r i n ga r e i n t r o d u c e d ,a n dw ep r o p o s ea na l g o r i t h mo nv a r i a b l e s e l e c t i o nt h r o u g h s e n s i t i v it ya n a l y s is r e f o r m so fp o w e ri n d u s t r yh a v e m a d e m a r k e tc l e a r i n gp r i c e ( m c p ) f o r e c a s t i n gm o r ei m p o z t a n t t h i s a r t i c l ep r e s c n t sam c pf o r e c a s t i n g m e t h o da c c o r d i n gt oz h e 、j i a n gc i r c u m s t a n c e a p p l i c a t i o nt ot h er e a lp o w e r s v s t e ms h o w st h ea c c u r a c yo ft h ep r o p o s e dm e t h o di sa b o u t9 0 o nt h eb a s e o fm c pp r e d i c t i o n s ,w es t u d yg e n e r a t i o nc o m p a n i e s b i d d i n gs t r a t e g i e s , a n di m p le m e n tc o r r e s p o n d i n gs o f t w a r e i n t h iss e c t i o n ,ac l u s t e ri n g m e t h o db a s e do na d j a c e n c ym a t r ixo fg r a p h si sp r o p o s e d f o r e c a s t i n gi sn o ta l w a y se f f e c t i v ef o ra n ya p p l i c a t i o n s t h ef o u r t h s e c t i o no ft h isp a p e rp r e s e n t ss u c hac a s e v eu s c1i n e a ra n dn o n l i n e a r t e c h n o l o g i e st oa n a l y z ep r o f i to fc h i n e s es t o c km a r k e t s ,m i dt h er e s u i t s s h o w st h a to n ec a n te x p e c tt og e ta n yv a l u a b l ei n f o r m a t i o no fp r o f i t i nt h ef u t u r eb ym i n i n gh i s t o r i c a ld a t a t h i si n d i c a t e sc h i n e s e s t o c k m a r k e t sp o s s e s sw e a kv a l i d i t y , k e yw o r d s :t i m es e r i e s ,m a r k e tc l e a r i n gp r i c e ( m c p ) ,c l u s t e r i n g ,b i d d i n g s t r a t e g y ,w e a kv a li d it y 4 浙江大学硕士学位论文 第一章绪论 1 。1 预测的目的和意义 预测就是人们对客观事物未来发展的预料、估计、分析、判断和推测。预测 是基于这样的假设:即通过以往经验或数据得到的规律或模式会在将来重现。 俗话说“未雨绸缪”,决策者做出的重大决策,必须建立在对未来事件发展 的尽量准确的预测上,否则就是漫无目的、毫无头绪的随机行为。预测在组织、 管理、决策等很多方面都非常重要,因为对将来事件的把握和评估影响到决策的 制定过程。 预测所涉及的领域包括政治、经济、历史、生态、文化、教育以及人们的心 理、社会道德等各个方面。比如政府部门必须对环境、经济增长速度、通胀率、 失业率、能源需求、社会福利状况等做出预测,从而指导它的相关政策。投资者 在项目投资前要进行营利分析以及风险评估。因此,预测的内容极其广泛,预测 渗透到了我们生活的方方面面。 由于预测有如此多的应用领域,对预测方法的研究自然就显得非常重要。 1 2 预测的分类 预测的类型是多种多样的,对预测作出精确的分类极其繁琐。大致可以把预 测分为这样几种基本类型:根据预测的内容,可以把预测分为科学预测、技术预 测、社会预测、经济预测、军事预测等;根据预测的期限,可以把预测分为短期 预测、中期预测、长期预测等;根据预测的性质,可以把预测分为定性预测、定 量预测、综合预测等。 下面将从预测的性质阐述预测方法: 1 2 1 定r 性预测 定性预测方法是基于经验和判断对预测对象作定性分析,一般不单纯依赖当 前的系统数据。主要有集思广义法和德尔菲法【”。定性预测的准确程度,主要取 决于预测者的经验、理论、业务水平以及掌握的情况和分析判断能力。 浙江大学硕士学位论文 集思广义法这种方法是请熟悉预测问题的专家或技术人员参加讨论会,对预 测问题发表看法进行探讨。会议一般分三个阶段,即明确问题阶段、发表意见阶 段和讨论阶段。该方法既能在充分利用专家丰富的知识和经验基础上,较全面地 考虑事件发生的可能性,对事件做出预测,又简单易行,节省时间。但该方法不 能更广泛地收集各方面意见,又由于是面对面地讨论,容易受权威人士意见的左 右,不能充分发表意见和看法。 德尔菲( d e l p h i ) 法是美国兰德公司1 9 6 4 年发明并首先用于技术预测的专 家会议预测法的改进方法。德尔菲法又称专家调查法或专家意见法。该方法是根 据预测的目的、要求,设计意见征询表,有选择地聘请一组专家,向他们提供有 关的情况和资料,发给征询表,对所提出的问题做出回答。之后将第一次征求到 的意见集中整理后发给专家,使他们可以根据其他专家的多数意见,修正自己的 判断。经过儿轮的意见反馈,意见较统一后,询问即结束。该方法简单易行、可 靠性好、节约经费,适用于没有足够信息资料的中长期预测。但该方法的缺点是 受人的主观因素影响较大,预测所需时间较长。 在掌握的历史数据不多、不够准确或主要因素无法用数字描述进行定量分析 时,定性预测就是一种行之有效的预测方法。 近年来,人工智能的发展也产生了如b o o s t i n g “,贝叶斯网络0 3 1 等一些定性 预测算法。 1 2 2 定量预测 1 2 21 定量预测概念及方法 定量预测,是指根据准确、及时、系统、全面的调查统计资料和信息,运用 统计方法或其他数学模型,对未来事件、现象发展的规模、水平、速度和比例等 量的关系的测定。定量预测方法有很多,如统计分析、因果联系和模拟、人工智 能算法等。常用的统计分析模型_ _ = 要有:指数平滑法,趋势外推法,移动平均法 等:常用的因果联系模型主要有线性同归臣i 果模型等。本文重点介绍统计分析模 型以及神经网络等儿种定量预测方法。 定量预测过程一般分为i 个步骤: 1 分析历史数据和信息,发现或识别数据模式或规律; 2 通过一定的数学模型来描述这种模式或规律; 浙江大学硕士学位论文 3 将建立的数学模型在时间域上扩展完成预测。 有时候定性预测与定量预测的划分并不是绝对的,可以将定量预测算法得出 的结果模糊化达到定性预测的目的;定性预测可以通过非模糊过程将预测结果定 量化。 1 2 2 2 点预测和区间预测 在应用中,有时只需要对所关心的量给出一个预测值,有时还关心满足一定 置信度要求的预测区间。这样就有了两种预测;点预测和区间预测。点预测只是 对待预测值的最佳估计;区间预测是在一定的置信度( 如9 5 ) 下得到的对待预 测变量取值范围的估计。 1 3 预测误差 预测本身就意味着存在一定的不确定性,这些不确定性包括无法解释的原因 以及不能预测的波动性。因此预测不可避免的会产生误差。 1 3 1 误差的组成部分 预测产生的误差一般包括兰个部分,一部分是问题本身的不确定性引起的, 这部分误差无法克服,它从根本上限制了预测所能达到的精度;另一部分误差是 因为信息刁i 完整引起的,要减少这部分误差,除非能得到更多的相关信息:还有 一部分误差是由预测算法引起的,通过选择更加有效的预测算法,可以减小这部 分误差。我们要做的就是在给定的有限信息的条件下,选择恰当的预测算法,尽 可能减小由预测算法引起的误差,以满足应用要求。 1 3 2 误差的度量 设待预测变量在时间r 的值为y 。,通过预测算法得到的y ,的预测值为y 。,则 此时的预测误差为e ,= m y 。 1 平均绝对误差( m e a na b s o l u t ee r r o r ) : 窆lqi 窆 多 m a e = 生一:土一 珂n 2 均方误差( m e a ns q u a l e dn l o f ) 浙江大学硕士学位论文 n ( q ) 2 ( 儿一y t ) 2 m s e = j 土一= 生一 n 3 平均百分比误差( m e a na b s o l u t ep e r c e n te r r o r ,( ,m a p e ) ( 1 2 ) m a 一专喜制 (1。)y智i ,i 删f 和脚都可以用来度量误差波动的幅度,但是它们之间也有一些区别, m s e 对于大于1 的误差有放大作用,因此它对于大的误差比删f 敏感。对于用m s e 作为目标函数的参数估计或学习算法来讲,m s e 的这个性质使得算法对奇异点或 噪声数据比较敏感,有时候这正是我们需要的,但有时也会带来麻烦,这时选用 m e 可能是一个比较好的选择。m a e 、m s e 和m a p e 还可以加上不等权,有些应用 中需要给 h 最大预测误差。m a p e 仅当iy ,a 0 时才能使用,口是一个正实数。 4 拟合度( c o e f f i c i e n to fd e t e l ,m i n a t i o n ) ( 只- y ) 2 ( 儿一罗) 2 ( 1 4 ) 反映了模型能够解释的波动部分占总波动的比例,一般来说r 2 越大,预测 模型的效果就越好。因此它也作为一个模型的评价标准。预测值与实际值的相关 系数也可以作为考察预测模型的一个指标1 4 i 。 5 对于区间预测误差的考察: 通过统计在预测模型应用巾实际值落在预测区间的比率,将它与区间预测时 采用的置信度相比较来考察预测的效果。在同样的置信度水平下,预测区间越短, 预测效果越好;对相同的预测区间,置信度越高,预测效果越好。 1 4 预测方法的选择 选择一个恰当的预测算法必须考虑下面的几个冈素 1 现有的信息 2 ,预测形式的要求( 点预测o r 区间预测) 浙江大学硕士学位 色文 3 数据的模式和规律 4 对预测精度的要求 5 预测的实时性要求( 数据量,时间) 6 可理解性与可操作性 在一些应用中,点预测可能就足够了,但是在某些情况下,区间预测也是必 不可少的;一些预测算法能够产生理论h 正确的区间预测,一些预测算法却不行; 有些算法对数据量的要求比较高,如果现有的数据量不够多,就不能采用这些方 法来做预测;如果应用对预测的实时性要求很高,则要在满足一定的精度要求后, 重点考虑计算速度;在时间序列模型中,数据的模式影响到对趋势、季节性、周 期性的描述等。 预测误差的检验通常能帮助我们考察所用的预测模型是否恰当。比方说,如 果一个预测模型已经很好的反映了待预测序列的性质,那么预测误差将呈现纯粹 的随机性。反之,预测误差将呈现某种模式或规律。 在实际应用中,要综合考虑各种因素,选择合适的模型。后面的章节将对几 种预测算法作较详细的分析。 1 5 本文主要工作 本文内容包括五个部分:第一部分( 第+ 章) 是绪论,介绍了预测的重要意 义、预测的分类、以及对预测误差的描述。第二部分( 第二章) 介绍和分析本文 主要采用的统计学预测方法与神经网络预测算法,并研究数据处理手段对预测效 果的影响,给出了一个对可能的影响冈子进行敏感性分析筛选变量的方法;第t 部分( 第三章、第四章) 研究浙江电力市场清算价格( m c p ) 的预测及发电商报价 决策,并提出一种基于图的邻接布尔矩阵的聚类算法:第四部分( 第五章) 给出 ,一个在一定信息量下不可预测的实例,即对中国证券市场弱有效性的检验:最 后一部分是对本文的总结。 浙江大学硕士学位论文 2 1 统计学方法 第二章预测算法 2 1 1 回归模型 回归模型是揭示随机变量之间的相互关系,进行数据分析的有力工具。回归 模型利用已知数据,通过确定含有待定系数的特定函数表达式揭示自变量、因变 量之间的联系。根据函数表达式是线性或者非线性可以分为线性回归和非线性回 归。 回归模型通常要求满足i 个假设条件 5 1 : 1 方差齐性( c o n s t a n tv a r i a n c e ) :对应于3 i i l 自变量的待预测变量( 因变 量) 的取值有相同的方差。换句话说,对应于不同自变量的预测误差有相同 的方差。 2 独立性( i n d e p e n d e n c e ) :因变量取值的分布是相互独立的。换句话说,预 测误差是相互独立的。 3 正态分布( n o r m a ld i s t r i b u t i o n ) :对应于任意自变量的因变量的取值是 正态分布。换句话说,对应于任意自变量的预测误差是正态分布。 芦】 图2 1 方差齐性与正态分布假设示意图 f i g u r e 2 1a n ii u s t r a t i o no ft h ec o n s t a n tv a r i a n e ea n dn o r t l t a li t ya s s u m p t io r y 关_ 丁x l ,屯,x 。的线性回归模型是 浙江大学硕士学位论文 y f = f 十s f = 风+ 屈x f l + 岛工n + + ,十 ( 2 1 ) 这里x i , x :,j ,可以表示尸个不同的自变量:町以是函数空间的一个线性无 关组( 如多项式) ;还可以表示因素之间的交互作用( 如用乘积x y 表示的j ,y 的交互作用) 。 风,屈,以可以通过最小化s s e ( s u mo fs q u a r e de r r o r ) 获得估计值,记为 b o , n ,b 。并记m 的预测值为y 。= 鸬 s s e = z e 2 ( 2 2 ) 1 2 l 在前面的三条假设中,如果待预测变量方差齐性的假设得不到满足,可以通 过一些对数据的变换来改善,比如数据m 的方差呈现出随时间而增大的趋势时, 可以采用变换: y ? = 订,0 n 时, 偏自相关序列 妒。 近似为独立分布,且每个具有零均值和近似为1 n 的方差 ( 为样本个数) ,因此粗略的检验妒。是否为零,可以看庐。是否落在2 而的 范围内。 对于m a 模型的阶数,采用自相关函数进行判断。已经证明m a ( m ) 模型的 自相关函数是i n 阶截尾的,可以采用f 检验方法检验n 是否为零。在统计软件 s a s 中,就是通过考察l t 。l 2 判断以为零的。 利用白相关函数和偏相关函数的尾部性质定阶是b o x 和j e n k i n s 首先提出并 使用的一种方法,但该法对n t l m 均不为零的a r m a 模型的阶数却没能给出定量 的估计。隅角法8 1 利用自相关函数在a r m a 过程情况下的一般特性,找出一个阵 列的“裁尾性”,它表现为将自相关函数构成的另一函数a 按照定方式排列时 会出现一个元素全为零的无穷维阵列,其左上方隅角元素的位置和阶数n ,i t i 有确 定关系。 实际应用中,通常要求将预测误差限定在一定范围内。在a r m a 模型中,可 以得到给定置信度下的预测区间,反过来,我们可以预报预测值在误差范围内的 概率值,称为命中概率,这就是给定一个预测区间,求胃信度的问题。 设在1o f 置信度下得到的预测区间是【多f l :。s 】,s 是预测误差的标准差。 如果实际要求多 y o 1 ,也即要求y 多o1 ,于足可以求得f 上。,进而得 到1 口就是满足预测值多满足预测精度的概率,也即命中率为1 口。 浙江大学硕士学位论文 理论上,a r m a 过程即可以表示为无限阶a r 过程,也可以表示成无限阶 m a 过程。做a r m a 过程参数估计时,虽然理论上可以用比较简便的a r 模型 来代替,实际中还是有很多不便之处,如果数据有季节陛,且季节周期较长,用 a r 模型代替a r m a 模型就需要很大的阶数,造成计算困难。如果采用低阶a r 模型,舍入误差增大,不能近似原a r m a 过程。a r m a 所用参数比较简约,但 参数估计计算比较复杂,在阶数不高时,采用a r 模型是较好的选择。 2 1 4 季节模型 许多实际问题中,经常遇到一些随时间而周期性变化的随机序列,将这种周 期性变化称为季节性,往往可以从问题的实际背景中得到数据序列的周期。关于 季节性序列的数据与处理方法,前面已经作了叙述。 b o x j e n k i n s 建模方法对季节性和非季节性是分别进行建模的,然后采用累 加或乘积的方式将两部分进行组合。根据组合的方法不同,分别称作累加式季节 模型和乘积型季节模型。 设非季节模型为a r m a ( p , 0 如式( 2 12 ) 表示:季节模型为a r m a ( 只功5 ,采用后 移算子记作: 中p ( 口5 ) x ;= o q ( b 5 ) s , ( 2 1 4 ) 则累加式季节模型为: 【巾p ( b ) + m p ( b 5 ) i x ,= o 口( b ) + o 曾( 口5 ) ( 21 5 ) 乘积型季节模型为: 【o p ( 口) o p ( 9 5 ) i x ,= 【o g ( 占) o q ( b 5 ) 】占, ( 2 1 6 ) 一般乘积型季节模型要比累加式季节模型预测效果好,( 2 1 6 ) 式也可记为 a r m a ( p j0 ( 只劬so 季节性a r m a 模型尽管对算子b 阶数很高,但参数大多取 零,也称为疏系数【9 i a r m a 模型。 2 1 5a r l m a 模型参数估计 1 矩估计 矩估计在时间序列分析建模中是常用的初步估计方法,它是待定参数值的渐 近无偏估计。矩估计的基本思想是:假设随机变量x 的概率分布含有k 个未知数 q ,0 2 ,& ,将分布的前k 阶矩表成臼,0 2 ,的函数: 浙江大学硕匕学位论文 f m ,= 五( 玩,幺,氏) ( 2 1 7 ) 【m 。= 工( 只,馥,护。) 根据x 的观察值,计算样术矩巍,廊:,峨,代入上式得到只,吼,0 。的估计值 q ,幺,。 在矩估计算法中,a r 模型参数通过求解y u l e w a l k e r 方程得到:m a 模型参 数采用迭代算法求得矩估计值,如n e w t o n r a p h s o n 算法。a r m a 模型先对a r 部分参数作估计,在对m a 部分作估计。 2 最小二乘估计 最小二乘估计是一种无偏估计。对于a r 模型,可以利用逆转形式将 e t 一:( i = 1 ,m ) 化为x t - 1x 。】的线性组合。由于逆函数本身是 a l ,一,口。,b l ,n ,b ,的函数,所以最终得到的方程对a 。,b ,是非线性的,于是遇到 非线性最小二乘的问题。非线性最小二乘问题的主要处理办法是线性近似及迭代 算法【1 0 l 。 3 极大似然估计 极大似然估计是一种一致估计。设随机序列 x t 的有穷维概率密度 p ( x l ,x 2 ,x n ) 能被一组参数口= ( 口l ,口2 ,口。) 唯一确定,希望选择盘使得样本 值x 1 , x :,x 。出现的概率p ( x 1 - ,h1 口) 达到极大,得到的舀值称为极大似然估 计。 矩 卉计算法简单,精度最差,采用迭代算法时,一般将矩估计作为迭代的初 值。a r m a 模型参数的最小二乘估计与极大似然估计计算都比较复杂,当样本 数量很大时,得到的参数估计值也很接近。 4 采用遗传算法简化参数估计 可以用遗传算法计算a r m a 模型的参数估计,当遗传算法目标函数取为误 差的平方和时,得到最小二乘估计,目标函数取为似然函数时得到极大似然估计。 当然,一般要根据目标函数在遗传算法巾采用的适当的适应度函数。 对时间序列的分析和建模是在大量观察数据、i k 已获得之后进行的,通常数据 浙江大学硕士学位论文 和计算所需程序占用的存储量较大,自适应模型在某种程度上能适时地根据量测 数据和估计结果自性调整模型参数,并随着数据的陆续到来,通过递推算法自动 地对模型参数加以修正,使其接近某种最佳值,即使在尚不完全掌握序列特性的 情况下也能得到满意的模型。已有的自适应模型递推算法很多,女1 k a l m a n 滤波、 递推最小二乘算法8 1 等。 2 2 神经网络算法 2 2 1 神经网络方法简介 神经网络方法是对生物神经系统的模拟,它的信息处理功能是由网络单元 ( 神经元) 的输入输出特性( 激活特性) 、网络的拓扑结构( 神经元的联系方式) 、 连接权的大小( 突触联系强度) 和神经元的阈值( 可看作特殊的连接权) 等所决 定的。神经网络在拓扑结构固定时,其学习归结为连接权的变化。 w a r r e n m c c u l l o c h 和w a l t e r p i t t s 在1 9 4 3 年建立了人工神经网络的第一个数 学模型。这以后神经网络的研究取得了长足的进展,至今已经有数百种神经网络 模型,在许多学科领域都得到了广泛的应用。 很多预测系统都用到了神经网络模型,这是因为神经网络方法的特点很适合 处理预测问题。采用人工神经网络模型构建预测系统,必须考虑的几个方面足: 决定整个预测系统的结构( 系统采用几个神经网络模型、其它的预测及修正技 术) 、采用的神经网络类型、神经网络的结构( 每个网络的层数、每层的神经元 数目、激活函数、神经元之间的连接方式) 、神经网络的训练方法以及程序终止 策略。 神经网络方法一般容易出现的两个主要问题是:1 建立的模型相对于样本数 据显得过于复杂。2 模型没有经过系统的全面测试,这使得模型并未达到最理想 状态。许多经验表明,神经网络模型是“系统依赖性的”,即不同的实体必须用 不同的神经网络模型】。 通常在训练神经网络模型时需要将样本数据分成两组,一组数据作为洲练样 本,另一组数据作为测试样本。训练样本用于网络的训练,不断调整各层神经元 之间的连接权,直至达到训练算法的终止条件,测试样本用于对训练后的网络进 行性能测试。 浙江大学硕士学位论文 在用洲练样本对网络进行训练之前,对样本数据进行预处理是必要的。比如 对样本数据的分类,根据预测系统的结构,不同的网络训练需要用不同的训练样 本。对样本数据进行平滑通常有助于预测精度的提高,一些模型采用滤波器对数 据做了预处理。可以采用预处理消减网络的输入参数,并使系统能够处理一些定 性数据。 关于神经网络的收敛条件,一般的算法中部采用以下两种终止条件。( 1 ) 给定 一个训练迭代次数。( 2 ) 当训练样本误差小于给定的容许误差。但是这样做的目的 仅能保证模型与训练样本真实值充分接近,并不能保证预测的有效性,预测数据 的精度事后才能得知。如果过度要求训练精度,则可能出现“过学习”,即虽然 训练样本逼近的很好,但是预测效果会下降。导致这种情况一般有两种原因,i ) 网络训练过了头。i i ) 网络结构太复杂。相对简单平滑的模型预测结果要好些【”1 。 针对i ) ,可以在模型的收敛条件上作些改进,通过将已知数据分成训练数据和测 试数据,在用训练数据训i 练神经网络的过程中,每经过数次迭代( 如1 0 0 次) , 将测试数据调入算法进行预测检验,如发现预测效果下降,训练终止。另外1 4 1 建 议对拟合误差的代价函数采取“重近轻远”的策略,距离预测时刻近的样本误差 项取较大权重。i i ) 模型的简化,目前主要集中在隐层的神经元数目上。另外, 还可以考虑简化各神经元之问的连接。对于给定的数据集,如何确定恰当的网络 拓扑结构,没有充分的理论指导,只能通过试验分析。可用遗传算法对神经网络 的结构进行优化i l “。 绝大部分神经网络采用多层感知器模型,也有采用其它形式的网络模型的。 关于多层感知器模型,已经证明三层网络足以逼近任何连续函数,为了简化模型, 一般的网络不超过四层,大部分模型都采用三层结构,全连接方式,也可以通过 减少连接来简化模型。有关确定输入层、隐层以及输出层的神经元数目的问题。 很少有理论指导,一般都是在试验过程中确定的。激活函数要求可微的非减函数, 一般在隐层使用对数函数或双曲正切函数,输出层激活函数使用线性函数。神经 网络的训练方法最常见的是采用误差反向传播算法( e t i o fb a c kp r o p a g a t i o n ) , 简称b p 算法。 2 2 2b p 神经网络算法 多层b p 神经网络的拓扑结构如图2 2 所示。它由输入层、隐层、和输出层 浙江大学硕士学位论文 i 部分组成,隐层可以是一层或多层。已经证明包含一个隐层的b p 神经网络可 以以任意精度逼近任何连续函数。 b p 网络的学习过程由两部分组成:正向传播和反向传播。当正向传播时, 输入信息从输入层经隐单元处理后传向输出层,每一层神经元的状态只影响下一 层的神经元状态。如果在输出层得不到希望的输出,则转入反向传播,将误差信 号沿原来的神经元连接通路返回。返回过程中,采用梯度下降法逐一修改各层神 经元连接的权值。这个过程不断迭代,直到满足事先设定的终止条件。 图2 2 多层b p 网络示意图 f i g u r e 2 ,2m u i t ii a y e rb pn e t w o r k 多层b p 前向网络实现的函数司写为如一卜的嵌套表达式 m ( 竹( u 。识( 虬( w 。- ) ) ) )( 2 1 8 ) j 女。 其中x 为输入向量;w 为上层神经元与下层神经元的连接权值:中,妒,苁, 虮为各层神经元激活函数。 1 激活函数 因为b p 算法采用梯度下降法调整权值,所以它的激活函数必须是处处可微 的,b p 网络经常使用的是s 型的激活函数与线性甬数。电有一些其它的激括函数 形式,如正弦型,不同的激活函数对网络的收敛速度和收敛性能均有影响”l 。 常用的单极降s 型激活函数( s i g m o i d 函数) : f c x ) = l ( 1 + e x p ( 一j ) )f 2 1 9 ) 常用的双极性s 型激活雨数( 双曲正切函数) : 浙江大学硕士学位论文 f ( x ) = t a n h ( x ) = 1 一e x p ( 一x ) 1 十e x p ( 一) ( 2 2 0 ) 目前已经提出一些可调激活函数7 i ,在网络训练过程中调整激活函数,提高收 敛速度和性能。例如:一种在训练过程中通过动态调整参数的激活函数是: m ) = 而,- 1 1 2 t f ( p ) = p , y t p 【b ,t ( 3 1 ) i b 一日i n 斗卜1 ,当尸 b $ j l f l l 在第f 时段的上网功率。 发电商面临的风险主要有:报价过高不能| 二网,机组起停机费用等。 机组的约束主要有:机组爬坡速率约束,机组发电功率约束,机组起停机约 束等。因为在实践中,机组起停机转换很少发生,我们主要考虑机组爬坡速率约 束和机组发电功率约束。 4 1 2 报价与修改的规定 浙江电网发电市场规则1 3 4 1 中对注册机组的报价做了一些规定,发电商在确 定报价决策以及对报价策略作出修改时必须遵守这些规定。 ( 一) 报价方法和程序 关于注册机组的报价方法和程序有如下规定: 浙江大学硕士学位论文 a ) 注册机组的报价必须符合阻下几点 报价应按交易曰进行,每个交易品的报价应按4 8 个交易时段申报: 报价包括段价和相应的段容量; 每个交易时段最多可按1 至1 0 顺序分成1 0 个容量段,每个段的容量值称为 段容量,各个段容量之和应等于该机组的注册容量; 每个容量段应申报一个价格,此价格称为段价:每个交易日报价中序号相同 的段容量的段价相等。 注册机组的段价应在截止时间以前上报,报价应通过市场计算机系统进行。 以下信息应提前两个工作日上报: 交易日每一个交易时段的可用容量; 若需要带固定出力运行,应在报价表固定出力一栏进行说明; 说明机组在交易日开始时是否为运行状态: 电厂一次能源受制约情况预计; 机组负荷变化速率的限制,包括加、减负荷两部分的变化速率。 以下信息至少提前一个工作日上报: 1 ) 段价 可以按l o 段1 0 个价格( 元m w h ) ,每个价格表示同意以这个价格向市 场售电; 从一个段到下一个段的价格必须单调递增; 价格的精度为0 o l 元m w h ; 报价除以相应的网损系数应不大于市场清算价格上限; 价格应大于一9 9 9 9 9 9 9 元m w h ; 第一段的价格可以为负值,表求愿意付钱保持在这一段出力运行,而不 愿意减出力。 2 ) 段容量: 对于每一个交易时段的每个价段,必须申报容量段: 每个交易时段的1 0 个段的容量之和应等r 该机组的注册容量。 ( 二) 报价修改规则 ( a ) 在修改段价的截至日期以前,可以对所报各段的段价进行修

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论