(模式识别与智能系统专业论文)系统辨识在稳定水位流量关系确立中的应用研究.pdf_第1页
(模式识别与智能系统专业论文)系统辨识在稳定水位流量关系确立中的应用研究.pdf_第2页
(模式识别与智能系统专业论文)系统辨识在稳定水位流量关系确立中的应用研究.pdf_第3页
(模式识别与智能系统专业论文)系统辨识在稳定水位流量关系确立中的应用研究.pdf_第4页
(模式识别与智能系统专业论文)系统辨识在稳定水位流量关系确立中的应用研究.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(模式识别与智能系统专业论文)系统辨识在稳定水位流量关系确立中的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 系统辨识在稳定水位流量关系确立中的应用研究 模式识别与智能系统专业 研究生:杨四海指导教师:古钟璧 在水文学中,水文资料整编是从水文资料收集到资料使用之间不可缺少的 重要环节。在水文资料中,流量资料是最重要的资料之一,流量资料整编的核 心是正确地确定水位流量关系。目前,处理水位流量关系的传统方法是曼宁公 式。曼宁公式基于宽浅人工渠道推导而来。因为天然河道形状复杂,故而在近 似化为宽浅人工渠道并用曼宁公式处理时不可避免地会带来模型误差。此外, 由于直接采用曼宁公式计算比较困难,因此传统算法在实际计算时采取了一些 近似方法。这些近似方法带来了额外的误差。为了解决传统方法的种种缺陷, 不少学者进行了新的探索,提出了一些新的思路和方法,如遗传算法、零点误 差消除方法、多项式拟合方法、单纯形法等等。 针对传统方法及现有改进方法存在的问题,本文利用系统辨识的方法对稳 定河道水位流量关系的确立进行了分析。基于差分方程的系统辨识是一种带反 馈的算法,能够根据环境的具体情况逐步修正系统的模型参数。本文采用差分 方程作为系统辨识的模型,将系统前一时段输出的加权作为部分输入,从而可 在一定程度上弥补未知因素的影响。由于天然河道的不确知因素很多,精确模 型难以建立,故而可使用系统辨识的方法处理天然河道稳定水位流量关系的确 立。本文将具有稳定水位流量关系的具体河道看作一个s i s o 系统,在给定一 个输入( 水位) 时,河道对应一个固定输出( 流量) ,在此基础上利用系统辨识 的方法对带有诸多不确知因素的水位流量关系进行了处理。 本文主要进行了以下几个方面的分析研究: 1 传统方法一曼宁公式的推导过程及对其存在问题的分析。 2 对传统方法目前已有的一些改进方案如遗传算法、零点误差消除方法 以及多项式拟合方法的分析研究。 3 介绍系统辨识的原理并利用模型阶的f 检验法和辨识模型参数的递推 最小二乘法来建立稳定河道的水位流量关系模型。 4 利用四川省都江堰灌区的部分实测水文数据,对传统方法、目前已有 的改进方法以及系统辨识方法统一进行了仿真研究和分析比较。通过 比较结果评价了各种方法的优、缺点,并讨论了其背后的可能原因。 仿真结果表明,传统方法由于零点选取的不尽相同从而使计算结果具有一 定的偶然性并且误差较大。目前存在的改进方法都具有一定的有效性。相比较 而言,零点误差消除方法和多项式拟合方法效果较好。系统辨识的方法可以显 著提高对天然河道稳定水位流量关系的拟合精度,具有较好的有效性和实用性。 关键词:水位流量关系 系统辨识遗传算法水文学 a b s t r a c t a p p l i c a t i o n o f s y s t e m i d e n t i f i c a t i o no n w a t e r - l e v e l o u t f l o wr e l a t i o n s h i p m a j o r :p a t t e r nr e c o g n i t i o na n di n t e l l i g e n ts y s t e m g r a d u a t e :y a n gs i h a i t u t o r :g u ,z h o n g b i i n h y d r o l o g y ,o n eo ft h ee m p h a s e so nc o d i f y i n go u t f l o wd a t u mi sh o wt o c o r r e c t l y e s t a b l i s hw a t e r l e v e l o u t f l o w r e l a t i o n s h i p a s w e k n o w n ,t h e t r a d i t i o n a lm e t h o d s o l v i n g t h i s p r o b l e m i s m a n n i n g se q u a t i o n ,w h i c h i s d e d u c e df r o mw i d es h a l l o wa r t i f i c i a l l yc h a n n e l sb e c a u s et h es i t u a t i o no fa n a c t u a lr i v e ri ss oc o m p l e x ( n o ta sa r t i f i c i a l l yc h a n n e l s ) t h a tu s i n gm a n n i n g s e q u a t i o nw i l l l e a dt oe r r o ri n e v i t a b l y b e s i d e s ,a si t i s v e r yd i f f i c u l t i n u s i n g m a n n i n g se q u a t i o n t o c o m p u t ed i r e c t l y ,t r a d i t i o n a l m e t h o dm a d es o m e a p p r o x i m a t i o ni na p p l i c a t i o n i t g e n e r a t e de r r o r st o o f o rr e s o l v i n gt h e s e p r o b l e m se x i s t e dj nt r a d i t i o n a lm e t h o d ,s c h o l a r sh a v ep u tf o r w a r dm a n yn e w m e t h o d sa n ds o m ei m p r o v e m e n t ss u c ha s g a ,m u l t i n o m i a l f i t t i n g m e t h o d h a v eb e e nb r o u g h tf o r w a r d i nt h i s p a p e r ,w ea n a l y z e dw a t e r - l e v e l o u t f l o wr e l a t i o n s h i pu s i n gs y s t e m i d e n t i f i c a t i o n s y s t e m i d e n t i f i c a t i o ni sa n a l g o r i t h mw i t hf e e d b a c k i tc a n m o d i f y m o d e l p a r a m e t e r ss t e pb ys t e pa c c o r d i n gt oc o n c r e t es i t u a t i o n b e c a u s ei tb a s e so nd i f f e r e n c e e q u a t i o nt h a ts i g n i f i e sn o wt i m es y s t e m o u t p u tw i t ht h ew e i g h t e ds u mo fl a s tt i m eo u t p u ta n dn o wt i m ei n p u t i tc a n m o d i f yp a r te r r o ri ns o m ed e g r e e c o n s i d e r i n gt h eu n c e r t a i n t yo fa na c t u a l r i v e r ,w ec o u l du s es y s t e mi d e n t i f i c a t i o nt od e a lw i t hw a t e r l e v e l o u t f l o w r e l a t i o n s h i p f o ru s i n gs y s t e mi d e n t i f i c a t i o n ,w er e g a r d e da na c t u a lr i v e ra sa s i s os y s t e m g i v e naw a t e rl e v e ld a t a ,w ec o u l dd e r i v ea no u t f l o wd a t a b a s e do n t h i s w eu s e ds y s t e mi c l e n t i f i c a t i o na sat o o l t o d i s p o s e t h e r e l a t i o n s h i p t h i sp a p e ri sd i v i d e di n t of i v ep a r t s : a b s t r a c t c h a p t e ri :t h ei n t r o d u c t i o na n da n a l y s i so ft h et r a d i t i o n a lm e t h o d c h a p t e ri ht h ea n a l y s e so fe x i s t i n gm e t h o d s s u c ha sg a ,z e r o p o i n te r r o r m o d i f i e dm e t h o d ,m u t t i n o m i a l - f i t t i n gm e t h o da n ds oo n c h a p t e r 川:t h ei n t r o d u c t i o no ft h ep r i n c i p i ao fs y s t e mi d e n t i f i c a t i o n i n c l u d i n gh o w t ou s efo r d e rp r o b a t i o ni d e n t i f yt h eo r d e ro fs y s t e ma n du s e n e w t o nm e t h o di d e n t i f yt h ep a r a m e t e r so fs y s t e m c h a p t e ri v :u s i n gt h ed a t u mf r o m s i c h u a np r o v i n c e d u j i a n gw e i r w e a t t a i n e dt h ee f f o r t so fa l lm e t h o d st h a tw eh a v ek n o w n b ya n a l y z i n gt h e s e r e s u l t s ,w eh a v ed e r i v e dt h eg o o d n e s sa n ds h o r t c o m i n go fe v e r ym e t h o da n d r e a s o n e dt h ec a u s e s i m u l a t e dr e s u l t sm a n i f e s t e dt h a tt h et r a d i t i o n a im e t h o dm a yc a u s e g r e a t e r r o r ;t h em e t h o do fz e r o p o i n te r r o rm o d i f i e dm e t h o da n dm u l t i n o m i a l f i t t i n g m e t h o dc a ng r e a ti m p r o v ep r e c i s i o n b e s i d e s ,i tc o u l dn o t a b l y i m p r o v ef i t p r e c i s i o nu s i n gs y s t e m i d e n t i f i c a t i o nt od e a lw i t h w a t e r l e v e l o u t f l o w r e l a t i o n s h i p k e y w o r d s :w a t e r - l e v e l o u t f l o wr e l a t i o n s h i ps y s t e mi d e n t i f i c a t i o n g a h y d r o l o g y 综述 我国幅员辽阔,水利资源丰富。流域面积在1 0 0 0 平方公里以上的大中河 流有1 5 0 0 多条。平均年降雨量6 3 0 毫米,平均年径流量2 6 0 0 0 多亿立方米, 水能蕴藏量5 8 亿千瓦。但由于受季风和自然地理条件的影响,各地降雨量差 异很大。东南沿海及岛屿平均年降雨量大于1 6 0 0 毫米,西北干旱区则小于2 0 0 毫米:降雨量的年内分配也很不均,每年7 、8 、9 三个月的降雨量约占年降雨 量的5 0 7 0 ;年际的变化也很大,丰水年与枯水年降雨量往往相差7 、8 倍 以上。由于雨量不均,以致旱涝时有发生。为充分利用丰富的水利资源,防治 水旱灾害,在我国对水文预报和验测有着极为迫切的要求【1 】。 水文资料整编是将观测或测量所得的原始水文资料按规定要求进行整理、审 查、汇编、刊印的工作过程。它是从水文资料收集到资料使用之间不可缺少的重 要环节。中国的水文观测开始于公元前二百多年,但有很长时间,观测主要为实 时需求服务,资料没有留传下来。经过漫长岁月,才对水文资料整编、积累有所 认识。 1 9 4 9 年新中国成立之后,水文资料整编工作发生了根本变化。五十年代,对 历史积累的水文资料进行了系统全面的整编刊印。随后,对逐年水文资料进行经 常的整编刊印。整编技术迅速发展,并向着应用计算机,建设水文数掘库的方向 迈进。进入2 1 世纪,一个以创新为特色、以信息化为标志的知识经济时代正在到 来,中国水利正在实现由传统水利向现代水利的转变。在“十五”规划纲要中, 水利建设作为国家基础设施建设优先考虑的目标,被提到非常突出的地位,西部 大开发国家重点支持的十个方面,水利建设名列第一。水利部领导明确提出,实 现新时期中国水利的跨越式发展,其核心就是信息化。因此,应用当代先进的电 子计算机技术实现对水文资料整编的改进和优化,对缓解我国当前水资源日益短 缺的矛盾,促进社会、经济的稳定和发展,更是具有十分紧迫的现实意义。 流量资料是水文资料中最重要的资料之一,因此收集和整理流量资料是水资 源研究中的一项基本工作。流量资料整编的核心是正确地确定水位流量关系。河 渠中水位与流量关系密切,一般都有一定的规律:水位过程易于观测,而施测流 量较观测水位要困难 2 1 。此外,整编是与大量数据打交道,稍有不慎就会产生 错误影响使用,使收集资料所付出的艰巨劳动丧失意义【3 】。因此,建立水位 流量关系既是可行的,又是必要的。 在水文测验学中,处理水位流量关系的传统方法是曼宁公式。曼宁公式的推 导是基于宽浅人工渠道。因为天然河道形状复杂,故而在近似化为宽浅人工渠道 并用曼宁公式处理时不可避免地会带来模型误差。此外,由于直接采用曼宁公式 计算比较困难,因此传统算法在实际计算时采取了一些近似。实践证明,采用传 统整编方法得出的数据相对而言误差较大,严重制约了我们对水资源的准确把握 及合理配置。针对传统方法的种种缺陷,目前已经有不少学者提出了一些改进方 案,如黄才安等提出的直接拟合方法【4 】,唐国田、张婷等提出的零点误差消除 方法【5 】,杨晓华、陆桂华、郦建强等提出的自适应加速遗传算法1 6 1 ,多项式拟 合方法以及郭洪财、秦敏等提出的基于零点补偿的线性方法【7 】。以上的种 种改进方法有一些( 【4 】【5 】【6 1 ) 在精度方面比传统方法略有提高。然而在提高 了精度的同时,这些方法却都不可避免地增加了计算的复杂性。而另一些方法 ( 【7 】) 虽然表面看来减轻了计算的复杂度,但在计算精度方面却出现了下降。此 外,除了方法 6 1 以外,这些改进方法都仍然是对基于手工计算的传统方法的弥 补。受传统方法自身模型的限制,这些方法的精度都没有取得实质性的提高。因 此我们考虑采用其它方法取代传统算法来描述水位流量关系。 天然河道中河水的流动是一个动态的系统行为,其f 白j 涉及到包括外星体等诸 多外界因素的影响。此外,研究表明,在河水的流动中存在混沌【8 】。这些不确 定因素的存在表明,要完全精确地描述一个具体河道的水位流量关系几乎是不可 能的。因此,处理水位流量关系的重点就在于适应或减弱不确定因素的影响,从 而能较精确地对之进行处理。 系统辨识研究如何通过实验数据建立实际系统的数学模型和估计它的参 数,而数据一般是在有随机扰动的情况下获得的。1 9 6 2 年,l t a z a d e h 曾经把 系统辨识定义为:根据输入和输出数据,从特定的系统类中确定一个同被检验 的系统等价的系统。1 9 7 8 年,l j i u i l g 更明确指出:系统辨识有三个要素:数据、 模型类和准则。意即按照一个准贝在模型类中选择一个与数据拟合得最好的模 型。实际被研究或被控制的对象总带有某种不确定性,利用反馈原理可以处理 一定范围内的不确定问题。但如果未知因素过多,或者不确定因素的范围过大, 就要求系统能不断地调整自己的结构和参数以适应这种变化 9 1 。在人有人的 用处中,维纳从熵的角度也提到了类似观点【l o j 。这些思考提示我们,可以 用系统辨识的方法处理天然河道中的水位流量关系。考虑到动态系统的数学模 型应是微分方程或差分方程,而代数方程只适于描述静态系统,故而采用系统 辨识中的差分方程模型可比曼宁公式( 代数方程) 更好地描述水位流量关系。 本文将系统辨识的思想引入到水位流量关系的处理之中,由此来描述天然 河道的水位流量关系。与此同时,虽然目前已有了一些对传统方法的改进方案, 但对这些改进方案改进效果的统一比较至今未见文献介绍。本文将现有的各种 方法和系统辨识方法统一进行了仿真比较,并通过仿真结果分析了各种方法的 性能,如拟合精度、计算量大小等等。为稳定河道水位流量关系的建立提供了 新的参考和依据。 第一章稳定河道的水位流量关系 天然河流中的水位与流量问的关系有时呈现单一关系,称为稳定的水位流 量关系:有时呈现复杂的关系,称为不稳定的水位流量关系,即受各种因素影 响下的水位流量关系。一个测站的水位流量关系是指基本水尺断面处的水位, 与通过该断面的流量之间的关系。但有时由于各种条件的限制,测流断面与基 本水尺断面不在同一处,若相距较近一般不会影响水位流量关系的建立。若相 距较远,但中间无大支流汇入,两断面处的流量基本相等,则基本水尺断面处 的水位与测流断面的流量仍可建立关系。 本文对稳定的水位流量关系进行分析。 1 1 水位流量关系的确立 下面从河渠发生稳定非均匀流时的水位流量关系的推演,看其为何呈单一 关系。 1 对于河渠,发生稳定非均匀流时, 其能量方程可用下式表示,其中 砌。一水流流经凼后的能量损失 其它符号如右图所示。 z + h + 笔墨:z + 出+ + 幽+ _ a ( v + d r ) 2 + 珊。( 1 一1 ) 2 92 9 令流速水头的增量为d h 。即 1 a ( v + r d r ) 2 一筹咄 ( 1 1 ) 式通过整理,并将各项同除以d s ,则 生+ 塑+ 堕+ 盟:o d d cd d e 由于d g :d z + d h ,水位g 的沿程变化a _ q q ;一j ( 为水面比降) ,在 d s 河道j 顿直匀整,流速的沿程变化很小时,磐。0 ,这时有:望冀: 出a s 把能量的沿程损失皇即能面比降用j 。表示,且,。可用谢才+ 公式计 a r s 算 扣蒜 ( 1 2 ) 谢才系数c 用曼宁公式计算,即c :土尺,变换( 1 2 ) 式,则 玎 v = ! r ,m n ( 1 3 ) 式中n 为糙率:r 为水力半径。把能面比降用水面比降代替,并写出其流 量公式为0 :f 上尺,咒 ( 1 4 ) 聆 当河流断面稳定,稳定流时某水位下n 、1 都为常数,r 、f 为水位g 的 单值函数,因此流量与水位成单值函数关系,即 q = f ( g ) ( 1 5 ) 所以这时是稳定的水位流量关系。 1 2 水位流量关系的模型 流量是由流速和断面积相乘而得,因此分析水位流量关系时,也包括对水 位面积、水位流速关系的分析。 对于宽浅人工渠,般水力半径r 与断面平均水深h 相差甚微。例如矩形 渠道,在b = 1 0 0 h 时,r = 0 9 8 h :在b = 5 0 h 时,r = o 9 6 h 。所以无论面积、 流速、流量都可写成水深的函数。对于矩形渠道,其公式为: f = b h式中:b 一水面宽 ,:! 彰,必,水面比降 q :b 三厅,彤h 一糙率 九 由于矩形渠道占为常数,且各级水位下稳定流时r l 、1 变化不大,也可作 为常数,上面三式可整理为: f = k l h v = 七 e q = k 3 h 7 3 若推广到一般宽浅渠道,并写成一般形式: f = k l h 8 口l ( 1 - - 6 ) v = k 2 h 4 0 1( 1 8 ) 天然宽浅河流其稳定的水位流量、水位面积、水位流速关系可借鉴人工渠 道的结果。一般而言,天然河道稳定的水位流量关系也可用( 1 8 ) 式来进行 分析,即 q = k 3 h 7y = 口+ 1 此即传统算法的原理,在实际计算时,由于要确定的参数为k ,、y ,为指 数方程,计算起来较为困难,故而一般要进行取对数转换。 1 3 水位流量关系的传统计算方法 在1 2 节中,我们得到了传统方法计算水位流量关系的公式,亦即曼宁公 式: q = a h 6与( 1 8 ) 式对应则口= k ,、b = y 。 实际计算过程如下: 由曼宁公式:q = a h 6 式中h 表水位,q 表流量,( 7 ,b 为须求之参数。 为确定参数口,b ,两边取对数可得: l n q = i n a + b i n h 。( 1 9 ) 令l n h 2 x ,l n q = y ,l n a = a ,b = b : 则上式变为:y = a + b + x ,( 1 1 0 ) 可利用最小二乘方法求a ,b 的值。 由n 组观测数据( h ,q ) ,( i = l ,2 , 3 ,n ) 可得:x ,= l n h ,y ,= i nq j 。 可求( 1 一l o ) 式计算出的估计值y 与实测值y ,间残差平方和e 。使e 最 小的参数a ,b 。 即为所求,最后由l n a = a ,b = b ,可求曼宁公式之参数口,b 。 其中,e 2 芝( 儿一爿一如) 2 ,欲使之取最小值,则e 对彳,曰的偏导数为 零。 令:三= 吉塾,多= i 1 善nm 则有: 筹一z 喜c 只一彳一融,= 。;筹= 之喜c y , - a - 观h = 。 一一( 一- x ) ( y ,- y ) 解得:a = y - b x ;b = 旦百_ ( 一- x ) 2 ;l 又:a = p 。,b = b ;可求出曼宁公式的参数。 1 4 本章小结 通过对传统算法的分析,我们可以发现,在传统算法中存在着这样一些问 题: 经线性变换后再利用最小二乘方法求出的参数o ,b ,只能使变换后的 式( 1 - - 9 ) 总残差达到最小,并不能使方程q = a h 6 的总残差达到最 小。因此不能认为上述方法所拟合的水位流量关系最优【4 】。 在实际测量中可以发现,并不是当水位高于一个确定值时,就有流量。 水位流量关系中的初始零点选取只能凭经验确定,这必然导致了最后 结果中的误差【5 】。 曼宁公式的推导基于种种假设和近似,天然河道是否满足这些假设以 及在多大程度上满足这些假设与近似到现在仍是一个值得研究的问 题,以之作为基础来确立水位流量关系必定会带来某种程度的误差。 综合以上情况我们可以看出,传统算法在处理水位流量关系时只是一个近 似的算法,存在不少问题。以之描述天然河道的水位流量关系必然会带来误差。 有必要对它进行改进。 第二章水位流量关系的研究现状 第二章水位流量关系的研究现状 在第一章里我们讨论了计算水位流量关系的传统方法及其存在的缺陷,本 章我们讨论目前存在的一些改进方案。 前面我们提到,处理水位流量关系的传统方法主要存在三个问题。针对这 三个问题,目前已有学者提出了一些改进措施。总体而言,这些改进措施主要 分为两类:对曼宁公式处理水位流量关系方法的优化、用其它模型替代曼宁公 式处理水位流量关系。目前提出的一些主要改进措施如下: 直接拟合方法( 不经变换直接拟合曼宁公式) 4 1 零点误差消除方法( 消除初始零点选取误差) 【5 】 自适应加速遗传算法( 直接拟合) 6 1 多项式拟合( 取代曼宁公式) 【1 1 】 2 1 遗传算法直接拟合 在第一章我们提到传统算法经线性变换后再利用最小二乘方法求出的参数 口,b ,只能使变换后的式( 1 - - 9 ) 总残差达到最小,并不能使方程p = 删6 的 总残差达到最小。因此不能认为上述方法所拟合的水位流量关系最优【4 】。针对 这一问题主要有以下改进方法:遗传算法、模拟退火算法和单纯形法【1 6 】。在 此,我们采用遗传算法。 2 1 1 遗传算法的基本原理 遗传算法是一种以达尔文自然进化论和孟德尔遗传变异理论为基础的全局 寻优仿生算法。我们知道,生命的基本特征包括生长、繁殖、新陈代谢、遗传 和变异。遗传算法可以通过模仿生物的进化现象( 自然选择、交叉、变异) ,高 效的、并行的搜索问题空间所对应的编码空间,从而得到问题的全局最优解。 在实际计算中,根据每一代问题域中个体适应度的大小挑选个体,并借助于遗 传算子进行组合交叉和变异,即可产生出代表新的解集的种群。由于交叉和变 异近似于随机。故而可寻得全局最优镌,适用于处理传统搜索方法难于解决的 复杂和非线性问题。 j 9 第二章水位流量关系的研究现状 遗传算法的实施过程中主要包括参数的编码、初始群体的设定、评估函数 即适应度函数的设计、遗传操作的设计和算法控制参数的设定。主要步骤如下: 1 ) 随机建立由编码串组成的初始群体; 2 ) 计算各个体的适应度: 3 ) 根据遗传概率,利用下述操作产生新群体: 复制:将已有的优良个体复制后添加入新群体中,删除劣质个体。 交换:将选出的两个个体进行交换,所产生的新个体添入新群体中。 突变:随机地改变某一个体的某个字符后添入新群体中。 反复执行( 2 ) 、( 3 ) ,一旦达到终止条件,选择最佳个体作为遗传算法的结 果。遗传算法是一种具有“生成+ 检测”( g e n e r a t e a n d t e s t ) 迭代过程的搜索 算法,标准操作流程图如图2 一l 。 由图2 1 可知,遗传算法是一种群体型操作,该操作以群体中的所有个体 为对象。选择( s e l e c t i o n ) 、交叉( c r o s s o v e r ) 和变异( m u t a t i or 1 ) 是遗传算法的 3 个主要操作算子。它们构成所谓的遗传操作( g e n e t i co p e r a t i o n ) ,使遗传操 作具有了其它传统方法所没有的特性。 遗传算法中包含了如下5 个基本要素: 参数编码。 初始群体的设定。 适应度函数的设计。 遗传操作设计。 控制参数设定 这5 个要素构成了遗传算法的核心 内容。遗传操作是模拟生物基因遗传的 操作,它的任务就是对群体的个体按照 它们对环境适应的程度施加一定的操作 从而实现优胜劣汰的进化过程。从优化 搜索的角度而言,遗传操作可使问题的 解一代又一代的优化,并逼近最优解。 图2 1 第二章水位流量关系的研究现状 2 1 2 遗传算法的实际操作 2 1 2 1 编码 遗传算法主要是通过遗传操作对群体中具有某种结构形式的个体施加结构 重组处理,从而不断地搜索出群体中个体间的结构相似性,形成并优化积木块 以逐渐逼近最优解,因此,遗传算法不能直接处理问题空间的参数,必须把它 们转换成遗传空间的由基因按一定结构组成的染色体或个体。该转换操作就称 为编码,或者称作( 问题的) 表示( r e p r e s e n t a t i o n ) 。编码过程是问题空间向 g a 空间的映射过程,所谓问题空间是指由g a 表现个体( 有效的候选解) 集合所 组成的空间;而g a 空间是指由基因型个体所组成的空间。 十进制编码和二进制编码是最常用的两种编码方式,文献【1 2 】对它们的性 能做了比较,设种群有j v 个个体,每个个体承载埘个变量,第,个变量x ,的取 值范围b 。m ,x ,。】。 本文采取二进制编码方式。 2 1 2 2 种群规模设定 群体规模越大,群体中个体的多样性越高,算法陷入局部解的危险性就越 小,但会影响个体竞争,且随之会造成计算量增加。而如果群体规模太小,会 使遗传算法的搜索空间中分布范围有限,因而搜索有可能停止在未成熟阶段, 引起未成熟收敛现象,所以应该针对不同的实际问题,确定不同的种群规模。 b e r t o n i 和d o r i 9 0 【1 3 】提出了遗传算法的隐并行性( i m p l i c i tp a r m l e l i s m ) 原理:若群体规模为m ,则遗传操作可从这m 个个体中生成和检测m 3 个模式, 这为种群规模提供了理论依据。g o l d b e r g 证明了在二进制编码的前提下,若个 体长度为l ,则种群规模的最优值为2 “。 2 1 2 3 适压度函数 遗传算法在进化搜索中基本上不利用外部信息,仅以适应度函数为依据, 遗传算法评价一个解的好坏不是取决于它的解的结构,而是取决于相应于该解 的适应度值,这正体现了遗传算法“优胜劣汰”的特点。 遗传算法不需要适应度函数满足连续可微等条件,唯一要求是针对输入可 计算出能加以比较的非负结果。这一特点使得遗传算法具有广泛的适用性。常 茹睁筘啶磷似解 兰三童查焦亟量叁墨塑里! 塑堡坚 用的函数变换形式是: 厂c 功= “一g o 。瀚 c z t , 其中系数c 一存在多种选择方法,它可以是一个合适的输入值,也可以采 用迄今为止进化过程中g ( z ) 的最大值,但c 。最好与群体无关。 另一种常用的变换函数如下所示: f ( x ) 2i ? 氕万 ( 2 2 ) 可以将值域为 0 ,+ 。 的f ( x ) 转换为值域为( 0 ,1 ) 的f ( x ) ,并且当f ( x ) 取其最小值0 时f ( x ) 取其最大值1 。a 为灵敏度控制参数。 同样当求解问题是最大化解时,为保证非负性,可作如下变换: 删= 倍崛“嚣嚣。 s , 其中c 。是合适的输入值。 适应度函数对g a 的收敛速度和结果影响很大。如果过分强调当前的较优点, 就可能很快降低种群的多样性,造成不成熟收敛:而如果对当前较优点强调不 够,算法就很容易丢失已经找到的较优点信息,从而不能在合理的时间内收敛 到较好的点,因此必须对适应度函数进行适当的调整。 2 1 2 4 遗传算子 遗传算法操作包括以下三个基本遗传算子( g e n e t i co p e r a t o r ) :综合考虑 三种算子,可以得知它们有如下的特点: 三个算子的操作都是在随机扰动的情况下进行的。 遗传操作的效果和它们所取的操作概率,编码方式,群体大小,初始群 体以及适应度函数的设定密切相关。 它们的操作方式或操作策略随具体求解问题的不同而异。 2 1 2 4 1 选择算子( s e l e c t i o no p e r a t o r ) 又称复制算子( r e p r o d u c t i o n ) 、繁殖算予。选择是从种群中选择生命力强 第二章水位流垂关系的研究现状 的染色体,产生新种群的过程。选择依据的是每个染色体的适应度大小,其值 越大,被选中的概率就越大,其子孙在下一代产生的个数就越多。选择的方法 根据不同的问题采用不同的方案。常见的方法有以下几种: 适应度比例法( f i t n e s sp r o p o r t i o n a lm o d e l ) 该方法又称为赌轮法( r o u l e t t ew h e e l ) 或蒙特卡洛( m o n t ec a r l o ) 模型。是 目前最常用的选择方法,具体表达方法如下: 坐 p 。= ? | j ? j 瞎曲 j = l 其中,只,为第i 个个体的选择概率,f i 为第i 个个体的适应度值。显然, 概率p s i 反映了个体i 的适应度在整个群体的个体适应度总和中所占的比例, 个体适应度越大,其被选择的概率就越高,反之亦然。按该式计算出群体中各 个个体的选择概率后,就可以决定哪些个体被选出。 最佳个体保存法( e l i t i s tm o d e l ) 其思想是把群体中适应度最高的个体不进行配对交叉而直接复制到下一代 中。此种选择操作又称为复制( c o p y ) 。采用该选择方法的优点是进化过程中某 一代的最优解可不被交叉和变异所破坏。但是这也隐含了一种危机,即局部最 优个体的遗传基因会急速增加而使得进化有可能陷于局部解。 联赛选择法( t o u r n a m e n ts e l e c t i o nm o d e l ) 该方法十分简单,其思想是从群体中任意选择一定数目的个体( 成为联赛 规模) ,其中适应度高的选择进入下一代。这一过程反复进行,直到下一代群体 个数满足要求为止,一般联赛规模为2 。 排序选择法( r a n k - b a s e dm o d e l ) 所谓排序选择即是按个体的适应度的大小排序,然后按事先设计的概率表 分配给每一个个体,作为各自的选择概率。 2 1 2 4 2 交叉算子 也称重组( r e c o m b i n a t i o n ) 、配对算子( b r e e d i n g ) 。在遗传算法中, 交叉是产生新个体的主要手段,它在遗传算法中起着核心作用。它仿照生物学 中杂交的原理,将两个父代个体( 染色体) 的部分字符( 基因) 互相交换,由 此产生新的个体。 常用的方法有: 第二章水位流量关系的研究现状 一点交叉( o n e p o i n tc r o s s o v e r ) 交叉过程分两个步骤:首先在新一代群体中随机选择两个染色体,每个染 色体由多个位( 基因) 组成;然后,沿着这两个染色体的基因随机取一位置, 二者互换从该位置起的末尾部分基因,因此长度为l 的字符串,可供选择的交 叉点为( l 一1 ) 个,一点交叉可能实现l - 1 个不同的交叉结果。 二点交叉( t w o p o i n tc r o s s o v e r ) 具体操作是随机设定两个交叉点,互换两个父代在这两点问的基因串,分 别生成两个新个体,若染色体有三长,则有( l 一2 ) ( 上一3 ) 种交叉结果。 一致交叉( u n i f o r mc r o s s o v e r ) 它的工作原理是通过设定屏蔽字( m a s k ) 来决定新个体的基因继承两个旧 个体中哪个个体的对应基因。 2 1 2 4 3 变异算子 变异是指对群体中的个体串的某些基因座上的基因值作变动,对于二进制 编码方式而言,变异操作就是把某些基因座上的基因值取反,即1 一o 或o 一1 。 通常情况,变异个体的选择以及变异位黄的确定都是采用随机的方法产生,并 且变异概率较小,约为0 0 0 1 一o o l 。一般而言,变异算子操作的基本步骤是: 在群体中所有个体的码范围内随机地确定基因座。 以事先设定的变异概率p m 来对这些基因座的的基因值进行变异。 变异的目的有二:一是使遗传算法具有局部的随机搜索能力。当遗传算法 通过交叉以接近最优解邻域时,利用变异算予可加速向最优解收敛,此时变异 概率应取较小值;二是使遗传算法可维持群体多样性,以防止出现未成熟收敛 现象。此时变异概率应取最大值。 遗传算法通过交叉和变异这一既相互配合又相互竞争的操作而使其具备兼 顾全局和局部的均衡搜索能力。 遗传算法寻优过程的一个重要特点是它始终保持整个种群的进化,于是, 即使某个个体在某个时刻丧失了有用的特征,这种特征也会被其他个体所保留 并延续发展下去。由于遗传算法仅需知道目标函数的信息,而不需要其连续可 微等要求,因而具有广泛的适应性。同时它又是一种采用启发性知识的智能搜 索算法,所以往往能在搜索空间高复杂的问题上取得比其他算法( 比如梯度法) 更好的效果。 l4 第二章水位流量关系的研究现状 2 1 3 遗传算法在水位流量关系确立中的应用 在用遗传算法求得曼宁公式参数的最优解时,为了使算法快速收敛,我们 采用了二进制编码。针对水位流量关系的现有经验值选取解空间范围。如对羊 头堰数据进行计算时,已知传统方法的求解结果为口= 2 9 1 2 9 5 5 , b = 2 3 7 0 5 0 4 ,我们就取遗传算法的初始解空间为:口: 2 ,4 ,b : 1 ,3 。 由于编码长度所限( 本例采用2 4 位) ,刚开始用遗传算法求得结果精度不高, 此时需要根据遗传算法求得结果重新选取更精确的解空间,以使解能达到精度 要求。初始种群的选取可以是随机的,选择好适应度函数后,劣势个体很快就 会被淘汰。选择算子我们采用经典的轮盘赌方法,适合于解空间均匀分布的情 形。交叉算予和变异算子依情况而定,对于本例,我们取交叉算子范围为: 0 2 ,0 4 、变异算子取值范围为: 0 0 1 ,0 1 。 适应度函数的确定是一个比较关键的问题。对水位流量关系来说,应该是 当个体确定后解码所得参数疗、b 的值使得总误差最小时,个体的适应度最高。 同时,要保证优势个体对比劣势个体而言有较大的选择概率。综合以上考虑, 应采取如下形式: , ,( x ) = 3 ( s u n , 一m ) 其中s u m ;ld 一a h ? l t 1 在调整参数口、b 的同时,常数m 的值依最小误差大小作相应调整。 2 。2 零点误差消除方法 传统方法采用曼宁公式q = a h 6 来模拟水位流量关系。但实际上,现使用 的水位流量关系多数水位和流量的零点并不重合,因此,应设法对水位h 加一 个改正数值c ,使模型变为q = a ( h + c ) 6 。模型中的参数c 可通过实际资料来 分析确定1 5 。 为确定参数c ,先按几何级数选取三个流量值,使得霞= q ,q ,再从曲线 上查得相应水位日、开,、片,则可证明: 。:里= 些些 日l 一2 h 2 + h 3 证明过程如下: 第二章水位流量关系的研究现状 首先,根据已知条件,我们有 q = a ( h + c ) 6 且讲= 蜴q 3 将( 2 5 ) 式代入( 2 6 ) 式可得: ( 2 + c ) 孙= ( h f + c ) 6 ( h 3 + c ) 6 两边取对数并化简后可得: 2 l n ( h 2 + c ) = l n ( h l + c ) + l n ( h 3 + c ) 亦即:( 日2 + c ) 2 = ( 4 l + c ) ( 3 + c ) ( 2 8 ) 式展开即得 ( 2 5 ) ( 2 6 ) ( 2 7 ) ( 2 8 ) 。:丝i 二星! 璺命题得证。 h 。一2 h ,+ h , 用此法处理水位流量关系时可以使用传统求解方法或遗传算法。但在使用 传统求解方法时,依然有如下问题:经线性变换后再利用最d - - 乘方法求出的 参数d ,b ,c ,只能使变换后的式l n q 。i n 口+ b l n ( h + c ) 总残差达到最小,并 不能使方程q = a h 6 的总残差达到最小。同样不能认为此方法所拟合的水位流量 关系最优。此外,满足上述条件的c 值可能有多个,在求取时应依据以下准则: q l ,q 3 之间取值范固应尽量大;流量数据选取应尽可能精确地满足式( 2 6 ) 。 其中前一个准则更为重要。 2 3 多项式拟合方法 用多项式拟合水位流量关系的尝试很早就已经开始了。但由于多项式拟合 的方法仅仅是一种数值模拟,没有明确的物理意义,而且多项式拟合在阶时 所得结果精度普遍偏低,高阶时计算又很复杂,故而长时间以来人们一直没有 采用这种方法。但相比较曼宁公式,多项式拟合可以对零点误差进行补偿( 包 含常数项) ,而且随着阶数的提高拟合的精度还会逐步提高。 2 3 1 多项式拟合水位流量关系的原理 稳定的水位流量关系是一种单值曲线,因而可以用带一个未知数的多项式 来逼近。于是,流量可以表示为水位的多项式函数。 第二章水位流量关系的研究现状 对于给定一组数据 ( 葺,y ,) ,i = 1 , 2 ,n ,若希望采用多项式模型对数据组 进行描述,且拟合目标是对于形如y ( x ) = f ( a ,x ) = 口l x ”+ 口2 z ”1 + + a n x + 口 的九阶多项式模型,求取参数a 1 口2 ,口。,a 使下列r 2 量最小: i j ( a ) :争f 址! 坐2 、: 2 ;学) 2 对亏;阿多损文2 善 y ,一( 口l x ? + 口2 x ? _ 1 + ! ! 兰! 竺! 12 、: ( 2 9 ) ( 2 1 0 ) 在缈,= a y 不变的假设下,使式( 2 - - 1 0 ) 达最小的解是: a = v y ( 2 1 1 ) 其中a = n i qi a 2i ,v = a 3l x ;五 工;x 2 x 2x y = y l y 2 y 。这里,v 就是v a n d e r m o n d e 矩阵。 a 的不确定性( 离差) 为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论