(环境工程专业论文)基于gis的地面沉降预测研究.pdf_第1页
(环境工程专业论文)基于gis的地面沉降预测研究.pdf_第2页
(环境工程专业论文)基于gis的地面沉降预测研究.pdf_第3页
(环境工程专业论文)基于gis的地面沉降预测研究.pdf_第4页
(环境工程专业论文)基于gis的地面沉降预测研究.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(环境工程专业论文)基于gis的地面沉降预测研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 地面沉降是天津市主要的地质灾害,这种复杂的环境地质问题严重影响着城 市基础设施建设,制约着天津市的经济发展。目前己普遍证实过量开采地下水造 成地下水文地质力学平衡的破坏是导致地面沉降最主要的原因。因此,研究并建 立适合该地区的沉降预测方法,为下一步天津市地面沉降的有效控制提供科学依 据将具有积极而深远的意义。 首先,本研究选取历史观测数据较为完备的研究区作为研究示范区域,在优 化了地面监测点的基础上,利用灰色关联理论对各个含水组与地面沉降系数进行 了计算,然后通过肯达尔非参数秩次相关检验法对各个含水组的关联系数进行分 析。 其次,以地下各含水组年均水位为输入变量,以优化后监测网络的各监测点 年沉降值为输出变量,建立了地面沉降预测b p 神经网络模型,并在此基础上, 利用规则化调整和初期中止的方法对模型的泛化能力进行改进,此外还建立了径 向基神经网络模型。通过三个模型的对比,筛选出了适合该地区的地面沉降预测 模型。 最后,详细地阐述了如何利用a r c g i s 设计和建立相关数据库和编制数据底 图,如何利用空间分析功能对地下水等值线、地面沉降等值线等进行分析。并提 出利用c o m 组件技术将m a t l a b 与a r c g i s 进行无缝结合,为a r c g i s 与其它软 件进行通信提供了一种思路。 关键词:地面沉降灰色关联分析神经网络地理信息系统空间分析 a b s t r a c t g r o u n ds u b s i d e n c ei so n eo ft h em a j o rg e o l o g i c a ld i s a s t e r so ft i a n j i n t h i s c o m p l e xe n v i r o n m e n t a lg e o l o g i c a lp r o b l e ms e r i o u s l ya f f e c t st h e c o n s t r u c t i o no fu r b a n i n f r a s t r u c t u r ef a c i l i t i e s ,s ot h a tr e s t r i c t st i a n j i n se c o n o m i cd e v e l o p m e n t i th a sb e e n w i d e l yc o n f i r m e dt h a t t h em a j o rc o u r s eo fg r o u n ds u b s i d e n c ei st h eb r e a ko f g e o h y d r o l o g i c a l m e c h a n i c a le q u i l i b r i u mc a u s e db ye x c e s s i v ee x p l o i t a t i o n o f g r o u n d w a t e r t h e r e f o r e ,i ti si m p o r t a n tt o e s t a b l i s has e to fm e t h o dt op r e d i c tt h e g r o u n ds u b s i d e n c ei nt i a n j i n t h u si tc a no f f e rs c i e n t i f i cb a s i sf o re f f e c t i v ec o n t r o lo f g r o u n ds u b s i d e n c e f i r s t l y ,t a n g g ud i s t r i c ti ss e l e c t e da sam o d e lr e g i o n a li nt h i sr e s e a r c h ,w h i c h h a sc o m p l e t eh i s t o r i c a ld a t a b a s e do no p t i m i z e dg r o u n dm o n i t o r i n gp o i n t s ,r e l a t e d a n a l y s i so fg r a ys y s t e mi se m p l o y e dt o c a l c u l a t e de a c ha q u i f e r o u sg r o u pa n dt h e c o e f f i c i e n to fg r o u n ds u b s i d e n c e k e n d a l le x a m i n a t i o nm e t h o di se m p l o y e dt oa n a l y z e t h ec o e f f i c i e n to fe a c ha q u i f e r o u sg r o u p s e c o n d l y ,w i t hi n p u t v a r i a b l e so fa v e r a g eu n d e r g r o u n dw a t e rl e v e l sa n d o p t i m i z e dv a l u e so fg r o u n ds u b s i d e n c em o n i t o r i n gp o i n t st ob eo u t p u tv a r i a b l e s ,ab p n e u r a ln e t w o r km o d e lf o rp r e d i c t i o no fg r o u n ds u b s i d e n c ei se s t a b l i s h e d o nt h i sb a s i s , r e g u l a r i z a t i o na n de a r l ys t o pm e t h o d sa r eu s e dt oi m p r o v et h eg e n e r a l i z a t i o no f t h i s m o d e l b e s i d e s ,ar b fn e u r a ln e t w o r km o d e li se s t a b l i s h e d w i t hc o m p a r e sb e t w e e n t h e s e3m o d e l s ,ab e s tm o d e lf o rp r e d i c t i o no fg r o u n dw a t e ri n t h i sr e g i o ni ss e l e c t e d f i n a l l y ,h o wt ou s ea r c g i st od e s i g na n d e s t a b l i s h e dt h ed a t ab a s ea n dd a t ab a s e m a pi s d e s c r i b e di nd e t a i l ,a sw e l la sh o wt ou s es p a t i a la n a l y s i st oa n a l y z e g r o u n d w a t e rc o n t o u ra n dg r o u n ds u b s i d e n c e m o r e o v e r ,am e t h o df o r s e a m l e s s i n t e g r a t i o nf o rm a t l a ba n da r c g i s i sd e v e l o p e d ,w h i c hi sb a s e do nc o mt e c h n o l o g y i te x p l o r e san e wm e t h o df o rc o m m u n i c a t i o nb e t w e e na r c g l sa n do t h e rs o f t w a r e k e yw o r d s :g r o u n d s u b s i d e n c e ,g r e yc o r r e l a t i o na n a l y s i s ,n e u r a ln e t w o r k , g e o g r a p h i ci n f o r m a t i o ns y s t e m ,s p a t i a la n a l y s t 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的 研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得丞鲞盘堂或其他教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示了谢意。 学位论文作者签名:盘馥磊 签字日期:l 汐刃年占月f 铲日 学位论文版权使用授权书 本学位论文作者完全了解苤洼盘堂有关保留、使用学位论文的规定。 特授权吞洼盘鲎可以将学位论文的全部或部分内容编入有关数据库进行检 索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校 向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名: 壶佞欲 翩躲别 签字日期:1 l p 刃年6 月份日签字日期:沙刃年多月修同 天津大学硕士学位论文第一- 章绪论 1 1 地面沉降的概念、危害 第一章绪论 地面沉降是指在自然和人为因素作用下,由于地壳表层土体压缩而导致区域 性地面标高降低的一种环境地质现象,是一种不可补偿的永久性环境和资源损 失,是地质环境系统破坏所导致的恶果,是一种对资源利用、环境保护、经济发 展、城市建设和人民生活构成威胁的地质灾害【l 】。导致地面沉降的自然因素主要 是构造升降运动、地震以及火山活动等,人为因素主要是开采地下水、油气资源、 固体矿藏资源以及局部载荷加大等。自然因素所形成的地面沉降范围大、速率相 对较小,在目前生产力水平下,人类无法控制。人为因素引起的地面沉降范围较 小,但速率和幅度都比较大。它的发生和发展与人类活动密切相关,可以通过一 定的途径和措施加以控制与预防。基于上述特点,一般把自然因素引起的地面沉 降归属于地壳形变或构造运动的范畴,作为一种自然现象来研究;而把入为因素 引起的地面沉降归属于人为地质灾害现象进行研究和防治。 世界上,1 8 9 8 年在日本新泻最早发现地面沉降。目前,世界上已有5 0 多个 国家和地区发生地面沉降,较严重的国家有日本、美国、墨西哥、意大利、泰国 和中国等。 其中,仅在美国,已经有遍及4 5 个洲,超过4 4 0 3 0 k m 2 的土地受到了地面 沉降的影响,相当于新汉布什尔州与佛蒙特州的总和。由此引发的经济损失更是 惊入:仅在圣克拉拉山谷,沉降所造成的直接经济损失,在1 9 7 9 年大约为1 3 1 亿美元,而到了1 9 9 8 年则高达3 亿美元。 在我国,1 9 2 1 年,自从上海出现地面沉降以来,至今已有9 6 个城市和地区 发生了不同程度地面沉降,较严重的有上海、天津、台北、西安、宁波、苏州等。 据最新全国水资源综合规划初步成果表明,全国地下水超采区面积近1 9 万k m 2 。 有2 4 个省( 自治区、直辖市) 存在不同程度的地下水超采问题,主要分布在黄 淮海流域。其超采区面积占全国的7 0 以上,其中河北省超采面积占该省平原 区面积的9 1 6 。地下水超采直接造成区域性地下水位持续下降、水资源枯竭, 危及供水安全和饮用水安全,还诱发了地面沉降、地面塌陷、海( 咸) 水入侵、 荒漠化、湿地萎缩等生态环境问题。 天津大学硕士学位论文 第章绪论 1 2 国内外研究历史与现状 2 0 世纪5 0 年代以后,地面沉降研究工作受到普遍重视。1 9 6 5 年联合国提出 的国际水文十年调研项目就包括该专题。1 9 7 5 年又对由于过度开采产生的地 面沉降一地下水评估和环境效应研究进行了研究。为加强各国对地面沉降的学 术交流,由联合国教科文组织、国际水文科学协会等团体发起,曾于1 9 6 9 、1 9 7 6 、 1 9 8 4 和1 9 9 1 年分别在日本东京、美国的阿纳海姆、意大利的威尼斯和美国的休 斯顿召开了前四届国际地面沉降讨论会。我国于1 9 6 4 年、1 9 8 0 年、1 9 8 8 年、1 9 9 0 和1 9 9 8 年在上海和天津等地召开了五次全国性地面沉降学术讨论会,推动了地 面沉降研究工作的发展,取得了显著成效1 2 j 。 经过世界各地对地面沉降的长期调查研究i 3 1 ,普遍认为地面沉降主要是开采 天然气、石油、地下水等引起的。根据分层沉降标的观测资料,粘土层的压缩程 度最大。因此粘土排水固结的理论是解释地面沉降的基本原理1 4 j 。过度抽取地下 水时,由于来不及从含水层外面补给水量,地下水位迅速下降,在隔水层项板与 含水层接触面上产生水力坡度,使粘土层中的水相应地进入含水层中,粘土层中 的孔隙水压力降低,有效压力增加引起土层压密。如果这种粘土层压缩性强,厚 度又比较大时,其压密的结果就会引起地面沉刚引。在这种地面沉降过程中,地 下水位下降是矛盾转化的主要方面。土体是产生地面沉降的物质基础,不同成因 的土体有不同的地质特征,沉降机理略有不同。关于土体微观结构的研究方面。 结构控制论是岩体稳定评价的基本观点,它从在外力作用下结构要素的变化入 手,来研究地面沉降的机理;粘性土中孔隙水的运移问题是地面沉降的本质,也 是造成地面沉降机理难以阐明的关键所在。 自第三次国际地面沉降会议( 1 9 8 4 年) 以来,世界各地对地面沉降理论和 数学模型的研究有了进一步的发展1 6 】,对地下水流一般采用三维( 或准三维) 流 模型,但固结模型一般仍用一维的,其原因是地面沉降是区域性的,发生的面积 的直径远比土层厚度大得多,排水也是垂直的,侧向位移极小。土体固结变形是 地面沉降的直接原因,影响地面沉降的内因有土体的地质成因、分布方式、物质 成分、结构特征和物理力学性质等:外因是附加应力大小、作用方式和持续时间 等。内外因素相互作用与相互制约,并且随时间延续而不断地变化,致使地面沉 降具有复杂、多变的特点。 1 3 地面沉降现有的研究方法及特点 目前,地面沉降数学模型可归纳为两大类:一类为土水模型;另一类为生命 天津大学硕:l 学位论文第章绪论 旋回模型1 7 l 。 1 3 1 土水模型 土水模型的建立包括两个过程,一是确定含水层水位与开采量( 回灌、粘土 层释水) 之间的关系,即水流模型;二是研究含水层水位变化引起粘性土层及含 水层的变形规律,即土力学模型。 1 3 1 1 水流模型 水流模型要求有再现地下水系统的能力,能真实地刻画实际地下水系统中发 生的物理过程。地面沉降计算中采用的水流模型主要有下列几种: ( 1 ) 含水层中的地下水在水平面内做二维渗流,含水层上、下的粘土、亚 粘土层则视为绝对不透水。这样只能分析含水层内的孔隙水压力变化,并根据与 粘土、亚粘土层相邻的上下含水层内的孔隙水压力的变化来估算粘土、亚粘土层 的压缩量。 ( 2 ) 含水层中的地下水作水平方向渗流,将粘土、亚粘土层中的压密释水 概化为水流模型的源汇项。如r b r a v o 8 1 等采用的含水层水流模型为: v ( 7 :v m ,) + 生生+ 墨一只:誓( s + 瓯) ( 1 1 ) c r , f 7 l 其中,( x ,y ,f ) 为砂层f 中的孔隙水水位;互( j r ,力为砂层i 的导水系数; 1 7 ,( x ,y ) 为砂层i n i - i 间粘土层的传导率;墨( x ,y ) 为砂层i 的补给量;p ( x ,力砂 层珀勺抽水量;s 为含水层的贮水系数;s :。为半含水粘土层的单位贮水量。 ( 3 ) 准三维模型,假设在无越流补给情况下,承压含水层是均质、等厚、 各向同性和无限延伸的,分别利用非稳定流理论和复变函数理论来解出水位与水 量的关系,而与实际相差甚远。2 0 世纪9 0 年代以来,模型考虑有越流产生,并 有粘土释水补给含水层的条件下,建立准三维地下水流多层含水层系统的水流模 型,实际使用效果也较好。 ( 4 ) 三维模型,即含水层和弱透水层中的地下水流均作三维渗流处理。三 维水流模型能较好地刻画地下水系统内真实的水流状态,同时对数据参数数量及 质量的要求也较高,因此往往是困难或不可能的。 1 3 1 2 土力学模型 抽水导致松散含水层( 组) 骨架发生压密所引起的地面沉降,是土力学范畴 内的一种固结过程,即饱和土孔隙水压力的逐渐消散及在外荷作用下,土层产生 天津大学硕士学位论文第一章绪论 压缩。一般认为,固结是由主固结和次固结两部分组成。普遍假定,主固结非瞬 间完成,它是由于土骨架弹性性质引起的变形过程,随着超静孔隙水压力的消散 而发生。次固结又称蠕变,是指若干种类的土层,在定荷载作用下的连续的变形 过程,这是由于土骨架结构的重新调整所引起的。根据模型所能反映的土层的固 结特征分为以下三种: ( 1 ) 线弹性模型 一般假定含水层( 组) 骨架的压缩变形与孔隙水压力减小成比例。这样处理 问题,仅考虑了土层的主固结现象,忽视了由于含水层( 组) 骨架的粘滞特征引 起的次固结作用。通常采用下述公式计算土层的压缩变形量: 曲:( 一a o - ) 6 0 ( 1 - 2 ) 7 矽 上式中,7 矽为水的比重;6 。为含水层的初始厚度;s 出为弹性贮量的主要 部分;a t r 为有效应力变化量。这一模型主要用于含水层的变形,即将含水层的 变形作为弹性的、可恢复的。 ( 2 ) 准线弹性模型 考虑到土层非弹性压密,准弹性理论依然保留土层符合弹性规律的假设,认 为含水层( 组) 的有关参数是地层孔隙度及颗粒间有效应力的函数。在计算土体 变形时通常按土体的前期固结应力的大小,进行分段处理。有代表性的,如r b r a v o 等( 1 9 9 1 ) ,考虑到土体变形与应力历史的关系,提出预固结水位的概念, 并认为【阳在非弹性范围内,有效应力增加的单位压缩量大大高于弹性范围时的压 缩量:。 磷= 屯,当矿 ”1 ( 1 3 ) = ,当缈” 0 6 0 , 因此关系最密切,而与第1 i 、i i i 、v 含水组的关联度也均大于0 6 0 ,关系也较密 切。这也说明了地下水位与地下水开采量之间存在密切关系。 天津大学硕士学位论文 第二章研究域概况及其数据特点 表2 119 9 0 - 2 0 0 5 年地下水开采量与地面沉降量关联系数 1 9 9 0 1 9 9 l 1 9 9 2 1 9 9 3 1 9 9 4 1 9 9 5 1 9 9 6 1 9 9 7 1 9 9 8 1 9 9 9 2 0 0 0 2 0 0 l 2 0 0 2 2 0 0 3 2 0 0 4 2 0 0 5 0 3 4 0 o 6 0 8 1 0 0 0 0 5 7 8 0 7 9 8 0 4 5 6 0 6 8 5 0 5 6 3 0 5 4 l 0 7 5 2 o 4 9 0 0 7 8 9 0 5 0 8 0 6 4 5 o 6 0 9 0 8 7 5 0 3 3 7 0 7 0 4 o 9 0 0 0 8 7 6 0 4 9 9 0 5 4 7 o 8 2 2 o 7 1 4 0 4 6 l 0 4 6 9 o 4 1 l 0 4 7 2 0 8 0 4 0 7 6 9 0 8 8 8 0 6 4 6 0 5 2 6 o 6 1 4 0 7 2 5 0 9 9 8 0 6 3 6 0 4 3 5 0 6 2 2 0 6 9 7 0 6 3 8 o 7 4 6 0 4 6 8 0 9 2 5 o 9 4 8 0 5 7 1 0 9 6 6 1 0 0 0 0 3 6 7 o 6 4 3 o 8 4 8 0 9 0 3 o 8 0 4 0 4 0 3 0 8 3 4 0 8 1 0 0 4 7 2 0 7 0 0 o 3 6 6 o 9 1 0 0 6 6 4 1 o o o o 8 4 8 0 5 7 6 关联度 o 6 4 00 6 4 5 o 7 2 00 6 9 7 霉擎擎擎擎守拶守。 年份 + 地面沉降量 + 第1 i 含水组 + 第m 含水组 _ 卜第含水组 卜第v 含水组 图2 5 研究区各含水组开采量与地面沉降量动态曲线 1 6 2 8 6 4 2 l 8 6 4 2 o l l 1 l o o o o 嘲眯隶*钲谁驴百鲎蜉巨粤 天津大学硕士学位论文第二章研究区域概况及其数据特点 2 5 关联系数趋势分析 应用肯达尔非参数秩次相关检验法对地面沉降量与开采量的关联度序列 x l ,毙,( n 为地下水水位时间系列长度) 进行趋势分析,首先确定所有对偶 值( x i , x j j i ) 中的( x i v oo ,时,趋势显著;当晰 l u l v 0 0 2 ,时,趋势高度显著1 3 0 3 1 t 3 2 1 。 天津大学硕士学位论文 第二章研究区域概况及其数据特点 。 年份 + 第1 l 含水组 + 第1 l l 含水组 + 第含水组 + 第v 含水组 图2 6 研究区各含水组开采量与地面沉降量关联度系数曲线 应用肯达尔非参数秩次相关检验法对地面沉降量与开采量的关联度序列分 析,得到数据如表2 2 。 表2 2 研究区地下水位肯达尔趋势分析 组别u p fv a r ( r )趋势 第1 i 含水组0 4 8 46 5 0 0 8 30 0 3 0趋势不显著 第1 含水组o 19 46 20 0 3 3 0 0 3 0趋势不显著 第含水组2 1 3 08 20 3 6 7 0 0 3 0高度显著上升趋势 第v 含水组0 7 7 56 80 1 3 30 0 3 0趋势不显著 从表2 2 中可以看出:第含水组检验统计量晰( 2 6 4 ) u u o 舾( 2 1 1 ) 且为正值,说明地面沉降量与第含水组的关联程度呈高度上升趋势,而第1 i 、 i i i 、v 含水组检验统计量u 虽均为正值但均小于1 9 0 ,说明地面沉降量与这些含 水组的关联趋势变化不是非常显著。这与近年来压缩i i 、i i i 含水组地下水开采, 增加含水组开采量的实际情况相符合。 壁擘粼n。,。_址 m删删也囝胁0 o o o o 0 0 d 2 o 8爆栅圈d l i m a 囝o a 黼搂粼 天津大学硕上学位论文第三章预测模型的建立及优化 第三章预测模型的建立及优化 3 1 预测模型的选取 对地面沉降的研究一般从内外两方面探讨地面沉降的原因。单从内因分析, 可归纳为含水组结构、地下水位、软土发育程度、松散层厚度及第四系沉积结构 等诸多因素。必须强调的是,这些因素在空间上具有多变性,就第四系而言又非 一个均质系统,各因素与地面沉降之间很难给出定量的联系,这些因素综合作用, 共同决定了区域性的地面沉降条件【j 引。 由于地质条件的隐藏性和目前勘察技术的局限性,使得许多因素成为不可知 或知之甚少。因此可以认为区域性的地面沉降更符合灰色系统的特征m l ,可运用 相关的理论方法来进行分析。神经网络模型有着十分复杂的输入输出关系,它为 解决非线性问题,模拟未知系统的控制问题提供了一条新思路。目前在地质环境 研究领域已有许多成功的应用| 3 s , 3 6 。因此本文选取b p 神经网络模型和径向基网 络作为预测模型。 3 2 神经网络的基本原理 神经网络模型用于模拟人脑神经元活动的过程,包括对信息的加工、处理、 存储和搜索等过程,它具有分布式存储、并行处理和推理信息、自组织和自学习 等基本特点l 硐。 翰入有偏劳的毒鲢元 ,。、,- 1 a = 厂( 哆p + 6 ) 图3 一 神经元结构示意图 天津大学硕士学位论文第三章预测模型的建立及优化 图3 - 2 神经网络学习示意图 神经网络是一个由高度相关处理单元所组成的计算系统,它( 除少数外) 由 以下单元组成: ( 1 ) 处理单元( 神经元) :处理单元是神经网络的基本组成部分,输入层 的处理单元只是将输入值转入相邻的联接权重,隐层和输出层的处理单元将它们 的输入值求和并根据转移函数计算输出值。 ( 2 ) 联接权重:联接权重是将神经网络中的处理单元联系起来,其值是随 各处理单元的联接程度而变化。 ( 3 ) 层:层神经网络一般具有输入层、隐层和输出层。 ( 4 ) 阈值:阈值可使网络能更自由地获取所要描述的函数关系,其值可为 恒值或可变值。 ( 5 ) 转移函数:转移函数通常为非线性函数,它是将输入的数据转化为输 出的处理单元。 根据网络结构和学习规则的不同,神经网络有许多种类,包括感知器,线性 神经网络,b p 网络,径向基函数网络,自组织竞争网络和回归网络等。在流模 型结构的设计量预测方面现在用得较多的是b p 网络,径向基函数网络。b p 神 经网络是目前应用的比较广,研究比较成熟的神经网络【2 9 , 3 8 】。 3 3 反向传播神经网络预测模型 3 3 1 反向传播神经网络的基本结构 图3 - 3 表示了一个概念化的反向传播网络( b a c k - p r o p a g a t i o nn e t w o r k ,简称 b p ) 的三层b p 神经网络。其中,p ( r x l ) 为输入,口3 ( s 3 1 ) 为输出;缈为连接 权矩阵;s 1 和s 2 代表两个隐层的神经元数;f 为激励函数,隐层之间常用s i g m o i d 函数,而隐层与输出层之间一般采用线性函数。 天津大学硕士学位论文第三章预测模型的建立及优化 图3 3 三层b p 网络示意图 可见,b p 网络实际上相当于一个从输入到输出的高度非线性映射,即: f :r ”专r ”。 3 3 2 模型的设计及分析 在进行b p 网络设计时,一般应从网络的层数,每层的神经元个数和激活函 数、初始权值以及学习速率等几个方面来进行考虑。 学习速率决定每一次循环训练所产生的权值变化量。大的学习速率可能导致 系统的不稳定;但小的学习速率导致较长的训练时间,可能收敛很慢,不过保证 网络的误差值不跳出误差表面的低谷而最终趋于最小误差值。所以在一般情况 下,倾向于选取较小的学习速率。 网络期望误差的适当选择是相对于所需要的隐含层节点数来确定的,因为较 小的期望误差值是要靠增加隐含层的节点,以及训练时间来获得的。由于系统是 非线性的,初始权值对于学习是否达到局部最小、是否能够收敛以及训练时间的 长短的关系很大。如果初始权值太大,使得加权后的输入和n 落在了s 型激励函 数的饱和区,从而导致其导数厂( 珂) 非常小,而在计算权值修正公式中,因为 万o cf ( 刀) ,当厂( 刀) 专0 时,则有万专0 ,这使得a w t i 专0 ,从而使得调节过程 几乎停顿下来。所以,一般总是希望经过初始加权后的每个神经元的输出值都接 近于零,这样可以保证每个神经元的权值能够在他们的s 型激励函数变化最大之 处进行调节。所以,一般初始权值取在( 1 ,1 ) 之间的随机数。 b p 网络的应用,其重点在于网络结构的设计。只要隐层中有足够多的神经 元,多层前向网络可用来逼近几乎任意一个函数。然而,通常并不能说多少层或 多少神经元就可以满足预测精度的要求。网络结构分析的目的是通过建立试验模 型分析不同网络结构对模型预测能力的影响,寻找足以表示训练集的最简单的网 络。 本文以1 9 9 0 2 0 0 4 年度的各含水组年均水位作为模型输入,以相应年度的地 天津大学硕士学位论文第三章预测模犁的建立及优化 面沉降数据作为模型输出进行组织训练,预留2 0 0 5 年度的观测数据校验模型的 泛化能力。并采用张建军【2 l 】的设计参数,即训练期望误差为0 0 0 1 ,最大训练周 期( e p o c h ) 为1 5 0 0 ,学习速率为0 0 1 。训练函数采用m a t l a b 提供的w a i n r p 函 数。通过筛选最终选取的模型为每个隐层具有5 个神经元的三层网络,最终拟合 均方误差为0 0 2 0 6 。训练误差曲线见图3 4 ,预测结果见表3 1 ,预测的平均误 差为2 1 6 2 。 塞 鑫 训练廊期 图3 4 训练过程曲线 表3 - 1b p 网络模型检验数据误差分析 监测点 观测值( m )预测值( m )相对误差( ) o 0 1 4 o 0 2 8 - o 0 4 4 o 0 1 2 - o 们7 o 0 1 8 一o 0 1 3 一o 0 2 1 o 0 1 9 - o 0 1 5 - o 0 2 5 o 0 5 l - 0 0 1 4 o 0 1 9 - o 0 1 5 o 0 1 9 0 0 2 6 o 0 2 3 2 2 1 4 3 0 1 1 4 6 1 4 9 3 1 5 7 3 l o 9 3 1 6 6 5 4 4 3 0 1 9 2 0 1 8 5 0 , 2 3 4 5 6 7 8 9 天津大学硕士学位论文第三章预测模型的建立及优化 3 4b p 神经网络预测模型的优化 3 4 1 优化问题的提出及优化方法 神经网络学习性能的好坏体现在学习速度和泛化能力上【3 引。即满意地逼近训 练样本所花费的时间,和对未训练样本的逼近程度。泛化能力( g e n e r a l i z a t i o n c a p a b i l i t y ) 是指对于同一样本集中的非训练样本,网络仍能给出正确的输入输 出映射关系的能力。这说明通过对有限地训练样本的学习,网络掌握了隐含在样 本中的内在规律性。这种有使用价值的神经网络是应用者最希望的。因此在成功 训练完网络以后,都要在验证集或工作集中进行网络泛化能力的检验,通过检验 误差去估计泛化误差来评价网络性能的好坏。 3 9 , 4 0 实际上,在b p 网络的训练中往往会出现这样的情况,当网络的训练误差很 小的时候,一个新的输入会使网络的训练误差迅速增大。这是因为网络记忆了已 被训练的样本,而对新输入没有良好的泛化能力,也就是说网络对新输入的输出 与对应的目标输出有较大的误差。 提高网络泛化能力地一个办法就是适当地增大网络的规模,但是对于一个具 体的问题,要事先就很好地确定网络的规模是很困难的。一般来说,有两种方法 能够提高网络的泛化能力,它们是规则化调整( r e g u l a r i z a t i o n ) 和初期中止( e a r l y s t o p ) 。 伯 舳 以 加 粥 侈 b 舛 m 够 体 侈 挖 驺 墙 侈 协 引 扒 扒 5 3 o o 6 9 3 2 7 9 9 8 6 舵 叭 叭 舵 叭 叭 m m m m 5 8 5 4 7 4 6 8 9 4 7 7 l 2 2 2 b 2 2 2 o l o o 2 饯 o a o o o o o o o 0 o o 0 o o o o o o o o o o o o _ - - - - - - - m n 圪 b h 抬 掩 侈 加 扒 砣 天津大学硕士学位论文第一章预测模型的建立及优化 3 4 1 1 规则化调整 规则化调整方法是通过调整网络的性能函数来增强网络泛化能力。普通的 b p 神经网络都采用网络误差的均方根之和作为性能函数,如公式( 3 - 1 ) 所示 f = 搠s p = 专姜( p j ) 2 = 丙1 善( t 一口1 ) 2 ( 2 1 ) 其中q 、,、口j 分别表示第f 个训练样本的训练误差、 而调整后的网络性能函数如公式( 3 2 ) 所示 m s e r e g = y m s e + ( 1 - ? ) m s w 其中y 是性能参数, = 去喜蟛 目标输出和网络输出。 ( 2 - 2 ) ( 2 - 3 ) 使用该性能函数可以减少网络的有效权值和阈值,并且使网络的训练输出更 加平滑,从而增强网络的泛化性能。但是性能参数y 的选择是一个不好解决的问 题,如果太大,网络的泛化能力不好;如果太小网络的训练精度又太低。在 m a t l a b 神经网络工具箱中,提供了自动设置最优性能参数厂的函数t r a i n b r 。 该函数使用了b a y e s i a n 框架结构,假设网络的权值和阈值是特殊分布的随机变 量,然后用统计学的方法估计出y 的值。 3 4 1 2 初期中止 利用初期终止方法也可以提高网络的泛化性能。在该方法中,将 j l l 练样本分 成三个集合。第一个集合n i ) i l 练样本集,这里的样本用于计算网络性能函数和梯 度,以更新网络的权值和阂值。第二个叫确认样本集,通过该集合中样本的训练 误差来确定最终的权值和阈值。第三个集合叫测试样本集,该集合中的样本并不 用于网络的训练,而是用来检验网络训练的结果。 3 4 2 优化后的模型分析 为了便于对比,该模型采用了与前面模型相同的训练和预测数据,即以 1 9 9 0 2 0 0 4 年度的各含水组年均水位作为模型输入,以相应年度的地面沉降数据 作为模型输出进行组织训练,预留2 0 0 5 年度的观测数据校验模型的泛化能力。 为了确定最终的网络结构,本研究对隐含层节点数5 1 0 的网络进行了试算,从 中寻找合适的网络结构。试算结果如表3 2 。 天津大学硕l 学位论文 第三章预测模型的建立及优化 表3 - 2 网络试算结果表 詈1 酽 上 卜一 1 0 0 ; c ,) t r a i n i n gs s e = 0 0 0 6 2 7 。 0 s q u a r e dw e i g h t s = 0 0 0 3 2 6 e f f e c t i l ,en u m b e ro fp a r a m e t e r s = 3 1 6 5 7 4 图3 5 训练过程曲线 由表3 2 可以看出,随着网络隐含层节点数的增多,训练误差和预测相对误 差都有一定程度地降低,但是预测相对误差的降低趋势并不如训练误差那么明 显。而且随着隐含层节点数的增多,训练时间也明显增长,在同等运算能力的机 器上进行计算时,隐含层节点数为1 0 的网络运行时间大概是隐含层节点数为5 的三倍,在综合考虑了预测误差、训练误差和运行时间后,决定采用隐含层数为 8 的神经网络。网络的预测结果如表3 3 。 天津大学硕士学位论文 第三章预测模型的建立及优化 表3 3 优化后b p 神经网络模型检验数据误差分析 3 4 3 避免其它因素对泛化的影响 b p 算法对初始权值极为敏感,它影响最终收敛的好坏。初始权值不同的情 况下进行训练,将得到不同泛化性能的神经网络。初始权值若太大,节点输出可 能一开始就接近饱和,在初始点附近就陷入局部极小。过去的实验证明:在隐节 点的权初始值赋均匀分布在零附近的很小的随机数时进行训练,可以保证权值变 化在激活函数变化最大的地方,最终得到低复杂性的神经网络,使泛化性能尽量 增大。在应用中简单的方法有表决网法( 或称多神经网络法) :先训练一组初始 天津大学硕士学位论文第三章预测模犁的建立及优化 权值不同的子网,然后通过各子网“表决”的方式得到学习系统的输出或先选少 量的有代表性的样本来训练网络,达到一定误差时形成的权值集合作为网络的初 始权值,继续训练网络,也可达到较好效果。唐巍等采用混沌优化方法优化b p 网络的初始权值1 4 。初始权值采用l o g i s t i c 映射z 。l = 肛。( 1 一z 。) 。此函数在控 制参量j = 4 时系统处于完全混沌状态。由于混沌是非线性动力学系统特有的一 种运动形式,混沌运动具有遍历性,在一定的范围内按其“自身规律”,不重复 的遍历所有状态。因此搜索比依概率随机遍历更快的速度进行,有效地解决了分 类问题。 这是改进神经网络泛化的一种新途径。训练中权值的修正方法也对网络的泛 化能力有影响。若用常规的动量法求解,由于权空间一般非常大,对于非常有限 的训练样本集合,连接权值的间断性或随机性。这样当样本数据有微小改变,都 会导致隐层神经元的输出有较大不同,网络泛化能力不强。j e a njsn 和j i nw a n g 提出了权值光滑算法【删,以及改进的有“退火”光滑因子的b p 算法( a s b p ) 。 其均方误差后添加能使隐层神经元相邻的两个权值间光滑的惩罚项。隐层与输入 层间的权值w 蛔修正采用退火因子。通过逐渐光滑连接权值来改善网络的推广性 能。 3 5 径向基网络模型预测 3 5 1 径向基网络的原理 图3 6 径向基神经网络 径向基函数( r a d i a lb a s i sf u n c t i o n ,r b f ) 神经网络由三层组成,其结构如 天津大学硕士学位论文第一章预测模犁的建立及优化 示。输入层节点只传递输入信号到隐层,隐层节点由像高斯核函数那样的辐射状 作用函数构成,而输出层节点通常是简单的线性函数。 隐层节点中的作用函数( 基函数) 对输入信号将局部产生响应,也就是说, 当输入信号靠近基函数的中央范围时,隐层节点将产生较大的输出,由此看出这 种网络具有局部逼近能力,所以径向基函数网络也称为局部感知场网络。 作为基函数的形式,有下列几种: 厂( x ) = e x p 巾7 f 户( 2 - 4 ) f ( x ) = 万岳 ,( x ) = ( 仃2 + x 2 ) , 上面这些函数都是径向对称的,但最常用的是高斯函数 ( 2 - 5 ) ( 2 - 6 ) 舭叫一喏卜2 ,。,m 其中x 是”维输入向量;e 是第f 个基函数的中心,与x 具有相同维数的向量, 正是第,个感知的变量( 可以自由选择的参数) ,它决定了该基函数围绕中心点 的宽度;聊是感知单元的个数。0 x - - 训是向量工一e 的范数,它通常表示x 和q 之 间的距离,墨( 工) 在q 处有一个惟一的最大值,随着忙一酬的增大,r ( x ) 迅速衰 减到零。对于给定的输入x r “,只有一小部分靠近x 的中心被激活。 从图3 6 可以看出,输入层实现从x 专r ( x ) 的非线性映射,输出层实现从 置( x ) 到n 的线性映射,即 ”- - - z k r ( 力k = 1 ,2 ,p ( 2 - 8 ) t = l 其中p 是输出节点数。 其连接权的学习修正仍可采用b p 算法。由于足( x ) 为高斯函数,因而对任 意工均有r ( x ) 0 ,从而失去局调整权值的优点,而事实上,当x 远离c 时,r ( x ) 已非常小,因此可作为0 对待。因此实际上只当足( x ) 大于某一数值( 例如o 0 5 ) 时才对应的权值进行修改。经这样处理后,r b f 网络也同样具备局部逼近网 络学习收敛快的优点。同时这样近似处理,可在一定程序上克服高斯函数不具备 紧密性的缺点1 4 2 , 4 3 , 4 4 ,4 5 1 。 上述采用的高斯函数,具备如下优点: 天津大学硕十学位论文第三章预测模犁的建立及优化 ( 1 ) 表示形式简单,即使对于多变量输入也不增加太多的复杂性。 ( 2 ) 径向对称。 ( 3 ) 光滑性好,任意阶层数存在。 ( 4 ) 由于该基函数表示简单且解析性好,因而便于进行理论分析。 3 5 2 模型结构的设计及分析 a , l = r a d b a s ( 1 l ,帜厂p 怯j ) a 2 = p u r e l i 玎( ,d 均2 ) + 图3 - 7 径向基神经网络 径向基网络由两层神经元组成,一个隐含层,由径向基神经元组成;一个输 出层,由线性神经元组成,其结构如图3 7 所示。其中,r 表示网络输入的维数, s 1 表示第一层的神经元个数,s 2 表示第二层的神经元个数,仉l 表示第一层输出 口1 的第f 个元素,川。表示第一层权值矩阵川。的第f 行元素。图孓7r 蝴l l d i s t 8 接收输入p 和权值矩阵职,的欧几里德距离,因此,输出是s 1 的向量,符号 “ 表示l l d i s t i 的输出与阈值b 1 的元素与元素之间的乘积关系。 同样,为了便于对比,该模型采用了与前面模型相同的训练和预测数据,即 以1 9 9 0 2 0 0 4 年度的各含水组年均水位作为模型输入,以相应年度的地面沉降数 据作为模型输出进行组织训练,预留2 0 0 5 年度的观测数据校验模型的泛化能力。 程序主要代码如下: f k c l n ,k c l m i n ,k c l m a x ,d m

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论