




已阅读5页,还剩39页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要地球物理勘探,简称物探,是研究地质构造和解决找矿勘探问题的基本方法之一。它以各种岩石和矿石的密度、磁性、电性、弹性、放射性等物理性质的差异为研究基础。其中,重力勘探、磁法勘探是目前使用的两种主要物探方法。区域重磁数据处理的目的之一是通过对区域地球物理场的各种方法处理与分析,推断研究区域内的构造断裂分布这一过程可通过解析延拓、任意水平方向导数等,与其它地球物理资料进行综合解译得到各种有关深部结构与断裂分布的信息。进而根据地质体之间存在物性的差异,就能解释推断存在的断裂构造和环形构造。在对区域重磁数据提取以及处理的过程中,人工智能算法被大量应用其中,以解决诸如判断轴线相关等非线性问题。目前,应用的比较成熟的人工智能模型就是b p人工智能网络模型。本文研究了传统b p 人工智能网络模型在重磁数据处理中的应用,并总结了传统b p 算法的一些缺陷与不足,结合新的改进遗传算法,对传统b p 人工智能模型进行了改进,此新方法最后的实验证明有效的克服了b p 算法容易陷入局部极小点从而导致网络训练失败的缺点,而且b p 网络收敛速度慢,训练时间长问题也得到了改善。关键词:重磁构造;重磁数据处理;b p 神经网络;遗传算法;a b s t r a c tt h eg e o p h y s i c a lp r o s p e c t i n g ,t h ea b b r e v i a t i o np h y s i c a lp r o s p e c t i n g ,i st h ee s s e n t i a lm e t h o dt os t u d yt h eg e o l o g i cs t r u c t u r ea n ds o l u t i o no fp r o s p e c t i n ge x p l o r a t i o nq u e s t i o n i tt a k e se a c hk i n do fp h y s i c a lp r o p e r t ya n ds oo nr o c ka n do r ed e n s i t y , m a g n e t i s m ,e l e c t r i cp r o p e r t i e s ,e l a s t i c i t y , r a d i o a c t i v i t yd i f f e r e n c e sa sr e s e a r c hf o u n d a t i o n a n d ,t h eg r a v i t a t i o n a le x p l o r a t i o n ,t h em a g n e t i cp r o s p e c t i n ga r et w om a i np h y s i c a lp r o s p e c t i n gm e t h o d su s e dp r e s e n t l y o n eo fr e g i o nh e a v ym a g n e t i s md a t ap r o c e s s i n g sg o a l si st h r o u g ht or e g i o ng e o p h y s i c sf i e l de a c hm e t h o dp r o c e s s i n ga n dt h ea n a l y s i s ,t h ei n f e r e n c es t u d i e si nt h er e g i o nt h es t r u c t u r eb r e a kd i s t r i b u t i o n t h i sp r o c e s sm a yt h r o u g ht h ea n a l y t i cc o n t i n u a t i o n ,t h eh o r i z o n t a ld i r e c t i o nd e r i v a t i v ea n ds oo n ,c a r r yo nt h es y n t h e s i si n t e r p r e t a t i o nw i t ho t h e rg e o p h y s i c sm a t e r i a lt oo b t a i ne a c hk i n do fr e l a t e dd e p t hp o r t i o ns t r u c t u r ea n dt h eb r e a kd i s t r i b u t e di n f o r m a t i o nw i l l f u l l y t h e na c c o r d i n gt ot h eg e o l o g i cb o d yb e t w e e nd i f f e r e n c e s ,w ec a ne x p l a i nt h ei n f e r e n c ee x i s t e n c ef a u l t e ds t r u c t u r ea n dt h er i n gs t r u c t u r e t ot h er e g i o nh e a v ym a g n e t i s md a t at a k e o f fa sw e l la si nt h ep r o c e s s i n gp r o c e s s ,t h ea r t i f i c i a li n t e l l i g e n c ea l g o r i t h mi sa p p l i e dm a s s i v e l yi nw h i c h , s o l v e ss u c ha sj u d g m e n ts p o o lt h r e a dr e l a t e da n ds oo nn o n - l i n e a rp r o b l e m s a tp r e s e n t ,t h ea r t i f i c i a li n t e l l i g e n c em o d e la p p l i e dq u i t em a t u r e l yi st h eb pa r t i f i c i a li n t e l l i g e n c en e t w o r km o d e l t h i ss t u d yh a ss t u d i e dt h et r a d i t i o n a lb pa r t i f i c i a li n t e l l i g e n c en e t w o r km o d e li nh e a v ym a g n e t i s md a t ap r o c e s s i n ga p p l i c a t i o n ,a n ds u m m a r i z e dt r a d i t i o n a lb pa l g o r i t h ms o m ef l a w sa n dt h ei n s u f f i c i e n c y , t oo t h e ra r t i f i c i a li n t e l l i g e n c em o d e l sr e s e a r c hc o m p a r i s o n ,h a sm a d et h ei m p r o v e m e n tt ot h et r a d i t i o n a lb pa r t i f i c i a li n t e l l i g e n c em o d e l ,t h i sn e wm e t h o df i n a le x p e r i m e n tc e r t i f i c a t ee f f e c t i v eo v e r c a m et h eb pa l g o r i t h me a s i l yt of a l li n t ot h ep a r t i a lm i n i m u mp o i n t ,t h u sc a u s e dt h en e t w o r kt r a i n i n gd e f e a t ss h o r t c o m i n g ,m o r e o v e rt h eb pn e t w o r kc o n v e r g e n c er a t ew a ss l o w , t h et r a i n i n gt i m el o n gq u e s t i o nw a sa l s oi m p r o v e d k e yw o r d s :g r a v i t ya n dm a g n e t i cr e g i o n a lf i e l d ;g r a v i t a t i o n a la n dm a g n e t i cd a t a ;b a c k p r o p a g a t i o nn e t w o r k ;g e n e t i c a l g o r i t h mi l独创性声明本人郑重声明:所提交的学位论文是本人在导师指导下独立进行研究工作所取得的成果。据我所知,除了特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果。对本人的研究做出重要贡献的个人和集体,均已在文中作了明确的说明。本声明的法律结果由本人承担。学位论文作者签名:当垃日期学位论文使用授权书本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东北师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅。本人授权东北师范大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其它复制手段保存、汇编本学位论文。( 保密的学位论文在解密后适用本授权书)学位论文作者签名:迸! 星塾:指导教师签名:日期:学位论文作者毕业后去向:工作单位:通讯地址:日期:电话:邮编:东北师范大学硕士学位论文第一章绪论1 1 重磁数据处理概述重磁数据处理系统是以位场数据( 重力、磁法数据) 的安全存储、信息共享、数据处理为目的,通过面向对象的程序实现具有数据的录入、查询、处理、输出等功能的专用数据处理系统。由于重力和磁法在数据处理方面具有共性,同属于位场理论研究的范畴,在处理解释过程中常进行两种方法的综合解释和对比,所以将它们的处理方法集成到同一个系统中以方便使用。当然也有单独的重力数据处理系统和磁法数据处理系统。任何一个数据处理系统都包含了三个主要模块:数据输入、数据处理和数据输出。系统与系统之间的差别也就存在于这三个方面的实现方式的不同之上。形成系统必须有三个必要条件:机构、功能、目标。重磁数据处理系统主要的目标是重磁数据,常规的数据类型包括原始数据和图件。随着物探技术的发展,数据处理的方法有很多种,不同的系统选择不同的方法来处理数据。因此,系统的执行机构和实现的功能也不相同。最后系统输出处理后的结果。当今计算机高效的数据处理能力和科学的数据管理模式能大大提高计算的精度和效率,节省人力物力。随着物探技术的发展和科研生产的需要,使用基于计算机的数据处理系统来完成大量的重磁数据处理已经成为一种趋势。它已经广泛地应用于科研生产单位,促进了生产力的发展。1 2 重磁数据处理系统的发展状况人们在本世纪初就开始利用天然重力场的异常来进行重力勘探,而早在1 6 4 0 年左右,瑞典人就开始利用罗盘寻找磁铁矿。在我国,重力勘探始于本世纪4 0 年代。磁法工作也是从本世纪3 0 年代从云南开始的。最初获得的重磁数据完全是靠手工计算来处理。当时大量的重磁数据对处理人员来说,计算量是相当大的而且在繁杂的计算过程中还容易出错。随着1 9 4 6 年第一台电子计算机的问世,人们发现利用计算机来进行科学计算可以大大提高效率。它的最初运用就是用在科学计算上。后来,由于半导体技术r 新月异的发展,计算机的成本越来越低,它被广泛地运用于各行各业的数据处理中。在我国广泛地运用计算机处理重磁数据是从1 9 7 4 年国家地质总局召开金属矿物探电算学习班进行推广后才开始【o l 】。由于物探技术和数据处理方法的不断革新,重磁数据处理的方法也在不断改进。从一维空间到多维空间,从空间域到波数域,从付里叶变换n d , 波变换等等【0 2 1 ,数据东北师范大学硕士学位论文处理的算法逐渐变得多种多样,能够解决的问题也越来越多。很多算法也处在不断改进的过程之中。没有一个系统能够包含所有的算法,系统之间的区别在于它们采用了不同的算法,它们在不同的方面各具特长。计算机的发展也影响着重磁数据处理系统的发展。从最早的低级编程语言到现在的高级编程语言,从面向过程的编程思想到面向对象的编程思想,从受限的内存空间到几乎不受限制的存储空间从基于磁盘操作系统到基于图形用户界面,重磁数据处理系统的计算处理能力突飞猛进。计算机已经成为数据处理的工具,随着计算机的普及,越来越多的数据处理解释人员掌握了计算机技术,他们将编程技术应用于各自领域,这对于各种地质数据处理系统的发展起到了极大的推动作用。比如,目前我国把规模最大、计算速度最快、处理能力最强的超级计算机应用于地震资料三维叠前深度偏移处理。它以每秒钟4 2 万亿次的计算能力大大提升了地震资料数据处理能力岬j 。重磁数据处理系统的发展是同时伴随着计算机技术和物探技术的发展而发展的。到现在为止,它已经成为重磁数据处理中不可缺少的工具。很多大的公司和研究院所都开发有自己独立的重磁数据处理系统。个人也将自己的算法付诸于计算机来实现,研究出不同的数据处理软件。重磁数据处理系统已经被人们所广泛地接受,在生产部门单位和研究部门得到空前的应用。地理信息系统( g e o g r a p h i c a l i n f o r m a t i o n s y s t e m g i s ) 是在计算机硬件、软件系统支持下,对整个或部分地下表层( 包括大气层) 空间中的有关地理分布数据进行采集、存储、管理、运算、分析、和可视化表达的信息处理与管理系统。地理信息系统( g i s ) 作为计算机信息时代的产物,它是地球科学、信息科学与计算机技术融为一体的高新技术。它具有开放性、信息资源共享和支持多平台的特点,已经对国民经济各个领域产生了显著影响。对地质应用来说,与成矿有关的地球物理、地球化学、地质构造及遥感信息等都与空间地理位置密切相关,g i s 可为这些空间信息提供空间分析和决策的功能,因此g i s 完全适合用于对多信息源的地学信息的综合分析和数据管理 0 4 1 。此外,g i s 技术所提供的多信息源地学信息的管理能力、灵活的查询检索能力、空间分析方法以及计算机辅助制图的能力不仅大大提高了矿产资源评价的效率,而且有利于发挥地质学家的主观能动性【4 】。由于g i s 技术与传统工作方式相比所具有的优点,早在上个世纪七、八十年代,地质学家们就开始尝试在矿产资源评价中应用g i s 技术。经过二十多年的实践证明,g i s 技术的应用形成了新一代的矿产资源评价方法。g i s 不仅已经成为发达国家矿产资源评价的有力工具,在中国、巴西、南非、越南等许多发展中国家的应用也越来越深入【0 5 1 。本文就是基于g i s “空间分析 功能对原有区域重磁构造的自动提取及处理方法提出改进,并对改良的方法进行了有益的研究和探索。2东北师范大学硕士学位论文1 3 本文研究的背景及意义由于地学数据具有多尺度、多时段、多精度、多比例尺和多解性等特点,这就造成了观测数据与研究对象的本质之间的对应关系具有非线性特征,因此,近年来发展起来的非线性方法中的人工神经网络方法研究处理一些地学问题,取得了较好的效果。人工神经网络是模仿大脑神经网络结构和功能而建立起来的一种信息处理系统。人工神经网络进行信息处理主要有以下特性:1 、分布存储与容错性;2 、并行处理性:3 、处理的非线性;4 、信息处理与储存的合二为一性;5 、可塑性与自组织性;6 、层次性与系统性。神经网络可以应用于模式识别、分类、聚类、预测、特征提取、函数逼近、数据插补、数据压缩等方面1 5 j 。在地学应用中,为了揭示空间变量的相互关系、挖掘隐藏在数据内部的信息,人工神经网络可以作为多源地学信息处理系统的子系统。本文特别论述了b p 算法在重磁数据处理中的应用。在实际应用中,绝大多数的人工神经网络的应用是b p 网络或它的变化形式的应用,b p 网络体现了现阶段人工神经网络最精华的部分。基本b p 算法的主要局限性是收敛速度太慢,而且极易陷入局部最小。在应用于实际问题时,训练网络需要很长的时间,并且训练结果误差也较大。针对基本b p 算法的局限性,已有许多成功的改进算法。本文使用改进的遗传算法对传统b p 算法进行了改进,从根本上克服了基本b p 算法的局限性,使网络的收敛速度大大加快,网络精度得到了很大的提高。3东北师范大学硕士学位论文第二章重磁数据智能化提取的基本原理及方法2 1 重磁数据智能化提取的基本原理区域重磁资料处理解释的目的之一是通过对区域地球物理场的各种方法处理与分析,推断研究区域内的构造断裂分布。区域重磁资料在固体矿产资源评价中主要是结合地质、化探、遥感进行综合信息研究圈定成矿靶区。重磁数据处理可采用频率域位场转换、分离深源异常场和浅源局部异常场,依据区域重磁场的频谱具有明显的高低频特征差异,由高低频特征分别反映浅部、深部地质体客观存在。向上延拓越高,信息反映了深部大的地质体存在,如古老基底、大的隐伏岩体等;反之,反映浅部小的地质体;根据地质体之间存在物性的差异( 如:密度或磁性) ,就能解释推断存在的断裂构造和环形构造。具体过程是通过解析延拓、目标场提取、任意水平方向导数计算、离散小波变换等处理,得到周边地区的断裂信息,在文献】中指出:任意方向水平导数与上延处理结合在一起具有突出不同深度、不同方向的断裂信息的功能与特点。杨文采等i o7 j 通过实验表明,用小波变换分解的重力异常小波细节,同样起到功率谱分解的作用,用分解之后的小波细节功率谱可以精确确定场源的埋深。j a c o b s e n 0 8 】提出了一种利用上延拓算子作异常划分的方法,向上延拓算子被用作异常划分算子,并且具有定量关系,把上延2 倍高度后的场,看作是位于该深度以下物质产生的场。钟慧智、王家林等岬j为了研究断裂,利用不同延拓高度方法提取不同深度的异常,进而反映出不同断裂的切割深度与规模大小的原理。上述各种对区域重磁场求解的方法,无论是求界面深度还是断裂分布,只要方法运用得当都能获得较为令人满意的结果。对上延某一高度平面场从4 个不同方向水平求导,并通过各方向水平导数轴线的水平关联,确定该平面断裂线的存在;然后将几个延拓高度平面的断裂线进行垂直方向的关联,确定其空间重( 磁) 断裂带的存在;最终推断出研究区的重( 磁) 构造格架的分布。它的特点是这些导数轴线的关联与提取以及区域重( 磁) 构造格架的形成,均是基于g i s 的空间图形数据基础上完成的。2 2 重磁数据智能化提取的基本方法区域重磁解译目的是推断线性和环形构造,建立重磁构造格架图以往整个解译过程是专家在透图台借助透明纸叠置分析完成的,而现在则多是利用计算机技术,采用g i s 空间分析功能自动完成区域重磁资料解译推断,建立空间信息库和图库。建立区域重磁空间信息库。计算机对重磁位场转换处理与成图的技术在8 0 年代就已成熟,故在这里不做详细讲解。4东北师范大学硕士学位论文2 2 1水平导数轴线的形成与提取根据垂直地质体走向的重磁水平一导峰谷值线可大致确定地质体边界的原理【lo 】,对重磁上延各平面场分别进行四个方向( o 。、4 5 。、9 0 。、1 3 5 。) 的一阶水平求导并形成等值线图;然后识别出每条等值线上的极值点,以及对所有极值点进行总体分析、连线;利用极值点所连的线再进行分析就可形成j 下负一阶水平导数轴线图。g i s 的最大特点之一是处理空间数据,这些由空间坐标点组成的曲线,作为g i s 的线图元处理起来就非常方便。算法流程见图1 。i 水平阶方向导数等值线图装入ju曲线识别 j求曲线极值点u极值点连接线处理u水平一阶方向导数轴线提取 l轴线输出图l 水平一阶方向导数轴线提取众所周知,一阶水平方向导数图是由许多正负异常等值曲线组成,而每条等值曲线实际上在计算机中存放的是线上若干控制点的坐标,这组有序的坐标在其相邻间以直线段相联,经圆滑处理可形成较光滑的曲线,针对图中待处理对象( 等值曲线) 的离散性和无规律性,设计用按曲率求极值点和按距离求极值点的算法,综合这两种算法,可以比较准确地求出极值点。一、按曲率求极值点i l l j它是指利用极值点附近曲线曲率大的特点求极值点。由于对曲线上这些离散点直接求曲率比较困难,因此用曲线上有序点的三个点间夹角来求近似曲率。当夹角在一定范围内变化时,即可判断有极值点。具体算法如下:( 1 ) 计算点0 、1 、2 的平均坐标假设为z b o ;计算点3 、4 、5 的平均坐标假设为z b l ;5东北师范大学硕士学位论文计算点6 、7 、8 的平均坐标假设为z b 2 ;( 2 ) 计算出线段z b 0 - z b j 为始边,线段z b l z b 2 为终边,以点z b l 为顶点所组成的角度,若弧度数大于1 2 ,并且小于1 1 3 兀1 2 ,可判断3 ,4 ,5 中有极值点【1 2 】。( 3 ) 令z b 0 = z b l ,z b i = z b 2 ;令z b 2 为点9 、1 0 、1 1 的平均坐标;重复( 2 ) ,直到线上的点处理完为止。二、利用距离求极值点( 1 ) 令点0 为始点sd ,终点zd 沿着点l 、2 、3 往下走;对每个点zd ,计算始点到终点间每个点到线段sd zd 的距离,找到最大距离的点记为p o i n t l ,并且记下最大距离s l ;接着zd 往下走一个点,同样找到距离最大的点记为p o i n t 2 ,并记下距离s 2 ;若s 2 小于s l ,则p o i n t l 为一个极值点,否则,继续做。( 2 ) p o i n t l 为始点,zd 沿着p o i n t l + i ,p o i n t l + 2 往下走,继续做。上述算法结果见图2 。图2 光滑后的极值点位置三、特征线跟踪提取导数图的轴线一般导数特征线不是闭合曲线图3 为一等轴状局部凸起的双特征线图,图4 为一脉状局部凹陷的特征线图。6查! 皇堕苎奎兰堡主兰篁笙窒一一_ 一,、肜沁0 心乡图3 等轴状局部凸起双特征线图4 脉状局部凹陷特征线对于非闭合曲线,采用八方位跟踪方式进行特征跟踪。如图5 所示八方位跟踪不是立足于网格上的各边,而是立足于网格点。若某一个网格控制点是特征点,则此特征点所属的特征线可能从八个方向通过此点,可能性从0 - 8 。当可能性为0 时,说明此特征点为一个孤立的特征点:当可能性大于1 时,说明此点有特征线通过;特别是当可能性为大于2 的偶数时,说明此点为特征线的交点;当可能性为大于1 的奇数时,说明有特征线在此处分叉。可见,八方位追踪容许特征线起始或终止于任何一点,而且容许特征线出现交叉或分叉,这都是四方位所不容许的。对整个数据分布区域进行扫描时,一旦发现某个网格控制点是导数特征点,且其八方位追踪可能性为1 ,则说明此点为某条导数特征线的起点,由此点开始,按八方位跟踪方式对这条导数特征线进行跟踪,直到再次出现八方位可能性为1 或奇数时为l 卜,这条导数特征线就被提取出来了3 1 。7查! 兰堕堇奎兰塑主堂垡笙窒067 5。2图5 八方位跟踪示意图42 2 2轴线的水平关联与垂向关联基于g i s 的导数轴线线状实体,它具有实体长度、弯曲度、方向性等空间特征。在g i s 中,线与线之间的实体关联,实质上是利用了线图元的有向性连线的坐标点特点,对两条轴线进行相关分析。将每个上延高度上提取的四个水平方向导数轴线图及该平面垂向二阶导数图进行水平关联,形成该平面的有效导数轴线图;将四个不同高度平面上的有效导数轴线图进行垂向关联,分别形成不同上延高度上的重磁解译构造图;最后将四个不同高度平面上的重磁构造进行垂向叠置,合成区域重磁构造格架图【l o 】。这一图形推理过程使得区域重磁空间信息的自动集成能够成为现实。由一阶水平求导原理知,平行构造走向求导的轴线近乎不存在。针对某一具有物性差异的地质构造线进行四个不同方向的水平一阶求导,最多有可能存在三个水平方向的导数轴,即有相近似的三条导数轴线。因此必须识别出其中一条能真实反映该地质构造线的有效导数轴线作为重磁轴线。以往专家给出重磁轴线存在的不同水平方向导数轴线相关判定的基本规则是:( 1 ) 两条轴线形态、位置相近,轴线性质正负同号;( 2 ) 两条轴线的走向相近;0 ) 两条轴线的长度相近。判断两轴线是否相关不能依靠简单的线性阈值组合标准,必须将长度、距离、走向等参数有效地结合起来考虑,否则顾此失彼。而且算法对点距和上延高度值的变化反映敏感,并在一定情况下失效。鉴于这种复杂的非线性系统,引入神经网络方法能够较好地解决求解问题。人工神经网络具有很好的学习能力,自适应、自组织和准确拟合任意非线性函数的能力,它能解决传统数值方法难以求解的问题i l4 。8东北师范大学硕士学位论文第三章b p 神经网络模型在重磁数据提取中的应用3 1b p 神经网络模型介绍3 1 1b p 算法原理b p 学习算法的基本思想是最小二乘学习算法,或称l m s ( l e a s tm e a ns q u a r e s ) 算法,是基于梯度搜索的最小均方差算法。为了获得网络实际输入和期望输出之间均方差最小,网络的学习过程是将误差从上层向下层边传播边修改权值的过程,故称为反向传播方法。多层网络运行b p 学习算法时,实际上包含了正向和反向的传播两个阶段。1 在正向传播过程中,输入信息从输入层经隐含层逐层处理,并传向输出层,每一层神经元的状态只影响下一层神经元的状态,计算各个神经元的实际输出。如果在输出层不能得到期望输出,则转入反向传播。2 在反向传播过程中,误差信号沿原来的连接通路即从输出端返回,先计算输出层的实际输出与所要求的输出之差即误差,并在传播中通过不断修改各层神经元的加权系数,使在输出层神经元上得到所需要的期望输出值为止,对一个样本完成网络加权系数的调整后,再输入另一样本对它进行类似学习,直到完成全部样本的训练学习为止。将一层节点的输出传送到另一层时,通过调整连接加权系数w 来达到增强和削弱这种输出的作用。除了输入层的结点外,隐含层和输出层结点的净输入是前一层结点的输出的加权系数和,每个节点的激励程度由它的输入信号、激励函数和结点的偏值来决定。注意这种网络实际运行是单向的,所以不能将其看成是一个非线性动力系统而只是一个非线性映射。b p ( b a c kp r o p a g a t i o n ) 神经网络又称为多层前馈神经网络1 1 5 j 。( 见图6 ) 为三层前馈神经网络的拓扑结构,这种神经网络模型的特点是:各层神经元仅与相邻层神经元之间有连接;各层内神经元之间无任何连接:各层神经元之间无反馈连接。输入信号先向前传播到隐结点,经过变换函数之后,把隐结点的输出信息传播到输出结点,再给出输出结果。结点的变换函数通常选取s i g m o i d 型函数。b p 神经网络的输入与输出关系是一个高度非线性映射关系,如果输入结点数为n ,输出结点数为m ,则网络是从n 维欧氏空间到m 维欧氏空间的映射。通过调整b p 神经网络中的连接权值以及网络的规模( 包括n m 和隐层结点数) ,可以实现非线性分类等问题,并且可以以任意精度逼近任何非线性函数。在确定了b p 网络的结构后,利用输入输出样本集对其进行训练,也即对网络的权值和阈值进行学习和调整,以使网络实现给定的输入输出映射关系。经过训练的b p 网络,对于不是样本集中的输入也能给出合适的输出,这种性质称为泛化( g e n e r a l i z a t i o n ) 功能【j 。从函数拟合的角度看,这说明b p 网络具有插值功能。9东北师范大学硕士学位论文图6b p 模型图输讼隐翳输入联3 1 2 标准b p 算法的描述网络学习公式推导的指导思想是:对网络权值( w i j , t l i ) 的修正与阐值( 0 ) 的修正,使误差函数( e ) 沿负梯度方向下降。b p 网络三层节点表示为,输入结点x i ,隐结点y i ,输出结点o l 输入节点与隐节点间的网络权值为w i l ,隐节点与输出节点间的网络权值为t l j ,当输出节点的期望输出为t l 时,b p 模型的计算公式如下l l7 】:隐节点的输出:其中:输出节点计算输出:其中:输出节点的误差公式:基本公式汇总:对输出节点:j l 一厂( 乏w i ,x i + o i ) 一fc n e tt )j以p 岛= w l j 0 + 瞑q = ,匹孤+ 岛) = ,( 羟)fn e t l = 瓦乃+ 岛f日= 1 1 ( b o i ) 3 = 1 ,2 j - f c t d l + 岛) ) lii= 1 ,2 色一,匹瓦眨w 备+ g ) + q ) ) 2l歹1 0东北师范大学硕士学位论文权值修正:3 对隐节点:4 权值修正:4 = ( 弓一q ) 尸( n e t t )正( 七+ 1 ) = 互( 后) + 五= 瓦( 露) + 7 7 4 m毋= f 0 2 厶) 磊正工 i b ( 豇+ 1 ) = 1 0 ( 七) + 厶 1 0 + ,7 j :x j3 1 3b p 网络训练的描述b p 算法训练的思想是,应用最速下降法对网络的权值和偏差修正,使网络误差沿负梯度方向下降,直到网络输出的误差小于或等于目标误差【1 8 l 。1 、信息的正向传播过程设b p 网络共有r 层,我们考察一般的从第r l 层到第r 层的信息传播过程。为此,首先引入如下记号:设第r 一1 层有1 个节点,其输出为i 维向量y = 0 ,:。1 ,) ,;。1 ,y :d ) t ,第r 层有j 个节点,其输入为j 维向量z 7 = ( 二:,_ = ;,二;) t ,第r 一1 层到第r 层之间的权值组成的j i 阶矩阵则第r 层的输入为:一吣圈( w ;) t = ( 垛,略,略) - 歹= 1 ,2 ,;囝( 3 1 )、,、yyt;t)何,kk=1 yw=东北师范大学硕士学位论文再设第r 层的偏差向量为:b r = ( w ,酲,6 ;) t ,设第r 层的神经元激活函数矩阵为:儿f 曩引y ,r = ( ( w ;) ty ,- l + 巧) ,_ = 1 ,2 - - ,。( 3 3 )穸7 _ l = ( yr - 1 相应地,连接权矩阵w r 增加一列,成为葡= r t b7 )于是有:w y 卜1 + b r = 前ry 7 五则( 3 2 ) 式成为:y r = fr ( w r 歹。1 )仍用原来的记号,还用( 3 1 ) 式计算第r 层的输入,( 3 2 ) 和( 3 3 ) 式可分别代之以简化形式y 7 = fr ( ,) = r t w y 卜1 ),( 3 4 )j ? ;= ( ( w ;) yd ) ,歹= 1 。2 ,;( 3 5 )r 可取为从l 到r 的任意整数,当r = l 时,第1 层的输入为第0 层( r 一1 = 0 ) 的输出,即整个网络的输入层的输出,也是整个网络的输入y o = ) 【;当r = r 时,第r 层的输出为整个网络的输出y r = y 。只要知道了r 个权值矩阵w7 ( f 1 ,2 ,r ) ,就可以利用1 2东北师范大学硕士学位论文( 3 4 ) 式实现信息的逐层传播,即由网络输入y o = x 算出网络输出y = y 土= fl ( z 量) = f 震唧m )= f 置【w j f 皂1 ( w 曩1 y 鼻2 ) 】= 一( w 置产1 f 1 1 砷】) ( 3 6 )yj f2 疗= ( w 多) tf | 1 【f 1 唧1 x ) 】) ,j2l ,2 ,( 3 7 )2 、误差的反向传播过程这里仅考虑一对训练样本( x ,d ) 。设输入向量x 按( 3 6 ) 式算得的输出向量为用r ,它与目标向量d 的误差由下述误差函数度量旦= 圭l 陟卫一d = 三 皇一d ) t ( y 上一d ) = 圭喜g 产一d ,广,。3 8 ,它的大小取决于网络的结构参数w 7 和b ( f 1 ,2 , - - - , r ) ,或者说e 是这些权值矩阵和偏差向量的多元函数。根据最速下降法,网络的权值和偏差的更新公式为:w r ( f + 1 ) _ w m 竹熹,b r ( f + 1 ) _ b 7 ) ,7 7 万0 e ,r = 1 2 一( 3 1 。)其中n 为学习速率。下面计算误差函数e 关于网络的结构参数w 7 和b r ( f 1 ,2 ,r ) 的梯度。对手任意指定的r = l ,2 ,r 和j 2 1 ,2 ,j ,f l 了( 3 3 ) n 1 ( 3 1 ) 式可知可0 e 嚣号善叫y r - l 罢拳罢萼:占;,歹- i ,2 ,;之;叫j。一( 3 1 2 )其中未知的是驴詈伊l 2 ,_我们分两种情形对它进行计算:( 1 ) f r ,x r i 是最后一层第i 节点的输入。f l = i ( 3 8 ) 式可知1 3东北师范大学硕士学位论文班号2 券蓦由歹- ) 口) ,垆,m 限( 2 ) 1 r r ,即第r 层为隐含层。这时,x l :j 是第r 层第j 节点的输入,它通过激活函数f 。j ( ) 产生输出y r j ,再通过连接权w 什1 传给第r + l 层各节点,这时有,= :+ 1 = ( w ? 1 ) t y 7 = r + 1 ) ,;。k = - l ,2 ,k ,- 丑于是有驴寻= 嚣蓦= z 砉害r a r + l 等- - 防】,= 主占:“瞄1 防( :;) 】,- 7 = ,_量d( 3 1 4 )总之,根据这几个公式就可以求出误差函数e 关于所有权值和偏差的偏导划1 9 1 ,它们组成e 的梯度。为了用向量运算表示上述运算关系,我们首先定义一些对向量或矩阵求导的一些公式,设有一般的向量和矩阵一二圈w 歹= ( w h ,u 3 ,w j s ) = 1 ,2 - ,_ r ;再设e 是这些向量或矩阵的纯量值函数。我们规定1 4东北师范大学硕士学位论文警= 凰熹= 别 ,= 虱如果u 中的元素都是v 的纯量值,则规定特别地,如果u 可以表示为u = a v ,其中a 是m n 阶矩阵,它可以表示成各行向量的组合形式jl=亡;t-:。=ccz。,cz,:,cz自,=-j:,t:于是由向量求导法则【2 0 】熹= 掣- 警掣,刳= a l , a 2 , - - - , a n ) - a t 不难验证,数学分析中求导运算的一些基本公式,特别是关于线性函数和复合函数的求导公式对这种求导也都是适用的。特别地,对于前边引用的关于函数矩阵的运算y = f - z = 石三一五按向量对向量的求导法则,我们有1 5眺割仁刁j2e j翱旦毗旦眦_乱旦甜挖舭纠刊l _ll _i挑一砒;札一札j,-。一,刳生钾挑百=孤丙、lilioo:以东北师范大学硕士学位论文鲁= ( 鲁,警,纠= 萎:封=o,= ,r 一、_ ,3p 2 ,o07i? l f ,( z );i 一( :,( 3 1 6 )这是一个j 阶对角矩阵。对于线性函数叩甜x :x t u ( 其中u 和x 都是n 维列向量) ,我们有,鲁一u t 2苏1( 3 1 7 )关于复合函数的求导法则,涉及若干矩阵的乘积,要特别考虑顺序关系,需要针对具体问题作具体分析。在我们的问题中,求计算误差函数e 关于网络的结构参数w 和b r ( r = l ,2 , - - - , r ) 的梯度,就是要对r = l ,2 ,r 计算e 关于每个矩阵w 和向量b 的导数令耳a e2 町歹_ l 2 _6 r - 科,群) t - 等注意到式( 3 1 ) 和( 3 1 7 ) 。我们有晶叫v伙w ;) tv。于是1 6,一,oo;分石。亟屯;ol _l钞一昆o;o)l00 :o,mu=塑良科丽;斜一训里舛堡群毋南旦科东北师范大学硕士学位论文6 r ) t这个结果相当于( 3 1 1 ) 和( 3 1 2 ) 式。下面分两种情况求6 。:( 1 ) f r ,这时有( 3 1 8 )( 3 1 9 )( 3 2 0 )这里涉及到复合函数的求导,等式左边的6r 是i t i 维列向量,等式右边第一个因子是m x m 阶矩阵,由( 3 1 6 ) 式,有吖ro ( :,) 】7o童,卜,由( 3 8 ) 式,第二个因子为等_ y l d它是m 维列向量。根据各矩阵的阶数,等式右边两个因子的运算顺序只能这样安排,否则无法进行运算。将( 3 2 0 ) 式用各向量的分量表示为6 量= i f 量( zj ) 】( y 上一d )( 3 2 1 )即为( 3 1 3 ) 式的结果。( 2 ) 1 r 。( 2 ) 设计网络的层数,每层神经元数,每个神经元的激活函数,初始化网络中各层的权值和偏差为( 1 ,1 ) 内的随机数。设置目标误差e ,学习速率t l ,最大训练次数t 。( 3 ) 0 1 1 练次数t = 0 。( 4 ) p = l ,总误差e = 0 。( 5 ) 输入网络一对训练样本( x p ,d p ) 。( 6 ) 通过网络将输入模式x p 的正向传播,计算网络的输出y py ,0 = 坤y 了1 = f h l ( w h ly ;+ b7 + 1 ) ,= o 。1 ,2 ,尺一1 ,y ,= y ;。( 7 ) 计算x p 的网络误差驴l = 三砉叫;户( 8 ) 通过网络将6 反向传播。1 8东北师范大学硕士学位论文6 ;= 一【f 上( z ;) 】7 ( d ,一y ;) ,6 ;- - i t 7 ( z ;) 】7 ( w m ) t 6 7 1 ,= r 一1 ,2 ,l 。( 9 ) 修正网络的权值和偏差:w 7 + 1 ) = w r ) 一1 7 6 :,( y 7 ) t ,b 7 ( f + 1 ) = b70 ) 一,7 6 ;,= 1 ,2 ,r ( 1 0 ) p q ?如果p q ,那么p = p + l ,转到( 5 ) :否则,转到( 1 1 ) 。( 11 ) e = e + e p 。( 1 2 ) e ?如果e ,那么训练成功,转到( 1 4 ) ;否则,转到( 1 3 ) 。( 13 ) t t ?如果t t ,那么t = t + 1 ,转到( 4 ) ;否则,训练未成功,转到( 1 4 ) 。( 1 4 ) 结束1 9i 而_ 而_ 圭塑垫塑主塑墼流程旧 1 】r 吲所i :连i “n i 6 y j f tn 目il m m l n 目 、- i jw j o o ,。一目。i 。二ju l n n k “i j _ k * i j i i 丽w 蜥k 。,i :f n ,“h t _ * 下i i 面而f j t m日嚣n z l t “虹l q *罔7b p 利l 经网络流程h东北师范大学硕士学位论文3 2b p 神经网络模型在重磁数据处理中的应用在重磁数据处理中,判断两轴线是否相关不能依靠简单的线性阈值组合标准,必须将长度、距离、走向等参数有效地结合起来考虑,否则顾此失彼。鉴于这种复杂的非线性系统,引入b p 神经网络方法能够较好地解决求解问题。人工神经网络具有很好的学习能力,自适应、自组织和准确拟合任意非线性函数的能力,它能解决传统数值方法难以求解的问题f 2 3 1 。具体步骤如下:l 、根据反向传播b p 模型1 2 4 ,建立了一个三层b p 网络结构的神经网络分类器,对两线相关进行判断。2 、输入层节点取决于样本的输入特征项,在综合分析的基础上,确定影响线相关判定的8 个主要因素作为差别特征参数,作为输入层各节点的输入值,因b p 网络所能实现的映射是建立于【0 ,1 】空间上,故对特征参数还有必要作归一化处理f 2 5 1 。3 、对于一个隐层的b p 网络,只要有足够的隐层节点,就足以解决复杂的非线性映射问题。隐层节点数对网络算法的收敛性有着重要的影响。隐层节点数过少使网络训练困难,说明不足以表达这种非线性映射问题;隐层节点数过多,反映得过细,又会使收敛速度过慢,性能变差。在具体应用中,隐含层节点数的多少由经验给出。、4 、输出层只有一个节点,l 表示相关,o 表示不相关。5 、选取实测的重磁数据作为样本数据,利用一、二、三、四上延层在水平0 。、4 5 。、9 0 。、1 3 5 。方向上求导后提取的轴线图数据以及垂向二导等值图数据,进行算法学习训练。对给定的学习样本,利用梯度搜索技术,调整权值使估价函数降到可接受值,达到获取和存储知识的目的。设学习模式样本对为x 2lx9 l ,x 、l ,x ,j 02 ,】0 :,】k ,昂。夕,p21 ,2 ,一冶,则评估函数为:勺f 。孵1弘,净2 ,翟j 。p 聃o p t ) :j ,2 :,2 一j 。其中i l p 为样本总数,m 为输出层数,yp j 为样本的期望输出;o 西为网络输出层的实际输出。权值调整量a6 0i jk 为:rm : = 野詈缸,优咚其中a i jk 为从k 一1 层第1 节点到第k 层第k 节点之间的连接权值,r l 为学习率。权值修正公式为咄 r ,+ lj = 魄 r 痧= 啦女r 一2 1东北师范大学硕士学位论文3 3b p 神经网络模型在应用中的缺点与不足在神经网络的研究历史中,与前期的神经网络相比,基本b p 网络在网络理论和网络性能上都更成熟。但是,它并不是十分完善,基本b p 算法存在以下一些缺点有待改进【2 6 1 。l 、网络训练的收敛速度很慢基本b p 算法在实际应用中,网络训练的收敛速度很慢,这主要是由于为了保证网络的稳定性,取较小的学习速率造成的。b p 网络的误差函数曲面不是一个二次函数,曲率在变量空间中变化很大。在曲面的一些区域,曲面很平坦,变化不大,网络训练需要较大的学习速率;在曲面的另一些区域,误差曲面较陡峭,曲率很大,如果算法采用大的学习速率,算法将变得不稳定,开始发散,因此,网络训练需要小的学习速率。2 、网络训练容易陷入局部极小值剧2 7 j由于b p 学习规则采用了按误差函数梯度下降的方向进行收敛,这就意味着由能量函数构成的连接权空间不仅是只有一个极小点的抛物面,而且是存有多个局部极小点的超曲面。因此,b p 网络的收敛过程很可能在遇到局部极小极值时便被“冻结”,而无法最终收敛到全局最小点。另外,导致b p 网络陷入局部极
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 1776-2025超细铂粉
- 2025年上半年上海市卫生健康技术评价中心工作人员公开招聘考前自测高频考点模拟试题及答案详解(易错题)
- 2025年4月广东深圳小学光明学校曙光校区、狮山校区赴济南定点面向2025年应届毕业生招聘教师11人模拟试卷含答案详解
- 安全培训教师体会课件
- 2025年福建省莆田市秀屿区上塘珠宝城实业有限公司招聘1人考前自测高频考点模拟试题及答案详解(典优)
- 2025年合肥复兴控股集团第一批人员招聘27人考前自测高频考点模拟试题及1套完整答案详解
- 安全培训教员资质课件
- 广播电台培训课件
- 2025贵州黔西南州望谟县消防救援大队招聘政府专职消防文员1人模拟试卷附答案详解
- Human-ZIC1-mRNA-生命科学试剂-MCE
- 口腔门诊6S管理标准化实施指南
- 《呼吸系统疾病的针灸治疗》课件
- 2025-2030公务航空行业市场发展现状分析及竞争格局与投资价值研究报告
- 高中数学集合试题及答案
- 2025年导游证资格考试知识测试试题及答案
- 羽毛球裁判员培训与实施
- 幼儿园获奖公开课:中班语言《顽皮的小雨滴》课件
- PPD接种培训课件
- 人教版中职数学拓展模块一:3.2.1向量的加法课件(共21张课件)
- 宫外孕大出血护理
- 《纳米陶瓷微珠保温隔热系统应用技术规程》
评论
0/150
提交评论