物探新方法新技术之四:模式识别技术(PatternRecognition).doc_第1页
物探新方法新技术之四:模式识别技术(PatternRecognition).doc_第2页
物探新方法新技术之四:模式识别技术(PatternRecognition).doc_第3页
物探新方法新技术之四:模式识别技术(PatternRecognition).doc_第4页
物探新方法新技术之四:模式识别技术(PatternRecognition).doc_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

4 模式识别技术一个模式类是由一些给定的共同属性所决定的一个类别,该类别中的一员就是一个模式。所谓模式识别也就是对所研究的对象根据其共同特征或属性进行识别和分类。严格地说,模式识别不是简单的分类学。模式识别过程主要包括三部分,首先从观测样品中提取特征;然后按照某种原则对这些特征进行选择,保留一些起主要作用的特征用于识别;最后采用各种判别方法或聚类方法,根据多个特征对样品进行研究和分类。模式识别的方法很多,本章讨论了模糊综合评判、模糊模式识别、分段线性模式识别和人工神经网络模式识别等四种方法。4.1 模糊综合评判法模糊综合评判就是应用模糊变换原理和最大隶属度原则,考虑与被评价事物相关的各个因素,对其所做的综合评判。在模糊综合评判中需考虑两个集合,即着眼因素集合和抉择评语集合。做模糊综合评判的关键就在于找出着眼因素集合与抉择评语集合之间的模糊关系,并确定合适的综合评判模型。对于断层识别而言,通过分析地震属性参数与小断层之间的模糊关系,建立各种地震属性参数对应小断层的隶属函数,最后预测小断层存在的肯定区、可能区及否定区。 首先对着眼因素集中的单因素做单因素评价,从因素着眼确定该事物对抉择等级的隶属度,这样就得出第个因素的单因素评价集 它是抉择评语集合上的模糊子集。这样个着眼因素的评价集就构造出一个总的评价矩阵 (4-1)式中着眼因素集到抉择评语集的一个模糊关系; 因素对抉择等级的隶属度。 在多因素综合评价中,一方面,对于被评价的事物,从不同的因素着眼可以得到不同的结论;另一方面,在诸多着眼因素中,有些因素在总评价中影响程度大些,而另一些可能影响小些,但究竟多大,则是一个模糊择优问题。 因此评价的着眼点可看作是着眼因素集上的一个模糊子集,记作 式中对的隶属度,它是单因素在总评价中的影响程度大小的度量,。 称为的因素重要程度模糊子集,称为因素的重要程度系数。 于是,当模糊向量和模糊关系矩阵为已知时,作模糊变换来进行综合评判。 (4-2)或 中各元素是广义模糊合成运算的结果,其计算式为 (4-3)简记为模型,其中为广义模糊“与”运算,为广义模糊“或”运算。称为抉择评语集合上的等级模糊子集,为等级对综合评判所得等级模糊子集的隶属度。如果要选择一个决策,则可按照最大隶属度原则选择最大的所对应的等级作为综合评判的结果。在断层(岩溶裂隙)识别工作中,着眼因素集合为(地震属性参数1,地震属性参数)抉择评语集合为(断层,非断层)或 (岩溶裂隙,非岩溶裂隙)至于重要程度模糊子集的选取,要根据不同测区的实际情况而定。综合评判有五种具体模型:模型1: (4-4) 式中,分别为取小和取大运算。模型2: (4-5) 式中“”为普通实数乘法。模型3: (4-6) 式中为对个数在运算下求和,。模型4: (4-7) 模型5:(乘幂,) (4-8) 模型1为主因素决定型的综合评判,其评判结果取决于在总评价中起主要作用的那个因素。模型2和模型3为主因素突出型综合评判,它们与模型1比较接近,但比运算精细,不仅突出了主因素,也兼顾了其它因素。模型4为加权平均型综合评判,依权重大小对所有因素均衡兼顾,比较适用于要求总和最大的情形。断层(岩溶裂隙)识别时,考虑到所选地震属性参数在断层(岩溶裂隙)上或多或少都有反映,属性所起作用大小可以通过权重予以调整。不存在一个属性占绝对的主导地位,通常是几个属性对断层(岩溶裂隙)的反映都比较好,或在这条测线上反映比较好,而在另外的测线上反映较差,或几个属性对断层(岩溶裂隙)的反映都较差,所以选用了模型4。在利用地震属性参数进行综合评判时,需要求出重要程度模糊子集与评价矩阵,由此才能求出等级模糊子集,最后进行判别。因为抉择评语集(断层,非断层)或(岩溶裂隙,非岩溶裂隙),只有两个元素,所以只需求出地震属性对断层(岩溶裂隙)的隶属函数即可。通常选用线性隶属函数的形式,这是因为用线性隶属函数来描述断层(岩溶裂隙)与地震属性的关系比较接近于实际情况,应用效果较好。线性隶属函数统一形式为 (4-9)其中 式中 正常地层时因素的标准值; 小断层(岩溶裂隙)时因素的标准值。4.2 模糊模式识别法设是给定待识别对象的全体集合,中每个对象有个特性指标。每个特性指标描述的是对象的某个方面的特征,于是个特性指标确定的对象可记成,将称为特性向量。设识别对象集合可分成个类别, 且每一类别均是上的一个模糊集,记作,则称它们为模糊模式。当一个识别算法作用于对象时,就产生一组隶属度, ,它们分别表示对象隶属于类别的程度。建立了模糊模式的隶属函数之后,可以按照某种隶属原则把对象进行分类,指出它应属于哪一类。模糊模式识别法的计算步骤是:(1) 识别对象的特性指标抽选;(2) 构造模糊模式的隶属函数组;(3) 识别判断。断层(岩溶裂隙)识别工作中,识别对象集合是地震测线上所有待研究点,它只有两个类别:断层(岩溶裂隙)和非断层(非岩溶裂隙)。识别对象的特性指标就是模式识别所用的地震属性参数。 在抽选特性指标时,特别要注意抽选与模式识别问题显著有关的特性指标。构造隶属函数除了在模糊综合评判中采用的线性隶属函数形式外,还可以采取一种常用的方法样板法。设是给定待识别对象的全体集合,给定上个模糊子集(模糊模式) ,每一个对象的特性向量为。从模糊模式中选出个样板 式中 第个模糊模式的第个样板特性向量; 第个模糊模式中第个样板的第个特性指标的实测数据值,。计算模糊模式中的个特性向量的平均值,即 (4-10)其中 称为模糊模式的均值样板。计算对象与均值样板之间的普通距离 (4-11)令 则模糊模式的隶属函数为 (4-12)根据具体问题,在选择样本时可以增加一些可变的指标,以适应更加复杂的情况。最后一步是识别判断,应用最大隶属原则进行判别。设是一被识别的对象,若,则认为优先属于。4.3 分段线性模式识别法4.3.1 线性模式识别法 本方法首先根据已知资料建立识别函数,然后计算分类临界值及识别标准,最后对识别规律的可靠性进行显著性检验。只有在识别规律可靠的前提下,方能用得到的识别规律对未知点进行判断。1建立识别函数含有个因素的线性识别函数具有以下形式 (4-13)式中,系数的确定过程就是建立识别函数。确定系数的原则是使判别函数值能最好地区分两组已知样本。通常应用费歇准则或贝叶斯准则来建立判别函数。在费歇准则下,为准确判别样本的归属应满足两个条件: 属于断层处与正常地层处的两组样本的识别函数的平均值的差别应最大;各组样本内已知样本的差异应最小。满足这两个条件的识别系数组,就是能最好区分两组样本的识别函数系数。通常用与之差的平方值作为组间差的衡量的标准,即 (4-14) (4-15)式中 第一组样本识别函数的平均值; 第二组样本识别函数的平均值; 分别为第一、二组已知样本个数; j第一组第个样本判别函数值; 第二组第个样本识别函数值。 (4-16) (4-17)式中 第一组中第个样本的第种地震属性参数值; 第二组中第个样本的第种地震属性参数值。设立目标函数 (4-18)式中 当参数取极大值时,则可认为同时满足了上述两个条件。通过对偏导数等于零,将求转化为解线性方程组。 (4-19)式中 而 2确定断层(岩溶裂隙)隶属度识别函数确立后,分别计算,和。 (4-20) (4-21) (4-22)则第道断层(岩溶裂隙)的隶属度为 (4-23)式中 3显著性检验识别的基础在于两类样本的各项指标确实存在差异,否则建立识别函数与识别规律毫无意义。因此在用该方法时应做显著性检验,常用统计量做检验。 (4-24) 在给定置信度下,根据第一、第二自由度分别为和,从分布表上查出该置信度下的临界值。当时,识别函数与识别规律才有意义,才能对未知样本作识别。当时,识别函数与识别规律无意义,不能对未知样本作识别。4.3.2 分段线性模式识别法线性模式识别的核心是线性分类器,它的概念清楚,算法简单,且对某些问题可取得较好的效果。但当样品集合“线性不可分”时,或为多峰分布时,采用线性分类器就会遇到困难。这时,可以采用适用性更为广泛的分段线性分类器。 所谓分段线性分类器,就是判别函数为分段线性函数的分类器,即它的决策面是由不止一个直线(平面、超平面)所组成的。分类器可分为:贝叶斯分类器、线性分类器和分段线性分类器。从图中看出,分段线性分类器比线性分类器的错误概率小而比贝叶斯分类器简单。 分段线性模式识别的思想来源于分段线性分类器,但它的原理与分段线性分类器还有很大的差别。 设待判样品的集合为,每个样品有个因素,写成矩阵的形式为 正常模式的样本集合为,每个样品有个因素,写成矩阵的形式为 断层(岩溶裂隙)模式的样本集合为,每个样品有个因素,写成矩阵的形式为 令 式中 第个因素的权重; 第个样品与正常模式中第个样本的加权距离; 第个样品与断层(岩溶裂隙)模式中第个样本的加权距离。则第个样品的断层(岩溶裂隙)隶属度为 (4-25)4.4 人工神经网络模式识别法4.4.1 人工神经网络概况 人工神经网络简称神经网络,是在现代生物科学研究人脑组织所取得的成果基础上提出的,用以模拟生物神经的结构和功能的一种信息处理系统。人工神经网络不能完全仿真人脑神经系统,而只是对其做某种简化、抽象和模拟。人工神经网络具有人脑功能的基本特征:学习、记忆和归纳,从而突破了人工智能研究中的某些局限性。 人工神经网络是一种大规模并行处理的高度复杂的非线性动力学系统。对于外加的输入,神经网络以并行的、非确定性的方式做出响应。一个神经网络模型一般由三部分组成:神经元、神经网络结构和神经网络学习规则。 1神经元神经元是神经网络的基本处理单元,它的数学模型如图21所示。这里神经元将接收的信息,用表示互联强度,以点积形式合成为自己的输入,并以某种方式设定阈值和输入做比较,再经函数的转换,便得到这个处理单元的输出。图41 神经元的数学模型神经元的内部状态为 (2-26)式中 第个输入元素;第个输入与神经元之间的连接权重; 神经元的内部阈值。神经元的输出为 (4-27)函数f是一个非线性函数,称作激活函数。一个神经元的性质取决于它的阈值和激活函数的类型。常用的激活函数为阈值型、分段线性型和Sigmoid函数型(图42)。图42 神经元常用的激活函数a阈值型;b分段线性型;cSigmoid函数型 为了便于表达,把上述有关变量写成矢量形式 2神经网络结构 一个简单的神经网络是由若干个神经元组成,各个神经元之间通过相互连接形成网络,网络可分成输入信息的神经元组成的输入层,输出信息的神经元组成的输出层,其余神经元组成的中间层或隐层。神经元之间的连接不只是单纯的传送信号的通道,而且对所传递的信息进行加权处理,可以加强或减弱上一个神经元的输出对下一个神经元的剌激,这个加权系数称为连接权重(或称为连接强度)。 神经网络类型与功能的差异是由其具体网络结构,即神经元的数目和连接来体现的。神经网络按其网络结构可分为:单纯前馈式网络、有反馈的前馈网络、内层互联的前馈网络、反馈型全互联网络、反馈型局部联接网络等。 3神经网络的学习规则具有确定网络结构的网络实现某种预定功能的能力,是由学习规则(算法)通过修改神经元之间的权重以使网络实际输出逼近期望输出来自动确定的,即通过网络训练来实现。神经网络的学习算法可分为两类:有监督的和无监督的。有监督学习算法的训练要求同时给出输入和正确的输出,网络根据当前输出与所要求的目标输出的差来进行网络调整,使网络做出正确的反映。无监督学习算法的训练只需给出输入,网络能够逐渐演变到对输入的某种模式做出特定的反映。4.4.2 反向传播算法反向传播神经网络简称BP网络,其结构如图23所示。它由层构成,第一层是输入层,第层是输出层,中间层称为中间层或隐层。描述网络的参数包括:层数、每层神经元数目、第层神经元与第层神经元1的连接权重。图43 网络的结构 对网络进行训练时,首先要提供一组训练样本,其中每个样本由输入样本和目标输出组成。网络学习的目的是要使网络尽量逼近所需要的映射,这种映射通过训练的输入输出对反映出来。网络训练时,不断地将网络输出与目标输出相比较,并按学习规则改变权重,直至对所有的训练数据网络输出和目标输出之差达到要求为止。激活函数取Sigmoid函数型。即 (4-28)可以发现是一个连续可微的函数,这种函数所划分的区域是由一个非线性的超平面组成的区域,因此它的分类比线性划分精确、合理,并有较好的容错性。另外,由于是连续可微的,可以严格利用梯度法进行推算,它的学习算法称为反向传播神经网络算法,简称BP算法。在BP算法中,每一个训练样本在网络中经过两次传递计算:一次向前传播计算,从输入层开始,经各层处理传递后产生一个输出,并计算实际输出和所需输出的误差矢量;一次反向传播计算,从输出层至输入层,利用误差矢量对权值进行逐层修改。BP算法扩展了神经网络的使用范围,得到了广泛的应用。下面以三层模型(图24)为例介绍这种算法,它也适用于多层模型。图44 三层BP网络设输入层、中间层、输出层神经元数目分别是,输入学习样本为,中间层输出为,输出层输出为 ,期望输出为,是期望输出与实际输出之差,输入层神经元与中间层神经元之间的联接权重为 ,中间层神经元与输出层神经元之间的联接权重为 。BP算法的具体步骤如下: (1) 给网络各层的联接权和阈值置一个随机数,作为初值。(2) 对一样本,按下列公式计算,其中 (4-29) (4-30) (4-31) (3) 计算,其中 (4-32) (4) 调整各层的联接权重 (4-33) (4-34)式中 称为冲量项和学习率; 上一次迭代联接权重的改变量。由(4-33)和(4-34)式可见,权重改变量的比例常数是学习率,学习率越大,权重改变量越大。为减少迭代次数,应使学习率足够大,但学习率太大会产生振荡,导致收敛过程的不稳定。为了增大学习率而不导致振荡,可增加一个冲量项,只要选取合适的值,便会抑制学习过程中的不稳定性。(5) 若满足精度要求,即则转到(6),否则转到(2)。 (6) 停止。4.5应用实例4.5.1 识别断层利用地震属性和模式识别方法对龙东煤矿二维地震资料进行解释,查明东翼采区7煤层中落差大于和等于10m的断层。利用模糊综合评判、模糊模式识别和分段线性模式识别三种模式识别方法对波峰波谷振幅、波谷相位时间、相似系数和主频带通能量百分比四种地震属性参数进行综合分析和断层识别。断点的判别准则是:(1) 三条识别曲线的隶属度值均大于60,认为是A级断点,解释完全可靠;(2) 三条识别曲线中,任意两条的隶属度值于60,另一条的隶属度值小于60,认为是B级断点,解释比较可靠;(3) 三条识别曲线中,任意一条的隶属度值于60,另外两条的隶属度值小于60,认为是C级断点,解释仅供参考。图45(a)是采勘对比线10线的偏移剖面,根据巷道揭露的断层有3条:F21、F22和F68,它们的落差分别是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论